Как получить доступ к конкретной информации PDF?

1

У меня есть проект, идущий в jav, где мне нужно отфильтровать следующую информацию из PDF-документов Science. Автор, название и ссылки. Существует несколько проблем с получением этих конкретных сведений из PDF-документа. 1. Нет конкретного способа написания бумаги, чтобы каждая бумага выглядела по-другому. 2. Для программы трудно различать имена и приводимые в действие описанные объекты. и есть еще несколько проблем, но это заставило бы нас слишком далеко от моего актуального вопроса. Мой вопрос заключается в том, есть ли возможность получить доступ к определенному виду информации в Pdf Dokument, например, какие размеры шрифта использовались в этом pdf или какие разные шрифты используются? Существуют ли какие-либо методы или редакторы, с которыми я могу смотреть в pdf в понятном виде, поэтому я, возможно, найду знаковые функции вокруг информации, которая мне нужна. Так что я могу использовать algorythem для их правильного извлечения. спасибо за вашу помощь. И я сожалею о своем английском, это не мой родной язык.

  • 0
    Посмотрите на использование IText
Теги:

1 ответ

2
Лучший ответ

Вы можете использовать SDK, такой как Apache PDFBox, чтобы читать свойства файла PDF, а также другое содержимое файла.

  • 1
    Спасибо. Я попробую это.
  • 0
    Не забудьте принять ответ, если он решит вашу проблему :)
Показать ещё 1 комментарий

Ещё вопросы

Сообщество Overcoder
Наверх
Меню