Как загрузить pdf в базу данных MySQL и выполнить поиск по метаданным?

0

Я пишу код для веб-приложения, которое имеет возможность загрузки файлов PDF. Я должен хранить метаданные PDF файла в базе данных MySQL, потому что позже некоторые из этих метаданных, таких как автор или год, будут критериями поиска. Каким будет самый простой способ сделать что-то подобное?

  • 0
    Возможно, вы захотите рассмотреть что-то вроде Solr, которое может поддерживать поиск текста и метаданных намного лучше, чем MySQL. Или любой другой полнотекстовый поисковик, поддерживающий метаданные.
Теги:
pdf
metadata

1 ответ

0

Простым способом может быть сохранение PDF в хранилище blob (например, AWS S3 или GCS). Эти магазины вернут уникальный идентификатор сохраненного объекта. В MySql сохраните любые метаданные, которые вам нужны, а также ссылку на сохраненный объект для извлечения позже.

Если вы не хотите добавлять дополнительный магазин, сериализуйте PDF в байты и храните его непосредственно в строке в столбце.

  • 0
    Должен ли я использовать какую-то библиотеку в качестве TIKA или ..? Потому что в моей базе данных pdf хранится в blob, но другие столбцы, зарезервированные для метаданных, остаются пустыми.

Ещё вопросы

Сообщество Overcoder
Наверх
Меню