Нужны ли мне оригинальные файлы, используемые для создания индекса в Lucene?

1

Прежде всего, как я объяснил в своем профиле, я не владею английским языком, поэтому, надеюсь, вы сможете простить меня, если я ошибаюсь.

Я пытаюсь разработать API Apache Lucene в Java. Я могу написать некоторые методы индекса и поиска, но я все еще смущен тем, как это работает за кулисами.

Из того, что я знаю, Lucene не заботится о происхождении данных. Он просто берет данные и индексирует их. Позвольте мне задать простой пример:

Я хочу индексировать слова из словаря на основе.txt. Как только Lucene сделала свои индексы, мне больше нужен исходный.txt-словарь? Как точно работают индексы?

Индексы содержат необходимый контент для выполнения поиска без исходного источника? Или индексы содержат только указания, в которых слова хранятся в исходном исходном файле.txt словаря? Я немного запутался.

Теги:
dictionary
lucene

1 ответ

0
Лучший ответ

После того, как вы указали все, Lucene не ссылается или не нуждается в каких-либо из исходных документов. Все, что ему нужно для работы, сохраняется в его индексном каталоге. Многие люди используют Lucene для индексирования файлов, других записей базы данных, других онлайн-ресурсов. Независимо от вашего источника, вы всегда должны сами вводить данные (или с помощью стороннего инструмента) и создавать Document для индекса lucene для индексации, и ничего о документе ничего не говорится о том, откуда он появился. Таким образом, не только lucene не нужно ссылаться на исходные источники данных, он не может найти их, если вы этого хотите.

Многие реализации людей полагаются на наличие оригинального источника. Это вовсе не необычно для людей, чтобы настроить Lucene на индексирование всего, но хранить только имя файла или идентификатор базы данных или какой-либо аналогичный указатель на исходный источник. Это позволяет им выполнять эффективный полнотекстовый поиск через lucene, одновременно обрабатывая полный контент в какой-либо другой системе.

  • 0
    Большое спасибо. Ваше объяснение теперь проясняет мою точку зрения.
  • 1
    Чтобы уточнить, Lucene может сохранять исходные данные, когда вы устанавливаете Field.Store.YES , и это обычная вещь при использовании Lucene, например, для отображения результатов поиска в браузере.

Ещё вопросы

Сообщество Overcoder
Наверх
Меню