Как преобразовать множественные существительные в единственные существительные [дубликаты]

1

В недавнем проекте я столкнулся с задачей превратить множественные существительные в единичные формы. Я знаю некоторые POS-метки algortihms и инструменты, которые могут распознавать множественные формы существительных и помечать их как "NNS", но я не знал ни одного алгоритма, который мог бы превратить их в единичные формы. Я пытался судить, но вывод кажется слишком агрессивным, чтобы преобразовать слово. Это дает что-то вроде этого:

parties -> parti

Но я хочу:

fish -> fish
classes -> class
parties -> party
goods -> goods
cups -> cup

Кажется, это сложная проблема без огромного словаря с каждым английским словом. Есть ли зрелые альгортимы, которые могут это сделать? Я также рад узнать, есть ли библиотека, которая может это сделать, особенно библиотеки на Java. Благодарю.

  • 1
    Вопросы с просьбой рекомендовать или найти инструмент, библиотеку или любимый сторонний ресурс не по теме для переполнения стека, поскольку они, как правило, привлекают взвешенные ответы и спам. Вместо этого опишите проблему и то, что уже сделано для ее решения.
  • 0
    Я реформировал вопрос.
Теги:
nlp

1 ответ

0

То, что вы хотите, это lemmatizer вместо стебля. В Java есть несколько реализаций. Я считаю, что Stanford CoreNLP проще всего использовать из командной строки. Морфа также довольно популярна.

PS Ваш вопрос повторяется. Я отвечаю, потому что найти ответ на него через Google удивительно сложно.

Ещё вопросы

Сообщество Overcoder
Наверх
Меню