используйте Lenskit, чтобы предсказать рейтинг книги

Question

используйте Lenskit, чтобы предсказать рейтинг книги

1

У меня есть файл "csv", который содержит идентификатор пользователя, книгу, которую он прочитал, рейтинг для каждой книги. Я хочу использовать Lenskit для прогнозирования книжного рейтинга для пользователя. Например, пользователь A прочитал 3 книги, A, B, C, я хочу предицировать рейтинг для книги A и посмотреть, насколько близок предикат от реального рейтинга. Может кто-нибудь дать мне некоторое представление о том, как использовать Lenskit для этого. Я не разрабатываю ни одного веб-сайта, и весь мой код - это просто нормальные java файлы в Eclipse.

user3369592 03 март 2015, в 00:14

Источник

Теги:

java

plugins

prediction

collaborative-filtering

lenskit

1 ответ

Ещё вопросы

Michael Ekstrand · Accepted Answer · 2015-03-04T00-05-00.000Z

2

Лучший ответ

Во-первых, традиционный способ сделать это - кросс-валидация, где вы выполняете надежное рандомизированное разбиение данных на данные обучения и тестовые данные.

LensKit Evaluator поддерживает это. Краткое руководство описывает, как начать работу; также есть быстрый старт, который включает в себя современные передовые методы проведения оценок.

Поэтому вам нужно будет настроить оценку, которая делает следующее:

разделяет ваши данные для оценки
запускает его по алгоритму LensKit, который вы хотите использовать

Michael Ekstrand 04 март 2015, в 00:05

0

благодарю вас. Итак, я просто скачал Lenskit и импортировал его в свой проект Java в Eclipse? Тогда я могу использовать алгоритмы от Lensk с моим набором дат?
user3369592 04 март 2015, в 09:50
1

@ user3369592 В основном да. Я бы порекомендовал использовать Maven, Gradle, Ivy или аналогичный инструмент для импорта LensKit из Maven Central вместо ручной загрузки и импорта. Соответствующий фрагмент Maven находится здесь: lenskit.org/download
Michael Ekstrand 06 март 2015, в 15:04
0

Когда я использую Intellij, чтобы использовать эту демонстрацию github.com/lenskit/lenskit-hello , intellij выдал мне ошибку: EventDAO dao = new SimpleFileRatingDAO (inputFile, delimiter); SimpleFileRatingDAO устарела.
user3369592 09 март 2015, в 02:55
1

@ user3369592, чтобы быть понятным, это предупреждение, а не ошибка; код все равно будет работать нормально. Но SimpleFileRatingDAO устарела в пользу TextEventDAO ; мы просто еще не обновили документы и примеры.
Michael Ekstrand 09 март 2015, в 23:55
0

@ Майкл Экстранд Я использовал Intellij для импорта этого проекта: github.com/lenskit/lenskit-hello. Я также скачал набор данных фильма ml-100l. Затем я изменил Java-файл hello.java "inputFile = new File (" ml-100k / u.data ");" Он выдал "INFO oglkimItemItemBuildContextProvider - создание контекста сборки INFO oglkimItemItemModelBuilder - построил модель для 1682 элементов за 2,947 с", то программа просто остановилась
user3369592 10 март 2015, в 20:41
0

я вывожу объект users и он пуст. Можете ли вы дать мне несколько идей о том, как я могу получить рекомендации для пользователей.
user3369592 10 март 2015, в 20:46
1

@ user3369592 Проект lenskit-hello принимает идентификаторы пользователей в командной строке и выводит рекомендации для этих пользователей. Попробуйте передать «100» в качестве аргумента командной строки.
Michael Ekstrand 11 март 2015, в 00:47
0

@ Майкл ЭкстрандСпасибо за помощь. Я использовал ratingpredicator в своем hello.java, чтобы видеть прогнозируемый рейтинг пользователя в книге. Но теперь я хочу рассчитать общие ошибки предикации для всех пользователей. Я видел эту ссылку: grepcode.com/file/repo1.maven.org/maven2/org.grouplens.lenskit/… Можете ли вы дать мне некоторое представление о том, как использовать этот класс для вычисления общего расхождения предикатов среди всех пользователей (используйте moive- 100К набор данных).
user3369592 11 март 2015, в 22:55
0

ссылка, которую я привел выше, это RMSEPredictMetri: grepcode.com/file/repo1.maven.org/maven2/org.grouplens.lenskit/… . Например, я попробовал с 5 пользователями, и все расхождения предикаций находятся в пределах 0,5 (предикация - реальная оценка), но есть ли какой-нибудь способ, которым мы могли бы видеть общее расхождение предикатов среди всех пользователей?
user3369592 11 март 2015, в 22:57
0

@ user3369592 Для этого и предназначен оценщик; вы можете запустить его самостоятельно, как описано на странице быстрого запуска по ссылке. Вы также можете запустить его из Java-программы, используя класс SimpleEvaluator . Метрики предназначены только для использования внутри оценки.
Michael Ekstrand 12 март 2015, в 20:14
0

Спасибо! Я поставил свой новый вопрос здесь. stackoverflow.com/questions/29023592/...
user3369592 13 март 2015, в 02:01
0

Когда я запускал скрипт, он выдавал ошибку: нет подписи метода: eval.trainTest () не применим для типов аргументов:
user3369592 13 март 2015, в 02:40

Показать ещё 10 комментариев