У меня есть файл "csv", который содержит идентификатор пользователя, книгу, которую он прочитал, рейтинг для каждой книги. Я хочу использовать Lenskit для прогнозирования книжного рейтинга для пользователя. Например, пользователь A прочитал 3 книги, A, B, C, я хочу предицировать рейтинг для книги A и посмотреть, насколько близок предикат от реального рейтинга. Может кто-нибудь дать мне некоторое представление о том, как использовать Lenskit для этого. Я не разрабатываю ни одного веб-сайта, и весь мой код - это просто нормальные java файлы в Eclipse.
Во-первых, традиционный способ сделать это - кросс-валидация, где вы выполняете надежное рандомизированное разбиение данных на данные обучения и тестовые данные.
LensKit Evaluator поддерживает это. Краткое руководство описывает, как начать работу; также есть быстрый старт, который включает в себя современные передовые методы проведения оценок.
Поэтому вам нужно будет настроить оценку, которая делает следующее: