Оценить производительность произвольного леса с помощью R-Squared

1

Я хочу оценить производительность теста случайного лесного регресса в Python и, помимо выполнения кросс-валидации на тренировочном наборе, интересно, целесообразно ли выполнять какой-либо корреляционный анализ между прогнозируемыми результатами Y-теста и фактические результаты Y испытаний?

Мое, возможно, упрощенное мышление заключается в том, что значительная корреляция между ними будет означать, что предсказанный Y согласуется с фактическим тестом Y и, как таковой, прогнозы хорошие...

Любые альтернативные предложения более чем приветствуются. Благодарю.

  • 0
    Я бы спросил об этом в стеке обмена "информатика". StackOverflow больше подходит для вопросов типа программирования
Теги:
random-forest
correlation

1 ответ

2
Лучший ответ

Вы можете запустить корреляционный анализ, который уместен, но если корреляция большая, это не всегда так, что ваша модель хороша. Вы также должны взглянуть на вариант. Также зависит от того, какую задачу вы решаете (классификация, сегментация, регрессия и т.д.), Вы можете использовать показатели для определения того, насколько хорошо вы прогнозируете. Здесь вы можете найти различные показатели: http://scikit-learn.org/stable/modules/model_evaluation.html.

Ещё вопросы

Сообщество Overcoder
Наверх
Меню