Оценить производительность произвольного леса с помощью R-Squared

Question

Оценить производительность произвольного леса с помощью R-Squared

1

Я хочу оценить производительность теста случайного лесного регресса в Python и, помимо выполнения кросс-валидации на тренировочном наборе, интересно, целесообразно ли выполнять какой-либо корреляционный анализ между прогнозируемыми результатами Y-теста и фактические результаты Y испытаний?

Мое, возможно, упрощенное мышление заключается в том, что значительная корреляция между ними будет означать, что предсказанный Y согласуется с фактическим тестом Y и, как таковой, прогнозы хорошие...

Любые альтернативные предложения более чем приветствуются. Благодарю.

DC_Liv 28 авг. 2018, в 17:18

Источник

0

Я бы спросил об этом в стеке обмена "информатика". StackOverflow больше подходит для вопросов типа программирования
ForeverStudent 28 авг. 2018, в 15:22

Теги:

python

random-forest

correlation

1 ответ

Ещё вопросы

Я бы спросил об этом в стеке обмена "информатика". StackOverflow больше подходит для вопросов типа программирования

Vage Egiazarian · Accepted Answer · 2018-08-28T13-54-00.000Z

Вы можете запустить корреляционный анализ, который уместен, но если корреляция большая, это не всегда так, что ваша модель хороша. Вы также должны взглянуть на вариант. Также зависит от того, какую задачу вы решаете (классификация, сегментация, регрессия и т.д.), Вы можете использовать показатели для определения того, насколько хорошо вы прогнозируете. Здесь вы можете найти различные показатели: http://scikit-learn.org/stable/modules/model_evaluation.html.