Удаление функции нулевого значения без переустановки в SciKit-Learn GradientBoostingClassifier

1

После установки GradientBoostingClassifier в SciKit-Learn некоторые функции имеют нулевое значение.

Мое понимание заключается в том, что нулевое значение будет означать, что в этой функции не будет разбиений.

Если я попытаюсь предсказать использование набора данных, который не включает эту функцию, тогда он выдает ошибку за отсутствие всех функций.

Конечно, я понимаю, что могу удалить ненужные функции, но я бы предпочел не изменять уже подходящую модель. (Если я удалю ненулевые функции важности и вернусь, я получу немного другую модель.)

Является ли это ошибкой, что модель требует нулевой важности, чтобы делать прогнозы или есть что-то о нулевых значениях, о которых я не думаю? Есть ли работа, чтобы получить ту же самую модель?

(Я задаю вопрос о том, почему это имеет значение - поскольку из-за необходимости использования функций с нулевой важностью вытягивание большего количества столбцов из очень большой базы данных, и это выглядит неряшливо, чтобы включить функцию в модель, которая ничего не делает).

Теги:
machine-learning
scikit-learn

1 ответ

0
Лучший ответ

Это не ошибка, а ожидаемое поведение. Scikit не будет делать предположений после того, как модель будет обучена тому, какие функции должны были быть включены или нет.

Вместо этого, когда вы называете fit для модели, подразумевается неявное предположение, что вы уже выполнили выбор функции для удаления функций, которые не будут важны для модели. Как только это оправдано, ожидается, что вы предоставите набор данных того же размера, который использовался для соответствия модели независимо от того, важны ли эти функции или нет.

Ещё вопросы

Сообщество Overcoder
Наверх
Меню