Как построить график для модели множественной линейной регрессии с помощью matplotlib

Question

Как построить график для модели множественной линейной регрессии с помощью matplotlib

1

Я пытаюсь установить модель с несколькими линейными регрессиями

Y = c + a1.X1 + a2.X2 + a3.X3 + a4.X4 +a5X5 + a6X6

Если бы у моей модели было всего 3 переменных, я бы использовал 3D-график для построения. Как это сделать? Я в основном хочу посмотреть, как выглядит линия наилучшего соответствия или мне нужно построить график разброса и увидеть влияние отдельной переменной Y = a1X1, когда все остальные равны нулю и видят наилучшую линию соответствия. Каков наилучший подход для этих моделей. Я знаю, что невозможно визуализировать более высокие измерения, чтобы знать, какой должен быть лучший подход. Я отчаянно хочу видеть линию наилучшего соответствия

nithin 19 сен. 2018, в 14:14

Источник

0

Попробуйте использовать tsne , метод уменьшения размерности, который особенно хорошо подходит для визуализации многомерных наборов данных
Kalsi 19 сен. 2018, в 11:35
0

Одно визуальное приближение состоит в том, чтобы определить, какие два параметра оказывают наибольшее влияние на Y, а затем построить трехмерный график. Если у вас нет только двух наиболее влиятельных, само по себе это приближение не очень полезно.
James Phillips 19 сен. 2018, в 12:34
1

Я сделал это, а также использовал PCA спасибо
nithin 19 сен. 2018, в 12:35
0

@nithin, почему вы отчаянно пытаетесь представить наиболее подходящую линию? На какие вопросы ответит визуализация, на которую вы не можете ответить в настоящее время?
duhaime 19 сен. 2018, в 12:59
0

theanalysisfactor.com/… Я читал это, хотел посмотреть, как лучше всего выглядит мультилинейный, прежде чем я попробую полиномиальный регистр
nithin 19 сен. 2018, в 13:09
1

@ В этом посте блога рекомендуется использовать «одномерные и двумерные проверки ваших данных», чтобы определить, следует ли вам использовать полиномиальные термины - пробовали ли вы это?
duhaime 19 сен. 2018, в 14:34
0

@ Duhaime нет, я не делал
nithin 20 сен. 2018, в 05:44
1

@duhaime поднимает хороший вопрос. Лично я заметил, что - иногда - визуальные проверки графиков рассеяния «Y» против каждого «X» дали некоторое представление о проблеме. Поскольку их так легко и быстро как сделать, так и проверить, стоит попробовать.
James Phillips 20 сен. 2018, в 15:07
1

Договорились, я сделал некоторую визуализацию, поставлю, что
nithin 20 сен. 2018, в 15:09

Показать ещё 7 комментариев

Теги:

python

machine-learning

matplotlib

regression

linear-regression

2 ответа

0

Вы можете попытаться визуализировать, насколько хорошо работает ваша модель, сравнивая фактические и прогнозируемые значения. Предполагая, что наши действительные значения хранятся в Y, а предсказанные в Y_, мы могли бы построить и сравнить оба.

import seaborn as sns

ax1 = sns.distplot(Y, hist=False, color="r", label="Actual Value")
sns.distplot(Y_, hist=False, color="b", label="Fitted Values" , ax=ax1)

Евгений Курьян 14 июнь 2019, в 16:21

Ещё вопросы

Попробуйте использовать tsne , метод уменьшения размерности, который особенно хорошо подходит для визуализации многомерных наборов данных
Одно визуальное приближение состоит в том, чтобы определить, какие два параметра оказывают наибольшее влияние на Y, а затем построить трехмерный график. Если у вас нет только двух наиболее влиятельных, само по себе это приближение не очень полезно.
Я сделал это, а также использовал PCA спасибо
@nithin, почему вы отчаянно пытаетесь представить наиболее подходящую линию? На какие вопросы ответит визуализация, на которую вы не можете ответить в настоящее время?
theanalysisfactor.com/… Я читал это, хотел посмотреть, как лучше всего выглядит мультилинейный, прежде чем я попробую полиномиальный регистр
@ В этом посте блога рекомендуется использовать «одномерные и двумерные проверки ваших данных», чтобы определить, следует ли вам использовать полиномиальные термины - пробовали ли вы это?
@duhaime поднимает хороший вопрос. Лично я заметил, что - иногда - визуальные проверки графиков рассеяния «Y» против каждого «X» дали некоторое представление о проблеме. Поскольку их так легко и быстро как сделать, так и проверить, стоит попробовать.
Договорились, я сделал некоторую визуализацию, поставлю, что

nithin · Accepted Answer · 2018-09-23T07-11-00.000Z

Я нашел этот пост, который был более полезным и последовал
https://stats.stackexchange.com/questions/73320/how-to-visualize-a-fitted-multiple-regression-model. Основываясь на предложениях, я в настоящее время просто рисую диаграммы рассеяния, такие как зависимая переменная vs. 1-я независимая переменная, а затем вторая независимая переменная и т.д. Я делаю то же самое. Я, возможно, не смогу увидеть линию наилучшего соответствия для полной модели, но я знаю, как она зависит от отдельной переменной

from sklearn.linear_model import LinearRegression
train_copy = train[['OverallQual', 'AllSF','GrLivArea','GarageCars']]
train_copy =pd.get_dummies(train_copy)
train_copy=train_copy.fillna(0)
linear_regr_test = LinearRegression()

fig, axes = plt.subplots(1,len(train_copy.columns.values),sharey=True,constrained_layout=True,figsize=(30,15))

for i,e in enumerate(train_copy.columns):
  linear_regr_test.fit(train_copy[e].values[:,np.newaxis], y.values)
  axes[i].set_title("Best fit line")
  axes[i].set_xlabel(str(e))
  axes[i].set_ylabel('SalePrice')
  axes[i].scatter(train_copy[e].values[:,np.newaxis], y,color='g')
  axes[i].plot(train_copy[e].values[:,np.newaxis], 
  linear_regr_test.predict(train_copy[e].values[:,np.newaxis]),color='k')