У меня есть df как следующий
email | date | type
_________________________
[email protected] | 6/1 | order
[email protected] | 6/1 | return
[email protected] | 6/2 | return
[email protected] | 6/2 | return
Я пытаюсь индивидуализировать тип столбца в каждой строке, сохраняя данные
email | date | order | return
_________________________________
[email protected] | 6/1 | 1 | 0
[email protected] | 6/1 | 0 | 1
[email protected] | 6/2 | 0 | 0
[email protected] | 6/2 | 0 | 0
Я пытался использовать pd.melt
но результат, похоже, не тот, что я ищу. ссылка на базу данных данных Pandas с исходными значениями строк и столбцов
Вы должны посмотреть, как создавать фиктивные переменные из категориальных столбцов.
Существует хорошая функция Pandas для достижения названного "get_dummies":
https://pandas.pydata.org/pandas-docs/stable/generated/pandas.get_dummies.html
df.drop('type', 1).join(pd.get_dummies(df['type']))
email date order return
0 [email protected] 6/1 1 0
1 [email protected] 6/1 0 1
2 [email protected] 6/2 0 1
3 [email protected] 6/2 0 1
return
нормально, что третья и четвертая строки имеют ноль вместо 1? Можете ли вы объяснить, чего вы пытаетесь достичь? получать только тогда, когдаemail
[email protected]
? То, что вы показали как желаемый результат, на самом деле не выглядит для меня транспонированием