Мне нужна помощь с Пандами.
У меня есть следующий фреймворк:
df = pd.DataFrame({'1Country': ['FR', 'FR', 'GER','GER','IT','IT', 'FR','GER','IT'],
'2City': ['Paris', 'Paris', 'Berlin', 'Berlin', 'Rome', 'Rome','Paris','Berlin','Rome'],
'F1': ['A', 'B', 'C', 'B', 'B', 'C', 'A', 'B', 'C'],
'F2': ['B', 'C', 'A', 'A', 'B', 'C', 'A', 'B', 'C'],
'F3': ['C', 'A', 'B', 'C', 'C', 'C', 'A', 'B', 'C']})
Я пытаюсь сделать groupby
на первых двух колонках 1Country
и 2City
и делать value_counts
на колонках F1
и F2
. До сих пор я мог только делать groupby и value_counts
по 1 столбцу за раз с
df.groupby(['1Country','2City'])['F1'].apply(pd.Series.value_counts)
Как я могу сделать value_counts
в нескольких столбцах и получить datframe в результате?
Вы можете использовать agg
, что-то вроде этого:
df.groupby(['1Country','2City']).agg({i:'value_counts' for i in df.columns[2:]})
F1 F2 F3
FR Paris A 2.0 1.0 2.0
B 1.0 1.0 NaN
C NaN 1.0 1.0
GER Berlin A NaN 2.0 NaN
B 2.0 1.0 2.0
C 1.0 NaN 1.0
IT Rome B 1.0 1.0 NaN
C 2.0 2.0 3.0
Вы можете передать dict в agg
следующим образом:
df.groupby(['1Country', '2City']).agg({'F1': 'value_counts', 'F2': 'value_counts'})