Преобразование кадра данных в пандах из итеративного списка в правильные столбцы и строки [дубликаты]

Question

Преобразование кадра данных в пандах из итеративного списка в правильные столбцы и строки [дубликаты]

1

У меня есть dataframe, который выглядит

Country | IndicatorName | Value
Spain   | Indicator1    | 3
Spain   | Indicator2    | 4
Germany | Indicator16   | 24
......

И я хочу преобразовать его в dataframe с столбцами IndicatorName, рядами Country и пересечениями значений

Country | Indicator 1 | Indicator 2 | Indicator 3 | ......
Spain   |     3       |     4       |   16        | ......
Germany |     23      |     232     |   232       | ......
.......

Я пытаюсь через groupby (["IndicatorName", "Value"]), но не уверен, как действовать

import pandas as pd
indicators = pd.read_csv("Indicators.csv")
indicators.groupbby(["IndicatorName","Value"])
.....

Есть ли подходящий способ справиться с этим или это нужно делать с помощью итерации?

Arkaitz Jimenez 01 дек. 2018, в 17:06

Источник

Теги:

python

pandas

dataframe

machine-learning

2 ответа

Ещё вопросы

Francisco · Answer 1 · 2018-12-01T13-32-00.000Z

Я не уверен в формате inital df, так как желаемый df имеет разные значения.

Помогает ли ниже?

df = pd.DataFrame({'Country' : ['Spain', 'Spain', 'Germany'],
                   'IndicatorName':['Indicator1', 'Indicator2', 'Indicator16'],
                  'Value':[3, 4, 24]
                  })


df.pivot(index = 'Country', columns='IndicatorName', values='Value').fillna(0)


IndicatorName   Indicator1  Indicator16     Indicator2
    Country             
    Germany            0.0        24.0              0.0
    Spain              3.0         0.0              4.0

@arkaitz Jimenez Я пока не могу комментировать ваш пост. Это было очень полезно для меня в сводках stackoverflow.com/questions/47152691/how-to-pivot-a-dataframe
Я получаю "ValueError: Индекс содержит повторяющиеся записи, не может изменить форму"
Привет! См. Выше ответ на вопрос 1 ответ. Это происходит потому, что pandas пытается переиндексировать столбцы или индексный объект с повторяющимися записями. Существуют различные методы, которые могут использовать для разворота. Некоторые из них не очень подходят, когда есть дубликаты клавиш, в которых его просят повернуть. Вам необходимо использовать pivot_table () и некоторую форму функции агрегирования
Да я думаю это именно то что мне нужно

Joe · Answer 2 · 2018-12-01T13-39-00.000Z

Я думаю, что вам нужна pivot:

df1 = df.pivot(index='Country', columns='IndicatorName', values='Value')

Вывод строк вашего примера:

IndicatorName  Indicator1  Indicator16  Indicator2
Country                                           
Germany               NaN         24.0         NaN
Spain                 3.0          NaN         4.0