Хотите MultiIndex для строк и столбцов с read_csv

1

Мой. CSV файл выглядит так:

Area    When    Year    Month   Tickets
City    Day     2015    1       14
City    Night   2015    1       5
Rural   Day     2015    1       18
Rural   Night   2015    1       21
Suburbs Day     2015    1       15
Suburbs Night   2015    1       21
City    Day     2015    2       13

содержащий 75 строк. Я хочу, чтобы строка multiindex и столбец multiindex выглядели следующим образом:

Area         City        Rural         Suburbs
When         Day Night   Day Night     Day Night
Year Month
2015 1       5.0   3.0  22.0  11.0    13.0   2.0
     2      22.0   8.0   4.0  16.0     6.0  18.0
     3      26.0  25.0  22.0  23.0    22.0   2.0
2016 1      20.0  25.0  39.0  14.0     3.0  10.0
     2       4.0  14.0  16.0  26.0     1.0  24.0
     3      22.0  17.0   7.0  24.0    12.0  20.0 

Я прочитал документ.read_csv на странице https://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html.

Я могу получить строку multiindex с:

df2 = pd.read_csv('c:\\Data\Tickets.csv', index_col=[2, 3])

Я пробовал:

df2 = pd.read_csv('c:\\Data\Tickets.csv', index_col=[2, 3], header=[1, 3, 5])

мышление [1, 3, 5] выбирает "Город", "Сельское" и "Пригород". Как получить желаемый столбец multiindex, показанный выше?

Теги:
pandas
multi-index

1 ответ

1

Похоже, вам нужно pivot_table с несколькими индексами и несколькими столбцами.

Начните с простого чтения вами csv прямо

df = pd.read_csv('Tickets.csv')

затем

df.pivot_table(index=['Year', 'Month'], columns=['Area', 'When'], values=['Tickets'])

С предоставленными вами входными данными вы получите

Area             City           Rural            Suburbs
When             Day    Night   Day     Night    Day    Night
Year    Month                       
2015    1        14.0   5.0     18.0    21.0     15.0   21.0
        2        13.0   NaN     NaN     NaN      NaN    NaN
  • 1
    Спасибо, РафаэльC!

Ещё вопросы

Сообщество Overcoder
Наверх
Меню