Преобразуйте двумерный массив Numpy в панды DataFrame со значением столбец-строка

Question

Преобразуйте двумерный массив Numpy в панды DataFrame со значением столбец-строка

1

Предположим, у меня есть массив двумерных чисел:

arr = np.array([[1, 2], [3, 4], [5, 6]])
# array([[1, 2],
#        [3, 4],
#        [5, 6]])

Как можно преобразовать это в "длинную" структуру с одной записью на значение, связанную с индексом строки и столбца? В этом случае это будет выглядеть так:

df = pd.DataFrame({'row': [0, 0, 1, 1, 2, 2],
                  'column': [0, 1, 0, 1, 0, 1],
                  'value': [1, 2, 3, 4, 5, 6]})

melt присваивает только идентификатор столбца, а не строку:

pd.DataFrame(arr).melt()
#   variable    value
# 0        0        1
# 1        0        3
# 2        0        5
# 3        1        2
# 4        1        4
# 5        1        6

Есть ли способ привязать идентификатор строки?

Max Ghenis 01 дек. 2018, в 08:08

Источник

0

Для эффективных решений с использованием NumPy - stackoverflow.com/questions/46135070/…
Divakar 01 дек. 2018, в 07:36

Теги:

python

pandas

numpy

2 ответа

1

melt может использовать индекс, если он столбец:

arrdf = pd.DataFrame(arr)
arrdf['row'] = arrdf.index
arrdf.melt(id_vars='row', var_name='column')

#    row    column  value
# 0    0         0      1
# 1    1         0      3
# 2    2         0      5
# 3    0         1      2
# 4    1         1      4
# 5    2         1      6

Max Ghenis 01 дек. 2018, в 05:02

Ещё вопросы

Для эффективных решений с использованием NumPy - stackoverflow.com/questions/46135070/…

W-B · Accepted Answer · 2018-12-01T04-37-00.000Z

Передать index idvar:

pd.DataFrame(arr).reset_index().melt('index')
#    index variable  value
# 0      0        0      1
# 1      1        0      3
# 2      2        0      5
# 3      0        1      2
# 4      1        1      4
# 5      2        1      6

Вы можете переименовать:

df = pd.DataFrame(arr).reset_index().melt('index')
df.columns = ['row', 'column', 'value']