Панды групповые значения в списке

Question

Панды групповые значения в списке

1

Я пытаюсь вернуть groupby из pandas df. Я хочу, чтобы выходные значения были суммированы, а не merged. Но следующее merges соответствующие lists.

import pandas as pd

d = ({
    'Id' : [1,2,2,1],                 
    'Val' : ['A','B','B','A'],                  
    'Output' : [[1,2,3,4,5],[5,3,3,2,1],[6,7,8,9,1],[6,7,8,9,1]],                       
     })

df = pd.DataFrame(data = d)

df = df.groupby(['Id','Val']).agg({'Output':'sum'}, axis = 1)

Из:

                                Output
Id Val                                
1  A    [1, 2, 3, 4, 5, 6, 7, 8, 9, 1]
2  B    [5, 3, 3, 2, 1, 6, 7, 8, 9, 1]

Предполагаемый выход:

                                Output
Id Val                                
1  A    [7,9,11,13,6]
2  B    [11,10,11,11,2]

jonboy 16 апр. 2019, в 06:09

Источник

Теги:

python

pandas

list

group-by

3 ответа

1

Вы можете изменить list для numpy array затем

df.Output=df.Output.apply(np.array)

df.groupby(['Id','Val']).Output.apply(lambda x : np.sum(x))
Out[389]: 
Id  Val
1   A        [7, 9, 11, 13, 6]
2   B      [11, 10, 11, 11, 2]
Name: Output, dtype: object

Wen-Ben 16 апр. 2019, в 00:29

0

Другое решение, использующее zip вместо использования apply дважды,

df.groupby(['Id','Val']).Output.apply(lambda x: [sum(i) for i in list(zip(*x))])

Id  Val
1   A        [7, 9, 11, 13, 6]
2   B      [11, 10, 11, 11, 2]

Vaishali 16 апр. 2019, в 01:46

Ещё вопросы

U9-Forward · Accepted Answer · 2019-04-16T00-42-00.000Z

Или используйте однострочник, который преобразуется в np.array:

df = df.groupby(['Id','Val']).apply(lambda x: x.Output.apply(np.array).sum())
print(df)

Выход:

Id  Val
1   A        [7, 9, 11, 13, 6]
2   B      [11, 10, 11, 11, 2]
dtype: object

В любом случае проголосую за вас :-)
@ Вэнь-Бен Спасибо, +1 тоже для тебя.