Сдвиг рядов в панде df

Question

Сдвиг рядов в панде df

1

Я пытаюсь shift значения в pandas df. В частности, rows которые соответствуют определенному value. Для df ниже я хочу shift row влево, когда указанное выше значение равно == 'X'.

d = ({
    'A' : ['Foo','','Foo',''],           
    'B' : ['X','Bar','X','Bar'],
    'C' : ['','Y','','Y'],
    })

df = pd.DataFrame(data=d)

Из:

     A    B  C
0  Foo    X   
1       Bar  Y
2  Foo    X   
3       Bar  Y

Я пробовал это:

b = ['X']
x = df.B=='X'
df.loc[x, b] = df.loc[x, b].apply(lambda x: x.shift(-1), axis=1)

Предполагаемый результат:

     A  B C
0  Foo  X  
1  Bar  Y  
2  Foo  X  
3  Bar  Y

Хотя эти strings идентичны, мой набор данных меняется. Foo будет таким же, но string, следующая за X будет отличаться. Поэтому я не могу просто выбрать " Bar и shift row влево. Мне нужно что-то, что найдет row ниже X и сдвинется влево

Jeremy Alexander 27 июль 2018, в 03:11

Источник

0

X только в столбце B?
rafaelc 27 июль 2018, в 00:49
0

Ага. Это не дублируется нигде @RafaelC.
user9410826 27 июль 2018, в 00:53

Теги:

python

pandas

3 ответа

1

Ты можешь сделать

df.replace('',np.nan).apply(lambda x: sorted(x, key=pd.isnull), 1).fillna('')
Out[538]: 
     A  B C
0  Foo  X  
1  Bar  Y  
2  Foo  X  
3  Bar  Y

Wen 26 июль 2018, в 23:38

0

Выдает серию списков здесь?
rafaelc 27 июль 2018, в 01:07
0

@RafaelC что ты имеешь ввиду здесь списки?
WeNYoBen 27 июль 2018, в 01:19
0

Я получаю pd.Series lists , например, 0 [Foo, X, nan] 1 [Bar, Y, nan] 2 [Foo, X, nan] 3 [Foo, W, P] 4 [Bar, Y, nan] dtype: object
rafaelc 27 июль 2018, в 01:27
0

@RafaelC IDK, почему у вас есть список здесь, но с моей стороны он возвращает фрейм данных
WeNYoBen 27 июль 2018, в 01:28
0

Это странно :) imgur.com/wXeKDIM с использованием панд 0,23
rafaelc 27 июль 2018, в 01:30
0

@RafaelC, может быть, перезагрузить свой Jupter
WeNYoBen 27 июль 2018, в 01:32

Показать ещё 4 комментария

1

Если вы просто хотите избавиться от пустых значений, вы можете использовать понимание списка, а затем pd.DataFrame конструктор pd.DataFrame:

res = pd.DataFrame([list(filter(None, row)) for row in df.values.tolist()],
                   columns=df.columns[:2])

print(res)

     A  B
0  Foo  X
1  Bar  Y
2  Foo  X
3  Bar  Y

jpp 26 июль 2018, в 23:36

1

Это здорово, держу пари, это будет очень быстро
WeNYoBen 27 июль 2018, в 01:22

Ещё вопросы

Ага. Это не дублируется нигде @RafaelC.
@RafaelC что ты имеешь ввиду здесь списки?
Я получаю pd.Series lists , например, 0 [Foo, X, nan] 1 [Bar, Y, nan] 2 [Foo, X, nan] 3 [Foo, W, P] 4 [Bar, Y, nan] dtype: object
@RafaelC IDK, почему у вас есть список здесь, но с моей стороны он возвращает фрейм данных
Это странно :) imgur.com/wXeKDIM с использованием панд 0,23
@RafaelC, может быть, перезагрузить свой Jupter
Это здорово, держу пари, это будет очень быстро

RafaelC · Accepted Answer · 2018-07-26T23-07-00.000Z

IIUC

s = (df == 'X').any(1)
idx_to_change = s[s].index+1
df.loc[idx_to_change,:] = df.loc[idx_to_change].shift(-1,axis=1)

df.fillna('')

    A   B   C
0   Foo X   
1   Bar Y
2   Foo X   
3   Bar Y