разделять / разбивать значения строк и формировать отдельные строки

Question

разделять / разбивать значения строк и формировать отдельные строки

1

воспроизводимый код для данных:

import pandas as pd
dict = {"a": "[1,2,3,4]", "b": "[1,2,3,4]"}
dict = pd.DataFrame(list(dict.items()))

dict

    0   1
 0  a   [1,2,3,4]
 1  b   [1,2,3,4]

Я хотел разделить/разграничить "столбец 1" и создать отдельные строки для каждого значения split.

ожидаемый результат:

Должен ли я сначала удалить скобки, а затем разделить значения? Я действительно не понимаю, как это сделать. Любая ссылка, которая поможет мне решить это, пожалуйста?

vishnu prashanth 14 июнь 2018, в 15:36

Источник

Теги:

python

reshape

delimiter

2 ответа

2

Основываясь на логике этого ответа:

s = d[1]\
    .apply(lambda x: pd.Series(eval(x)))\
    .stack()

s.index = s.index.droplevel(-1)
s.name = "split"
d.join(s).drop(1, axis=1)

koPytok 14 июнь 2018, в 11:34

0

Спасибо Копыток, Это решение тоже сработало. Я чувствовал, что другой легче понять и интерпретировать. Еще раз спасибо за решение :)
vishnu prashanth 14 июнь 2018, в 13:30

Ещё вопросы

Спасибо Копыток, Это решение тоже сработало. Я чувствовал, что другой легче понять и интерпретировать. Еще раз спасибо за решение :)

Ben.T · Accepted Answer · 2018-06-14T10-28-00.000Z

Поскольку у вас есть строки, содержащие список (а не списки) в ваших ячейках, вы можете использовать eval:

dict_v = {"a": "[1,2,3,4]", "b": "[1,2,3,4]"}
df = pd.DataFrame(list(dict_v.items()))
df = (df.rename(columns={0:'l'}).set_index('l')[1]
          .apply(lambda x: pd.Series(eval(x))).stack()
           .reset_index().drop('level_1',1).rename(columns={'l':0,0:1}))

или другим способом может быть создание DataFrame (возможно, быстрее), например:

df = (pd.DataFrame(df[1].apply(eval).tolist(),index=df[0])
          .stack().reset_index(level=1, drop=True)
            .reset_index(name='1'))

ваш выход

все переименовываются, чтобы получить именно ваш вход/выход

Спасибо Бен! Это решение сработало :)