Изменить dict в ячейке данных

Question

Изменить dict в ячейке данных

1

У меня есть кадр данных pandas. В каждой клетке есть dict:

id | A                | B              | ...
1  | {"a": 1, "b":1}  |{"d": 1, "e":1} | ...
2  | {"a": 2, "b":3}  |{"d": 5, "e":6} | ...
...
10  | {"a": 1, "b":1}  |{"d": 1, "e":3} | ...

Я хотел бы обновить одну ячейку (ei 1, A):

df.loc[1,"A"].update({"c":2})

Эта процедура обновляет каждую отдельную ячейку, которая имеет тот же самый dict, поэтому в этом случае будет (1, A и 10, A будет изменено):

id | A                       
1  | {"a": 1, "b":1, "c":2}  
2  | {"a": 2, "b":3}         
...
10  | {"a": 1, "b":1, "c":2}

Как заставить python обновлять только 1, A?

Вот как я создаю фрейм данных:

df = pd.read_csv( file_path, sep='\t', names=['id', 'A'], compression='gzip', converters={1:ast.literal_eval})

ruan 19 сен. 2018, в 14:56

Источник

1

Похоже, у вас есть представления словарей, хранящихся по всему вашему dataframe. Поэтому, если вы измените один, вы измените все остальные. Может быть, сделать тест, чтобы увидеть, если 1, A и 10, A являются одним и тем же объектом
Yuca 19 сен. 2018, в 12:21
0

чтобы добавить к комментарию @Yuca, вы должны думать о столбце dicts как о столбце указателей на dicts (и то, что вы увидите, произойдет, если две строки имеют одинаковое значение указателя)
IanS 19 сен. 2018, в 12:23
0

Любые идеи, как я могу построить DF, чтобы избежать проблемы? @Yuca
ruan 19 сен. 2018, в 12:29
0

честно говоря, у меня нет опыта с этим. Похоже, у вас очень чистая конструкция, поэтому мое первое предположение - проверить, есть ли параметр для read_csv который помогает
Yuca 19 сен. 2018, в 12:34
0

@IanS Честно говоря, работать с указателями не моя цель. Они сделали себя спонтанными ...
ruan 19 сен. 2018, в 12:40
0

Для меня это работает хорошо, но в Python 3.6. Можете ли вы использовать cols = ['A','B'] df[cols] = df[cols].applymap(ast.literal_eval) вместо converters={1:ast.literal_eval} ?
jezrael 19 сен. 2018, в 12:52
0

@ruan, Юка предлагает вам попробовать df.loc[1,"A"] is df.loc[10,"A"] чтобы увидеть, одинаковы ли они (или аналогично посмотреть, если id(df.loc[1,"A"]) и id(df.loc[10,"A"]) совпадают)
IanS 19 сен. 2018, в 13:44
0

@jezrael - ничего не изменилось
ruan 20 сен. 2018, в 05:19
0

@ruan - Так все же проблема? Одно - нужны ли словари?
jezrael 20 сен. 2018, в 05:20
0

@IanS - идентификаторы одинаковые; / В этом проблема - но я действительно не знаю, почему; /
ruan 20 сен. 2018, в 05:20
0

@jezrael - все то же самое; (Кажется, это невозможно. Было бы здорово использовать дикты в моем случае.
ruan 20 сен. 2018, в 06:06
0

Мое решение сработало?
IanS 21 сен. 2018, в 07:42

Показать ещё 10 комментариев

Теги:

python

pandas

dataframe

dictionary

python-2.7

1 ответ

Ещё вопросы

Похоже, у вас есть представления словарей, хранящихся по всему вашему dataframe. Поэтому, если вы измените один, вы измените все остальные. Может быть, сделать тест, чтобы увидеть, если 1, A и 10, A являются одним и тем же объектом
чтобы добавить к комментарию @Yuca, вы должны думать о столбце dicts как о столбце указателей на dicts (и то, что вы увидите, произойдет, если две строки имеют одинаковое значение указателя)
Любые идеи, как я могу построить DF, чтобы избежать проблемы? @Yuca
честно говоря, у меня нет опыта с этим. Похоже, у вас очень чистая конструкция, поэтому мое первое предположение - проверить, есть ли параметр для read_csv который помогает
@IanS Честно говоря, работать с указателями не моя цель. Они сделали себя спонтанными ...
Для меня это работает хорошо, но в Python 3.6. Можете ли вы использовать cols = ['A','B'] df[cols] = df[cols].applymap(ast.literal_eval) вместо converters={1:ast.literal_eval} ?
@ruan, Юка предлагает вам попробовать df.loc[1,"A"] is df.loc[10,"A"] чтобы увидеть, одинаковы ли они (или аналогично посмотреть, если id(df.loc[1,"A"]) и id(df.loc[10,"A"]) совпадают)
@ruan - Так все же проблема? Одно - нужны ли словари?
@IanS - идентификаторы одинаковые; / В этом проблема - но я действительно не знаю, почему; /
@jezrael - все то же самое; (Кажется, это невозможно. Было бы здорово использовать дикты в моем случае.

IanS · Answer 1 · 2018-09-20T05-38-00.000Z

Как указано в комментариях, оба словаря в [1, "A"] и [10, "A"] одинаковы, поэтому вы не можете обновлять их без обновления другого.

Хотя я не понимаю, почему это происходит, глубокое копирование словаря в каждой ячейке решает проблему:

import copy
df = df.applymap(lambda d: copy.deepcopy(d))