Непоследовательные результаты при добавлении нового столбца в Pandas DataFrame. Это серия или ценность?

Question

Непоследовательные результаты при добавлении нового столбца в Pandas DataFrame. Это серия или ценность?

1

Так что я знаю, что могу добавить новый столбец в Пандах вот так:

df
=====
  A
1 5
2 6
3 7

df['new_col'] = "text"

df
====
  A    new_col
1 5    text
2 6    text
3 7    text

И я также могу установить новый столбец на основе операции над существующим столбцом.

def times_two(x):
    return x * 2

df['newer_col'] = time_two(df.a)
df
====
  A    new_col   newer_col
1 5    text      10
2 6    text      12
3 7    text      14

однако, когда я пытаюсь работать с текстовым столбцом, я получаю неожиданный AttributeError.

df['new_text'] = df['new_col'].upper()
AttributeError: 'Series' object has no attribute 'upper'

Теперь он рассматривает значение как серию, а не значение в этой "ячейке".

Почему это происходит с текстом, а не с числами, и как можно обновить мой DF новым столбцом на основе существующего текстового столбца?

Matt O'Neill 12 апр. 2019, в 17:48

Источник

Теги:

python

pandas

dataframe

1 ответ

Ещё вопросы

EdChum · Answer 1 · 2019-04-12T13-40-00.000Z

1

Это потому, что оператор * реализован как оператор mul а upper не определен для Series. Вы должны использовать str.upper который реализован для Series:

In[53]:
df['new_text'] = df['new_col'].str.upper()
df

Out[53]: 
   A new_col new_text
1  5    text     TEXT
2  6    text     TEXT
3  7    text     TEXT

EdChum 12 апр. 2019, в 13:40

0

Привет. Так что спасибо тебе. Я понял, что здесь происходит что-то более низкое. Мой фактический вариант использования пытается sha256 кодировать текстовое поле. Сначала он должен быть закодирован в utf-8. Когда я пытаюсь выполнить любую операцию с текстовым полем, включая кодирование, я получаю сообщение об ошибке. Является ли решение для передачи версии .str?
Matt O'Neill 12 апр. 2019, в 18:23
0

Если мой ответ разрешил ваш вопрос, то не забудьте принять его, в левом верхнем углу моего ответа будет пустая галочка.
EdChum 12 апр. 2019, в 18:34
0

Я сделал. Но по какой-то причине SO решил убрать мои очки с прошлого десятилетия и вернуть меня к нулю. Поэтому, пока я проголосовал за ваш комментарий, он не позволит мне его показать.
Matt O'Neill 12 апр. 2019, в 20:51
0

Извините, но не одобряю, но принимаю, как при нажатии на галочку, чтобы он стал зеленым
EdChum 12 апр. 2019, в 21:09
0

сделанный. извиняюсь. Я не знал об этом
Matt O'Neill 12 апр. 2019, в 21:13
0

Хорошо. Так что теперь, когда я передаю это, я вижу, что это «<class 'pandas.core.strings.StringMethods'>», и это все еще не обрабатывает это правильно. Любое дальнейшее руководство?
Matt O'Neill 13 апр. 2019, в 09:01
0

Извините, вам нужно отправить код, а не описание ошибки
EdChum 13 апр. 2019, в 09:06
0

Я сделаю. Но похоже, что даже при использовании атрибутов .str он не передает правильную строку. Это что-то вроде строки pans, и она вызывает кодирование ('utf-8') для barf.
Matt O'Neill 13 апр. 2019, в 10:19

Показать ещё 6 комментариев