Панды - заменить знаки% в данных и вернуть их обратно

Question

Панды - заменить знаки% в данных и вернуть их обратно

1

У меня есть следующий df:

Name   Jan_2018   Feb_2018  Mar_2018
A      33%        40%       42%
B      20%        35%       50%
C      21%        31%       12%

Я делаю некоторые операции с числовыми данными (суммы, средние и т.д.), Поэтому мне нужно удалить знак%, поэтому панды могут перестать рассматривать их как строки. Однако мой выпуск должен иметь знак%.

Кроме того, я не могу кодировать любые столбцы, так как в будущем может быть добавлено больше.

Какой самый простой способ удалить знаки% от числовых данных и добавить их обратно позже?

JesusMonroe 26 сен. 2018, в 17:21

Источник

3

df.replace({'%':'', regex=True) и добавить обратно df.astype(str).add('%') . Может понадобиться pd.to_numeric в середине, чтобы сделать столбцы int dtype
rafaelc 26 сен. 2018, в 15:02

Теги:

python

pandas

dataframe

3 ответа

0

Удаление % из блока данных pandas.

df.replace({'%': ''}, regex=True)

Или если вы хотите заменить конкретный столбец, то:

df['some_col'].replace({'%': ''}, regex=True)

df['some_col'] = df['some_col'].replace({'%':''}, regex=True)

Атрибут str для каждого документа

df['some_col'] = df['some_col'].str.replace('%', '')

другой хороший пример вообще игнорирует символы и выбирает только числовые значения с помощью pandas:

Используйте str.strip, если префикс исправлен или str.replace, если нет:

data = pandas.Series(["U$ 192.0"])
data.str.replace('^[^\d]*', '').astype(float)

Это удаляет все нечисловые символы слева от числа и отбрасывает на float.

pygo 26 сен. 2018, в 13:56

0

Удалите %

df=df.apply(lambda x : x.str.rstrip('%'))
df
#df=df.apply(pd.to_numeric,errors='ignore')

Out[156]: 
  Name Jan_2018 Feb_2018 Mar_2018
0    A       33       40       42
1    B       20       35       50
2    C       21       31       12

Добавьте его обратно

#df.iloc[:,1:]=df.iloc[:,1:].astype(str)
df.iloc[:,1:]+='%'
df
Out[160]: 
  Name Jan_2018 Feb_2018 Mar_2018
0    A      33%      40%      42%
1    B      20%      35%      50%
2    C      21%      31%      12%

W-B 26 сен. 2018, в 13:23

0

Имя не обязательно будет единственным нечисловым столбцом.
JesusMonroe 26 сен. 2018, в 15:06
0

@JesusMonroe, что вы имеете в виду?
WeNYoBen 26 сен. 2018, в 15:07
0

Может быть добавлено больше столбцов, поскольку таблица, из которой я читаю, обновлена. Числовые данные всегда будут%, но если бы они добавили столбец типа «уникальный_код» или что-то еще, ваше решение добавило бы% к каждой записи в столбце.
JesusMonroe 26 сен. 2018, в 15:09
0

@JesusMonroe вы имеете в виду обновление огня?
WeNYoBen 26 сен. 2018, в 15:10
0

@ Вен, .. хороший трюк.
Karn Kumar 26 сен. 2018, в 15:33

Показать ещё 3 комментария

Ещё вопросы

df.replace({'%':'', regex=True) и добавить обратно df.astype(str).add('%') . Может понадобиться pd.to_numeric в середине, чтобы сделать столбцы int dtype
Имя не обязательно будет единственным нечисловым столбцом.
Может быть добавлено больше столбцов, поскольку таблица, из которой я читаю, обновлена. Числовые данные всегда будут%, но если бы они добавили столбец типа «уникальный_код» или что-то еще, ваше решение добавило бы% к каждой записи в столбце.
@JesusMonroe вы имеете в виду обновление огня?

RafaelC · Accepted Answer · 2018-09-26T13-56-00.000Z

Заменить:

df = df.replace({'%':''}, regex=True)

    Name    Jan_2018    Feb_2018    Mar_2018
0   A       33          40          42
1   B       20          35          50
2   C       21          31          12

Преобразовать в номера

df = df.apply(lambda s: pd.to_numeric(s, errors='ignore'))

df.dtypes
Name        object
Jan_2018     int64
Feb_2018     int64
Mar_2018     int64
dtype: object

Преобразование обратно в числовые столбцы %

mask = df.dtypes[[np.issubdtype(x, np.number) for x in df.dtypes]].index
df.loc[:, mask] = df.loc[:, mask].astype(str).add('%')

    Name    Jan_2018    Feb_2018    Mar_2018
0   A       33%         40%         42%
1   B       20%         35%         50%
2   C       21%         31%         12%