Определенная операция столбцов в Excel с использованием панд

Question

Определенная операция столбцов в Excel с использованием панд

1

У меня есть excel (test.xlsx) лист с несколькими столбцами, col1,col2,col3,col4 и т.д. Я хочу выполнить некоторую операцию в col2,col3 а затем выход output.xlsx имеющий все столбцы снова с обновленным col2,col3..

Что я пытался..

df = pd.read_xlsx('test.xlsx')
col = ['col2','col3']
df_with_some_operation = df[col].<some_op>
df_with_some_operation.to_excel(output.xlsx)

Нужна помощь по этому коду, чтобы все столбцы, включая col2, col3, включались в окончательный output.xlsx

Для лучшей визуализации... Проверьте ниже, я не хочу менять имена столбцов, хочу только обновить контент. Я выбрал этот пример, чтобы упростить его.. col2 и col3 → умножить на 2. просто примечание, в действительности есть несколько столбцов, но только на 2 мне нужно сделать некоторую работу.

input.xlsx
col1   col2 col3
 1      2    3

output.xls
col1  col2  col3
1     4    6

steveJ 27 авг. 2018, в 19:05

Источник

0

Почему ты не можешь просто использовать drop ?
roganjosh 27 авг. 2018, в 17:12
0

@roganjosh Мне нужно сохранить все столбцы как есть, просто нужно обновить col2, col3. Лист Excel должен использоваться со всеми столбцами. Какой лучший способ вы можете предложить?
steveJ 27 авг. 2018, в 17:13
0

Итак, to_excel столбцы, которые вам не нужны, перед to_excel
roganjosh 27 авг. 2018, в 17:14
0

@roganjosh Я не понял, ясно, как это поможет исправить это?
steveJ 27 авг. 2018, в 17:16
0

@roganjosh, я думаю, что поставил вопрос неправильно, просто обновил его с последней строкой, мне нужны все столбцы в output.xlsx который также включает обновленные col1 and col2
steveJ 27 авг. 2018, в 17:20
1

Чтобы обеспечить хорошее решение, вы должны указать, что участвует в <and then the logic work> . Векторизованные операции могут быть возможны вместо более общего, но неэффективного pd.DataFrame.apply .
jpp 27 авг. 2018, в 17:23
0

@jpp Я использовал .applymap, а затем внутри него лямбда-функцию ..
steveJ 27 авг. 2018, в 17:24
0

^ Пожалуйста, включите это в свой ОП
rahlf23 27 авг. 2018, в 17:24
1

@jpp Пожалуйста, проверьте код, обновлено ..
steveJ 27 авг. 2018, в 17:26

Показать ещё 7 комментариев

Теги:

python

pandas

excel

python-3.x

3 ответа

1

import pandas as pd

df = pd.DataFrame({'A': [2, 3, 4], 'B': [5, 7, 9], 'C':[10, 11, 12]})

df['A'] = df ['A']*3
df['B'] = df ['B']*2

df.to_excel('output.xlsx')

Kiruparan Balachandran 27 авг. 2018, в 16:08

0

Какое это имеет отношение к вопросу?
roganjosh 27 авг. 2018, в 17:18
1

от @steveJ: «Мне нужно сохранить все столбцы как есть, просто нужно обновить col2, col3», я просто пытаюсь предоставить пример для его требования (обновление столбцов A и B и сохранение столбца C как есть)
Kiruparan Balachandran 27 авг. 2018, в 17:21
0

Но это записывает все столбцы в файл
roganjosh 27 авг. 2018, в 17:26
1

Вот что он спросил
Kiruparan Balachandran 27 авг. 2018, в 17:29
0

Вопрос был отредактирован, чтобы изменить «кроме» на «включая». Извинения: /
roganjosh 27 авг. 2018, в 17:35
0

@KiruparanBalachandran Я думаю, что вы правильно получили то, что я искал .. но пусть я сделаю тест ..
steveJ 27 авг. 2018, в 17:49

Показать ещё 4 комментария

1

просто включите только что созданные столбцы в фреймворк orignal.

df_with_some_operation = df[col].<and then the logic work>
newcolums=["coln1","coln2"]


df[newcolums]=df_with_some_operation

теперь таким образом ваш dataframe df, если вы сохраните, будет иметь все столбцы orignal, а также сделанные вами изменения.

Примечание. Вы можете напрямую назначать новые столбцы вместо записи отдельно, как указано выше. Это только для понимания:

newcolums=["coln1","coln2"]

df[newcolumns]=df[col].<and then the logic work>

Inder 27 авг. 2018, в 14:33

0

* Извините за недопонимание, я только что обновил последнюю строку, мне нужны все столбцы, включая обновленные col1 and col2 в output.xlsx
steveJ 27 авг. 2018, в 17:22
0

@steveJ сделал изменения
Inder 27 авг. 2018, в 17:24

Ещё вопросы

Почему ты не можешь просто использовать drop ?
@roganjosh Мне нужно сохранить все столбцы как есть, просто нужно обновить col2, col3. Лист Excel должен использоваться со всеми столбцами. Какой лучший способ вы можете предложить?
Итак, to_excel столбцы, которые вам не нужны, перед to_excel
@roganjosh Я не понял, ясно, как это поможет исправить это?
@roganjosh, я думаю, что поставил вопрос неправильно, просто обновил его с последней строкой, мне нужны все столбцы в output.xlsx который также включает обновленные col1 and col2
Чтобы обеспечить хорошее решение, вы должны указать, что участвует в <and then the logic work> . Векторизованные операции могут быть возможны вместо более общего, но неэффективного pd.DataFrame.apply .
@jpp Я использовал .applymap, а затем внутри него лямбда-функцию ..
^ Пожалуйста, включите это в свой ОП
@jpp Пожалуйста, проверьте код, обновлено ..
Какое это имеет отношение к вопросу?
от @steveJ: «Мне нужно сохранить все столбцы как есть, просто нужно обновить col2, col3», я просто пытаюсь предоставить пример для его требования (обновление столбцов A и B и сохранение столбца C как есть)
Но это записывает все столбцы в файл
Вопрос был отредактирован, чтобы изменить «кроме» на «включая». Извинения: /
@KiruparanBalachandran Я думаю, что вы правильно получили то, что я искал .. но пусть я сделаю тест ..
* Извините за недопонимание, я только что обновил последнюю строку, мне нужны все столбцы, включая обновленные col1 and col2 в output.xlsx

jpp · Accepted Answer · 2018-08-27T16-27-00.000Z

Вы можете просто назначить результат pd.DataFrame.applymap для df[cols]. Это оставит остальную часть вашего блока данных без изменений.

df = pd.read_excel('test.xlsx')

cols = ['col2','col3']
df[cols] = df[cols].applymap(lambda c: translate.translate_text(...))

df.to_excel('output.xlsx')

Если вам нужны 2 новых столбца, вы можете использовать pd.DataFrame.join:

df = df.join(df[cols].applymap(lambda c: translate.translate_text(...))\
                     .set_axis(['col2a', 'col3a'], 1))