В пакете pandas python я хотел бы сгруппировать, чтобы я соблюдал определенный порядок. Код ниже, похоже, делает это, но есть ли более быстрый/более простой способ? Или гарантируется, что группа по функциям pandas сохраняет порядок записей в исходном фрейме данных?
import pandas as pd
sep = ' - '
df1 = pd.DataFrame([[1,"apple",1],[1,"banana",3],[1,"pear",2],[2,"lemon",3],[2,"orange",1],[2,"apple",2]])
df1.columns = ["id","product","seq"]
df1 = df1.sort_values(by=["id","seq"])
pd.DataFrame(df1.groupby('id',as_index=False)['product'].apply(lambda x: sep.join(x)))
Используйте параметр sort=False
, также не нужен конструктор DataFrame
:
df2 = df1.groupby('id', sort=False)['product'].apply(sep.join).reset_index()
print (df2)
id product
0 1 apple - pear - banana
1 2 orange - apple - lemon