Панды способ получить уникальные значения в группе?

1

Здесь мой dataframe:

df = pd.DataFrame([['a',1],['a',1],['a',1],['a',2],['b',2],['b',2],['c',3]], columns=['letters','numbers'])

    letters numbers
0   a   1
1   a   1
2   a   1
3   a   2
4   b   2
5   b   2
6   c   3

Мне нужно по группе ("буквы") количество уникальных значений в "числах". Таким образом, выход был бы

a 2
b 1
c 1

Вот мое (очень уродливое) решение. Это работает, но может ли кто-нибудь помочь мне найти более Pythonic способ сделать это с помощью pandas?

result = []
groups = list(df['letters'].unique())
for g in groups:

    filtered_df = df[df['letters'] == g]

    uniques = len(filtered_df['numbers'].unique())
    result.append((g, uniques))

[('a', 2), ('b', 1), ('c', 1)]
Теги:
pandas

1 ответ

5
Лучший ответ

Использование nunique

df.groupby('letters').numbers.nunique()
Out[864]: 
letters
a    2
b    1
c    1
Name: numbers, dtype: int64

Ещё вопросы

Сообщество Overcoder
Наверх
Меню