Как сделать запрос как GROUP BY в Django?

Question

Как сделать запрос как GROUP BY в Django?

222

Я запрашиваю модель,

Members.objects.all()

и он возвращает:

Eric, Salesman, X-Shop
Freddie, Manager, X2-Shop
Teddy, Salesman, X2-Shop
Sean, Manager, X2-Shop

Я хочу, чтобы узнать лучший способ Django запрос group_by к моему db, как будто,

Members.objects.all().group_by('designation')

Это не работает, конечно. Я знаю, что мы можем сделать некоторые трюки на "django/db/models/query.py", но мне просто интересно узнать, как это сделать без исправления.

simplyharsh 10 март 2009, в 09:34

Источник

2

Я был бы довольно забавный синтаксис все же.
Glycerine 07 нояб. 2012, в 12:04

Теги:

django

python

8 ответов

36

Простое решение, но не правильно, это использовать RAW-SQL:

http://docs.djangoproject.com/en/dev/topics/db/sql/#topics-db-sql

Другим решением является использование свойства group_by:

query = Members.objects.all().query
query.group_by = ['designation']
results = QuerySet(query=query, model=Members)

Теперь вы можете перебирать переменную результатов для получения результатов. Обратите внимание, что group_by не документируется и может быть изменен в будущей версии Django.

И... почему вы хотите использовать group_by? Если вы не используете агрегацию, вы можете использовать order_by для достижения аналогичного результата.

Michael 10 март 2009, в 11:03

0

Подскажите пожалуйста, как это сделать с помощью order_by ??
simplyharsh 10 март 2009, в 11:19
2

Привет, если вы не используете агрегацию, вы можете эмулировать group_by с помощью order_by и удалить ненужные записи. Конечно, это эмуляция, и ее можно использовать только при небольшом количестве данных. Поскольку он не говорил об агрегации, я подумал, что это может быть решением.
Michael 11 март 2009, в 10:28
0

Эй, это здорово - не могли бы вы объяснить, как использовать execute_sql, который не работает ...
rh0dium 12 июль 2012, в 23:47
6

Обратите внимание, что это больше не работает на Django 1.9. stackoverflow.com/questions/35558120/...
grokpot 08 март 2017, в 18:46
0

Вроде работает на Django 1.11. Хорошая особенность.
haͣrͬukaͣreͤrͬu 06 фев. 2018, в 04:52
0

Это своего рода хакерский способ использования ORM. Вам не нужно создавать экземпляры новых наборов запросов, передавая старые вручную.
Ian Kirkpatrick 19 апр. 2018, в 13:34

Показать ещё 4 комментария

5

Вам нужно сделать пользовательский SQL, как показано в этом фрагменте:

Пользовательский SQL через подзапрос

Или в пользовательском менеджере, как показано в онлайн-документах Django:

Добавление дополнительных методов Менеджера

Van Gale 10 март 2009, в 10:58

1

Вид двустороннего решения. Я бы использовал это, если бы у меня было некоторое расширенное использование этого. Но здесь мне просто нужно количество членов на обозначение, вот и все.
simplyharsh 10 март 2009, в 11:22
0

Нет проблем. Я подумал упомянуть о возможностях агрегации 1.1, но сделал предположение, что вы используете версию выпуска :)
Van Gale 10 март 2009, в 11:26
0

Все дело в использовании необработанных запросов, которые показывают слабость ORM Джанго.
Sławomir Lenart 02 март 2018, в 12:46

Показать ещё 1 комментарий

4

Вы также можете использовать тег шаблона regroup для группировки по атрибутам. Из документов:

cities = [
    {'name': 'Mumbai', 'population': '19,000,000', 'country': 'India'},
    {'name': 'Calcutta', 'population': '15,000,000', 'country': 'India'},
    {'name': 'New York', 'population': '20,000,000', 'country': 'USA'},
    {'name': 'Chicago', 'population': '7,000,000', 'country': 'USA'},
    {'name': 'Tokyo', 'population': '33,000,000', 'country': 'Japan'},
]

...

{% regroup cities by country as country_list %}

<ul>
    {% for country in country_list %}
        <li>{{ country.grouper }}
            <ul>
            {% for city in country.list %}
                <li>{{ city.name }}: {{ city.population }}</li>
            {% endfor %}
            </ul>
        </li>
    {% endfor %}
</ul>

Похож:

Индия
- Мумбаи: 19 000 000
- Калькутта: 15 000 000
США
- Нью-Йорк: 20 000 000
- Чикаго: 7 000 000
Япония
- Токио: 33 000 000

Он также работает на QuerySet Я верю.

источник: https://docs.djangoproject.com/en/1.11/ref/templates/builtins/#regroup

inostia 15 нояб. 2017, в 23:23

1

Это потрясающе! Я много искал простой способ сделать это. И это также работает с наборами запросов, вот как я это использовал.
CarmenA 27 фев. 2018, в 11:43
1

Это совершенно неправильно, если вы читаете из базы данных большой набор данных, а затем просто используете агрегированные значения.
Sławomir Lenart 02 март 2018, в 12:34
0

@ SławomirLenart, конечно, это может быть не так эффективно, как прямой запрос к БД. Но для простых случаев использования это может быть хорошим решением
inostia 02 март 2018, в 18:55
0

Это будет работать, если результат показан в шаблоне. Но для JsonResponse или другого косвенного ответа. это решение не будет работать.
Willy satrio nugroho 20 июль 2018, в 08:53
1

@Willysatrionugroho, если вы хотите сделать это в виде, например, stackoverflow.com/questions/477820/… может работать для вас
inostia 20 июль 2018, в 17:32

Показать ещё 3 комментария

3

Существует модуль, который позволяет группировать модели Django и по-прежнему работать с QuerySet в результате: https://github.com/kako-nawao/django-group-by

Например:

from django_group_by import GroupByMixin

class BookQuerySet(QuerySet, GroupByMixin):
    pass

class Book(Model):
    title = TextField(...)
    author = ForeignKey(User, ...)
    shop = ForeignKey(Shop, ...)
    price = DecimalField(...)

class GroupedBookListView(PaginationMixin, ListView):
    template_name = 'book/books.html'
    model = Book
    paginate_by = 100

    def get_queryset(self):
        return Book.objects.group_by('title', 'author').annotate(
            shop_count=Count('shop'), price_avg=Avg('price')).order_by(
            'name', 'author').distinct()

    def get_context_data(self, **kwargs):
        return super().get_context_data(total_count=self.get_queryset().count(), **kwargs)

'книга/books.html

<ul>
{% for book in object_list %}
    <li>
        <h2>{{ book.title }}</td>
        <p>{{ book.author.last_name }}, {{ book.author.first_name }}</p>
        <p>{{ book.shop_count }}</p>
        <p>{{ book.price_avg }}</p>
    </li>
{% endfor %}
</ul>

Разница с базовыми Django-запросами annotate/aggregate заключается в использовании атрибутов связанного поля, например. book.author.last_name.

Если вам нужны PK экземпляров, которые были сгруппированы вместе, добавьте следующую аннотацию:

.annotate(pks=ArrayAgg('id'))

ПРИМЕЧАНИЕ. ArrayAgg - это специальная функция Postgres, доступная с Django 1.9 и далее: https://docs.djangoproject.com/en/1.10/ref/contrib/postgres/aggregates/#arrayagg

Risadinha 29 сен. 2016, в 15:38

0

Этот django-group-by является альтернативой методу values . Это для другой цели, я думаю.
LShi 06 июль 2017, в 09:21
1

@LShi Это, конечно, не альтернатива ценностям. values - это select SQL, а group_by - это group by SQL (как следует из названия ...). Почему отрицательный голос? Мы используем такой код в производстве для реализации сложных операторов group_by .
Risadinha 07 июль 2017, в 11:56
0

Его документ говорит, что group_by «ведет себя в основном как метод значений, но с одним отличием ...» В документе не упоминается SQL GROUP BY а предоставляемый им вариант использования не предполагает, что он имеет какое-либо отношение к SQL GROUP BY . Я откажусь от голосования, когда кто-то прояснил это, но этот документ действительно вводит в заблуждение.
LShi 07 июль 2017, в 14:00
0

Прочитав документацию по values , я обнаружил, что упустил, что values сами по себе работают как GROUP BY. Это моя вина. Я думаю, что проще использовать itertools.groupby чем этот django-group-by, когда values недостаточны.
LShi 07 июль 2017, в 15:37
1

Невозможно создать group by сверху с помощью простого вызова values -w или без annotate и без извлечения всего из базы данных. Ваше предложение itertools.groupby работает для небольших наборов данных, но не для нескольких тысяч наборов данных, которые вы, вероятно, хотите разместить на странице. Конечно, в этот момент вам придется подумать о специальном поисковом индексе, который в любом случае содержит подготовленные (уже сгруппированные) данные.
Risadinha 08 июль 2017, в 17:24
0

Документ для values немного отличается от того, что я испытал в Django 1.8. (Возможно, версия имеет значение здесь, или я не понял.) Этот вопрос демонстрирует типичное использование, которое требует order_by (без которого результат потребовал бы дальнейшей обработки).
LShi 09 июль 2017, в 01:34
0

Извините, мой предыдущий комментарий вводит в заблуждение, когда я пишу "сверху". С этим я ссылаюсь на пример в своем собственном ответе, который я предложил, чтобы помочь другим в более сложных случаях использования.
Risadinha 10 июль 2017, в 09:21

Показать ещё 5 комментариев

3

Django не поддерживает свободную группу по запросам. Я узнал это очень плохо. ORM не предназначен для поддержки таких вещей, как то, что вы хотите сделать, без использования пользовательского SQL. Вы ограничены:

RAW sql (т.е. MyModel.objects.raw())
cr.execute (и ручной анализ результата).
.annotate() (группа по предложениям выполняется в дочерней модели для .annotate() в примерах, таких как aggregating lines_count = Count ('lines'))).

В запросе qs вы можете вызвать qs.query.group_by = ['field1', 'field2', ...], но это рискованно, если вы не знаете, какой запрос вы редактируете, и не имеете гарантии, что он будет работать, а не нарушать внутренние объекты QuerySet. Кроме того, это внутренний (недокументированный) API, к которому вы не должны обращаться напрямую, не рискуя тем, что код больше не совместим с будущими версиями Django.

Luis Masuelli 12 нояб. 2015, в 18:11

0

на самом деле вы ограничены не только в свободном групповом доступе, поэтому попробуйте SQLAlchemy вместо Django ORM.
Sławomir Lenart 02 март 2018, в 12:38

0

В документе говорится, что вы можете использовать значения для группировки набора запросов.

class Travel(models.Model):
    interest = models.ForeignKey(Interest)
    user = models.ForeignKey(User)
    time = models.DateTimeField(auto_now_add=True)

# Find the travel and group by the interest:

>>> Travel.objects.values('interest').annotate(Count('user'))
<QuerySet [{'interest': 5, 'user__count': 2}, {'interest': 6, 'user__count': 1}]>
# the interest(id=5) had been visited for 2 times, 
# and the interest(id=6) had only been visited for 1 time.

>>> Travel.objects.values('interest').annotate(Count('user', distinct=True)) 
<QuerySet [{'interest': 5, 'user__count': 1}, {'interest': 6, 'user__count': 1}]>
# the interest(id=5) had been visited by only one person (but this person had 
#  visited the interest for 2 times

Вы можете найти все книги и сгруппировать их по имени с помощью этого кода:

Book.objects.values('name').annotate(Count('id')).order_by() # ensure you add the order_by()

Вы можете посмотреть некоторые листовки здесь.

ramwin 07 нояб. 2017, в 10:58

-2

Если я не ошибаюсь, вы можете использовать, независимо от запроса-set.group_by = ['field']

Reed Jones 10 нояб. 2014, в 13:39

7

Это не так, по крайней мере, в Django 1.6: у объекта 'QuerySet' нет атрибута 'group_by'
Facundo Olano 04 июнь 2015, в 19:07
0

Правильное использование может быть queryset.query.group_by = [...], но это нарушит семантику запроса и будет работать не так, как ожидалось.
Luis Masuelli 12 нояб. 2015, в 18:01

Ещё вопросы

Я был бы довольно забавный синтаксис все же.
Подскажите пожалуйста, как это сделать с помощью order_by ??
Привет, если вы не используете агрегацию, вы можете эмулировать group_by с помощью order_by и удалить ненужные записи. Конечно, это эмуляция, и ее можно использовать только при небольшом количестве данных. Поскольку он не говорил об агрегации, я подумал, что это может быть решением.
Эй, это здорово - не могли бы вы объяснить, как использовать execute_sql, который не работает ...
Обратите внимание, что это больше не работает на Django 1.9. stackoverflow.com/questions/35558120/...
Вроде работает на Django 1.11. Хорошая особенность.
Это своего рода хакерский способ использования ORM. Вам не нужно создавать экземпляры новых наборов запросов, передавая старые вручную.
Вид двустороннего решения. Я бы использовал это, если бы у меня было некоторое расширенное использование этого. Но здесь мне просто нужно количество членов на обозначение, вот и все.
Нет проблем. Я подумал упомянуть о возможностях агрегации 1.1, но сделал предположение, что вы используете версию выпуска :)
Все дело в использовании необработанных запросов, которые показывают слабость ORM Джанго.
Это потрясающе! Я много искал простой способ сделать это. И это также работает с наборами запросов, вот как я это использовал.
Это совершенно неправильно, если вы читаете из базы данных большой набор данных, а затем просто используете агрегированные значения.
@ SławomirLenart, конечно, это может быть не так эффективно, как прямой запрос к БД. Но для простых случаев использования это может быть хорошим решением
Это будет работать, если результат показан в шаблоне. Но для JsonResponse или другого косвенного ответа. это решение не будет работать.
@Willysatrionugroho, если вы хотите сделать это в виде, например, stackoverflow.com/questions/477820/… может работать для вас
Этот django-group-by является альтернативой методу values . Это для другой цели, я думаю.
@LShi Это, конечно, не альтернатива ценностям. values - это select SQL, а group_by - это group by SQL (как следует из названия ...). Почему отрицательный голос? Мы используем такой код в производстве для реализации сложных операторов group_by .
Его документ говорит, что group_by «ведет себя в основном как метод значений, но с одним отличием ...» В документе не упоминается SQL GROUP BY а предоставляемый им вариант использования не предполагает, что он имеет какое-либо отношение к SQL GROUP BY . Я откажусь от голосования, когда кто-то прояснил это, но этот документ действительно вводит в заблуждение.
Прочитав документацию по values , я обнаружил, что упустил, что values сами по себе работают как GROUP BY. Это моя вина. Я думаю, что проще использовать itertools.groupby чем этот django-group-by, когда values недостаточны.
Невозможно создать group by сверху с помощью простого вызова values -w или без annotate и без извлечения всего из базы данных. Ваше предложение itertools.groupby работает для небольших наборов данных, но не для нескольких тысяч наборов данных, которые вы, вероятно, хотите разместить на странице. Конечно, в этот момент вам придется подумать о специальном поисковом индексе, который в любом случае содержит подготовленные (уже сгруппированные) данные.
Документ для values немного отличается от того, что я испытал в Django 1.8. (Возможно, версия имеет значение здесь, или я не понял.) Этот вопрос демонстрирует типичное использование, которое требует order_by (без которого результат потребовал бы дальнейшей обработки).
Извините, мой предыдущий комментарий вводит в заблуждение, когда я пишу "сверху". С этим я ссылаюсь на пример в своем собственном ответе, который я предложил, чтобы помочь другим в более сложных случаях использования.
на самом деле вы ограничены не только в свободном групповом доступе, поэтому попробуйте SQLAlchemy вместо Django ORM.
Это не так, по крайней мере, в Django 1.6: у объекта 'QuerySet' нет атрибута 'group_by'
Правильное использование может быть queryset.query.group_by = [...], но это нарушит семантику запроса и будет работать не так, как ожидалось.

Guðmundur H · Accepted Answer · 2009-03-10T11-24-00.000Z

358

Лучший ответ

Если вы хотите сделать агрегацию, вы можете использовать функции агрегации ORM:

from django.db.models import Count
Members.objects.values('designation').annotate(dcount=Count('designation'))

В результате возникает запрос, похожий на

SELECT designation, COUNT(designation) AS dcount
FROM members GROUP BY designation

и выход будет иметь вид

[{'designation': 'Salesman', 'dcount': 2}, 
 {'designation': 'Manager', 'dcount': 2}]

Guðmundur H 10 март 2009, в 11:24

0

Вы не поверите, что я жонглировал одним и тем же фрагментом кода в настоящее время. Да, 1.1 есть довольно хорошие вещи, чтобы смотреть.
simplyharsh 10 март 2009, в 11:18
3

Как бы вы добавили еще один фильтр, чтобы, скажем, искать разные значения по дате?
Harry 31 авг. 2011, в 08:38
5

@Harry: Вы можете связать это. Что-то типа: Members.objects.filter(date=some_date).values('designation').annotate(dcount=Count('designation'))
Eli 15 май 2013, в 23:14
35

У меня есть вопрос, этот запрос только возвращает обозначение и dcount, что, если я хочу получить другие значения таблицы тоже?
Clayton 05 март 2014, в 08:02
14

Обратите внимание, что если ваша сортировка является полем, отличным от обозначения, она не будет работать без сброса сортировки. См. Stackoverflow.com/a/1341667/202137
Gidgidonihah 05 май 2014, в 19:41
9

@Gidgidonihah Правда, в примере следует читать Members.objects.order_by('disignation').values('designation').annotate(dcount=Count('designation'))
bjunix 30 окт. 2014, в 15:16
1

Можно ли выполнить запрос без count ?
aDoN 22 дек. 2015, в 10:36
3

У меня есть вопрос, этот запрос только возвращает обозначение и dcount, что, если я хочу получить другие значения таблицы тоже?
Yann叶 26 окт. 2016, в 02:18
1

@Clayton: поместите остальные поля в круглые скобки значений следующим образом: Members.objects.values ('обозначение', 'field2', 'field3'). Annotate (dcount = Count ('обозначение'))
MouTio 07 нояб. 2016, в 12:13
0

@Yann 叶: поместите остальные поля в скобки значений следующим образом: Members.objects.values ('обозначение', 'field2', 'field3'). Annotate (dcount = Count ('обозначение'))
MouTio 07 нояб. 2016, в 12:13
0

иногда я так комментирую, что эквивалентно обозначению SELECT, COUNT (обозначение) AS dcount FROM members GROUP BY members.id . Почему это происходит?
JPG 06 нояб. 2017, в 16:25
0

Это ДОЛЖНО (хотя и необязательно) оканчиваться на .order_by(designation) , причина в том, что в зависимости от модели или базы данных они будут неявным order_by на месте, полностью нарушая механизм группировки. Так что явное сохранение здесь.
nehemiah 17 янв. 2018, в 00:16
0

@MouTio, если я добавлю в значения другие поля, то группа будет разбита по правилу, например: values ('обозначение', 'field2'), а затем будет сгруппирована по полю2 вместо обозначения. Есть ли другой способ добиться такого запроса? Выберите Max (field1), field2, field3 из группы таблиц по field2
paugoo 21 сен. 2018, в 11:12

Показать ещё 11 комментариев