Производительность MySQL. Повышает ли производительность соединение с помощью ключа?

Question

Производительность MySQL. Повышает ли производительность соединение с помощью ключа?

0

У меня есть две таблицы с миллионами данных. обе таблицы имеют 2 параметра, по которым я хочу присоединиться к этим таблицам. пример запроса:

SELECT 
    bills.meter_id,
    records.record_id
FROM records
JOIN bills ON (
    bills.mnumber = records.mnumber
    AND bills.end_date = records.enddate
)
WHERE records.mnumber IS NOT NULL
AND records.enddate IS NOT NULL

Итак, вы можете видеть, что у меня есть две таблицы записей и счетов, которые соединяются с использованием полей mnumber и endate. в настоящее время ни один из этих столбцов не индексируется. Какая наилучшая комбинация индексов дает наилучшую производительность для этого запроса. Будет ли производительность GROUP BY records.mnumber,records.enddate справки?

Shivam 02 июль 2018, в 16:49

Источник

0

Всегда присоединяйтесь к индексируемому идентификатору. Я не понимаю, почему вы присоединяетесь на свидание. И у вас есть end_date и enddate . Я знаю, что это разные поля, но вы должны придерживаться одной нотации, а не писать поля по-разному.
Daniel W. 02 июль 2018, в 14:42
0

"Поможет ли производительность GROUP BY records.mnumber, records.enddate производительности?" Нет, и он испортит результаты вашего запроса, если вы просто добавите его, предполагая, что сервер не работает в режиме ONLY_FULL_GROUP_BY.
Raymond Nijland 02 июль 2018, в 14:48
0

Для лучших ответов вы можете лучше поделиться своими структурами таблиц и некоторыми примерами данных. И ожидаемые результаты ..
Raymond Nijland 02 июль 2018, в 14:50
0

@DanFromGermany да, это была не моя схема, поэтому она была названа так. но мне нужно только объединить эти оба столбца, так как я хочу, чтобы результаты совпадали.
Shivam 02 июль 2018, в 14:50
0

@RaymondNijland Я предложил GROUP BY, так как я хочу только одно совпадение для объединения, другие столбцы таблицы не важны, так как это не поможет при присоединении к таблице.
Shivam 02 июль 2018, в 14:55
0

«Я предложил GROUP BY, так как мне нужно только одно совпадение для объединения» SELECT bills.meter_id, records.record_id ... GROUP BY records.mnumber,records.enddat - это просто неверный SQL-запрос, поскольку SELECT использует столбцы, которые не являются в GROUP BY .. Кроме того, использование GROUP BY для удаления дубликатов не имеет смысла без агрегированных функций (таких как COUNT , SUM , MAX или MIN ), по моему мнению. Я бы использовал DISTINCT для удаления дубликатов.
Raymond Nijland 02 июль 2018, в 15:02

Показать ещё 4 комментария

Теги:

mysql

database-performance

2 ответа

0

Будет ли производительность GROUP BY records.mnumber, records.enddate справки?

GROUP BY управляет вашим набором результатов - он для агрегации, а не для производительности...

Вы выбираете между тремя вариантами:

Оптимизируйте свою схему и сделайте соответствующие идентификаторы, а не в поле даты
Добавить индекс в поле даты
Добавьте составной индекс по обоим полям

Чтобы проверить, что работает лучше всего, используйте EXPLAIN перед запросами и сравните вывод (меньше запросов обычно означает лучшую производительность).

DanFromGermany 02 июль 2018, в 12:30

Ещё вопросы

Всегда присоединяйтесь к индексируемому идентификатору. Я не понимаю, почему вы присоединяетесь на свидание. И у вас есть end_date и enddate . Я знаю, что это разные поля, но вы должны придерживаться одной нотации, а не писать поля по-разному.
"Поможет ли производительность GROUP BY records.mnumber, records.enddate производительности?" Нет, и он испортит результаты вашего запроса, если вы просто добавите его, предполагая, что сервер не работает в режиме ONLY_FULL_GROUP_BY.
Для лучших ответов вы можете лучше поделиться своими структурами таблиц и некоторыми примерами данных. И ожидаемые результаты ..
@DanFromGermany да, это была не моя схема, поэтому она была названа так. но мне нужно только объединить эти оба столбца, так как я хочу, чтобы результаты совпадали.
@RaymondNijland Я предложил GROUP BY, так как я хочу только одно совпадение для объединения, другие столбцы таблицы не важны, так как это не поможет при присоединении к таблице.
«Я предложил GROUP BY, так как мне нужно только одно совпадение для объединения» SELECT bills.meter_id, records.record_id ... GROUP BY records.mnumber,records.enddat - это просто неверный SQL-запрос, поскольку SELECT использует столбцы, которые не являются в GROUP BY .. Кроме того, использование GROUP BY для удаления дубликатов не имеет смысла без агрегированных функций (таких как COUNT , SUM , MAX или MIN ), по моему мнению. Я бы использовал DISTINCT для удаления дубликатов.

Rick James · Accepted Answer · 2018-07-02T20-07-00.000Z

В JOIN (но не в LEFT JOIN) сначала посмотрите, какая таблица может извлечь выгоду из индекса для фильтрации. Поскольку WHERE ссылается только на records, это, вероятно, будет первая таблица, которую будет использовать Оптимизатор.

WHERE records.mnumber IS NOT NULL
  AND records.enddate IS NOT NULL

может выиграть от INDEX(mnumber, enddate) - в любом порядке. Это зависит от того, какая часть таблицы имеет оба столбца: NULL.

Перейдем к следующей таблице (bills):

 ON bills.mnumber  = records.mnumber
AND bills.end_date = records.enddate

безусловно, выиграют от этого составного индекса по bills:

INDEX(mnumber, enddate)  -- in either order

(Я согласен с другим ответом о GROUP BY.)