Поиск повторяющихся значений в MySQL

Question

Поиск повторяющихся значений в MySQL

665

У меня есть таблица с столбцом varchar, и я бы хотел найти все записи, которые имеют повторяющиеся значения в этом столбце. Какой лучший запрос я могу использовать для поиска дубликатов?

Jon Tackabury 27 март 2009, в 03:53

Источник

0

Поскольку вы упомянули найти все записи, я предполагаю, что вам нужно знать КЛЮЧИ, а также дублированные значения в этой колонке varchar.
TechTravelThink 27 март 2009, в 04:34
0

Я могу найти ключи достаточно легко после того, как получу значения, я просто хочу получить список всех повторяющихся значений.
Jon Tackabury 27 март 2009, в 13:49

Теги:

mysql

24 ответа

204

SELECT varchar_col
FROM table
GROUP BY varchar_col
HAVING COUNT(*) > 1;

maxyfc 27 март 2009, в 06:17

9

Превосходит ответ @ levik, так как не добавляет лишний столбец. Делает его полезным для использования с IN() / NOT IN() .
wmassingham 24 нояб. 2015, в 20:42
1

Поиск дублирующих записей в нескольких столбцах в MySQL activelab.io/code-snippets/… Я нашел этот сайт полезным.
Anurag_BEHS 14 фев. 2018, в 18:41

153

SELECT  *
FROM    mytable mto
WHERE   EXISTS
        (
        SELECT  1
        FROM    mytable mti
        WHERE   mti.varchar_column = mto.varchar_column
        LIMIT 1, 1
        )

Этот запрос возвращает полные записи, а не только разные varchar_column.

Этот запрос не использует COUNT(*). Если имеется много дубликатов, COUNT(*) стоит дорого, и вам не нужен весь COUNT(*), вам просто нужно знать, есть ли две строки с одинаковым значением.

Наличие индекса на varchar_column, конечно, значительно ускорит этот запрос.

Quassnoi 27 март 2009, в 11:25

3

Отлично. Я добавил ORDER BY varchar_column DESC в конец запроса.
trante 28 май 2014, в 20:25
4

Это должен быть принятый ответ, поскольку GROUP BY и HAVING возвращают только один из возможных дубликатов. Кроме того, производительность с индексированным полем вместо COUNT(*) и возможность ORDER BY для группировки дубликатов записей.
Rémi Breton 22 сен. 2015, в 20:08
0

Как указано в комментариях выше, этот запрос позволяет вам перечислить все дублированные строки. Очень полезно.
TryHarder 26 авг. 2016, в 01:36
1

Глядя на это, я не понимаю, как это будет работать вообще. Разве внутреннее условие всегда будет истинным, поскольку любая строка во внешней таблице будет также доступна во внутренней таблице, и поэтому каждая строка всегда будет хотя бы соответствовать самой себе? Я попробовал запрос и получил результат, который я подозревал - каждая строка вернулась. Но с таким большим количеством голосов я сомневаюсь в себе. Разве во внутреннем запросе отсутствует что-то вроде «AND mto.id <> mti.id»? Это работает для меня, когда я добавляю это.
Clox 09 май 2017, в 12:35
0

@clox: обратите внимание на LIMIT 1, 1 внизу коррелированного запроса (по сути, означающего «вернуть вторую строку»). EXISTS вернет true только в том случае, если вышеупомянутая вторая строка существует (т. varchar_column Есть как минимум две строки с одинаковым значением varchar_column )
Quassnoi 09 май 2017, в 15:27
0

@Quassnoi Ах, да. Я понимаю причину, не обращал внимания на эту часть. Однако, как я уже сказал, это не работает для меня. На самом деле он возвращает все строки. Даже если я сделаю LIMIT 1554554,1, это все равно будет. но если я использую внутренний запрос сам по себе, он работает как положено и возвращает только строки с дублирующимися значениями. Однако он работает, как вы описали, если я добавляю ORDER BY к внутреннему запросу, и делает его чуть медленнее, чем с условием. Вы уверены, что это работает для вас без этого заказа или дополнительного внутреннего условия? Кстати, я использую MariaDB, может быть, поэтому? 10.0.26-MariaDB-3 + deb.sury.org ~ + 1 дружественный
Clox 09 май 2017, в 16:14
0

@Clox: он определенно работал в 2009 году на самой последней версии MySQL, иначе я бы не опубликовал ее. Не могли бы вы собрать sqlfiddle вместе?
Quassnoi 09 май 2017, в 17:09
2

@Quassnoi Хорошо. Я пытался поместить его в sqlfiddle, но я отказался, так как каждый запрос, который я пытаюсь выполнить, кроме создания схемы, получает тайм-аут. Я понял, что удаление «EXISTS» также делает запрос корректным для меня.
Clox 16 май 2017, в 09:34
0

Без анализа этот запрос очень долго занимал довольно маленькую таблицу из нескольких тысяч проиндексированных строк. Это была задержка от полсекунды до секунды. Запрос на подсчет из основного ответа был решен без заметной задержки (и это было сделано первым, поэтому кеш запросов не выполнялся)
John 12 окт. 2017, в 01:36

Показать ещё 7 комментариев

109

Построение ответа levik для получения идентификаторов повторяющихся строк, вы можете сделать GROUP_CONCAT, если ваш сервер поддерживает его (это вернет список идентификаторов, разделенных запятыми).

SELECT GROUP_CONCAT(id), name, COUNT(*) c FROM documents GROUP BY name HAVING c > 1;

Matt Rardon 19 фев. 2015, в 02:21

10

Все это время, не зная о GROUP_CONCAT ()! очень очень полезно
aesede 21 май 2015, в 14:36
0

Действительно ценится Мэтт. Это действительно полезно! Для тех, кто пытается обновить в phpmyadmin, если вы оставляете идентификатор вместе с функцией, подобной этой: SELECT id, GROUP_CONCAT(id), name, COUNT(*) c [...] он включает встроенное редактирование и должен обновлять все строки участвует (или, по крайней мере, первое совпадение), но, к сожалению, редактирование приводит к ошибке Javascript ...
Armfoot 14 сен. 2015, в 11:25
0

Как бы вы тогда подсчитали, сколько идентификаторов подвержены дублированию?
CMCDragonkai 17 янв. 2017, в 13:33
1

Как мне не получить все идентификаторы сгруппированы, но вместо этого перечислены с первого до последнего; со всеми соответствующими значениями в столбцах рядом с ними? Таким образом, вместо группировки, он просто показывает ID 1 и его значение, ID 2 и его значение. ДАЖЕ, если значения для идентификатора совпадают.
MailBlade 15 фев. 2018, в 09:29
1

Чрезвычайно полезный ответ, это должно быть главным, чтобы больше людей видели это. Я помню, сколько боли я пережил, создав такие списки, и это было доступно все время как команда ..
John 23 май 2018, в 15:45

Показать ещё 3 комментария

12

SELECT * 
FROM `dps` 
WHERE pid IN (SELECT pid FROM `dps` GROUP BY pid HAVING COUNT(pid)>1)

strustam 22 май 2014, в 15:42

1

Нет, потому что это, пожалуй, самый медленный из всех. Подвыборы известны своей медлительностью, так как они выполняются для каждой возвращаемой строки.
Oddman 21 нояб. 2016, в 06:33

10

Предполагая, что ваша таблица имеет имя TableABC, а нужный столбец - Col, а первичный ключ - T1 - Key.

SELECT a.Key, b.Key, a.Col 
FROM TableABC a, TableABC b
WHERE a.Col = b.Col 
AND a.Key <> b.Key

Преимущество такого подхода в отношении вышеприведенного ответа заключается в том, что он дает ключ.

TechTravelThink 27 март 2009, в 04:30

3

+1 Потому что это удобно. Хотя, как ни странно, сам результат содержит дубликаты (в нем перечислены a и b, затем b и a.)
Fabien Snauwaert 19 май 2016, в 10:25
1

@FabienSnauwaert Вы можете избавиться от некоторых дубликатов, сравнив меньше (или больше чем)
Michael 25 окт. 2017, в 18:45

9

Чтобы узнать, сколько записей дубликатов в столбце имен в Employee, приведенный ниже запрос полезен;

Select name from employee group by name having count(*)>1;

user5599549 24 нояб. 2015, в 13:04

7

SELECT t.*,(select count(*) from city as tt
  where tt.name=t.name) as count
  FROM `city` as t
  where (
     select count(*) from city as tt
     where tt.name=t.name
  ) > 1 order by count desc

Замените город на таблицу. Замените имя на имя своего поля

Lalit Patel 25 янв. 2013, в 06:52

6

Я не вижу никаких подходов JOIN, у которых есть много применений с точки зрения дубликатов.

Этот подход дает вам реальные удвоенные результаты.

SELECT t1.* FROM table as t1 LEFT JOIN table as t2 ON t1.name=t2.name and t1.id!=t2.id WHERE t2.id IS NOT NULL ORDER BY t1.name

Adam Fischer 20 апр. 2018, в 11:00

1

К вашему сведению - вы захотите «выбрать отличный somecol ..», если существует вероятность существования более 1 дублированной записи, иначе результаты будут содержать дубликаты найденных дублированных строк.
Drew 04 дек. 2018, в 21:19

5

В моем последнем запросе было несколько ответов, которые помогли - объединить группу по, count и GROUP_CONCAT.

SELECT GROUP_CONCAT(id), `magento_simple`, COUNT(*) c 
FROM product_variant 
GROUP BY `magento_simple` HAVING c > 1;

Это обеспечивает идентификатор обоих примеров (разделенных запятыми), штрих-кода, который мне нужен, и количества дубликатов.

Соответственно измените таблицу и столбцы.

Jonathan 05 май 2017, в 04:19

4

Я видел вышеприведенный результат, и запрос будет работать нормально, если вам нужно проверить одно значение столбца, которое является дубликатом. Например, электронная почта.

Но если вам нужно проверить с большим количеством столбцов и хотите проверить комбинацию результата, чтобы этот запрос работал нормально:

SELECT COUNT(CONCAT(name,email)) AS tot,
       name,
       email
FROM users
GROUP BY CONCAT(name,email)
HAVING tot>1 (This query will SHOW the USER list which ARE greater THAN 1
              AND also COUNT)

user2235601 30 май 2016, в 09:22

3

Взяв @maxyfc ответ, мне нужно было найти все строки, которые были возвращены с повторяющимися значениями, поэтому я мог бы редактировать их в MySQL Workbench:

SELECT * FROM table
   WHERE field IN (
     SELECT field FROM table GROUP BY field HAVING count(*) > 1
   ) ORDER BY field

AbsoluteƵERØ 01 авг. 2017, в 23:45

3

Ниже вы найдете все product_id, которые используются более одного раза. Вы получаете только одну запись для каждого product_id.

SELECT product_id FROM oc_product_reward GROUP BY product_id HAVING count( product_id ) >1

Код, взятый из: http://chandreshrana.blogspot.in/2014/12/find-duplicate-records-based-on-any.html

Chandresh 30 май 2016, в 14:06

3

CREATE TABLE tbl_master
    (`id` int, `email` varchar(15));

INSERT INTO tbl_master
    (`id`, `email`) VALUES
    (1, '[email protected]'),
    (2, '[email protected]'),
    (3, '[email protected]'),
    (4, '[email protected]'),
    (5, '[email protected]');

QUERY : SELECT id, email FROM tbl_master
WHERE email IN (SELECT email FROM tbl_master GROUP BY email HAVING COUNT(id) > 1)

Bijesh Sheth 04 март 2016, в 08:08

3

SELECT 
    t.*,
    (SELECT COUNT(*) FROM city AS tt WHERE tt.name=t.name) AS count 
FROM `city` AS t 
WHERE 
    (SELECT count(*) FROM city AS tt WHERE tt.name=t.name) > 1 ORDER BY count DESC

magesh 21 фев. 2013, в 10:36

1

Выполнение одного и того же подзапроса дважды кажется неэффективным.
NobleUplift 24 июль 2014, в 14:44

2

SELECT DISTINCT a.email FROM `users` a LEFT JOIN `users` b ON a.email = b.email WHERE a.id != b.id;

Pawel Furmaniak 01 июль 2013, в 19:38

1

Стоит отметить, что это невыносимо медленно или может даже не закончиться, если запрашиваемый столбец не проиндексирован. В противном случае я смог изменить a.email на a.* И получить все идентификаторы строк с дубликатами.
NobleUplift 24 июль 2014, в 14:53
0

@NobleUplift О чем ты говоришь?
Michael 25 окт. 2017, в 18:43
0

@Michael Ну, так как это три года, я не могу тестировать ни на какой версии MySQL, которую я использовал, но я попробовал этот же запрос к базе данных, где у выбранного столбца не было индекса, поэтому потребовалось довольно много времени. несколько секунд, чтобы закончить. Изменение его на SELECT DISTINCT a.* Решено почти мгновенно.
NobleUplift 26 окт. 2017, в 19:54
0

@NobleUplift Ах, хорошо. Я могу понять, что это медленно ... часть, о которой я беспокоюсь, это "может даже не закончить".
Michael 27 окт. 2017, в 18:58
0

@ Михаил, я не помню, к какой таблице в нашей системе мне нужно было выполнить этот запрос, но для таблиц с несколькими миллионами записей, которые они, вероятно, закончили бы, но за время, которое заняло так много времени, что я перестал видеть, когда это на самом деле закончится.
NobleUplift 27 окт. 2017, в 20:19

Показать ещё 3 комментария

1

Если вы хотите удалить дубликаты, используйте DISTINCT

В противном случае используйте этот запрос:

SELECT users.*,COUNT(user_ID) as user FROM users GROUP BY user_name HAVING user > 1;

Hassan Latif Butt 14 янв. 2019, в 07:53

1

Я предпочитаю использовать оконные функции (MySQL 8. 0+) для поиска дубликатов, потому что я мог видеть всю строку:

WITH cte AS (
  SELECT *
    ,COUNT(*) OVER(PARTITION BY col_name) AS num_of_duplicates_group
    ,ROW_NUMBER() OVER(PARTITION BY col_name ORDER BY col_name2) AS pos_in_group
  FROM table
)
SELECT *
FROM cte
WHERE num_of_duplicates_group > 1;

DB Fiddle Demo

Lukasz Szozda 12 июль 2018, в 18:41

1

Один очень поздний вклад... в случае, если он помогает любому waaaaaay вниз по линии... У меня была задача найти соответствующие пары транзакций (на самом деле обе стороны передачи от учетной записи к учетной записи) в банковском приложении, чтобы определите, какие из них были "от" и "до" для каждой транзакции между счетами, поэтому мы закончили с этим:

SELECT 
    LEAST(primaryid, secondaryid) AS transactionid1,
    GREATEST(primaryid, secondaryid) AS transactionid2
FROM (
    SELECT table1.transactionid AS primaryid, 
        table2.transactionid AS secondaryid
    FROM financial_transactions table1
    INNER JOIN financial_transactions table2 
    ON table1.accountid = table2.accountid
    AND table1.transactionid <> table2.transactionid 
    AND table1.transactiondate = table2.transactiondate
    AND table1.sourceref = table2.destinationref
    AND table1.amount = (0 - table2.amount)
) AS DuplicateResultsTable
GROUP BY transactionid1
ORDER BY transactionid1;

В результате DuplicateResultsTable содержит строки, содержащие совпадающие (т.е. повторяющиеся) транзакции, но он также предоставляет одинаковый идентификатор транзакции в обратном порядке во второй раз, когда он соответствует одной и той же паре, поэтому внешний SELECT существует для группировки по первому идентификатору транзакции, который выполняется с помощью LEAST и GREATEST, чтобы убедиться, что два транзагента всегда находятся в одном и том же порядке в результатах, что делает его безопасным для GROUP первым, тем самым устраняя все дубликаты матчей. Прошел почти миллион записей и определил 12 000+ матчей всего за 2 секунды. Конечно, transactionid - это основной индекс, который действительно помог.

fortyninthnet 06 сен. 2016, в 15:32

1

Для удаления повторяющихся строк с несколькими полями сначала привяжите их к новому уникальному ключу, который указан только для отдельных строк, а затем используйте команду "group by" для удаления повторяющихся строк с помощью того же нового уникального ключа:

Create TEMPORARY table tmp select concat(f1,f2) as cfs,t1.* from mytable as t1;
Create index x_tmp_cfs on tmp(cfs);
Create table unduptable select f1,f2,... from tmp group by cfs;

irshst 04 фев. 2016, в 10:35

0

Вы также можете добавить объяснение?
Robert 04 фев. 2016, в 10:17
0

Почему бы не использовать CREATE TEMPORARY TABLE ... ? Небольшое объяснение вашего решения было бы здорово.
maxhb 04 фев. 2016, в 10:24

1

Select column_name, column_name1,column_name2, count(1) as temp from table_name group by column_name having temp > 1

Vipin Jain 18 дек. 2015, в 19:36

0

Попробуйте использовать этот запрос:

SELECT name, COUNT(*) value_count FROM company_master GROUP BY name HAVING value_count > 1;

Atul Akabari 15 нояб. 2018, в 10:36

0

SELECT DISTINCT name, count(name) as times FROM yourtable GROUP BY name

Mustafa 03 июнь 2012, в 17:24

0

SELECT ColumnA, COUNT( * )
FROM Table
GROUP BY ColumnA
HAVING COUNT( * ) > 1

Scott Ferguson 27 март 2009, в 05:25

3

Это неверно, так как он также находит уникальные вхождения. 0 должно быть 1.
Kafoso 06 янв. 2017, в 14:45

Ещё вопросы

Поскольку вы упомянули найти все записи, я предполагаю, что вам нужно знать КЛЮЧИ, а также дублированные значения в этой колонке varchar.
Я могу найти ключи достаточно легко после того, как получу значения, я просто хочу получить список всех повторяющихся значений.
Превосходит ответ @ levik, так как не добавляет лишний столбец. Делает его полезным для использования с IN() / NOT IN() .
Поиск дублирующих записей в нескольких столбцах в MySQL activelab.io/code-snippets/… Я нашел этот сайт полезным.
Отлично. Я добавил ORDER BY varchar_column DESC в конец запроса.
Это должен быть принятый ответ, поскольку GROUP BY и HAVING возвращают только один из возможных дубликатов. Кроме того, производительность с индексированным полем вместо COUNT(*) и возможность ORDER BY для группировки дубликатов записей.
Как указано в комментариях выше, этот запрос позволяет вам перечислить все дублированные строки. Очень полезно.
Глядя на это, я не понимаю, как это будет работать вообще. Разве внутреннее условие всегда будет истинным, поскольку любая строка во внешней таблице будет также доступна во внутренней таблице, и поэтому каждая строка всегда будет хотя бы соответствовать самой себе? Я попробовал запрос и получил результат, который я подозревал - каждая строка вернулась. Но с таким большим количеством голосов я сомневаюсь в себе. Разве во внутреннем запросе отсутствует что-то вроде «AND mto.id <> mti.id»? Это работает для меня, когда я добавляю это.
@clox: обратите внимание на LIMIT 1, 1 внизу коррелированного запроса (по сути, означающего «вернуть вторую строку»). EXISTS вернет true только в том случае, если вышеупомянутая вторая строка существует (т. varchar_column Есть как минимум две строки с одинаковым значением varchar_column )
@Quassnoi Ах, да. Я понимаю причину, не обращал внимания на эту часть. Однако, как я уже сказал, это не работает для меня. На самом деле он возвращает все строки. Даже если я сделаю LIMIT 1554554,1, это все равно будет. но если я использую внутренний запрос сам по себе, он работает как положено и возвращает только строки с дублирующимися значениями. Однако он работает, как вы описали, если я добавляю ORDER BY к внутреннему запросу, и делает его чуть медленнее, чем с условием. Вы уверены, что это работает для вас без этого заказа или дополнительного внутреннего условия? Кстати, я использую MariaDB, может быть, поэтому? 10.0.26-MariaDB-3 + deb.sury.org ~ + 1 дружественный
@Clox: он определенно работал в 2009 году на самой последней версии MySQL, иначе я бы не опубликовал ее. Не могли бы вы собрать sqlfiddle вместе?
@Quassnoi Хорошо. Я пытался поместить его в sqlfiddle, но я отказался, так как каждый запрос, который я пытаюсь выполнить, кроме создания схемы, получает тайм-аут. Я понял, что удаление «EXISTS» также делает запрос корректным для меня.
Без анализа этот запрос очень долго занимал довольно маленькую таблицу из нескольких тысяч проиндексированных строк. Это была задержка от полсекунды до секунды. Запрос на подсчет из основного ответа был решен без заметной задержки (и это было сделано первым, поэтому кеш запросов не выполнялся)
Все это время, не зная о GROUP_CONCAT ()! очень очень полезно
Действительно ценится Мэтт. Это действительно полезно! Для тех, кто пытается обновить в phpmyadmin, если вы оставляете идентификатор вместе с функцией, подобной этой: SELECT id, GROUP_CONCAT(id), name, COUNT(*) c [...] он включает встроенное редактирование и должен обновлять все строки участвует (или, по крайней мере, первое совпадение), но, к сожалению, редактирование приводит к ошибке Javascript ...
Как бы вы тогда подсчитали, сколько идентификаторов подвержены дублированию?
Как мне не получить все идентификаторы сгруппированы, но вместо этого перечислены с первого до последнего; со всеми соответствующими значениями в столбцах рядом с ними? Таким образом, вместо группировки, он просто показывает ID 1 и его значение, ID 2 и его значение. ДАЖЕ, если значения для идентификатора совпадают.
Чрезвычайно полезный ответ, это должно быть главным, чтобы больше людей видели это. Я помню, сколько боли я пережил, создав такие списки, и это было доступно все время как команда ..
Нет, потому что это, пожалуй, самый медленный из всех. Подвыборы известны своей медлительностью, так как они выполняются для каждой возвращаемой строки.
+1 Потому что это удобно. Хотя, как ни странно, сам результат содержит дубликаты (в нем перечислены a и b, затем b и a.)
@FabienSnauwaert Вы можете избавиться от некоторых дубликатов, сравнив меньше (или больше чем)
К вашему сведению - вы захотите «выбрать отличный somecol ..», если существует вероятность существования более 1 дублированной записи, иначе результаты будут содержать дубликаты найденных дублированных строк.
Выполнение одного и того же подзапроса дважды кажется неэффективным.
Стоит отметить, что это невыносимо медленно или может даже не закончиться, если запрашиваемый столбец не проиндексирован. В противном случае я смог изменить a.email на a.* И получить все идентификаторы строк с дубликатами.
@Michael Ну, так как это три года, я не могу тестировать ни на какой версии MySQL, которую я использовал, но я попробовал этот же запрос к базе данных, где у выбранного столбца не было индекса, поэтому потребовалось довольно много времени. несколько секунд, чтобы закончить. Изменение его на SELECT DISTINCT a.* Решено почти мгновенно.
@NobleUplift Ах, хорошо. Я могу понять, что это медленно ... часть, о которой я беспокоюсь, это "может даже не закончить".
@ Михаил, я не помню, к какой таблице в нашей системе мне нужно было выполнить этот запрос, но для таблиц с несколькими миллионами записей, которые они, вероятно, закончили бы, но за время, которое заняло так много времени, что я перестал видеть, когда это на самом деле закончится.
Вы также можете добавить объяснение?
Почему бы не использовать CREATE TEMPORARY TABLE ... ? Небольшое объяснение вашего решения было бы здорово.
Это неверно, так как он также находит уникальные вхождения. 0 должно быть 1.

levik · Accepted Answer · 2009-03-27T05-35-00.000Z

1380

Лучший ответ

Сделайте SELECT с предложением GROUP BY. Пусть говорят, что имя - это столбец, в котором вы хотите найти дубликаты:

SELECT name, COUNT(*) c FROM table GROUP BY name HAVING c > 1;

Это вернет результат с именем в первом столбце и количеством раз, сколько раз это значение появляется во второй.

levik 27 март 2009, в 05:35

19

Но как это полезно, если вы не можете получить идентификаторы строк с повторяющимися значениями? Да, вы можете выполнить новый запрос на сопоставление для каждого дублированного значения, но возможно ли просто перечислить дубликаты?
NobleUplift 24 июль 2014, в 14:41
15

@NobleUplift Вы можете сделать GROUP_CONCAT(id) и он будет перечислять идентификаторы. Смотрите мой ответ для примера.
Matt Rardon 19 фев. 2015, в 00:53
1

Спасибо @MattRardon. Сотрудник показал мне эту команду месяц назад или около того, но я рад, что она указана здесь, потому что в противном случае многие из этих запросов не очень полезны.
NobleUplift 19 фев. 2015, в 16:23
0

Можно ли сделать что-то подобное, но в подзапросе, который возвращает только один столбец?
bheussler 28 июль 2015, в 14:16
3

Что бы это значило, если бы он сказал ERROR: column "c" does not exist LINE 1 ?
User 04 окт. 2015, в 17:36
0

Несколько столбцов могут быть выполнены следующим образом: SELECT col1, col2, COUNT(*) c FROM table GROUP BY col1, col2 HAVING c > 1;
mark 07 окт. 2016, в 11:56
11

Я смущен, почему это принятый ответ и почему у него так много голосов. ОП спросил: «Я хотел бы найти все записи, которые имеют повторяющиеся значения в этом столбце». Этот ответ возвращает таблицу отсчетов. -1
Monica Heddneck 03 апр. 2017, в 20:56
4

Для тех, кто не понимает, как работает HAVING - это просто фильтр по результирующему набору, который происходит после основного запроса.
John Hunt 22 июнь 2017, в 10:02
3

Я использую having count(*) > 1 более интуитивно
Blauhirn 27 июль 2017, в 15:50

Показать ещё 7 комментариев