Как найти дубликаты в 2 столбцах, а не в 1

Question

Как найти дубликаты в 2 столбцах, а не в 1

72

У меня есть таблица базы данных MySQL с двумя столбцами, которые меня интересуют. Индивидуально они могут иметь дубликаты, но у них никогда не должно быть дубликатов ОБОИХ из них, имеющих одинаковое значение.

stone_id может иметь дубликаты, если для каждого заголовка upsharge другое значение, и наоборот. Но скажем, например, stone_id= 412 и upcharge_title= "sapphire", что комбинация должна выполняться только один раз.

Это нормально:

stone_id = 412 upcharge_title = "sapphire"
stone_id = 412 upcharge_title = "ruby"

Это НЕ нормально:

stone_id = 412 upcharge_title = "sapphire"
stone_id = 412 upcharge_title = "sapphire"

Есть ли запрос, который найдет дубликаты в обоих полях? И если возможно, есть ли способ установить, что моя база данных не позволяет этого?

Я использую MySQL версии 4.1.22

JD Isaacks 13 март 2009, в 14:41

Источник

Теги:

mysql

duplicates

6 ответов

25

Мне было полезно добавить индекс unqiue, используя "ALTER IGNORE", который удаляет дубликаты и применяет уникальные записи, которые звучат так, как вы хотели бы сделать. Таким образом, синтаксис будет выглядеть следующим образом:

ALTER IGNORE TABLE `table` ADD UNIQUE INDEX(`id`, `another_id`, `one_more_id`);

Это эффективно добавляет уникальное ограничение, означающее, что у вас никогда не будет дубликатов записей, а IGNORE удаляет существующие дубликаты.

Подробнее о eh ALTER IGNORE вы можете узнать здесь: http://mediakey.dk/~cc/mysql-remove-duplicate-entries/

Обновление: мне было сообщено @Inquisitive, что это может быть неудачно в версиях MySql > 5.5:

Не удается выполнить команду MySQL > 5.5 и в таблице InnoDB, а в Percona из-за их функция быстрого индексирования InnoDB [http://bugs.mysql.com/bug.php?id=40344]. В этом случае сначала запустите set session old_alter_table=1, а затем указанную выше команду будет отлично работать

SeanDowney 14 июнь 2012, в 23:08

0

+1 Только на 3 года позже ... но все же полезная информация. Благодарю.
JD Isaacks 15 июнь 2012, в 14:44
1

Правда, но, по крайней мере, в следующий раз вы знаете. У меня была такая же проблема, и я подумал, что хорошо поделиться с другими
SeanDowney 15 июнь 2012, в 18:12
0

Я только дразнил об этом с опозданием на 3 года. Действительно рад, что вы поделились. Отсюда плюс 1.
JD Isaacks 16 июнь 2012, в 00:43
0

+1 За простоту и своевременность. Отличное решение.
David 19 окт. 2012, в 00:57
0

Я предполагаю, что это удаляет один из дубликатов произвольно, поэтому убедитесь, что между каждой строкой нет различий, которые было бы полезно узнать или сохранить.
Joshua Pinter 30 нояб. 2012, в 00:24
0

+1 за ответ даже после двухлетнего опоздания. Я случайно удалил составной ключ, и это спасло жизнь. Спасибо
ivcode 13 июнь 2014, в 07:14
0

Я попробовал несколько методов поиска дубликатов, и ни один из них не был таким простым и быстрым. Спасибо, что поделились этим методом.
Kristjan O. 29 сен. 2014, в 23:25
0

Спасибо за полезную информацию. Хотя я просто запустил это с помощью phpMyAdmin и получил это предупреждение. Предупреждение: # 1681 «IGNORE» устарела и будет удалена в следующем выпуске.
TheWebsiteGuy 19 янв. 2019, в 13:13
0

не работает в MySQL 5.7.11 удалить ключевое слово IGNORE
SolidSnake 19 март 2019, в 07:00
0

Да - я добавлю комментарий о том, что
SeanDowney 19 март 2019, в 19:25

Показать ещё 8 комментариев

4

Чтобы найти дубликаты:

select stone_id, upcharge_title from tablename group by stone_id, upcharge_title having count(*)>1

Чтобы ограничить это в будущем, создайте составной уникальный ключ в этих двух областях.

Ian Nelson 13 март 2009, в 14:22

1

Большое спасибо, подскажите, пожалуйста, как удалить все, кроме одного из дубликатов. А как мне настроить составной ключ в phpmyadmin. БЛАГОДАРЮ ВАС!!!
JD Isaacks 13 март 2009, в 13:45

3

Вы можете найти дубликаты, подобные этому.

Select
    stone_id, upcharge_title, count(*)
from 
    particulartable
group by 
    stone_id, upcharge_title
having 
    count(*) > 1

Jason Punyon 13 март 2009, в 14:56

0

Фантастика, спасибо.
Andy 18 сен. 2018, в 17:46

2

Кстати, сложное уникальное ограничение в таблице помешало бы этому в первую очередь.

ALTER TABLE table
    ADD UNIQUE(stone_id, charge_title)

(Это действительный T-SQL. Не уверен в MySQL.)

P Daddy 13 март 2009, в 15:27

0

Я думаю, что это работает, но это не позволит мне сделать это, пока я сначала не удалю дубликаты. Благодарю.
JD Isaacks 13 март 2009, в 14:05

0

эта служба SO помогла мне, но я тоже хотел знать, как удалить и сохранить одну из строк... здесь PHP-решение для удаления повторяющихся строк и сохранения одного (в моем случае было всего 2 столбца, и это находится в функции для очистки дублирующих ассоциаций категорий)

$dupes = $db->query('select *, count(*) as NUM_DUPES from PRODUCT_CATEGORY_PRODUCT group by fkPRODUCT_CATEGORY_ID, fkPRODUCT_ID having count(*) > 1');
if (!is_array($dupes))
    return true;
foreach ($dupes as $dupe) {
    $db->query('delete from PRODUCT_CATEGORY_PRODUCT where fkPRODUCT_ID = ' . $dupe['fkPRODUCT_ID'] . ' and fkPRODUCT_CATEGORY_ID = ' . $dupe['fkPRODUCT_CATEGORY_ID'] . ' limit ' . ($dupe['NUM_DUPES'] - 1);
}

(ограничение NUM_DUPES - 1) является тем, что сохраняет одну строку...

спасибо всем

groovenectar 19 авг. 2010, в 21:52

3

ALTER IGNORE TABLE table ADD UNIQUE INDEX index_name(stone_id, charge_title) удалит дублирующиеся строки, оставив только одну уникальную пару.
dev-null-dweller 19 авг. 2010, в 21:38

Ещё вопросы

+1 Только на 3 года позже ... но все же полезная информация. Благодарю.
Правда, но, по крайней мере, в следующий раз вы знаете. У меня была такая же проблема, и я подумал, что хорошо поделиться с другими
Я только дразнил об этом с опозданием на 3 года. Действительно рад, что вы поделились. Отсюда плюс 1.
+1 За простоту и своевременность. Отличное решение.
Я предполагаю, что это удаляет один из дубликатов произвольно, поэтому убедитесь, что между каждой строкой нет различий, которые было бы полезно узнать или сохранить.
+1 за ответ даже после двухлетнего опоздания. Я случайно удалил составной ключ, и это спасло жизнь. Спасибо
Я попробовал несколько методов поиска дубликатов, и ни один из них не был таким простым и быстрым. Спасибо, что поделились этим методом.
Спасибо за полезную информацию. Хотя я просто запустил это с помощью phpMyAdmin и получил это предупреждение. Предупреждение: # 1681 «IGNORE» устарела и будет удалена в следующем выпуске.
не работает в MySQL 5.7.11 удалить ключевое слово IGNORE
Да - я добавлю комментарий о том, что
Большое спасибо, подскажите, пожалуйста, как удалить все, кроме одного из дубликатов. А как мне настроить составной ключ в phpmyadmin. БЛАГОДАРЮ ВАС!!!
Я думаю, что это работает, но это не позволит мне сделать это, пока я сначала не удалю дубликаты. Благодарю.
ALTER IGNORE TABLE table ADD UNIQUE INDEX index_name(stone_id, charge_title) удалит дублирующиеся строки, оставив только одну уникальную пару.

Miyagi Coder · Accepted Answer · 2009-03-13T14-02-00.000Z

133

Лучший ответ

Вы должны настроить составной ключ между двумя полями. Для каждой строки потребуется уникальное значение stone_id и upcharge_title.

Что касается поиска существующих дубликатов, попробуйте это:

select   stone_id,
         upcharge_title,
         count(*)
from     your_table
group by stone_id,
         upcharge_title
having   count(*) > 1

Miyagi Coder 13 март 2009, в 14:02

0

Спасибо, что выбрал их. Не могли бы вы сказать мне, как удалить дубликаты (но оставьте, конечно, 1 копию) СПАСИБО!
JD Isaacks 13 март 2009, в 14:06
1

Один из способов - собрать все данные и воссоздать таблицу.
Miyagi Coder 13 март 2009, в 14:48
1

@John Isaacks: Если нет других полей, по которым вы могли бы их различить (т.е. все поля являются дубликатами), вам придется удалить обе строки и воссоздать одну. Один из способов - скопировать дубликаты в копию таблицы, удалить их из оригинала и заново вставить отдельные строки из копии.
P Daddy 13 март 2009, в 23:24
0

Очень умно! Золото
infomaniac 22 июнь 2015, в 22:03
0

Это не работает на Postgres 8.1, кто-то может мне помочь?
Lennon 17 дек. 2015, в 13:20
0

большое спасибо, порядок, который вы группируете, имеет значение?
Andrew 27 янв. 2017, в 20:56
0

И почему добавление еще одного столбца, только для целей выбора данных, не приводит к появлению результатов, если без дополнительного столбца он появляется?
Andrew 27 янв. 2017, в 21:06
0

Ницца! ☺ Есть ли способ показать id ? В моем случае дубликаты находятся в first_name и last_name но id отличаются. В набранном вами запросе я четко вижу эти повторяющиеся запросы, но вижу только один из id . Как сделать так, чтобы он показывал другие id ?
Pathros 26 апр. 2017, в 16:42

Показать ещё 6 комментариев