Python Удалить дубликаты и оригинал из вложенного списка на основе определенного ключа

Question

Python Удалить дубликаты и оригинал из вложенного списка на основе определенного ключа

1

Я пытаюсь удалить все дубликаты и оригиналы из вложенного списка на основе определенного столбца.

пример

list = [['abc',3232,'demo text'],['def',9834,'another text'],['abc',0988,'another another text'],['poi',1234,'text']]

Ключевой столбец - первый (abc, def, abc), и на основе этого я хочу удалить любой элемент (плюс оригинал), который имеет то же значение с оригиналом.

Поэтому новый список должен содержать:

newlist = [['def',9834,'another text'],['poi',1234,'text']]

Я нашел много похожих тем, но не для вложенных списков... Любая помощь, пожалуйста?

Chris El 15 июнь 2018, в 10:43

Источник

Теги:

python

list

duplicates

nested-lists

4 ответа

2

Вы можете создать список ключей

keys = [x[0] for x in list]

и выберите только те записи, для которых ключ происходит ровно один раз

newlist = [x for x in list if keys.count(x[0]) == 1]

taras 15 июнь 2018, в 05:43

0

Вы имеете O (n ^ 2) сложность здесь, вызывая list.count n раз. Вы можете использовать collections.Counter чтобы сделать это O (n). Или хранить ваши счета отдельно.
jpp 15 июнь 2018, в 09:28
0

Что ж, OP ничего не сказал относительно размера списка, поэтому я предположил, что он недостаточно велик, чтобы сделать разницу между O (n) и O (n ^ 2). Определенно, использование Counter является более эффективным подходом, но я намеревался дать быстрое и грязное решение, которое хорошо работает в большинстве случаев.
taras 15 июнь 2018, в 11:52
0

Мой комментарий не жалоба, это просто заметка, которая может заинтересовать читателей.
jpp 15 июнь 2018, в 11:53
0

Без обид;) Просто объяснил мои намерения.
taras 15 июнь 2018, в 17:45

Показать ещё 2 комментария

1

Использование collections.defaultdict для решения O (n):

L = [['abc',3232,'demo text'],
     ['def',9834,'another text'],
     ['abc',988,'another another text'],
     ['poi',1234,'text']]

from collections import defaultdict

d = defaultdict(list)

for key, num, txt in L:
    d[key].append([num, txt])

res = [[k, *v[0]] for k, v in d.items() if len(v) == 1]

print(res)

[['def', 9834, 'another text'],
 ['poi', 1234, 'text']]

jpp 15 июнь 2018, в 06:56

0

Между этим решением тоже хорошо. Я обычно иду на Counter чем путь по defaultdict . +1.
Austin 15 июнь 2018, в 09:42

1

Использование понимания списка.

Демо - версия:

l = [['abc',3232,'demo text'],['def',9834,'another text'],['abc', 988,'another another text'],['poi',1234,'text']]
checkVal = [i[0] for i in l]
print( [i for i in l if not checkVal.count(i[0]) > 1 ] )

Выход:

[['def', 9834, 'another text'], ['poi', 1234, 'text']]

Rakesh 15 июнь 2018, в 05:28

0

Вы имеете O (n ^ 2) сложность здесь, вызывая list.count n раз. Вы можете использовать collections.Counter чтобы сделать это O (n). Или хранить ваши счета отдельно.
jpp 15 июнь 2018, в 09:31

Ещё вопросы

Вы имеете O (n ^ 2) сложность здесь, вызывая list.count n раз. Вы можете использовать collections.Counter чтобы сделать это O (n). Или хранить ваши счета отдельно.
Что ж, OP ничего не сказал относительно размера списка, поэтому я предположил, что он недостаточно велик, чтобы сделать разницу между O (n) и O (n ^ 2). Определенно, использование Counter является более эффективным подходом, но я намеревался дать быстрое и грязное решение, которое хорошо работает в большинстве случаев.
Мой комментарий не жалоба, это просто заметка, которая может заинтересовать читателей.
Без обид;) Просто объяснил мои намерения.
Между этим решением тоже хорошо. Я обычно иду на Counter чем путь по defaultdict . +1.
Вы имеете O (n ^ 2) сложность здесь, вызывая list.count n раз. Вы можете использовать collections.Counter чтобы сделать это O (n). Или хранить ваши счета отдельно.

Austin · Accepted Answer · 2018-06-15T06-58-00.000Z

Используйте collections.Counter:

from collections import Counter

lst = [['abc',3232,'demo text'],['def',9834,'another text'],['abc',988,'another another text'],['poi',1234,'text']]

d = dict(Counter(x[0] for x in lst))
print([x for x in lst if d[x[0]] == 1])

# [['def', 9834, 'another text'], 
#  ['poi', 1234, 'text']]

Также обратите внимание, что вы не должны указывать свой список как list поскольку он затеняет встроенный list.

Хорошее решение, это имеет сложность O (n). Но я не думаю, if x[0] in d.keys() необходим?
@jpp упс! Это не обязательно. Большое спасибо.