У меня есть список
a = [([4, 7, 9], [3], 5.5), ([2, 5, 8], [3], 5.5), ([3], [4, 7, 9], 5.5), ([3], [2, 5, 8], 5.5)]
и я пытаюсь удалить дубликаты кортежей, которые имеют ту же комбинацию списков.
Например, ([4, 7, 9], [3], 5.5)
и ([3], [4, 7, 9], 5.5)
совпадают. Таким образом, результат после удаления дубликатов кортежей будет выглядеть примерно так:
a = [([4, 7, 9], [3], 5.5), ([2, 5, 8], [3], 5.5)]
с любым порядком списков в кортежах.
Изменить (на основе обратной связи @DYZ): Полностью сплющенные кортежи не допускаются. Например, (4,7,9,3,5.5)
не допускается. Вывод должен по-прежнему иметь вид: ([list 1], [list2], constant)
.
Я попытался адаптировать метод, связанный с удалением дублированных списков в списке списков в Python, но я достиг психологического тупика..
Возможно ли изменить код в связанном вопросе, или есть более эффективный способ сделать это?
Вы можете использовать словарь для этой работы. Создайте пустой словарь:
from itertools import chain
d = {}
Вставьте каждый кортеж и его сплющенную форму в словарь как значение и ключ соответственно:
for t in a:
# Flatten the tuple
flat = chain.from_iterable(part if isinstance(part,list) else [part]
for part in t)
maps_to = frozenset(flat) # Sets cannot be used as keys
d[maps_to] = t # Add it to the dict; the most recent addition "survives"
list(d.values())
#[([3], [4, 7, 9], 5.5), ([3], [2, 5, 8], 5.5)]
Сортируйте элементы a по их длине (задав длину элементов, которые не перечислены как -1). Затем найдите индексы уникальных элементов результирующей сортировки и используйте их для индексирования в несортированный список.
asort = [sorted(aa, key= lambda x: len(x) if isinstance(x,list) else -1) for aa in a]
inds = [i for i,x in enumerate(asort) if asort.index(x)==i]
a = [a[i] for i in inds]
(4, 7, 9, 3, 5.5)
.