Есть ли способ сортировки вложенных списков без использования operator.itemgetter?

Question

Есть ли способ сортировки вложенных списков без использования operator.itemgetter?

1

У меня есть файл, который я читаю, а затем создаю вложенные списки, которые я хочу отсортировать по 4 элемента (zipcode)

jk43:23 Marfield Lane:Plainview:NY:10023
axe99:315 W. 115th Street, Apt. 11B:New York:NY:10027
jab44:23 Rivington Street, Apt. 3R:New York:NY:10002
ap172:19 Boxer Rd.:New York:NY:10005
jb23:115 Karas Dr.:Jersey City:NJ:07127
jb29:119 Xylon Dr.:Jersey City:NJ:07127
ak9:234 Main Street:Philadelphia:PA:08990

Вот мой код:

ex3_3 = open('ex1.txt')
exw = open('ex2_sorted.txt', 'w')

data = []
for line in ex3_3:
    items = line.rstrip().split(':')
    data.append(items)
print sorted(data, key=operator.itemgetter(4))

Вывод:

[['jb23', '115 Karas Dr.', 'Jersey City', 'NJ', '07127'], ['jb29', '119 Xylon Dr.', 'Jersey City', 'NJ', '07127'], ['ak9', '234 Main Street', 'Philadelphia', 'PA', '08990'], ['jab44', '23 Rivington Street, Apt. 3R', 'New York', 'NY', '10002'], ['ap172', '19 Boxer Rd.', 'New York', 'NY', '10005'], ['jk43', '23 Marfield Lane', 'Plainview', 'NY', '10023'], ['axe99', '315 W. 115th Street, Apt. 11B', 'New York', 'NY', '10027']]

все это прекрасно работает, мне просто интересно, есть ли способ сделать это без использования "оператора импорта"?

jed 03 нояб. 2011, в 23:46

Источник

3

Почему бы не захотеть использовать какой-либо import ?
naeg 03 нояб. 2011, в 21:54
0

@naeg: Я думаю, что OP означает: без импорта модуля operator .
Fred Foo 03 нояб. 2011, в 22:05
0

Как отмечено ниже, вы можете использовать lambda . Но весь смысл operator.itemgetter для таких случаев использования, как ваш.
John Y 03 нояб. 2011, в 22:15
1

@larsmans: да, но operator является частью стандартной библиотеки. Единственное, что я мог представить, что он использует Python <2.4. ИЛИ что он думает, что он не должен использовать import , что было бы глупостью.
naeg 04 нояб. 2011, в 06:56

Показать ещё 2 комментария

Теги:

python

sorting

nested-lists

3 ответа

3

Грубым workalike будет:

print sorted(data, key=lambda items: items[4])

но operator.itemgetter немного быстрее. Я использую эту программу для сравнения обоих подходов:

#!/usr/bin/env python

import timeit

withlambda = 'lst.sort(key=lambda items: items[4])'
withgetter = 'lst.sort(key=operator.itemgetter(4))'

setup = """\
import random
import operator
random.seed(0)
lst = [(random.randrange(100000), random.randrange(100000), random.randrange(100000), random.randrange(100000) ,random.randrange(100000))
       for _ in range(10000)]
"""

n = 10000

print "With lambda:"
print timeit.timeit(withlambda, setup, number=n)

print "With getter:"
print timeit.timeit(withgetter, setup, number=n)

Он создает случайный список из 100 000 5-позиционных кортежей, а затем выполняет sort() в списке 1000 раз. На моем MacBook Pro с Python 2.7.2, то withlambda версия работает примерно 55.4s и withgetter работает в около 46.1s.

Обратите внимание, что по мере увеличения списков время, затрачиваемое на алгоритм сортировки, растет быстрее, чем время, затрачиваемое на извлечение ключей. Поэтому разница намного больше, если вы сортируете множество небольших списков. Запуск же тест со списком в 1000 пункта повторяется 100000 раз Урожайность 22.4s для withlambda против 12.5s для withgetter.

Kirk Strauser 03 нояб. 2011, в 19:16

0

На самом деле, не намного быстрее в случайных списках из 100 000 элементов: примерно на 8% быстрее.
Fred Foo 03 нояб. 2011, в 22:09
0

Я получил примерно 18% быстрее в списках из 100 000 элементов против 41% быстрее в списках из 10000 элементов. Я думаю, это имеет смысл, так как издержки самой сортировки растут быстрее, чем длина списка. Замена sorted() на map() дала ускорение 55%. Мораль: оба быстры. Itemgetter быстрее. Выберите тот, который наиболее читабелен для вас, если вы не хотите иметь самый быстрый.
Kirk Strauser 03 нояб. 2011, в 23:09
0

@KirkStrauser Спасибо, я прочитал «оператор», я вижу выгоду, но был заинтересован в том, чтобы не использовать его для тестирования. Спасибо!
jed 04 нояб. 2011, в 00:53
0

@KirkStrauser: какая это версия Python? Я продолжаю получать это ~ 8% ускорение на Python 2.7.2, который представляет собой список списков случайных чисел, приуроченный к %timeit IPython.
Fred Foo 04 нояб. 2011, в 11:26
0

@larsmans Я отредактировал свой ответ, чтобы показать используемый мной тест.
Kirk Strauser 04 нояб. 2011, в 13:22
0

@KirkStrauser: спасибо. Я использовал sorted а не list.sort для моего теста. Я уже дал вам +1, кстати :)
Fred Foo 04 нояб. 2011, в 13:25
0

@larsmans Ах, это может быть сделано, поскольку он также должен управлять распределением списков и т. д. Спасибо!
Kirk Strauser 04 нояб. 2011, в 15:19

Показать ещё 5 комментариев

0

Постройте или реорганизуйте свой подсписчик, чтобы первое, что вы хотите сортировать. В вашем случае почтовый индекс, а не элемент 4, должен быть элементом 0. Затем вы можете просто отсортировать их.

Разумеется, необходимо также учитывать пригодность этого заказа для других видов использования данных.

kindall 03 нояб. 2011, в 20:20

Ещё вопросы

Почему бы не захотеть использовать какой-либо import ?
@naeg: Я думаю, что OP означает: без импорта модуля operator .
Как отмечено ниже, вы можете использовать lambda . Но весь смысл operator.itemgetter для таких случаев использования, как ваш.
@larsmans: да, но operator является частью стандартной библиотеки. Единственное, что я мог представить, что он использует Python <2.4. ИЛИ что он думает, что он не должен использовать import , что было бы глупостью.
На самом деле, не намного быстрее в случайных списках из 100 000 элементов: примерно на 8% быстрее.
Я получил примерно 18% быстрее в списках из 100 000 элементов против 41% быстрее в списках из 10000 элементов. Я думаю, это имеет смысл, так как издержки самой сортировки растут быстрее, чем длина списка. Замена sorted() на map() дала ускорение 55%. Мораль: оба быстры. Itemgetter быстрее. Выберите тот, который наиболее читабелен для вас, если вы не хотите иметь самый быстрый.
@KirkStrauser Спасибо, я прочитал «оператор», я вижу выгоду, но был заинтересован в том, чтобы не использовать его для тестирования. Спасибо!
@KirkStrauser: какая это версия Python? Я продолжаю получать это ~ 8% ускорение на Python 2.7.2, который представляет собой список списков случайных чисел, приуроченный к %timeit IPython.
@larsmans Я отредактировал свой ответ, чтобы показать используемый мной тест.
@KirkStrauser: спасибо. Я использовал sorted а не list.sort для моего теста. Я уже дал вам +1, кстати :)
@larsmans Ах, это может быть сделано, поскольку он также должен управлять распределением списков и т. д. Спасибо!

eudoxos · Accepted Answer · 2011-11-03T20-46-00.000Z

О да, есть способ:

print sorted(data,key=lambda x: x[4])