Когда я должен использовать список против LinkedList

Question

Когда я должен использовать список против LinkedList

304

Когда лучше использовать List(Of T) vs a LinkedList(Of T)?

Jonathan Allen 04 окт. 2008, в 09:01

Источник

3

Java q не должна сильно отличаться.
nawfal 03 июль 2014, в 00:39
3

@ drew-noakes, пожалуйста, подумайте об изменении принятого ответа. Нынешний неточный и крайне вводящий в заблуждение.
Ben 22 авг. 2017, в 18:10
1

@ jonathan-allen, пожалуйста, подумайте об изменении принятого ответа. Нынешний неточный и крайне вводящий в заблуждение.
Neil Patrao 09 авг. 2018, в 10:54

Показать ещё 1 комментарий

Теги:

c#

.net

data-structures

linked-list

vb.net

13 ответов

232

В большинстве случаев List<T> более полезен. LinkedList<T> будет иметь меньшую стоимость при добавлении/удалении элементов в середине списка, тогда как List<T> может только дешево добавить/удалить в конце списка.

LinkedList<T> работает только в том случае, если вы получаете доступ к последовательным данным (либо вперед, либо назад) - случайный доступ является относительно дорогостоящим, так как он должен каждый раз ходить по цепочке (следовательно, у него нет индексатора). Однако, поскольку List<T> по существу является просто массивом (с оберткой), то произвольный доступ в порядке.

List<T> также предлагает множество методов поддержки - Find, ToArray и т.д.; однако они также доступны для LinkedList<T> с .NET 3.5/С# 3.0 с помощью методов расширения - так что это менее важно.

Marc Gravell 04 окт. 2008, в 09:15

3

Одно из преимуществ List <> по сравнению с LinkedList <>, о котором я никогда не задумывался, касается того, как микропроцессоры реализуют кэширование памяти. Хотя я не совсем понимаю это, автор этой статьи блога много говорит о «местонахождении ссылки», которая делает обход массива намного быстрее, чем обход связанного списка, по крайней мере, если связанный список стал несколько фрагментированным в памяти , kjellkod.wordpress.com/2012/02/25/...
RenniePet 18 дек. 2014, в 22:40
0

@RenniePet List реализован с помощью динамического массива, а массивы являются смежными блоками памяти.
Casey 02 апр. 2015, в 02:05
1

Поскольку List - это динамический массив, поэтому иногда полезно указывать емкость List в конструкторе, если вы знаете это заранее.
Cardin 27 июль 2015, в 01:19
0

почему это не принятый ответ?
tomalone 01 апр. 2017, в 19:50
0

Возможно ли, что реализация C, all, array, List <T> и LinkedList <T> несколько неоптимальна для одного очень важного случая: вам нужен очень большой список, append (AddLast) и последовательный обход (в одном направлении) совершенно нормально: я не хочу изменять размер массива для получения непрерывных блоков (гарантируется ли это для каждого массива, даже для массивов по 20 ГБ?), и я заранее не знаю размер, но могу заранее угадать размер блока, например, 100 МБ резервировать каждый раз заранее. Это было бы хорошей реализацией. Или массив / список похож на это, и я пропустил точку?
Philm 19 апр. 2017, в 14:00
1

@Philm - это сценарий, в котором вы пишете свою собственную шим над выбранной стратегией блока; List<T> и T[] потерпят неудачу из-за того, что они слишком длинные (все одна плита), LinkedList<T> будет плакать из-за того, что они слишком гранулированы (плита на элемент).
Marc Gravell♦ 19 апр. 2017, в 14:27
0

Да. В то же время я думаю о реализации прокладки LinkedList <T> массивов 10 МБ или что-то. Реализация может быть интересной ..
Philm 19 апр. 2017, в 14:38
0

@Philm - если Array удастся распределить, он будет полностью последовательным; распределение, выполненное в Resize является new T[newSize] . array.cs . List внутренне Array , так же верно для него. LinkedList - это не то, что вам нужно, когда у вас есть большое количество элементов: он выделяет LinkedListNode каждого элемента . Каждый LinkedListNode отдельное распределение: есть не Array ничего. Нет преемственности. Много памяти используется для предыдущих / следующих указателей. Google c# LinkedList source code .
ToolmakerSteve 20 нояб. 2018, в 18:45

Показать ещё 6 комментариев

166

Мышление связанного списка в виде списка может немного ввести в заблуждение. Это больше похоже на цепочку. На самом деле, в .NET, LinkedList<T> даже не реализует IList<T>. В связанном списке нет реальной концепции индекса, хотя может показаться, что есть. Конечно, ни один из методов, предоставляемых в классе, не принимает индексы.

Связанные списки могут быть связаны по отдельности или дважды связаны. Это относится к тому, имеет ли каждый элемент в цепочке ссылку только на следующую (односвязную) или на оба предшествующих/следующих элемента (дважды связанную). LinkedList<T> имеет двойную связь.

Внутренне, List<T> поддерживается массивом. Это обеспечивает очень компактное представление в памяти. И наоборот, LinkedList<T> включает дополнительную память для хранения двунаправленных ссылок между последовательными элементами. Таким образом, размер памяти LinkedList<T> обычно будет больше, чем для List<T> (с оговоркой, что List<T> может иметь неиспользуемые внутренние элементы массива для повышения производительности во время операций добавления).

У них также разные характеристики:

Append

LinkedList<T>.AddLast(item) постоянное время
List<T>.Add(item) амортизированное постоянное время, линейный наихудший случай

Prepend

LinkedList<T>.AddFirst(item) постоянное время
List<T>.Insert(0, item) линейное время

Вставка

LinkedList<T>.AddBefore(node, item) постоянное время
LinkedList<T>.AddAfter(node, item) постоянное время
List<T>.Insert(index, item) линейное время

Удаление

LinkedList<T>.Remove(item) линейное время
LinkedList<T>.Remove(node) постоянное время
List<T>.Remove(item) линейное время
List<T>.RemoveAt(index) линейное время

Count

LinkedList<T>.Count постоянное время
List<T>.Count постоянное время

Содержит

LinkedList<T>.Contains(item) линейное время
List<T>.Contains(item) линейное время

Очистить

LinkedList<T>.Clear() линейное время
List<T>.Clear() линейное время

Как вы можете видеть, они в основном эквивалентны. На практике API LinkedList<T> является более громоздким в использовании, и детали его внутренних потребностей выходят в ваш код.

Однако, если вам нужно сделать много вложений/абстракций из списка, он предлагает постоянное время. List<T> предлагает линейное время, так как дополнительные элементы в списке должны быть перемешаны после вставки/удаления.

Drew Noakes 15 окт. 2011, в 13:38

2

Является ли количество связанных списков постоянным? Я думал, что это будет линейным?
Iain Ballard 04 нояб. 2011, в 10:05
9

@ Iain, счетчик кэшируется в обоих классах списка.
Drew Noakes 04 нояб. 2011, в 18:13
3

Вы написали, что «List <T> .Add (item) logarithmic time», однако на самом деле это «Constant», если емкость списка может хранить новый элемент, и «Linear», если список не имеет достаточно места и нового быть перераспределенным.
aStranger 16 сен. 2012, в 13:32
0

@aStranger, конечно, ты прав. Не уверен, что я думал выше - возможно, что нормальное время амортизации является логарифмическим, а это не так. На самом деле амортизированное время постоянно. Я не попал в лучший / худший случай операций, стремясь к простому сравнению. Я думаю, что операция добавления достаточно важна, чтобы предоставить эту деталь, однако. Буду редактировать ответ. Благодарю.
Drew Noakes 16 сен. 2012, в 16:14
0

Хороший ответ! Следует отметить, что индексированный доступ является постоянным временем для List, но линейным для LinkedList.
Robert Jeppesen 03 дек. 2012, в 08:58
0

@RobertJeppesen, на самом деле LinkedList<T> не имеет членов для доступа на основе индекса. Вы все еще можете сделать это, используя метод расширения, основанный на IEnumerable<T> который, конечно, предлагает линейный доступ по времени.
Drew Noakes 03 дек. 2012, в 12:00
0

@DrewNoakes Это делает это очевидным. :). Тем не менее, это преимущество List <T>, которое упоминают дезертиры.
Robert Jeppesen 03 дек. 2012, в 15:09
0

@RobertJeppesen, я полностью согласен, что это ключевое различие. На самом деле, я думаю, что название «список» вводит в заблуждение, хотя, конечно, сейчас оно внедрено в коллективное сознание информатики. Не могли бы вы расширить вступительный абзац, где я освещаю то, о чем мы говорим?
Drew Noakes 03 дек. 2012, в 16:15
0

Я не думаю, что название List вообще вводит в заблуждение в случае связанного списка. Это вводит в заблуждение в случае массива!
Miles Rout 15 март 2013, в 23:48
0

Это, безусловно, лучший ответ здесь. Также вы можете добавить Clear . Оба O (n). Затраты памяти на LinkedList стоит отметить. Уже проголосовал.
nawfal 13 май 2014, в 18:32
0

@nawfal, я добавил раздел для Clear . Третий абзац уже обсуждает использование памяти. Вы бы добавили к этому?
Drew Noakes 13 май 2014, в 19:26
0

@DrewNoakes Да, действительно, вы обсуждали использование памяти, я только что сказал. Небольшая коррекция, Clear - это линейное время, а не постоянное время для обоих методов. Это задокументировано в MSDN.
nawfal 14 май 2014, в 07:29
0

Объем памяти после очистки значительно отличается, так как List <T> сохраняет свой размер, а LinkedList - нет.
Lorenzo Santoro 08 фев. 2016, в 09:54
0

Несколько мыслей о добавлении и добавлении: 1. List <T> .AddItem (item) - должно ли это быть O (1), поскольку List не должен делать больших вычислений относительно того, как добраться до последнего элемента, верно? 2 .. Разве List <T> .Insert (0, item) не выполняется за постоянное время? тогда как в общем случае Insert был бы O (n), в частности, insert (0, item) имел бы O (1), потому что List не нужно сильно потеть, чтобы вычислить, где находится индекс 0, не так ли?
tomalone 01 апр. 2017, в 20:09
0

@tomalone Если я правильно понимаю, Insert (0, item) на самом деле является наихудшим случаем для вставки, поскольку для вставки с индексом 0 список должен сначала переместить все элементы на одну клетку, прежде чем вставлять новый элемент. Я считаю, что это может быть даже хуже, если ему нужно перераспределить массив из-за недостатка места.
Francis Lord 16 апр. 2017, в 14:47
0

Вот так. List.Add считается амортизированным постоянным временем, потому что стоимость выращивания массива распределена по каждому из его N элементов, что делает его постоянным фактором. List.Insert считается линейным, потому что вы должны перемещать элементы, чтобы освободить место для вставленного элемента. Технически, если вы всегда вставляете в конце, это постоянное время, но тогда вы можете просто использовать Add в любом случае.
Drew Noakes 16 апр. 2017, в 17:01
0

В некоторых выводах я вижу одно противоречие: учитывая, что меня волнует только скорость Append, что лучше? Я хочу заполнить контейнер несколькими миллионами строк текста (или любым другим потоком), но мне нет дела до оперативной памяти: мне нужно заботиться только о скорости Append (.Добавить в конец списка). Это наиболее важный (канонический) случай, вставки в середине - это что-то еще: ----- Лучше ли использовать LinkedList <T> oder List <T> ??
Philm 19 апр. 2017, в 13:49
1

@Philm, вы, возможно, должны начать новый вопрос, и вы не скажете, как вы собираетесь использовать эту структуру данных после ее создания, но если вы говорите миллион строк, вам может понадобиться какой-то гибрид (связанный список куски массива или аналогичные) для уменьшения фрагментации кучи, уменьшения накладных расходов памяти и исключения одного огромного объекта в LOH.
Drew Noakes 19 апр. 2017, в 13:54
0

@Philm - ваш комментарий здесь «все, что меня волнует, это скорость добавления» расходится с вашим комментарием к ответу Марка Гравелла о том, что вам нужны непрерывные блоки. Либо вы думаете о двух очень разных целях, либо вы не понимаете, что вам нужно. В случае сомнений используйте List и напишите свой алгоритм настолько просто, насколько это возможно, не заботясь о производительности. После того, как ваш код работает правильно в каждом тестовом примере, подумайте. Если достаточно быстро, перейдите к другому заданию.
ToolmakerSteve 20 нояб. 2018, в 18:50
0

Мои комментарии больше не соответствуют интересам деталей стандартных реализаций .NET и возможных идей по улучшению чего-либо. чем один случай использования. Конечно, я знаю, что каждое заявление о производительности «зависит». Таким образом, эти два замечания по двум ответам не влияют на идентичный сценарий. Но в целом, конечно, желательно получить высокую скорость итерации (локальность кэша) как для массивов, так и для вставки. Вставка в конец List (если базовый массив все еще достаточно большой) должна быть достаточно быстрой. Вставка в начале это, конечно, что-то еще.
Philm 20 нояб. 2018, в 20:58

Показать ещё 18 комментариев

111

Связанные списки обеспечивают очень быструю вставку или удаление члена списка. Каждый член в связанном списке содержит указатель на следующий член в списке, чтобы вставить элемент в позицию i:

обновить указатель в элементе i-1, чтобы указать на новый элемент
установите указатель в новом члене, чтобы указать член i

Недостатком связанного списка является то, что случайный доступ невозможен. Доступ к члену требует прохождения списка до тех пор, пока не будет найден нужный элемент.

b3. 04 окт. 2008, в 09:18

6

Я хотел бы добавить, что связанные списки имеют накладные расходы для каждого элемента, сохраненного выше, через LinkedListNode, который ссылается на предыдущий и следующий узел. Выгода от того, что это непрерывный блок памяти, не требуется для хранения списка, в отличие от списка на основе массива.
paulecoyote 22 июль 2009, в 16:26
3

Разве непрерывный блок памяти обычно не отрабатывается?
Jonathan Allen 05 фев. 2010, в 19:52
6

Да, непрерывный блок предпочтителен для производительности произвольного доступа и потребления памяти, но для коллекций, которым необходимо регулярно менять размер, структуру, такую как массив, обычно необходимо копировать в новое местоположение, тогда как связанный список должен управлять памятью только для недавно вставленные / удаленные узлы.
jpierson 17 март 2010, в 13:37
6

Если вам когда-либо приходилось работать с очень большими массивами или списками (список просто оборачивает массив), у вас начнутся проблемы с памятью, даже если на вашем компьютере достаточно памяти. Список использует стратегию удвоения, когда он выделяет новое пространство в своем базовом массиве. Таким образом, заполненный массив 1000000 elemnt будет скопирован в новый массив с 2000000 элементами. Этот новый массив должен быть создан в непрерывном пространстве памяти, достаточно большом для его хранения.
Andrew 04 май 2011, в 08:57
1

У меня был конкретный случай, когда все, что я делал, это добавлял и удалял, и зацикливал один за другим ... здесь связанный список намного превосходил обычный список ...
Peter 27 окт. 2011, в 09:35
0

если объединить двойной связанный список со словарем - вы можете получить скорость O (1) при вставке / удалении и доступе тоже.
ALZ 22 апр. 2013, в 07:15
0

Чтобы добавить к точке @ ALZ: «быстрая вставка» LinkedList помогает, только если у вас есть ссылка на элемент, который нужно вставить до или после . если вам нужно искать элемент, то этот линейный поиск будет доминировать над временем. Если каждый элемент связан с уникальным ключом , то ключ преобразования Dictionary в элемент даст вам элемент за O (1) времени. (Например, если у каждого элемента есть int Id , и вы передаете эти Id вместо того, чтобы передавать ссылки на элементы, вам нужен этот Dictionary .)
ToolmakerSteve 20 нояб. 2018, в 19:04
0

@ b3 «произвольный доступ невозможен»: только частично верно. Если вы пишете алгоритмы, которые передают ссылки на узлы , то LinkedList превосходит List в манипулировании «случайными» элементами, если вставки / удаления выполняются где угодно, но не в конце коллекции . Как только вы вставляете / удаляете посередине, все существующие индексы списка становятся недействительными, и преимущество списка теряется. Принимая во внимание, что если ваш алгоритм содержит узел , он все равно может эффективно проверять элементы до / после. Для некоторых алгоритмов это дает превосходную производительность.
ToolmakerSteve 20 нояб. 2018, в 20:53

Показать ещё 6 комментариев

16

Разница между списком и LinkedList заключается в их основной реализации. Список представляет собой массив на основе массива (ArrayList). LinkedList - это коллекция node -interinter based (LinkedListNode). При использовании уровня API оба они почти одинаковы, поскольку оба реализуют один и тот же набор интерфейсов, таких как ICollection, IEnumerable и т.д.

Ключевое различие возникает, когда производительность имеет значение. Например, если вы реализуете список с тяжелой операцией "INSERT", LinkedList превосходит List. Поскольку LinkedList может сделать это в O (1) раз, но List может потребоваться расширить размер базового массива. Для получения дополнительной информации/подробностей вам может потребоваться ознакомиться с алгоритмической разницей между LinkedList и структурами данных массива. http://en.wikipedia.org/wiki/Linked_list и Array

Надеюсь на эту помощь,

user23117 04 окт. 2008, в 10:14

4

List <T> основан на массиве (T []), а не на ArrayList. Повторно вставьте: изменение размера массива не является проблемой (алгоритм удвоения означает, что большую часть времени ему не нужно это делать): проблема заключается в том, что он должен сначала скопировать все существующие данные, что занимает немного время.
Marc Gravell♦ 04 окт. 2008, в 08:38
2

@Marc, «алгоритм удвоения» только делает его O (logN), но он все еще хуже, чем O (1)
Ilya Ryzhenkov 04 окт. 2008, в 10:02
2

Моя точка зрения заключалась в том, что боль вызывает не изменение размера, а блядь. В худшем случае, если мы добавляем первый (нулевой) элемент каждый раз, то блит должен каждый раз все перемещать.
Marc Gravell♦ 04 окт. 2008, в 10:23
0

@IlyaRyzhenkov - вы думаете о случае, когда Add всегда находится в конце существующего массива. List «достаточно хорош», даже если не O (1). Серьезная проблема возникает, если вам нужно много Add , которых нет в конце. Марк указывает на то, что необходимость перемещать существующие данные каждый раз, когда вы вставляете (а не только когда требуется изменение размера), является более существенным снижением производительности List .
ToolmakerSteve 20 нояб. 2018, в 19:11
0

Проблема в том, что теоретические обозначения Big O не рассказывают всю историю. В компьютерных науках это все, что кого-либо когда-либо заботит, но в реальном мире беспокоиться гораздо больше, чем это.
MattE 08 фев. 2019, в 01:46

Показать ещё 3 комментария

9

Основным преимуществом связанных списков по массивам является то, что ссылки предоставляют нам возможность эффективно перестраивать элементы. Sedgewick, p. 91

Dr. Alrawi 25 нояб. 2012, в 09:21

1

ИМО это должен быть ответ. LinkedList используются, когда важен гарантированный заказ.
RBaarda 13 июль 2016, в 09:28
1

@RBaarda: я не согласен. Это зависит от уровня, о котором мы говорим. Алгоритмический уровень отличается от уровня реализации машины. Для рассмотрения скорости вам понадобится и последнее. Как уже указывалось, массивы реализованы как «один кусок» памяти, что является ограничением, поскольку это может привести к изменению размеров и реорганизации памяти, особенно с очень большими массивами. Подумав немного, особая собственная структура данных, связанный список массивов - это одна из идей, которая позволит лучше контролировать скорость линейного заполнения и доступ к очень большим структурам данных.
Philm 19 апр. 2017, в 14:16
1

@Philm - я одобрил ваш комментарий, но хотел бы отметить, что вы описываете другое требование. Ответ говорит о том, что связанный список имеет преимущество в производительности для алгоритмов, которые включают в себя большое переупорядочение элементов. Учитывая это, я интерпретирую комментарий RBaarda как относящийся к необходимости добавлять / удалять элементы, постоянно поддерживая заданный порядок (критерии сортировки). Так что не просто "линейная начинка". Учитывая это, List проигрывает, потому что индексы бесполезны (меняются каждый раз, когда вы добавляете элемент в любом месте, кроме как в конце).
ToolmakerSteve 20 нояб. 2018, в 21:06

Показать ещё 1 комментарий

4

Мой предыдущий ответ был недостаточно точным. Как это было ужасно: D Но теперь я могу опубликовать гораздо более полезный и правильный ответ.

Я сделал несколько дополнительных тестов. Вы можете найти его источник по следующей ссылке и переустановить его в своей среде по своему усмотрению: https://github.com/ukushu/DataStructuresTestsAndOther.git

Короткие результаты:

Массив должен использовать:
- Так часто, насколько это возможно. Он быстро и занимает наименьший объем оперативной памяти для информации о том же объеме.
- Если вы знаете точное количество необходимых ячеек
- Если данные, сохраненные в массиве < 85000 b
- Если требуется высокая скорость произвольного доступа
Список должен использовать:
- Если необходимо добавить ячейки в конец списка (часто)
- Если необходимо добавить ячейки в начало/середину списка (NOT OFTEN)
- Если данные, сохраненные в массиве < 85000 b
- Если требуется высокая скорость произвольного доступа
LinkedList должен использовать:
- Если необходимо добавить ячейки в начало/середину/конец списка (часто)
- При необходимости только последовательный доступ (вперед/назад)
- Если вам нужно сохранить LARGE-элементы, но количество элементов будет низким.
- Лучше не использовать для большого количества элементов, так как он использует дополнительную память для ссылок.

Подробнее:

Интересно знать:

Связанный список внутри не является списком в .NET. LinkedList<T>. Он даже не реализует IList<T>. И поэтому отсутствуют индексы и методы, связанные с индексами.
LinkedList<T> представляет собой коллекцию node -interinter. В .NET это связано с двойной связью. Это означает, что предыдущие/следующие элементы имеют ссылку на текущий элемент. И данные фрагментированы - разные объекты списка могут быть расположены в разных местах ОЗУ. Кроме того, для LinkedList<T> будет больше памяти, чем для List<T> или массива.
List<T> в .Net является альтернативой Java ArraList<T>. Это означает, что это оболочка массива. Таким образом, он выделяется в памяти как один непрерывный блок данных. Если выделенный размер данных превышает 85000 байт, он будет выделен как часть большой кучи объектов. В зависимости от размера это может привести к фрагментации кучи, легкой утечке памяти. Но в то же время, если размер < 85000 байт - это обеспечивает очень компактное представление с быстрым доступом в памяти.
Единственный непрерывный блок предпочтительнее для производительности произвольного доступа и потребления памяти, но для коллекций, которые должны регулярно менять размер, структура, такая как массив, обычно должна быть скопирована в новое место, тогда как связанный список должен управлять только память для вновь вставленных/удаленных узлов.

Andrew 25 март 2015, в 19:57

1

Вопрос: Под "данными, сохраненными в массиве <или> 85.000 байт" вы имеете в виду данные на массив / список ELEMENT, не так ли? Можно понять, что вы имеете в виду размер данных всего массива ..
Philm 19 апр. 2017, в 13:33
0

Элементы массива расположены последовательно в памяти. Так по массиву. Я знаю об ошибке в таблице, позже я это исправлю :) (надеюсь ....)
Andrew 15 янв. 2019, в 12:30

3

Общим для использования LinkedList является следующее:

Предположим, вы хотите удалить многие строки из списка строк большого размера, скажем, 100 000. Строки для удаления можно найти в HashSet dic, и, как считается, список строк содержит от 30 000 до 60 000 таких строк для удаления.

Тогда какой лучший тип списка для хранения 100 000 строк? Ответ: LinkedList. Если они хранятся в ArrayList, то итерация по ней и удаление совпадающих строк, которые будут занимать к миллиардам операций, тогда как требуется около 100 000 операций с использованием итератора и метода remove().

LinkedList<String> strings = readStrings();
HashSet<String> dic = readDic();
Iterator<String> iterator = strings.iterator();
while (iterator.hasNext()){
    String string = iterator.next();
    if (dic.contains(string))
    iterator.remove();
}

Tom 19 авг. 2014, в 13:58

4

Вы можете просто использовать RemoveAll чтобы удалить элементы из List не перемещая много элементов, или использовать Where из LINQ, чтобы создать второй список. Однако использование LinkedList приводит к тому, что он потребляет значительно больше памяти, чем другие типы коллекций, а потеря локальности памяти означает, что итерация будет заметно медленнее, что делает его несколько хуже, чем List .
Servy 21 окт. 2014, в 14:36
0

@ Служите, обратите внимание, что в ответе Тома используется Java. Я не уверен, что в Java RemoveAll эквивалент RemoveAll .
Arturo Torres Sánchez 21 нояб. 2014, в 02:05
2

@ ArturoTorresSánchez Ну, вопрос, в частности, гласит, что речь идет о .NET, так что просто делает ответ гораздо менее уместным.
Servy 24 нояб. 2014, в 15:08
0

@ Служба, тогда ты должен был упомянуть об этом с самого начала.
Arturo Torres Sánchez 24 нояб. 2014, в 15:54
0

Если RemoveAll недоступно для List , вы можете выполнить алгоритм «сжатия», который будет выглядеть как цикл Тома, но с двумя индексами и необходимостью перемещать элементы, которые будут храниться по одному во внутреннем массиве списка. Эффективность равна O (n), так же, как алгоритм Тома для LinkedList . В обеих версиях время для вычисления ключа HashSet для строк доминирует. Это не хороший пример того, когда использовать LinkedList .
ToolmakerSteve 20 нояб. 2018, в 19:35

Показать ещё 3 комментария

2

Если вам нужен встроенный индексированный доступ, сортировка (и после этого двоичного поиска) и метод ToArray(), вы должны использовать List.

Michael Damatov 04 окт. 2008, в 10:24

1

Это адаптировано из Tono Nam, принявшего ответ, исправляющий несколько неправильных измерений в нем.

Тест:

static void Main()
{
    LinkedListPerformance.AddFirst_List(); // 12028 ms
    LinkedListPerformance.AddFirst_LinkedList(); // 33 ms

    LinkedListPerformance.AddLast_List(); // 33 ms
    LinkedListPerformance.AddLast_LinkedList(); // 32 ms

    LinkedListPerformance.Enumerate_List(); // 1.08 ms
    LinkedListPerformance.Enumerate_LinkedList(); // 3.4 ms

    //I tried below as fun exercise - not very meaningful, see code
    //sort of equivalent to insertion when having the reference to middle node

    LinkedListPerformance.AddMiddle_List(); // 5724 ms
    LinkedListPerformance.AddMiddle_LinkedList1(); // 36 ms
    LinkedListPerformance.AddMiddle_LinkedList2(); // 32 ms
    LinkedListPerformance.AddMiddle_LinkedList3(); // 454 ms

    Environment.Exit(-1);
}

И код:

using System.Collections.Generic;
using System.Diagnostics;
using System.Linq;

namespace stackoverflow
{
    static class LinkedListPerformance
    {
        class Temp
        {
            public decimal A, B, C, D;

            public Temp(decimal a, decimal b, decimal c, decimal d)
            {
                A = a; B = b; C = c; D = d;
            }
        }



        static readonly int start = 0;
        static readonly int end = 123456;
        static readonly IEnumerable<Temp> query = Enumerable.Range(start, end - start).Select(temp);

        static Temp temp(int i)
        {
            return new Temp(i, i, i, i);
        }

        static void StopAndPrint(this Stopwatch watch)
        {
            watch.Stop();
            Console.WriteLine(watch.Elapsed.TotalMilliseconds);
        }

        public static void AddFirst_List()
        {
            var list = new List<Temp>();
            var watch = Stopwatch.StartNew();

            for (var i = start; i < end; i++)
                list.Insert(0, temp(i));

            watch.StopAndPrint();
        }

        public static void AddFirst_LinkedList()
        {
            var list = new LinkedList<Temp>();
            var watch = Stopwatch.StartNew();

            for (int i = start; i < end; i++)
                list.AddFirst(temp(i));

            watch.StopAndPrint();
        }

        public static void AddLast_List()
        {
            var list = new List<Temp>();
            var watch = Stopwatch.StartNew();

            for (var i = start; i < end; i++)
                list.Add(temp(i));

            watch.StopAndPrint();
        }

        public static void AddLast_LinkedList()
        {
            var list = new LinkedList<Temp>();
            var watch = Stopwatch.StartNew();

            for (int i = start; i < end; i++)
                list.AddLast(temp(i));

            watch.StopAndPrint();
        }

        public static void Enumerate_List()
        {
            var list = new List<Temp>(query);
            var watch = Stopwatch.StartNew();

            foreach (var item in list)
            {

            }

            watch.StopAndPrint();
        }

        public static void Enumerate_LinkedList()
        {
            var list = new LinkedList<Temp>(query);
            var watch = Stopwatch.StartNew();

            foreach (var item in list)
            {

            }

            watch.StopAndPrint();
        }

        //for the fun of it, I tried to time inserting to the middle of 
        //linked list - this is by no means a realistic scenario! or may be 
        //these make sense if you assume you have the reference to middle node

        //insertion to the middle of list
        public static void AddMiddle_List()
        {
            var list = new List<Temp>();
            var watch = Stopwatch.StartNew();

            for (var i = start; i < end; i++)
                list.Insert(list.Count / 2, temp(i));

            watch.StopAndPrint();
        }

        //insertion in linked list in such a fashion that 
        //it has the same effect as inserting into the middle of list
        public static void AddMiddle_LinkedList1()
        {
            var list = new LinkedList<Temp>();
            var watch = Stopwatch.StartNew();

            LinkedListNode<Temp> evenNode = null, oddNode = null;
            for (int i = start; i < end; i++)
            {
                if (list.Count == 0)
                    oddNode = evenNode = list.AddLast(temp(i));
                else
                    if (list.Count % 2 == 1)
                        oddNode = list.AddBefore(evenNode, temp(i));
                    else
                        evenNode = list.AddAfter(oddNode, temp(i));
            }

            watch.StopAndPrint();
        }

        //another hacky way
        public static void AddMiddle_LinkedList2()
        {
            var list = new LinkedList<Temp>();
            var watch = Stopwatch.StartNew();

            for (var i = start + 1; i < end; i += 2)
                list.AddLast(temp(i));
            for (int i = end - 2; i >= 0; i -= 2)
                list.AddLast(temp(i));

            watch.StopAndPrint();
        }

        //OP original more sensible approach, but I tried to filter out
        //the intermediate iteration cost in finding the middle node.
        public static void AddMiddle_LinkedList3()
        {
            var list = new LinkedList<Temp>();
            var watch = Stopwatch.StartNew();

            for (var i = start; i < end; i++)
            {
                if (list.Count == 0)
                    list.AddLast(temp(i));
                else
                {
                    watch.Stop();
                    var curNode = list.First;
                    for (var j = 0; j < list.Count / 2; j++)
                        curNode = curNode.Next;
                    watch.Start();

                    list.AddBefore(curNode, temp(i));
                }
            }

            watch.StopAndPrint();
        }
    }
}

Вы можете видеть, что результаты соответствуют теоретическим показателям, описанным в других документах. Совершенно ясно - LinkedList<T> получает большое время в случае вставок. Я не тестировал для удаления из середины списка, но результат должен быть таким же. Конечно, List<T> имеет другие области, где он лучше работает как O (1) произвольный доступ.

nawfal 03 июль 2014, в 01:41

0

Я спросил аналогичный вопрос, связанный с производительностью коллекции LinkedList, и обнаружил Стивен Клири Реализация С# для Deque была решением. В отличие от коллекции Queue, Deque позволяет перемещать элементы взад и вперед спереди и сзади. Он похож на связанный список, но с улучшенной производительностью.

Adam Cox 12 авг. 2017, в 16:16

0

Deque что Deque «похож на связанный список, но с улучшенной производительностью» . Пожалуйста, уточните это утверждение: Deque - лучшая производительность, чем LinkedList , для вашего конкретного кода . Перейдя по вашей ссылке, я вижу, что через два дня вы узнали от Ивана Стоева, что это не неэффективность LinkedList, а неэффективность вашего кода. (И даже если бы это был неэффективный LinkedList, это не оправдало бы общее утверждение, что Deque более эффективен; только в определенных случаях.)
ToolmakerSteve 20 нояб. 2018, в 20:12

0

Здесь так много средних ответов...

В некоторых реализациях связанных списков используются базовые блоки предварительно выделенных узлов. Если они этого не делают, то постоянное время/линейное время менее важно, так как производительность памяти будет плохой, а производительность кэша еще хуже.

Используйте связанные списки, когда

1) Вам нужна безопасность потоков. Вы можете создавать улучшенные поточные альги. Затраты на блокировку будут доминировать в параллельном списке стилей.

2) Если у вас большая структура, похожая на очередь, и вы хотите удалить или добавить где угодно, кроме конца все время. > 100K-списки существуют, но не так распространены.

user1496062 08 окт. 2016, в 05:58

2

Этот вопрос касался двух реализаций C #, а не связанных списков в целом.
Jonathan Allen 09 окт. 2016, в 06:30
0

То же самое на каждом языке
user1496062 07 дек. 2018, в 08:51

0

Используйте LinkedList<>, когда

Вы не знаете, сколько объектов проходит через шлюз. Например, Token Stream.
Когда вы ТОЛЬКО хотите удалить \insert в конце.

Для всего остального лучше использовать List<>.

Antony Thomas 23 нояб. 2012, в 16:30

6

Я не понимаю, почему пункт 2 имеет смысл. Связанные списки хороши, когда вы делаете много вставок / удалений по всему списку.
Drew Noakes 25 дек. 2012, в 20:23
0

Из-за того, что LinkedLists не основаны на индексах, вам действительно нужно сканировать весь список для вставки или удаления, что влечет за собой штраф O (n). List <>, с другой стороны, страдает от изменения размера массива, но все же, IMO, является лучшим вариантом по сравнению с LinkedLists.
Antony Thomas 26 дек. 2012, в 22:45
1

Вам не нужно сканировать список для вставок / удалений, если вы отслеживаете объекты LinkedListNode<T> в своем коде. Если вы можете сделать это, то это намного лучше, чем использовать List<T> , особенно для очень длинных списков, где часто вставляются / удаляются.
Drew Noakes 26 дек. 2012, в 23:02
0

Вы имеете в виду хеш-таблицу? Если это так, то это был бы типичный компромисс между пространством и временем, когда каждый программист должен сделать выбор на основе проблемной области :) Но да, это сделало бы это быстрее.
Antony Thomas 27 дек. 2012, в 04:23
0

@AntonyThomas - Нет, он подразумевает передачу ссылок на узлы вместо передачи ссылок на элементы . Если все, что у вас есть, это элемент , то и List, и LinkedList имеют плохую производительность, потому что вам приходится искать. Если вы думаете «но со списком, я могу просто передать индекс»: это действительно только тогда, когда вы никогда не вставляете новый элемент в середину списка. LinkedList не имеет этого ограничения, если вы держитесь за узел (и используете node.Value всякий раз, когда вы хотите оригинальный элемент). Таким образом, вы переписываете алгоритм для работы с узлами, а не с необработанными значениями.
ToolmakerSteve 20 нояб. 2018, в 20:29
0

Пункт 1) иногда верно, иногда нет. Недостатком LinkedList , когда может быть много объектов, а объекты маленького размера, является то, что каждый объект требует дополнительного выделения - LinkedListNode который создается при добавлении его в LinkedList. Положительным моментом является то, что вам не нужно приобретать один непрерывный кусок памяти, поэтому вы избегаете потенциальной проблемы фрагментации памяти. (Я никогда не находил значительных затрат на производительность внутреннего изменения размера в List ; на практике важно, как используется память.)
ToolmakerSteve 20 нояб. 2018, в 20:35
0

Как указывает Дрю, пункт 2) сомнителен. Обычный аргумент в пользу LinkedList - это когда вам нужно удалить / вставить где угодно, кроме как в хвосте . Список должен переместить существующие данные. LinkedList не имеет. Ваш аргумент в комментарии, что «вам действительно нужно просмотреть весь список» означает, что вы думаете об алгоритмах, где индексы не меняются . Действительно, List в этих случаях хорош, но как только вы удаляете / вставляете в середину списка, существующие индексы становятся бесполезными. Так что в таких случаях список не годится. У вас есть это задом наперед; «середина списка» - это когда LinkedList выигрывает у List.
ToolmakerSteve 20 нояб. 2018, в 20:44

Показать ещё 5 комментариев

Ещё вопросы

@ drew-noakes, пожалуйста, подумайте об изменении принятого ответа. Нынешний неточный и крайне вводящий в заблуждение.
@ jonathan-allen, пожалуйста, подумайте об изменении принятого ответа. Нынешний неточный и крайне вводящий в заблуждение.
Одно из преимуществ List <> по сравнению с LinkedList <>, о котором я никогда не задумывался, касается того, как микропроцессоры реализуют кэширование памяти. Хотя я не совсем понимаю это, автор этой статьи блога много говорит о «местонахождении ссылки», которая делает обход массива намного быстрее, чем обход связанного списка, по крайней мере, если связанный список стал несколько фрагментированным в памяти , kjellkod.wordpress.com/2012/02/25/...
@RenniePet List реализован с помощью динамического массива, а массивы являются смежными блоками памяти.
Поскольку List - это динамический массив, поэтому иногда полезно указывать емкость List в конструкторе, если вы знаете это заранее.
Возможно ли, что реализация C, all, array, List <T> и LinkedList <T> несколько неоптимальна для одного очень важного случая: вам нужен очень большой список, append (AddLast) и последовательный обход (в одном направлении) совершенно нормально: я не хочу изменять размер массива для получения непрерывных блоков (гарантируется ли это для каждого массива, даже для массивов по 20 ГБ?), и я заранее не знаю размер, но могу заранее угадать размер блока, например, 100 МБ резервировать каждый раз заранее. Это было бы хорошей реализацией. Или массив / список похож на это, и я пропустил точку?
@Philm - это сценарий, в котором вы пишете свою собственную шим над выбранной стратегией блока; List<T> и T[] потерпят неудачу из-за того, что они слишком длинные (все одна плита), LinkedList<T> будет плакать из-за того, что они слишком гранулированы (плита на элемент).
Да. В то же время я думаю о реализации прокладки LinkedList <T> массивов 10 МБ или что-то. Реализация может быть интересной ..
@Philm - если Array удастся распределить, он будет полностью последовательным; распределение, выполненное в Resize является new T[newSize] . array.cs . List внутренне Array , так же верно для него. LinkedList - это не то, что вам нужно, когда у вас есть большое количество элементов: он выделяет LinkedListNode каждого элемента . Каждый LinkedListNode отдельное распределение: есть не Array ничего. Нет преемственности. Много памяти используется для предыдущих / следующих указателей. Google c# LinkedList source code .
Является ли количество связанных списков постоянным? Я думал, что это будет линейным?
@ Iain, счетчик кэшируется в обоих классах списка.
Вы написали, что «List <T> .Add (item) logarithmic time», однако на самом деле это «Constant», если емкость списка может хранить новый элемент, и «Linear», если список не имеет достаточно места и нового быть перераспределенным.
@aStranger, конечно, ты прав. Не уверен, что я думал выше - возможно, что нормальное время амортизации является логарифмическим, а это не так. На самом деле амортизированное время постоянно. Я не попал в лучший / худший случай операций, стремясь к простому сравнению. Я думаю, что операция добавления достаточно важна, чтобы предоставить эту деталь, однако. Буду редактировать ответ. Благодарю.
Хороший ответ! Следует отметить, что индексированный доступ является постоянным временем для List, но линейным для LinkedList.
@RobertJeppesen, на самом деле LinkedList<T> не имеет членов для доступа на основе индекса. Вы все еще можете сделать это, используя метод расширения, основанный на IEnumerable<T> который, конечно, предлагает линейный доступ по времени.
@DrewNoakes Это делает это очевидным. :). Тем не менее, это преимущество List <T>, которое упоминают дезертиры.
@RobertJeppesen, я полностью согласен, что это ключевое различие. На самом деле, я думаю, что название «список» вводит в заблуждение, хотя, конечно, сейчас оно внедрено в коллективное сознание информатики. Не могли бы вы расширить вступительный абзац, где я освещаю то, о чем мы говорим?
Я не думаю, что название List вообще вводит в заблуждение в случае связанного списка. Это вводит в заблуждение в случае массива!
Это, безусловно, лучший ответ здесь. Также вы можете добавить Clear . Оба O (n). Затраты памяти на LinkedList стоит отметить. Уже проголосовал.
@nawfal, я добавил раздел для Clear . Третий абзац уже обсуждает использование памяти. Вы бы добавили к этому?
@DrewNoakes Да, действительно, вы обсуждали использование памяти, я только что сказал. Небольшая коррекция, Clear - это линейное время, а не постоянное время для обоих методов. Это задокументировано в MSDN.
Объем памяти после очистки значительно отличается, так как List <T> сохраняет свой размер, а LinkedList - нет.
Несколько мыслей о добавлении и добавлении: 1. List <T> .AddItem (item) - должно ли это быть O (1), поскольку List не должен делать больших вычислений относительно того, как добраться до последнего элемента, верно? 2 .. Разве List <T> .Insert (0, item) не выполняется за постоянное время? тогда как в общем случае Insert был бы O (n), в частности, insert (0, item) имел бы O (1), потому что List не нужно сильно потеть, чтобы вычислить, где находится индекс 0, не так ли?
@tomalone Если я правильно понимаю, Insert (0, item) на самом деле является наихудшим случаем для вставки, поскольку для вставки с индексом 0 список должен сначала переместить все элементы на одну клетку, прежде чем вставлять новый элемент. Я считаю, что это может быть даже хуже, если ему нужно перераспределить массив из-за недостатка места.
Вот так. List.Add считается амортизированным постоянным временем, потому что стоимость выращивания массива распределена по каждому из его N элементов, что делает его постоянным фактором. List.Insert считается линейным, потому что вы должны перемещать элементы, чтобы освободить место для вставленного элемента. Технически, если вы всегда вставляете в конце, это постоянное время, но тогда вы можете просто использовать Add в любом случае.
В некоторых выводах я вижу одно противоречие: учитывая, что меня волнует только скорость Append, что лучше? Я хочу заполнить контейнер несколькими миллионами строк текста (или любым другим потоком), но мне нет дела до оперативной памяти: мне нужно заботиться только о скорости Append (.Добавить в конец списка). Это наиболее важный (канонический) случай, вставки в середине - это что-то еще: ----- Лучше ли использовать LinkedList <T> oder List <T> ??
@Philm, вы, возможно, должны начать новый вопрос, и вы не скажете, как вы собираетесь использовать эту структуру данных после ее создания, но если вы говорите миллион строк, вам может понадобиться какой-то гибрид (связанный список куски массива или аналогичные) для уменьшения фрагментации кучи, уменьшения накладных расходов памяти и исключения одного огромного объекта в LOH.
@Philm - ваш комментарий здесь «все, что меня волнует, это скорость добавления» расходится с вашим комментарием к ответу Марка Гравелла о том, что вам нужны непрерывные блоки. Либо вы думаете о двух очень разных целях, либо вы не понимаете, что вам нужно. В случае сомнений используйте List и напишите свой алгоритм настолько просто, насколько это возможно, не заботясь о производительности. После того, как ваш код работает правильно в каждом тестовом примере, подумайте. Если достаточно быстро, перейдите к другому заданию.
Мои комментарии больше не соответствуют интересам деталей стандартных реализаций .NET и возможных идей по улучшению чего-либо. чем один случай использования. Конечно, я знаю, что каждое заявление о производительности «зависит». Таким образом, эти два замечания по двум ответам не влияют на идентичный сценарий. Но в целом, конечно, желательно получить высокую скорость итерации (локальность кэша) как для массивов, так и для вставки. Вставка в конец List (если базовый массив все еще достаточно большой) должна быть достаточно быстрой. Вставка в начале это, конечно, что-то еще.
Я хотел бы добавить, что связанные списки имеют накладные расходы для каждого элемента, сохраненного выше, через LinkedListNode, который ссылается на предыдущий и следующий узел. Выгода от того, что это непрерывный блок памяти, не требуется для хранения списка, в отличие от списка на основе массива.
Разве непрерывный блок памяти обычно не отрабатывается?
Да, непрерывный блок предпочтителен для производительности произвольного доступа и потребления памяти, но для коллекций, которым необходимо регулярно менять размер, структуру, такую как массив, обычно необходимо копировать в новое местоположение, тогда как связанный список должен управлять памятью только для недавно вставленные / удаленные узлы.
Если вам когда-либо приходилось работать с очень большими массивами или списками (список просто оборачивает массив), у вас начнутся проблемы с памятью, даже если на вашем компьютере достаточно памяти. Список использует стратегию удвоения, когда он выделяет новое пространство в своем базовом массиве. Таким образом, заполненный массив 1000000 elemnt будет скопирован в новый массив с 2000000 элементами. Этот новый массив должен быть создан в непрерывном пространстве памяти, достаточно большом для его хранения.
У меня был конкретный случай, когда все, что я делал, это добавлял и удалял, и зацикливал один за другим ... здесь связанный список намного превосходил обычный список ...
если объединить двойной связанный список со словарем - вы можете получить скорость O (1) при вставке / удалении и доступе тоже.
Чтобы добавить к точке @ ALZ: «быстрая вставка» LinkedList помогает, только если у вас есть ссылка на элемент, который нужно вставить до или после . если вам нужно искать элемент, то этот линейный поиск будет доминировать над временем. Если каждый элемент связан с уникальным ключом , то ключ преобразования Dictionary в элемент даст вам элемент за O (1) времени. (Например, если у каждого элемента есть int Id , и вы передаете эти Id вместо того, чтобы передавать ссылки на элементы, вам нужен этот Dictionary .)
@ b3 «произвольный доступ невозможен»: только частично верно. Если вы пишете алгоритмы, которые передают ссылки на узлы , то LinkedList превосходит List в манипулировании «случайными» элементами, если вставки / удаления выполняются где угодно, но не в конце коллекции . Как только вы вставляете / удаляете посередине, все существующие индексы списка становятся недействительными, и преимущество списка теряется. Принимая во внимание, что если ваш алгоритм содержит узел , он все равно может эффективно проверять элементы до / после. Для некоторых алгоритмов это дает превосходную производительность.
List <T> основан на массиве (T []), а не на ArrayList. Повторно вставьте: изменение размера массива не является проблемой (алгоритм удвоения означает, что большую часть времени ему не нужно это делать): проблема заключается в том, что он должен сначала скопировать все существующие данные, что занимает немного время.
@Marc, «алгоритм удвоения» только делает его O (logN), но он все еще хуже, чем O (1)
Моя точка зрения заключалась в том, что боль вызывает не изменение размера, а блядь. В худшем случае, если мы добавляем первый (нулевой) элемент каждый раз, то блит должен каждый раз все перемещать.
@IlyaRyzhenkov - вы думаете о случае, когда Add всегда находится в конце существующего массива. List «достаточно хорош», даже если не O (1). Серьезная проблема возникает, если вам нужно много Add , которых нет в конце. Марк указывает на то, что необходимость перемещать существующие данные каждый раз, когда вы вставляете (а не только когда требуется изменение размера), является более существенным снижением производительности List .
Проблема в том, что теоретические обозначения Big O не рассказывают всю историю. В компьютерных науках это все, что кого-либо когда-либо заботит, но в реальном мире беспокоиться гораздо больше, чем это.
ИМО это должен быть ответ. LinkedList используются, когда важен гарантированный заказ.
@RBaarda: я не согласен. Это зависит от уровня, о котором мы говорим. Алгоритмический уровень отличается от уровня реализации машины. Для рассмотрения скорости вам понадобится и последнее. Как уже указывалось, массивы реализованы как «один кусок» памяти, что является ограничением, поскольку это может привести к изменению размеров и реорганизации памяти, особенно с очень большими массивами. Подумав немного, особая собственная структура данных, связанный список массивов - это одна из идей, которая позволит лучше контролировать скорость линейного заполнения и доступ к очень большим структурам данных.
@Philm - я одобрил ваш комментарий, но хотел бы отметить, что вы описываете другое требование. Ответ говорит о том, что связанный список имеет преимущество в производительности для алгоритмов, которые включают в себя большое переупорядочение элементов. Учитывая это, я интерпретирую комментарий RBaarda как относящийся к необходимости добавлять / удалять элементы, постоянно поддерживая заданный порядок (критерии сортировки). Так что не просто "линейная начинка". Учитывая это, List проигрывает, потому что индексы бесполезны (меняются каждый раз, когда вы добавляете элемент в любом месте, кроме как в конце).
Вопрос: Под "данными, сохраненными в массиве <или> 85.000 байт" вы имеете в виду данные на массив / список ELEMENT, не так ли? Можно понять, что вы имеете в виду размер данных всего массива ..
Элементы массива расположены последовательно в памяти. Так по массиву. Я знаю об ошибке в таблице, позже я это исправлю :) (надеюсь ....)
Вы можете просто использовать RemoveAll чтобы удалить элементы из List не перемещая много элементов, или использовать Where из LINQ, чтобы создать второй список. Однако использование LinkedList приводит к тому, что он потребляет значительно больше памяти, чем другие типы коллекций, а потеря локальности памяти означает, что итерация будет заметно медленнее, что делает его несколько хуже, чем List .
@ Служите, обратите внимание, что в ответе Тома используется Java. Я не уверен, что в Java RemoveAll эквивалент RemoveAll .
@ ArturoTorresSánchez Ну, вопрос, в частности, гласит, что речь идет о .NET, так что просто делает ответ гораздо менее уместным.
@ Служба, тогда ты должен был упомянуть об этом с самого начала.
Если RemoveAll недоступно для List , вы можете выполнить алгоритм «сжатия», который будет выглядеть как цикл Тома, но с двумя индексами и необходимостью перемещать элементы, которые будут храниться по одному во внутреннем массиве списка. Эффективность равна O (n), так же, как алгоритм Тома для LinkedList . В обеих версиях время для вычисления ключа HashSet для строк доминирует. Это не хороший пример того, когда использовать LinkedList .
Deque что Deque «похож на связанный список, но с улучшенной производительностью» . Пожалуйста, уточните это утверждение: Deque - лучшая производительность, чем LinkedList , для вашего конкретного кода . Перейдя по вашей ссылке, я вижу, что через два дня вы узнали от Ивана Стоева, что это не неэффективность LinkedList, а неэффективность вашего кода. (И даже если бы это был неэффективный LinkedList, это не оправдало бы общее утверждение, что Deque более эффективен; только в определенных случаях.)
Этот вопрос касался двух реализаций C #, а не связанных списков в целом.
Я не понимаю, почему пункт 2 имеет смысл. Связанные списки хороши, когда вы делаете много вставок / удалений по всему списку.
Из-за того, что LinkedLists не основаны на индексах, вам действительно нужно сканировать весь список для вставки или удаления, что влечет за собой штраф O (n). List <>, с другой стороны, страдает от изменения размера массива, но все же, IMO, является лучшим вариантом по сравнению с LinkedLists.
Вам не нужно сканировать список для вставок / удалений, если вы отслеживаете объекты LinkedListNode<T> в своем коде. Если вы можете сделать это, то это намного лучше, чем использовать List<T> , особенно для очень длинных списков, где часто вставляются / удаляются.
Вы имеете в виду хеш-таблицу? Если это так, то это был бы типичный компромисс между пространством и временем, когда каждый программист должен сделать выбор на основе проблемной области :) Но да, это сделало бы это быстрее.
@AntonyThomas - Нет, он подразумевает передачу ссылок на узлы вместо передачи ссылок на элементы . Если все, что у вас есть, это элемент , то и List, и LinkedList имеют плохую производительность, потому что вам приходится искать. Если вы думаете «но со списком, я могу просто передать индекс»: это действительно только тогда, когда вы никогда не вставляете новый элемент в середину списка. LinkedList не имеет этого ограничения, если вы держитесь за узел (и используете node.Value всякий раз, когда вы хотите оригинальный элемент). Таким образом, вы переписываете алгоритм для работы с узлами, а не с необработанными значениями.
Пункт 1) иногда верно, иногда нет. Недостатком LinkedList , когда может быть много объектов, а объекты маленького размера, является то, что каждый объект требует дополнительного выделения - LinkedListNode который создается при добавлении его в LinkedList. Положительным моментом является то, что вам не нужно приобретать один непрерывный кусок памяти, поэтому вы избегаете потенциальной проблемы фрагментации памяти. (Я никогда не находил значительных затрат на производительность внутреннего изменения размера в List ; на практике важно, как используется память.)
Как указывает Дрю, пункт 2) сомнителен. Обычный аргумент в пользу LinkedList - это когда вам нужно удалить / вставить где угодно, кроме как в хвосте . Список должен переместить существующие данные. LinkedList не имеет. Ваш аргумент в комментарии, что «вам действительно нужно просмотреть весь список» означает, что вы думаете об алгоритмах, где индексы не меняются . Действительно, List в этих случаях хорош, но как только вы удаляете / вставляете в середину списка, существующие индексы становятся бесполезными. Так что в таких случаях список не годится. У вас есть это задом наперед; «середина списка» - это когда LinkedList выигрывает у List.

Tono Nam · Accepted Answer · 2012-09-17T22-17-00.000Z

Изменить

Прочтите комментарии к этому ответу. Люди утверждают, что я не делал надлежащие тесты. Я согласен, что это не должно быть приемлемым ответом. Как я был Я провела несколько тестов и почувствовала, как их разделять.

Оригинальный ответ...

Я нашел интересные результаты:

// Temporary class to show the example
class Temp
{
    public decimal A, B, C, D;

    public Temp(decimal a, decimal b, decimal c, decimal d)
    {
        A = a;            B = b;            C = c;            D = d;
    }
}

Связанный список (3,9 секунды)

        LinkedList<Temp> list = new LinkedList<Temp>();

        for (var i = 0; i < 12345678; i++)
        {
            var a = new Temp(i, i, i, i);
            list.AddLast(a);
        }

        decimal sum = 0;
        foreach (var item in list)
            sum += item.A;

Список (2,4 секунды)

        List<Temp> list = new List<Temp>(); // 2.4 seconds

        for (var i = 0; i < 12345678; i++)
        {
            var a = new Temp(i, i, i, i);
            list.Add(a);
        }

        decimal sum = 0;
        foreach (var item in list)
            sum += item.A;

Даже если вы только получаете доступ к данным, он значительно медленнее! Я говорю, никогда не используйте связанный список.

Вот еще одно сравнение, выполняющее множество вставок (мы планируем вставить элемент в середине списка)

Связанный список (51 секунда)

        LinkedList<Temp> list = new LinkedList<Temp>();

        for (var i = 0; i < 123456; i++)
        {
            var a = new Temp(i, i, i, i);

            list.AddLast(a);
            var curNode = list.First;

            for (var k = 0; k < i/2; k++) // In order to insert a node at the middle of the list we need to find it
                curNode = curNode.Next;

            list.AddAfter(curNode, a); // Insert it after
        }

        decimal sum = 0;
        foreach (var item in list)
            sum += item.A;

Список (7.26 секунд)

        List<Temp> list = new List<Temp>();

        for (var i = 0; i < 123456; i++)
        {
            var a = new Temp(i, i, i, i);

            list.Insert(i / 2, a);
        }

        decimal sum = 0;
        foreach (var item in list)
            sum += item.A;

Связанный список со ссылкой на место, где нужно вставить (0,04 секунды)

        list.AddLast(new Temp(1,1,1,1));
        var referenceNode = list.First;

        for (var i = 0; i < 123456; i++)
        {
            var a = new Temp(i, i, i, i);

            list.AddLast(a);
            list.AddBefore(referenceNode, a);
        }

        decimal sum = 0;
        foreach (var item in list)
            sum += item.A;

Итак, только если вы планируете вставлять несколько элементов, а также, где-то есть ссылка, где вы планируете вставить элемент, а затем использовать связанный список. Просто потому, что вам нужно вставить множество элементов, это не ускоряет работу, поскольку поиск места, в который вы хотите вставить, требует времени.

У LinkedList есть преимущество перед списком (это зависит от .net): поскольку список поддерживается внутренним массивом, он размещается в одном непрерывном блоке. Если размер выделенного блока превышает 85000 байт, он будет размещен в куче больших объектов, некомпактное поколение. В зависимости от размера это может привести к фрагментации кучи, легкой форме утечки памяти.
Обратите внимание, что если вы много делаете предоплату (как вы это делаете в последнем примере) или удаляете первую запись, связанный список почти всегда будет значительно быстрее, так как не нужно выполнять поиск, перемещение или копирование. Список потребует перемещения всего на определенное место, чтобы разместить новый элемент, делая операцию O (N).
Примечание. Это звучит совершенно типично для ЛЮБОЙ реализации связанного списка, а не только для .Net.
Это странно. Первые результаты идут вразрез с тем, что упоминали @marc gravell и другие авторы. Например: время вставки и обхода вперед должно быть одинаковым как для LinkedList, так и для List. есть идеи?
Я думаю, что примечательно, что список реализован с использованием массива. Это означает, что этот массив должен быть расширен, как только список превысит его первоначальный размер. Что снова является операцией O (n). В отличие от связного списка, нет необходимости в перемещении памяти, поэтому у нас никогда не бывает такой дорогостоящей операции O (n). Объединенный список наиболее удобен при добавлении большого количества данных в начале списка. Поправьте меня если я ошибаюсь.
Почему в цикле list.AddLast(a); в двух последних примерах LinkedList? Я получаю это один раз перед циклом, как со list.AddLast(new Temp(1,1,1,1)); в следующем за последним LinkedList, но, похоже, вы добавляете вдвое больше объектов Temp в сами циклы. (И когда я дважды проверяю себя с помощью тестового приложения , конечно же, вдвое больше, чем в LinkedList.)
Фрагментация кучи @JerKimball не имеет ничего общего с утечками памяти
@Quonux Строго говоря, правда - но фрагментированный LOH будет почти идентично утечке памяти; выделенная память будет продолжать расти.
@ Tono Nam, если вы хотите добавить элемент в начале коллекции, то LinkedList (O (1)) будет быстрее, чем List (O (n)), потому что List должен будет сместить n элементов вправо. Обидно, что вы не можете связать или объединить связанный список.
Также может быть хорошей идеей проверить вставку в начале списка, LinkedList должен быть намного быстрее, чем List в этой задаче.
Разве в обычном приложении это довольно распространено, что вам нужно только "найти его один раз" ?? Более того; производительность довольно искажена, вы добавляете 2 элемента в связанный список, поэтому размер в 2 раза больше, чем список.
@ChristopheDeTroyer вы правы! В основном cHao делает то же самое ...
Я понизил этот ответ. 1) Ваш общий совет, который I say never use a linkedList. ошибочна, как показывает ваш последующий пост. Вы можете отредактировать его. 2) Какое у вас время? Инстанцирование, сложение и перечисление всего за один шаг? Главным образом, создание экземпляров и перечисление - это не то, о чем беспокоятся люди, это одноразовые шаги. В частности, сроки вставки и дополнения даст лучшую идею. 3) Самое главное, вы добавляете больше, чем требуется, в связанный список. Это неправильное сравнение. Распространяет неправильное представление о связном списке.
Извините, но этот ответ действительно плохой. Пожалуйста, НЕ слушайте этот ответ. Причина в двух словах: совершенно ошибочно думать, что реализации списков на основе массива достаточно глупы, чтобы изменять размер массива при каждой вставке. Связанные списки, естественно, медленнее списков на основе массива при обходе, а также при вставке с обоих концов, потому что только им нужно создавать новые объекты, в то время как списки на основе массива используют буфер (очевидно, в обоих направлениях). (Плохо сделанные) тесты указывают именно на это. Ответ полностью не проверяет случаи, в которых связанные списки предпочтительнее!
Понизил этот «ответ», потому что, во-первых, вопиющая неточность «количества секунд». Может быть, тип за наносекунды, но вопиющий и повторный, так плохо. Кроме того, API для List и LinkedList отличаются друг от друга - это означает, что иногда один является правильным, а другой неуместным. Так что этот «ответ», в котором говорится «никогда не использовать LinkedList», основанный исключительно на производительности для конкретной задачи, является неточным. Я даже не собираюсь искать больше недостатков (которые, я уверен, существуют) в этом ответе. Используйте другой ответ.
@mafu, где ответ allude List <T> изменяет размер массива при каждой вставке?
Я добавил ответ, исправляющий измерения ОП.
Я потрясен, обнаружив, что выбранным ответом является тот, который полностью игнорирует реализацию List / Array vs LinkedList с точки зрения информатики. Это обход связанного списка, который замедляет вещи!
Это совершенно неосведомленный ответ. Это не должен быть выбранный ответ или лучший результат!
Интересно, как это получает 101 голосов ...
Меня больше всего интересует, почему он не был удален. Учитывая, что даже его автор утверждает, что ответ неправильный, мод не должен был занять слишком много времени, чтобы решить удалить его.