C # / .NET сравнивает два больших списка и находит недостающие элементы в обоих списках

Question

C # / .NET сравнивает два больших списка и находит недостающие элементы в обоих списках

2

так что в основном у меня есть два больших списка, например:

public class Items
{
 public string ItemID { get; set; }
}


var oldList = new List<Items>(); // oldList

var newList = new List<Items>(); // new list

Оба списка очень велики, и простой двойной foreach не будет достаточным из-за плохого времени выполнения, если они оба велики (более 30 секунд).

В предыдущем вопросе, который я задал для stackoverflow, я получил ответ о том, как сравнить эти два одинаковых списка и выяснить, какие элементы имеют различный параметр QuantitySold, а затем сохранить его в третьем списке с именем "DifferentQuantityItems", например:

var differentQuantityItems =
    (from newItem in newList
     join oldItem in oldList on newItem.ItemID equals oldItem.ItemID
     where newItem.QuantitySold != oldItem.QuantitySold
     select newItem).ToList();

Теперь я хотел бы получить из этих двух списков следующее:

- A list of items that are present in newList, but not in oldList

- A list of items that are present in oldList, but not in newList

Как мне этого добиться? Кто-нибудь может мне помочь?

PS То, как я "узнал", что ни один из элементов отсутствует в одном из списков, это свойство "ItemID"...

User987 13 март 2019, в 15:02

Источник

0

Кто-нибудь, ребята? знак равно
User987 13 март 2019, в 13:28
0

Вы можете попробовать intersection и union LINQ docs.microsoft.com/en-us/dotnet/api/…
Aarif 13 март 2019, в 13:29
0

Вы можете использовать метод Equals с пользовательским классом сравнения
Aarif 13 март 2019, в 13:30
0

использование LINQ не обещает никакого увеличения производительности, посмотрите здесь stackoverflow.com/questions/11124797/…
Aarif 13 март 2019, в 13:35
0

@Aarif Аариф, когда я увидел параллельные циклы, упомянутые в одном из ответов, я сразу же убежал ... У меня плохой опыт с параллельными циклами, хахах = D
User987 13 март 2019, в 13:36
0

чтобы получить чистый код, который я бы предложил использовать с помощью LINQ (как уже упоминалось ранее), у вас есть проблема с этими списками, занимающими слишком много времени (не очень понятно из вашего вопроса), вы можете ускорить некоторые параллельные задачи, чтобы сделать это быстрее или лучше написать работу cron, чтобы сделать это.
Aarif 13 март 2019, в 13:40
0

Вы не сказали, были ли списки отсортированы. Это важно знать, прежде чем выбрать подход.
codenheim 13 март 2019, в 15:34

Показать ещё 5 комментариев

Теги:

c#

linq

5 ответов

2

Рассматривали ли вы преобразование ваших списков в хэш-наборы и использование метода Except?

Смотрите разницу между двумя списками

И: Есть ли способ получить разницу между двумя наборами объектов в С#

Pierre 13 март 2019, в 11:26

0

Выглядит хорошо, не могли бы вы показать мне пример, если это возможно, пожалуйста? :)
User987 13 март 2019, в 13:35
1

Согласитесь с попыткой Except (), потому что это должна быть сложность O (1) или O (log N) из-за внутреннего использования HashSet (хотя я не на 100%, но в тестировании это кажется так)
codenheim 13 март 2019, в 15:44

1

var items = new List<int>(oldList.Select(x => x.ItemID ));
var missingValues = newList.Where(x => !diffids.Contains(x.ItemID)).ToList();

Вы также можете использовать кроме.

Kadir 13 март 2019, в 11:07

0

Хм, это немного смущает меня ... Могу ли я извлечь предметы в форме класса? Не только целочисленное значение ..: D
User987 13 март 2019, в 13:33

0

Если списки достаточно велики, чтобы вложенные циклы занимали 30 секунд, я рекомендую помещать каждый элемент списка в соответствующий HashSet и использовать его для поиска исключений. Хеш-таблицы будут масштабироваться в O (1) или O (log N), тогда как сравнение 2 несортированных списков - O (n ^ 2).

Тем не менее, попробуйте использовать Linq Except()

var notinNewList = oldList.Except(newList);

Если я не ошибаюсь, внутренняя реализация .Except() опирается на HashSets

Во-вторых, если списки отсортированы или могут быть предварительно отсортированы, то вы можете выполнить линейный проход за 1 цикл без вложенного цикла, вероятно, быстрее, чем любой подход.

Я не рекомендую использовать List.Contains(), потому что это линейная реализация, которая приведет к тому же O (n ^ 2), которого вы пытаетесь избежать, хотя он выглядит просто красивее из-за синтаксического сахара Linq.

codenheim 13 март 2019, в 13:51

-1

var items = newList.Where(n => !oldlist.Any(o => o.ItemID == n.ItemID)).ToList();

Это более гибко, так как вам не нужно снова заходить в БД и не использовать Contains, который похож на SQL и также находится в строке.

J4ime 13 март 2019, в 12:58

Ещё вопросы

Вы можете попробовать intersection и union LINQ docs.microsoft.com/en-us/dotnet/api/…
Вы можете использовать метод Equals с пользовательским классом сравнения
использование LINQ не обещает никакого увеличения производительности, посмотрите здесь stackoverflow.com/questions/11124797/…
@Aarif Аариф, когда я увидел параллельные циклы, упомянутые в одном из ответов, я сразу же убежал ... У меня плохой опыт с параллельными циклами, хахах = D
чтобы получить чистый код, который я бы предложил использовать с помощью LINQ (как уже упоминалось ранее), у вас есть проблема с этими списками, занимающими слишком много времени (не очень понятно из вашего вопроса), вы можете ускорить некоторые параллельные задачи, чтобы сделать это быстрее или лучше написать работу cron, чтобы сделать это.
Вы не сказали, были ли списки отсортированы. Это важно знать, прежде чем выбрать подход.
Выглядит хорошо, не могли бы вы показать мне пример, если это возможно, пожалуйста? :)
Согласитесь с попыткой Except (), потому что это должна быть сложность O (1) или O (log N) из-за внутреннего использования HashSet (хотя я не на 100%, но в тестировании это кажется так)
Хм, это немного смущает меня ... Могу ли я извлечь предметы в форме класса? Не только целочисленное значение ..: D

Akmal Salikhov · Accepted Answer · 2019-03-13T11-57-00.000Z

1

Лучший ответ

отредактированный

Кроме будет работать намного быстрее. Здесь вы можете прочитать о его исполнении

var missedOld = oldList.Except(newList, new ItemsEqualityComparer());
var oldList= oldList.Except(missedOld, new ItemsEqualityComparer());

Старый ответ

Два разных списка с отсутствующими элементами

var missedOld = oldList.Where(x => !newList.Select(i => i.ItemID).Contains(x.ItemID)) 
var missedNew = newList.Where(x => !oldList.Select(i => i.ItemID).Contains(x.ItemID))

Все пропущенные предметы в одном списке:

oldList.Concat(newList).GroupBy(x => x.ItemID).Where(x => x.Count() < 2).Select(x => x.Value).ToList()

Akmal Salikhov 13 март 2019, в 11:57

0

Разве вы не должны создавать новую переменную и хранить в ней новые значения?
User987 13 март 2019, в 13:38
0

PS Я хотел бы, чтобы отсутствующие элементы из обоих списков были разделены на два разных списка ... = d
User987 13 март 2019, в 13:39
0

@ User987 Да, конечно, вы должны поместить значение этого выражения в новую переменную и использовать его, чем
Akmal Salikhov 13 март 2019, в 13:40
0

это пропускает элементы из старого или нового списка? : D
User987 13 март 2019, в 13:41
0

@ User987 хорошо, тогда просто пользуйся! Содержит. Я отредактирую свой ответ
Akmal Salikhov 13 март 2019, в 13:42
0

Акмал, хорошо выглядит, но как работает «Contains»? Предположим, что у меня есть более 1 свойства внутри этого класса ... Как он узнает, на основании чего он будет сравнивать элемент? = / (Стоит сравнить их на основе ItemID
User987 13 март 2019, в 13:46
1

@ User987 Вы можете сравнивать и по таким свойствам: var missedOld = oldList.Where(x => !newList.Select(l => l.ItemID).Contains(x.ItemID))
Akmal Salikhov 13 март 2019, в 13:50
0

Да, вот и все :) ... Можете ли вы опубликовать этот ответ, чтобы другие тоже могли его увидеть?
User987 13 март 2019, в 13:54
0

Я не верю, что List.Contains () лучше, чем вложенные циклы. Его O (N) - поэтому вложенные циклы будут O (n ^ 2) - реализация List в ICollection не O (1) или O (log N), что вам и нужно в этом случае, иначе это то же самое решение он пытается избежать.
codenheim 13 март 2019, в 15:43
0

@codenheim Вы абсолютно правы! Спасибо за вашу вдумчивость. Я отредактирую свой ответ.
Akmal Salikhov 14 март 2019, в 10:33

Показать ещё 8 комментариев