Сравнение двух распространенных алгоритмов сравнения и их Big O, пожалуйста, помогите

Question

Сравнение двух распространенных алгоритмов сравнения и их Big O, пожалуйста, помогите

0

Сегодня мой профессор дал нам 2 взять домашние вопросы в качестве практики для предстоящей единицы массива в C, и мне интересно, какой именно алгоритм сортировки эти две проблемы похожи и что такое Big O. Теперь я не прихожу сюда, просто ожидая ответов, и я УЖЕ решил их, но я не уверен в своих ответах, поэтому я буду публиковать их каждый вопрос, и если я ошибаюсь, пожалуйста, исправьте меня и объясните мою ошибку в мышлении.

Вопрос 1:

Если мы решили идти через элемент на массив ( в коробке) (папки) по одному. Начиная с первого элемента и сравнивая его со следующим. Тогда, если они совпадают, сравнение заканчивается, однако, если оба они не равны, то он переходит к сравнению следующих двух ЭЛЕМЕНТОВ [2] и [3]. Этот процесс повторяется и останавливается, когда сравниваются последние два элемента, и обратите внимание, что массив IS уже отсортирован по фамилии, и мы ищем то же имя! Пример: [Харпер Стивен, Хокинг Джон, Инглтон Стивен]

Мой верный ответ:

Я верю, что это O (n), потому что он просто перебирает элементы массива, сравнивая массив [0] с массивом [1], а затем массив [2] с массивом [3] ect ect. Этот процесс является линейным и продолжается до тех пор, пока не будут сопоставлены последние два. Определенно не логн, потому что мы не умножаемся и не ныряем на 2.

Заключительный вопрос: предположим, что у нас есть папка с папками, каждая из которых содержит информацию об одном человеке. Если бы мы хотели искать людей с таким же именем, мы могли бы сначала начать с размещения наклейки в первой папке в коробке, а затем пройти через папки после нее упорядоченным образом, пока мы не найдем человека с таким же именем. Если мы найдем папку с тем же именем, мы перемещаем эту папку рядом с папкой с наклейкой. Как только мы найдем ОДИН случай, когда два человека имеют одно и то же имя, мы останавливаемся и ложимся спать, потому что мы ленивы. Если первый поиск не удается, мы просто удаляем наклейку и помещаем ее в следующую папку, а затем продолжаем, как мы это делали ранее. Мы повторяем этот процесс до тех пор, пока наклейка не появится в последней папке в сценарии, где у нас нет двух людей с одинаковым именем.

Этот массив НЕ отсортирован и сравнивает первую папку с папкой с наклейкой [0] со следующими элементами i-й папки [i].

Мой ответ:

Я чувствую, что это не может быть O (n), но, возможно, O (n ^ 2), где это похоже на массив, а затем мы повторяем процесс, где n пропорционально квадрату входа (папок), Я мог ошибаться здесь через>.>

Belphegor 19 сен. 2014, в 08:16

Источник

0

Я правда, извините, я хотел сказать элемент!
Belphegor 19 сен. 2014, в 06:16
0

Я исправил это, и больше не должно быть ошибок в этом вопросе.
Belphegor 19 сен. 2014, в 06:16
1

В первом вопросе вы говорите «обратите внимание, что массив уже отсортирован». Это также верно во втором вопросе? Это отсортировано по имени или по фамилии? (Это может изменить то, что означает «… упорядоченным образом…».) Кроме того, вы правы, что мы должны выполнить N поисков (сколько бы времени ни занимал поиск), за которыми следует 1 своп (который кажется неоднозначным и может означать линейный сдвиг, но его все равно можно игнорировать). Итак, если это линейный поиск, то это N запросов, каждый из которых занимает O (N) времени, так что да, O (N ^ 2). Но если это двойной поиск, то это N запросов, каждый из которых занимает O (log N) времени, поэтому O (N log N).
abarnert 19 сен. 2014, в 06:17
0

Хорошо, я редактировал в последний раз>. <, Первый действительно отсортирован по фамилии, и мы ищем имя. Секунда не отсортирована, и мы ищем то же имя, но на этот раз процесс не заканчивается в конце элемента, если не найдено того же имени. потому что это просто повторяется и сравнивается со второй папкой сейчас.
Belphegor 19 сен. 2014, в 06:22
0

Q1: в чем вопрос ? Вы описываете поиск двух последовательных элементов, которые одинаковы, но что за дело с именами, которые вы упоминаете? Можете ли вы четко изложить реальную проблему кому-то, кто не прочитал задание?
JDługosz 19 сен. 2014, в 06:28
0

большой O означает худший случай. Представьте себе худший случай в вашем последнем вопросе. два человека в конце вашего массива имеют одно и то же имя, или ни одно из имен не совпадает ... что означает, что вам нужно выполнить n + n-1 + n-2 + n-3 до 2 поисков .. связан (n) * (n-1) поисков, т.е. O (N ^ 2).
cageman 19 сен. 2014, в 06:30
0

Ну, я перефразировал его, но это, по сути, то, что он выводит, а имена - это своего рода аналогия, представьте, что это отсортированный массив от минимальной до большой длины, и мы ищем одно и то же слово.
Belphegor 19 сен. 2014, в 06:32
0

Я все еще не следую за Q1. Поиск по имени (только?), Поиск двух последовательных элементов, которые равны? Вы не согласны с описаниями, и вы недостаточно строги и не заявляете все, что нужно. Подумайте о написании программы: как она может работать, если вы не вкладываете все? Попробуйте объяснить алгоритм в псевдокоде, по крайней мере, или работающий код еще лучше.
JDługosz 19 сен. 2014, в 06:41
0

Первоначально это был полноценный вопрос из двух абзацев, и я сократил его, потому что там было много ненужной информации, где описывался рабочий Боб (бесполезная информация), который собирался сделать это сравнение.
Belphegor 19 сен. 2014, в 06:43
0

@user3718584 user3718584, я хотел бы отметить, что класс Data Structures and Algorithms, который я посещал в старшей школе (AP), был единственной наиболее полезной вещью, которую я узнал о программировании в школьной ситуации. Я также применил этот вид знаний в «реальном мире», например, сортируя коробки с чеками, смехотворно быстрее, чем кто-либо когда-либо делал это раньше в офисе.
JDługosz 19 сен. 2014, в 06:46
0

Хм, @user3718584 user3718584, вы сравниваете элементы 0 и 1, если они не равны, вы сравниваете элементы 2 и 3, и т. Д. Это найдет два идентичных элемента, которые выровнены соответствующим образом, и не определит их, если они выровнены по-разному (например, [A , B, B, C] A! = B, B! = C]). Вы «ищете два одинаковых элемента в отсортированном массиве»? Это та проблема, о которой вы не можете заявить?
JDługosz 20 сен. 2014, в 05:47

Показать ещё 9 комментариев

Теги:

c++

c

big-o

2 ответа

1

Сценарий 2, метод поиска двух совпадающих элементов произвольной величины, действительно "квадратичен". Каждый проход, который ищет совпадение одного кандидата со всеми остальными элементами, - O (n). Но вы повторяете это n раз. Значение n капель по мере того, как вы проходите так, чтобы подробное количество сравнений было бы ближе к n+ (n-1) + (n-2) +... 1, которое равно (n+ 1) × (n/2) или ½ (n² +n), но все, о чем мы заботимся, это общая форма кривой, поэтому не беспокойтесь о членах нижнего порядка или коэффициентах. Это O (n²).

JDługosz 19 сен. 2014, в 04:00

Ещё вопросы

Я правда, извините, я хотел сказать элемент!
Я исправил это, и больше не должно быть ошибок в этом вопросе.
В первом вопросе вы говорите «обратите внимание, что массив уже отсортирован». Это также верно во втором вопросе? Это отсортировано по имени или по фамилии? (Это может изменить то, что означает «… упорядоченным образом…».) Кроме того, вы правы, что мы должны выполнить N поисков (сколько бы времени ни занимал поиск), за которыми следует 1 своп (который кажется неоднозначным и может означать линейный сдвиг, но его все равно можно игнорировать). Итак, если это линейный поиск, то это N запросов, каждый из которых занимает O (N) времени, так что да, O (N ^ 2). Но если это двойной поиск, то это N запросов, каждый из которых занимает O (log N) времени, поэтому O (N log N).
Хорошо, я редактировал в последний раз>. <, Первый действительно отсортирован по фамилии, и мы ищем имя. Секунда не отсортирована, и мы ищем то же имя, но на этот раз процесс не заканчивается в конце элемента, если не найдено того же имени. потому что это просто повторяется и сравнивается со второй папкой сейчас.
Q1: в чем вопрос ? Вы описываете поиск двух последовательных элементов, которые одинаковы, но что за дело с именами, которые вы упоминаете? Можете ли вы четко изложить реальную проблему кому-то, кто не прочитал задание?
большой O означает худший случай. Представьте себе худший случай в вашем последнем вопросе. два человека в конце вашего массива имеют одно и то же имя, или ни одно из имен не совпадает ... что означает, что вам нужно выполнить n + n-1 + n-2 + n-3 до 2 поисков .. связан (n) * (n-1) поисков, т.е. O (N ^ 2).
Ну, я перефразировал его, но это, по сути, то, что он выводит, а имена - это своего рода аналогия, представьте, что это отсортированный массив от минимальной до большой длины, и мы ищем одно и то же слово.
Я все еще не следую за Q1. Поиск по имени (только?), Поиск двух последовательных элементов, которые равны? Вы не согласны с описаниями, и вы недостаточно строги и не заявляете все, что нужно. Подумайте о написании программы: как она может работать, если вы не вкладываете все? Попробуйте объяснить алгоритм в псевдокоде, по крайней мере, или работающий код еще лучше.
Первоначально это был полноценный вопрос из двух абзацев, и я сократил его, потому что там было много ненужной информации, где описывался рабочий Боб (бесполезная информация), который собирался сделать это сравнение.
@user3718584 user3718584, я хотел бы отметить, что класс Data Structures and Algorithms, который я посещал в старшей школе (AP), был единственной наиболее полезной вещью, которую я узнал о программировании в школьной ситуации. Я также применил этот вид знаний в «реальном мире», например, сортируя коробки с чеками, смехотворно быстрее, чем кто-либо когда-либо делал это раньше в офисе.
Хм, @user3718584 user3718584, вы сравниваете элементы 0 и 1, если они не равны, вы сравниваете элементы 2 и 3, и т. Д. Это найдет два идентичных элемента, которые выровнены соответствующим образом, и не определит их, если они выровнены по-разному (например, [A , B, B, C] A! = B, B! = C]). Вы «ищете два одинаковых элемента в отсортированном массиве»? Это та проблема, о которой вы не можете заявить?

abarnert · Accepted Answer · 2014-09-19T04-23-00.000Z

Вы правы по обоим вопросам... но это поможет объяснить вещи немного более строго. Я не знаю, каковы стандарты вашего класса; вам, вероятно, не нужно фактическое доказательство, но показывая более подробные рассуждения, чем "мы не умножаем или не разделяем на два", никогда не болит. Так…

В первом вопросе, очевидно, ничего не происходит здесь, кроме сравнений, так что мы должны рассчитывать.

И в худшем случае очевидно, что вам нужно пройти весь массив.

Итак, в этом случае вам нужно сравнить a[0] == a[1], затем a[1] == a[2] ,..., a[N-1] == a[N]. Для каждого из элементов N-1 есть 1 сравнение. Это шаги N-1, что, очевидно, O(N).

Тот факт, что массив отсортирован, оказывается здесь неактуальным. (Конечно, поскольку они не сортируются по вашему поисковому ключу, то есть они сортируются по имени, но вы сравниваете по имени - это было уже довольно очевидно).

Во втором вопросе здесь происходят две вещи: сравнения, а затем движения.

Для сравнений наихудший случай заключается в том, что вы должны выполнять все N поисковых запросов, потому что совпадений нет. Как вы говорите, мы начинаем с a[0] сравнению a[1] ,..., a[N]; затем a[1] против a[2] ,..., a[N] и т.д. Итак, N-1 сравнения, затем N-2 и т.д. до 0. Таким образом, общее число сравнений представляет собой sum(0…N-1), которая равна N*(N-1)/2, или N^2/2 - N/2, что равно O(N^2).

Для ходов наихудший случай заключается в том, что вы находите совпадение между a[0] и a[N]. В этом случае вам нужно поменять a[N] a[N-1], затем a[N-1] с a[N-2] и так далее, пока вы не поменяли a[2] a[1]. Итак, что N-1 swaps, что O(N), который вы можете игнорировать, потому что у вас уже есть O(N^2).

В качестве побочного примечания я не уверен в вашем описании, говоришь ли вы о массиве из a[0…N] или массиве длины N, поэтому a[0…N-1], поэтому может быть ошибка по-одному в обоих вышеперечисленных. Но вам должно быть довольно легко доказать, что это не имеет значения.

Я не вижу никаких движений в Q2. Наклейка - это просто указатель для отслеживания текущего элемента-кандидата. Это поиск, а не повторный заказ.
Спасибо! Это действительно помогает получить второе представление о том, насколько мой ответ верен.
@jdlugosz: «Если мы находим папку с тем же именем, мы перемещаем эту папку рядом с папкой с наклейкой». Как это не движение?
@ user3718584: Важно иметь возможность записывать вещи так, чтобы они действительно подсчитывали (в худшем случае) шаги, а не просто замечали, что это выглядит линейно. Во многих случаях все очевидно, но есть случаи, когда это, например, выглядит так, будто вы делите на 2, но на самом деле вы каждый раз выполняете в 2 раза больше работы, поэтому она все еще линейна.
@abarnert это "движение" - вещь разовая. Переместите одну папку рядом с другой, затем готово. Я воспринял это как описание «возврата», а не как вставку, которая сама по себе требует времени для выполнения. Физическая коробка с бумагой может быть вставлена за один шаг, без необходимости перемещать каждую папку по отдельности.
@jdlugosz: Как вы перемещаете a[6] рядом с a[2] не перемещая a[3] в сторону первым? И как вы убираете a[3] с дороги, не перемещая a[4] с дороги в первую очередь? (Конечно, на практике вы собираетесь сделать одно большое memmove а затем одно назначение, но это memmove такое же, как O(N) как куча отдельных перестановок.)
@abarnert в физическом примере вставка - это коробка папок с файлами, а не, скажем, индивидуально выдолбленная коробка CD. В программе это не обязательно должен быть линейный массив! Это может быть связанный список, поэтому вставка указателя в найденное место - O (1). Это может быть массив для каждого «ящика», так что работа по вставке ограничена емкостью ящика, а не всем n. В реальном программировании, если бы вставка имела достаточно большой коэффициент, чтобы иметь значение, я бы использовал нелинейную структуру данных, такую как дерево.
@jdlugosz: спрашивающий использует слово «массив» 10 раз. Он говорит об индексации массива, чего нельзя сделать со связанным списком (если только вы не хотите, чтобы он занимал линейное время). Он говорит о том, что он отсортирован, и подразумевается, что это может позволить разделить пополам, что было бы неверно для связанного списка. Совершенно очевидно, что и спрашивающий, и его профессор действительно имеют в виду массив здесь, и если вы изменили структуру данных, чтобы вы могли изменить алгоритм, а не оценивать алгоритм, как указано, вы могли бы аргументировать свой путь к хорошей оценке, но это было бы не то, что он искал ...