Является ли неинициализированная локальная переменная самым быстрым генератором случайных чисел?

Question

Является ли неинициализированная локальная переменная самым быстрым генератором случайных чисел?

317

Я знаю, что неинициализированная локальная переменная - это поведение undefined (UB), а также значение может иметь ловушечные представления, которые могут повлиять на дальнейшую работу, но иногда я хочу использовать случайное число только для визуального представления и больше не буду использовать их в другой части программы, например, установить что-то со случайным цветом в визуальном эффекте, например:

void updateEffect(){
    for(int i=0;i<1000;i++){
        int r;
        int g;
        int b;
        star[i].setColor(r%255,g%255,b%255);
        bool isVisible;
        star[i].setVisible(isVisible);
    }
}

это быстрее, чем

void updateEffect(){
    for(int i=0;i<1000;i++){
        star[i].setColor(rand()%255,rand()%255,rand()%255);
        star[i].setVisible(rand()%2==0?true:false);
    }
}

а также быстрее, чем другой генератор случайных чисел?

ggrr 31 июль 2015, в 07:20

Источник

86

+1 Это совершенно законный вопрос. Это правда, что на практике неинициализированные значения могут быть случайными. Тот факт, что они не особенно и что это UB, не заставляет спрашивать так плохо.
imallett 31 июль 2015, в 07:02
34

@imallett: Абсолютно. Это хороший вопрос, и по крайней мере одна старая игра Z80 (Amstrad / ZX Spectrum) в прошлом использовала свою программу в качестве данных для настройки ландшафта. Так что есть даже прецеденты. Не могу сделать это в эти дни. Современные операционные системы убирают все веселье.
Bathsheba 31 июль 2015, в 07:08
2

@ Bathsheba не обязательно! Вы можете выделить память системными вызовами, записать в нее данные и затем выполнить их. Вот как работают JIT-компиляторы. Есть и другие возможности: некоторые системы даже позволяют вам выполнять массивы (например, байтов, соответствующих машинному коду), например, с помощью union и указателя на функцию.
imallett 31 июль 2015, в 07:13
80

Конечно, главная проблема в том, что это не случайно.
john 31 июль 2015, в 07:13
3

зависит от качества, которое вы готовы принять в своем генераторе случайных чисел.
sashang 31 июль 2015, в 07:33
5

@Bathsheba, который выглядит как определенное поведение, так как программа не меняется. Если вы не говорите о самомодифицирующемся коде, что было забавно ... На самом деле это напоминает мне одну забавную вещь, которую я однажды видел в коде Z80. Был JP (прыжок) на полпути через 2-байтовый код операции! Оказалось, что второй байт кода операции соответствует совершенно другой инструкции, которая должна была быть вызвана. Я не уверен, сделал ли это ассемблер или придумал какой-то творческий гений, и никто никогда не знал ...
M.M 31 июль 2015, в 07:43
29

Фактически, есть пример неинициализированной переменной, используемой в качестве случайного значения, см. Аварию Debian RNG (пример 4 в этой статье ).
PaperBirdMaster 31 июль 2015, в 07:55
3

некоторые компиляторы инициализируют неинициализированную память с 0xCC , поэтому каждый раз вы читаете одно и то же значение. В некоторых случаях память обнуляется ОС после того, как она использовалась другим процессом перед этим приложением.
phuclv 31 июль 2015, в 08:04
30

На практике - и поверьте мне, я много отлаживаю на различных архитектурах - ваше решение может выполнять две вещи: либо читать неинициализированные регистры, либо неинициализированную память. Теперь, когда «неинициализированный» означает случайным образом определенным образом, на практике он, скорее всего, будет содержать а) нули , б) повторяющиеся или непротиворечивые значения (в случае чтения памяти, ранее занимаемой цифровыми носителями) или в) непостоянный мусор с ограниченным значением установить (в случае чтения памяти, ранее занятой закодированными цифровыми данными). Ни один из них не является реальным источником энтропии.
mg30rg 31 июль 2015, в 08:22
1

Посмотрите этот вопрос, чтобы узнать, почему использование неопределенных значений является неопределенным поведением. Хотя в моем ответе речь идет о языке C ++, я отмечаю ссылки, которые говорят то же самое и о языке C.
Shafik Yaghmour 31 июль 2015, в 09:26
1

Посмотрите этот вопрос для примера того, как компилятор может преобразовать код с неопределенным поведением неожиданными и плохими способами.
Shafik Yaghmour 31 июль 2015, в 09:34
5

@ mg30rg или, компилятор может заменить любое чтение на unreachable() и удалить половину вашей программы. Это происходит и на практике. Я считаю, что такое поведение полностью нейтрализовало ГСЧ в некоторых дистрибутивах Linux.
usr 31 июль 2015, в 10:26
5

@usr - однажды я работал на платформе (интерпретатор с песочницей c, запускаемый во встроенных системах Windows), где чтение неинициализированной переменной приводило к исключению нарушения прав доступа, поскольку оно предоставляло виртуальный стек вместо реального, а неинициализированная локальная переменная переводилась в нулевой указатель. Мораль истории - неопределенное поведение не определено.
mg30rg 31 июль 2015, в 10:40
0

Ответ однозначно отрицательный, поскольку неинициализированная переменная вообще не является генератором случайных чисел. Половина времени это куча нулей.
Superbest 31 июль 2015, в 18:46
1

Даже при отсутствии оптимизации может произойти сбой неинициализированного мусора .
Kevin 31 июль 2015, в 21:12
1

@MattMcNabb: Обычная хитрость на 6502 состояла в том, чтобы использовать опкод "BIT abs" $ 2C для пропуска следующих двух байтов. Функция может иметь две точки входа с интервалом в три байта: «Entry1: LDA # 0 / byte $ 2C / Entry2: LDA # 1 / etc.». Вызов Entry1 загрузит аккумулятор с нуля, выполнит чтение с адреса $ 01A9, пропустив инструкцию LDA # 1 и т. Д. Точки входа Load / Verify в ядре Commodore VIC-20 настроены таким образом. Одна небольшая ошибка состоит в том, что необходимо убедиться, что пропущенные байты не представляют адрес, который может вызвать нежелательное поведение при чтении.
supercat 31 июль 2015, в 21:39
1

У Z80 был 7-битный регистр обновления, который использовался, чтобы помочь с обновлением драмы. Это сделало адекватное семя в большинстве случаев.
EvilTeach 01 авг. 2015, в 00:25
2

Конечно, для этого есть xkcd , отображающий одинаково быструю и гораздо более безопасную реализацию (при условии, что мы все еще рассматриваем «случайный» и «произвольный» как одно и то же).
Jeff Bowman 01 авг. 2015, в 05:37
2

Кстати, выполнение rand()%n как правило, не очень хорошая идея из-за смещения по модулю .
PM 2Ring 01 авг. 2015, в 12:47
1

но что если вы случайно выберете свою неинициализированную память?
Andrew Gallasch 04 авг. 2015, в 12:19
0

@ Энди: Для этого вам не нужен генератор случайных чисел? :)
500 - Internal Server Error 04 авг. 2015, в 20:01
0

@ 500-InternalServerError (: это все еще не случайно. Некоторые реализации могут обнулять всю нераспределенную память. Доступ к нераспределенной памяти является неопределенным поведением.
Andrew Gallasch 05 авг. 2015, в 01:07
0

Подобный stackoverflow.com/questions/26882023
Mohit Jain 05 авг. 2015, в 07:04
2

Хороший способ увидеть, как предоставляемые числа не являются случайными: получить 16-битные «случайные» числа пару раз по 100 миллионов, каждый раз увеличивать выбранное число в массиве 2 16, а затем наблюдать распределение чисел. Скорее всего, разочарование.
Ring Ø 08 авг. 2015, в 07:23
0

@ ring0 Согласитесь, все, что нужно было сделать оператору, - это запустить код, а затем распечатать значения из массива star чтобы убедиться, что они не являются случайными.
user3386109 10 авг. 2015, в 21:02
1

@MattMcNabb Да, перекрывающиеся инструкции использовались преднамеренно, как можно увидеть здесь . Как вы можете себе представить, было очень трудно собрать все воедино, но когда вы добились успеха, ваши коллеги всегда уважали вас :)
biziclop 01 сен. 2015, в 11:00
0

Вы должны выбрать ответ на этот вопрос.
Ungeheuer 29 март 2017, в 23:09

Показать ещё 25 комментариев

Теги:

c++

c

undefined-behavior

garbage

22 ответа

Ещё вопросы

+1 Это совершенно законный вопрос. Это правда, что на практике неинициализированные значения могут быть случайными. Тот факт, что они не особенно и что это UB, не заставляет спрашивать так плохо.
@imallett: Абсолютно. Это хороший вопрос, и по крайней мере одна старая игра Z80 (Amstrad / ZX Spectrum) в прошлом использовала свою программу в качестве данных для настройки ландшафта. Так что есть даже прецеденты. Не могу сделать это в эти дни. Современные операционные системы убирают все веселье.
@ Bathsheba не обязательно! Вы можете выделить память системными вызовами, записать в нее данные и затем выполнить их. Вот как работают JIT-компиляторы. Есть и другие возможности: некоторые системы даже позволяют вам выполнять массивы (например, байтов, соответствующих машинному коду), например, с помощью union и указателя на функцию.
Конечно, главная проблема в том, что это не случайно.
зависит от качества, которое вы готовы принять в своем генераторе случайных чисел.
@Bathsheba, который выглядит как определенное поведение, так как программа не меняется. Если вы не говорите о самомодифицирующемся коде, что было забавно ... На самом деле это напоминает мне одну забавную вещь, которую я однажды видел в коде Z80. Был JP (прыжок) на полпути через 2-байтовый код операции! Оказалось, что второй байт кода операции соответствует совершенно другой инструкции, которая должна была быть вызвана. Я не уверен, сделал ли это ассемблер или придумал какой-то творческий гений, и никто никогда не знал ...
Фактически, есть пример неинициализированной переменной, используемой в качестве случайного значения, см. Аварию Debian RNG (пример 4 в этой статье ).
некоторые компиляторы инициализируют неинициализированную память с 0xCC , поэтому каждый раз вы читаете одно и то же значение. В некоторых случаях память обнуляется ОС после того, как она использовалась другим процессом перед этим приложением.
На практике - и поверьте мне, я много отлаживаю на различных архитектурах - ваше решение может выполнять две вещи: либо читать неинициализированные регистры, либо неинициализированную память. Теперь, когда «неинициализированный» означает случайным образом определенным образом, на практике он, скорее всего, будет содержать а) нули , б) повторяющиеся или непротиворечивые значения (в случае чтения памяти, ранее занимаемой цифровыми носителями) или в) непостоянный мусор с ограниченным значением установить (в случае чтения памяти, ранее занятой закодированными цифровыми данными). Ни один из них не является реальным источником энтропии.
Посмотрите этот вопрос, чтобы узнать, почему использование неопределенных значений является неопределенным поведением. Хотя в моем ответе речь идет о языке C ++, я отмечаю ссылки, которые говорят то же самое и о языке C.
Посмотрите этот вопрос для примера того, как компилятор может преобразовать код с неопределенным поведением неожиданными и плохими способами.
@ mg30rg или, компилятор может заменить любое чтение на unreachable() и удалить половину вашей программы. Это происходит и на практике. Я считаю, что такое поведение полностью нейтрализовало ГСЧ в некоторых дистрибутивах Linux.
@usr - однажды я работал на платформе (интерпретатор с песочницей c, запускаемый во встроенных системах Windows), где чтение неинициализированной переменной приводило к исключению нарушения прав доступа, поскольку оно предоставляло виртуальный стек вместо реального, а неинициализированная локальная переменная переводилась в нулевой указатель. Мораль истории - неопределенное поведение не определено.
Ответ однозначно отрицательный, поскольку неинициализированная переменная вообще не является генератором случайных чисел. Половина времени это куча нулей.
Даже при отсутствии оптимизации может произойти сбой неинициализированного мусора .
@MattMcNabb: Обычная хитрость на 6502 состояла в том, чтобы использовать опкод "BIT abs" $ 2C для пропуска следующих двух байтов. Функция может иметь две точки входа с интервалом в три байта: «Entry1: LDA # 0 / byte $ 2C / Entry2: LDA # 1 / etc.». Вызов Entry1 загрузит аккумулятор с нуля, выполнит чтение с адреса $ 01A9, пропустив инструкцию LDA # 1 и т. Д. Точки входа Load / Verify в ядре Commodore VIC-20 настроены таким образом. Одна небольшая ошибка состоит в том, что необходимо убедиться, что пропущенные байты не представляют адрес, который может вызвать нежелательное поведение при чтении.
У Z80 был 7-битный регистр обновления, который использовался, чтобы помочь с обновлением драмы. Это сделало адекватное семя в большинстве случаев.
Конечно, для этого есть xkcd , отображающий одинаково быструю и гораздо более безопасную реализацию (при условии, что мы все еще рассматриваем «случайный» и «произвольный» как одно и то же).
Кстати, выполнение rand()%n как правило, не очень хорошая идея из-за смещения по модулю .
но что если вы случайно выберете свою неинициализированную память?
@ Энди: Для этого вам не нужен генератор случайных чисел? :)
@ 500-InternalServerError (: это все еще не случайно. Некоторые реализации могут обнулять всю нераспределенную память. Доступ к нераспределенной памяти является неопределенным поведением.
Хороший способ увидеть, как предоставляемые числа не являются случайными: получить 16-битные «случайные» числа пару раз по 100 миллионов, каждый раз увеличивать выбранное число в массиве 2 16, а затем наблюдать распределение чисел. Скорее всего, разочарование.
@ ring0 Согласитесь, все, что нужно было сделать оператору, - это запустить код, а затем распечатать значения из массива star чтобы убедиться, что они не являются случайными.
@MattMcNabb Да, перекрывающиеся инструкции использовались преднамеренно, как можно увидеть здесь . Как вы можете себе представить, было очень трудно собрать все воедино, но когда вы добились успеха, ваши коллеги всегда уважали вас :)
Вы должны выбрать ответ на этот вопрос.

imallett · Answer 1 · 2015-07-31T07-47-00.000Z

300

Как отмечали другие, это Undefined Поведение (UB).

На практике это (возможно) фактически (kindof) работает. Чтение из неинициализированного регистра на архитектуре x86 [-64] действительно приведет к результатам мусора и, вероятно, не сделает ничего плохого (в отличие от, например, Itanium, где регистры могут быть помечены как недопустимые, так что чтение распространяется на ошибки, такие как NaN).

Есть две основные проблемы:

Это не будет особенно случайным. В этом случае вы читаете из стека, так что вы получите все, что было ранее. Который может быть эффективно случайным, полностью структурированным, пароль, который вы ввели десять минут назад, или рецепт вашей бабушки cookie.
Это плохо (капитал "B" ), чтобы позволить подобным образом проникнуть в ваш код. Технически компилятор может вставлять reformat_hdd(); каждый раз, когда вы читаете переменную Undefined. Это не так, но вы все равно не должны этого делать. Не делайте небезопасные вещи. Чем меньше исключений вы делаете, тем более безопасны вы от случайных ошибок все время.

Более насущная проблема с UB заключается в том, что она полностью управляет вашей программой undefined. Современные компиляторы могут использовать это, чтобы преодолеть огромные полосы вашего кода или даже вернуться во времени. Игра с UB похожа на викторианского инженера, который демонтирует живой ядерный реактор. Там что-то не так, и вы, вероятно, не будете знать половину основополагающих принципов или внедренных технологий. Это может быть хорошо, но вы все равно не должны позволять этому случиться. Посмотрите на другие приятные ответы для деталей.

Кроме того, я бы уволил вас.

imallett 31 июль 2015, в 07:47

5

В любой архитектуре нет такого понятия, как «неинициализированный регистр». Машина не понимает инициализацию или ее отсутствие; это языковая конструкция.
Potatoswatter 31 июль 2015, в 09:11
39

@Potatoswatter: Регистры Itanium могут содержать NaT (не вещь), который по сути является «неинициализированным регистром». На Itanium чтение из регистра, если вы не написали в него, может прервать вашу программу (подробнее об этом здесь: blogs.msdn.com/b/oldnewthing/archive/2004/01/19/60162.aspx ). Таким образом, есть веская причина, по которой чтение неинициализированных значений является неопределенным поведением. Это также, вероятно, одна из причин, почему Itanium не очень популярен :)
tbleher 31 июль 2015, в 09:25
1

@tbleher Инициализация чего-либо для представления ловушек - это не то же самое, что инициализация. Аппаратные средства просто занимаются тасовкой битов детерминистическим образом. Но точка взята.
Potatoswatter 31 июль 2015, в 09:48
56

Я действительно возражаю против понятия "это вроде работы". Даже если бы это было правдой сегодня, а это не так, она может измениться в любое время из-за более агрессивных компиляторов. Компилятор может заменить любое чтение на unreachable() и удалить половину вашей программы. Это происходит и на практике. Такое поведение полностью нейтрализовало ГСЧ в некоторых дистрибутивах Linux; Большинство ответов на этот вопрос, кажется, предполагают, что неинициализированное значение ведет себя как значение вообще. Это неверно
usr 31 июль 2015, в 10:27
25

Кроме того, я бы уволил вас, кажется, довольно глупо говорить, если предположить, что передовой опыт должен быть обнаружен при проверке кода, обсужден и никогда не должен повториться. Это определенно должно быть поймано, поскольку мы используем правильные флаги предупреждения, верно?
Shafik Yaghmour 31 июль 2015, в 11:39
2

Я должен согласиться с @usr здесь, вы можете увидеть мои живые примеры Godbolt в моем ответе , по крайней мере, для лязга это не работает.
Shafik Yaghmour 31 июль 2015, в 12:57
0

@CaptainCodeman UB означает, что он может делать что угодно, включая вставку кода. Он буквально может отформатировать ваш диск. На практике происходят другие неприятные вещи.
usr 31 июль 2015, в 13:55
0

Но в этом случае просто значение не определено, не так ли? Я имею в виду, что не похоже, что все поведение программы внезапно становится неопределенным только потому, что вы где-то используете унифицированную переменную.
Michael 31 июль 2015, в 16:02
15

@ Майкл На самом деле, это так. Если в какой-то момент программа имеет неопределенное поведение, компилятор может оптимизировать вашу программу таким образом, чтобы это влияло на код, предшествующий тому, что вызывало неопределенное поведение. Существуют различные статьи и демонстрации того, как это может быть ошеломляющим. Вот довольно хорошая статья : blogs.msdn.com/b/oldnewthing/archive/2014/06/27/10537746.aspx (которая включает в себя часть стандарта, которая гласит: все ставки отключены, если любой путь в вашей программе вызывает UB)
Tom Tanner 31 июль 2015, в 16:47
0

@usr: Примерно до 2010 года эффект Undefined Behavior можно было рассматривать как эквивалент перезаписи всей оперативной памяти (включая стек) с произвольными значениями и прыжка в случайное место, но на машине с архитектурой Гарварда с недоступным для записи кодом store (обычное явление в мире встраиваемых систем), программа может предложить определенные гарантии относительно ее поведения даже в таких обстоятельствах. Действительно, некоторые системы требуют, чтобы программа не могла запускать определенные аппаратные действия, даже если сбой питания приводит к перегрузке ОЗУ. Однако с 2010 года неопределенное поведение в C ...
supercat 31 июль 2015, в 20:17
0

... выходит за рамки даже модели ошибки "произвольно переписать все в памяти и перейти к произвольному адресу".
supercat 31 июль 2015, в 20:18
1

@supercat что случилось в 2010 году? Более агрессивные компиляторы?
usr 31 июль 2015, в 20:18
0

@tbleher: Когда стандарт был написан, говоря: «Чтение неинициализированной переменной может привести к произвольному значению или может оказаться в ловушке способом, который находится за пределами юрисдикции настоящего стандарта; документация для реализации должна указывать, какой» был бы, из точка зрения требований, эквивалентная тому, что стандарт не предъявляет никаких требований, за исключением того факта, что отсутствие в документации компилятора чего-либо относительно его поведения будет эквивалентно указанию, что компилятор может интерпретировать действие как запуск ловушки, которая освобождает система из ...
supercat 31 июль 2015, в 20:23
0

... юрисдикция стандарта. Я действительно сомневаюсь, что первоначальные авторы Стандарта предполагали идею, которая возникла примерно в 2010 году, что компилятор должен попытаться определить входные данные, которые приведут к тому, что программа вызовет Неопределенное поведение, а затем исключить любой код, который будет неуместным если такие входные данные не были получены. Я не совсем уверен, что кто-то на самом деле выигрывает от предоставления компиляторам такой свободы, поскольку введение более строгих правил о том, как компиляторы должны интерпретировать большинство форм UB, позволило бы многим программам соответствовать требованиям ...
supercat 31 июль 2015, в 20:31
0

... более эффективно, чем это возможно, используя только действия, определенные текущим стандартом. Многие программы предъявляют два требования: (1) Когда дан действительный ввод, производят строго определенный вывод; (2) Не запускать ядерные ракеты, если дан неверный ввод. Если (с int числом 32 бита) x<<y были определены как произвольно приводящие к x<<(y & 31) или y & ~31 ? 0 : x<<y , код, который был бы доволен любым значением, когда входные данные, в которых значение y превышало 31, могло позволить машинам, где одна операция будет дешевле, чем другая, использовать более дешевую операцию. Делать это UB означает, что компиляторы не могут получить эту свободу.
supercat 31 июль 2015, в 20:42
0

@supercat: Ваше заявление о том, что что-то изменилось в 2010 году или около того, не поддерживается и неверно. В UB всегда было много плохих вещей, и многие / большинство плохих вещей, которые могут случиться в UB из-за оптимизации компиляции, случаются, даже если компилятор не пытается сломать код с помощью UB . Существует очень маленький ограниченный класс случаев UB, которые компилятор может обнаружить во время компиляции, и, следовательно, будет иметь свободу «избегать взлома» (то есть «делать то, что ожидал программист»), но это взрывается и требует очень дорогого времени выполнения проверяет в общем случае.
R.. 01 авг. 2015, в 04:17
18

Этот ответ звучит так, как будто «вызывать неопределенное поведение - это плохо в теории, но на практике это не навредит вам» . Это неверно. Сбор энтропии из выражения, которое вызовет UB, может (и, вероятно, приведет ) к потере всей ранее собранной энтропии . Это серьезная опасность.
Theodoros Chatzigiannakis 01 авг. 2015, в 09:11
0

@R ..: Что вы знаете о том, что кто-то раньше защищал идею о том, что компиляторы должны стремиться использовать UB, чтобы делать выводы о том, какие входные данные может получить фрагмент кода, и устранять мертвые пути, основанные на таких выводах? Мне хорошо известно, что компиляторы сделали определенные выводы о целочисленной арифметике еще до 2000 года, но все такие выводы, о которых я знаю, могут быть охарактеризованы в вычислительной модели, которую я называю «Частично-неопределенным значением». Если int равен 16 битам, то после unsigned char b=200; int i=b*b; , каждое использование i в качестве значения может ...
supercat 01 авг. 2015, в 16:48
0

... независимо ведут себя как любое число (представимое или нет), которое было конгруэнтно 40000 модулю 65536. Такое поведение может вызвать путаницу для кода, который, как правило, ожидает перенос двух дополнений в стандарте, как правило, обычно требуется при приведении 32-битного int к int16_t , но если бы i использовали таким образом, чтобы любое число, совпадающее с 40000 mod 65536, позволило бы программе удовлетворить ее требования, у программиста не было бы никаких причин ограничивать компилятор, например, используя unsigned вместо int .
supercat 01 авг. 2015, в 16:54
0

@TheodorosChatzigiannakis: даже в тех случаях, когда можно прочитать неинициализированную память, не вызывая неопределенного поведения (и есть некоторые), и даже в тех случаях, когда компилятор не сможет сказать, что код читает неинициализированную память, может быть корреляция между считанными значениями и существующей «коллекцией энтропии». Если у кого-то есть uint64_t seed; и uint8_t arbitrary[1]; закодированный таким образом, что чтение последнего приводит к неопределенному значению, которое компилятор не может оптимизировать, код seed += arbitrary[0]; может потерять немного энтропии, если arbitrary[0] ...
supercat 01 авг. 2015, в 17:03
0

... всегда, даже если seed четный и нечетный, когда он нечетный (например, потому что его значение было скопировано из хранилища, которое использовалось в последнем вычислении seed ). Бывают случаи, когда чтение неосуществленных данных может обеспечить очень слабый источник сущности для программы в то время, когда в противном случае они не были бы доступны (например, если много идентичных встроенных процессоров в сети включаются одновременно и требуется установить произвольные уникальные идентификаторы, расхождение во времени может в конечном итоге сработать, но любая энтропия, которая может быть использована для запуска процесса, может сильно помочь), но такие случаи редки.
supercat 01 авг. 2015, в 17:05
0

@R ..: Я был бы искренне заинтересован в том , чтобы доказательства того, что использование UB , чтобы сделать выводы о программных вкладах отстаивались до 2009-2010 гг. Мое утверждение о том, что что-то изменилось в то время, основано на том, что я прочитал статьи примерно того времени, выступая за то, чтобы составители использовали такие умозаключения, но не видел доказательств того, что такие вещи были отстаены ранее. Кроме того, я бы сказал, что тот факт, что ни в стандартах C89, ни в C99 не упоминается о том, что эффекты неопределенного поведения могут иметь обратную силу, а в стандарте C11 это указывает на изменение.
supercat 01 авг. 2015, в 18:57
7

"Я бы тебя уволил?" Какая высокомерная вещь, чтобы сказать. Он пытался придумать творческий способ решения проблемы. Надеюсь, никто не работает на вас.
FrostRocket 01 авг. 2015, в 22:12
8

@FrostRocket: Люди, которые настаивают на том, чтобы делать вещи, которые задокументированы как неправильные и небезопасные ради «креативности», несут ответственность за проект, будь то коммерческий или FOSS. Замечание, на которое вы отвечаете, возможно, было излишне подстрекательским, но мнение, что люди должны прекратить делать это или уйти, вполне обоснованно.
R.. 02 авг. 2015, в 01:54
0

@supercat: То, что вы написали ранее («Примерно до 2010 года эффект Undefined Behavior можно было рассматривать как эквивалент перезаписи всей оперативной памяти ... но ... программа могла предложить определенные гарантии относительно ее поведения даже в таких условиях») ) не имеет ничего общего с тем, что вы утверждаете сейчас, что DCE на основе UB был представлен примерно в 2010 году. Даже без DCE на основе UB, UB гораздо опаснее, чем вы его себе представляете.
R.. 02 авг. 2015, в 01:57
0

@R ..: Существует много обстоятельств, когда программам, получающим недопустимый ввод, разрешено производить произвольный вывод при условии относительно небольшого числа ограничений. То, как многие платформы исторически рассматривали такие вещи, как целочисленное переполнение (например, xy>z может произвольно выдавать 0 или 1, если переполняет xy , но не запускает nuke в любом случае), позволило выполнить это требование дешево, при этом позволяя оптимизировать некоторые платформы, которые были бы невозможны, если бы код был переписан как (int)((unsigned)xy)>z .
supercat 02 авг. 2015, в 02:06
0

@R ..: Вы полагаете, что образец (x << y) | (x >> (32-y)) появился потому, что авторы были дураками, или потому что до недавнего времени каждый компилятор для машины с 32-разрядными целыми числами правильно его оценивал? Если все экземпляры этого кода, которые необходимы для работы при y == 0, были заменены на (x << y) | (x >> (31-y) >> 1) ли какие-либо полезные оптимизации, которые были бы невозможны, если бы стандарт был изменен, чтобы требовать, чтобы x>>32 должен был давать либо x либо 0 по выбору компилятора?
supercat 02 авг. 2015, в 02:10
2

@supercat: Я не пытаюсь спорить по существу, заявляя, что некоторые конкретные вещи не определены. Это огромная дискуссия, и она здесь не по теме. Я хочу сказать, что вы утверждаете, что UB был относительно безопасным до 2010 года, и что агрессивная оптимизация компилятора с использованием UB для DCE сделала его небезопасным, не поддерживается и, на мой взгляд, ложным. Неочевидные (для компилятора) случаи некорректного псевдонима, нарушения точек последовательности, доступа к неинициализированным объектам и т. Д. Могут привести к таким вещам, как непоследовательная оценка выражений в разных точках, что очень небезопасно.
R.. 02 авг. 2015, в 02:29
6

Этот ответ, хотя и подвергнут тщательному голосованию, к сожалению, фактически неверен. Я бы посоветовал вам прочитать ответ Шафика, а также то, что должен знать каждый программист C о неопределенном поведении, чтобы лучше понять тонкости неопределенного поведения (вкратце: компилятор ожидает, что неопределенное поведение никогда не происходит, и разрешено удалять любую ветвь кода, которая будет вызывать его).
Matthieu M. 02 авг. 2015, в 17:13
0

#### Я отредактировал этот ответ, чтобы было (более) ясно, что UB - это не то, с чем кто-либо, кроме разработчиков компиляторов, имеет дело. ####
imallett 02 авг. 2015, в 18:23
0

@R .. Они могут . Могли ли они примерно до 2010 года?
immibis 02 авг. 2015, в 22:06
10

«Кроме того, я бы тебя уволил». Может быть. Но мы здесь, в стране неопределенного поведения. Вы могли бы в конечном итоге дать ему рейз :)
James Thorpe 03 авг. 2015, в 11:13
1

@immibis: У меня сейчас нет тестового примера, но концептуально нет причин, по которым они не должны были бы состояться. Все, что необходимо для запуска противоречивых оценок, связанных с незаконным алиасингом, - это достаточно сильно мешать, чтобы повлиять на разлив регистров, и такая проблема возникнет на любом компиляторе, который не настолько идиотичен, чтобы загружать / хранить при каждом доступе в абстрактном виде. машина (т.е. обрабатывать все объекты как volatile ).
R.. 03 авг. 2015, в 15:35
0

@R ..: Если переменная записывается в одну сторону, а читается по-другому, в нарушение правила строгого псевдонима (или любого из правил псевдонима, которые некоторые компиляторы могут по желанию включить до C99), традиционная поведенческая модель подразумевает, что компилятор может создать отдельный объект для каждого режима доступа к этой переменной и произвольно скопировать значение любого такого объекта в любое время в любой из других объектов, связанных с той же переменной (в дополнение к копированию значений в определенные четко определенные моменты времени). Во многих случаях это может иметь катастрофические последствия, но если алгоритм будет работать правильно ...
supercat 03 авг. 2015, в 19:06
0

... для любой комбинации видимости чтения / записи, согласующейся с моделью [возможно, лучше для некоторых таких комбинаций, чем для других], кодирование алгоритма таким образом, который дает гибкость компилятору (на компиляторе, который обещал не делать ничего, кроме того, что такая модель позволила бы) включить оптимизации, которые были бы невозможны, если бы код не мог запрашивать какие-либо действия, кроме тех, которые разрешены Стандартом.
supercat 03 авг. 2015, в 19:09
0

@immibis: Компиляторы в течение длительного времени делали определенные выводы о поведении целочисленной арифметики в циклах, которые на первый взгляд могут показаться нарушающими причинность, но вместо этого могут быть описаны в терминах линейных преобразований. 16-битный компилятор может переписать int i,n; long total; ... for (i=n; i>=0; i--) total+=i*3000; 16-разрядный компилятор может предполагать модель исполнения, где целые числа имеют достаточно дополнительных битов, чтобы избежать переполнения, и преобразовать код в for (i=n*3000; i>=0; i-=3000) total+=i; , что может в конечном итоге выполнить цикл 0 раз, например, если n равно 11. С другой стороны, ...
supercat 03 авг. 2015, в 19:18
0

... есть разница между утверждением, что определенные виды преобразований, которые будут сохранять семантику в такой модели выполнения, могут выполняться, даже если платформа использует другую модель выполнения, и утверждением, что любая форма UB выбрасывает все поведенческие требования в окно.
supercat 03 авг. 2015, в 19:22
0

@supercat: Мой аргумент не в том, что не существует определенных недопустимых программ, для которых вы, тем не менее, можете доказать теоремы об их поведении, учитывая знания о преобразованиях конкретного компилятора, а скорее о том, что в целом программы с неопределенным поведением были небезопасны даже до 2010. В частности, всякий раз, когда одно и то же выражение может оценивать по-разному в разных точках из-за UB, вы можете в конечном итоге обойти проверки границ и т. Д.
R.. 03 авг. 2015, в 19:47
0

@R ..: на 16-битных машинах, в соответствии с давней общей поведенческой моделью, заданной int x=32767; int y=x+1; значение y может иногда вести себя как +32768, а иногда как -32768; иногда он может вести себя так же, как и любые другие числа, совпадающие с 32768 модом 65536. Поскольку проверки границ, такие как if (y >= 0 && y < 50) foo(y); вполне может обойтись без кода, необходимого для обеспечения того, чтобы любые значения, которые могли быть переполнены, использовались только в ситуациях, когда такое противоречивое поведение не могло представлять опасности. В тех случаях, когда любое значение, совпадающее с арифметически-корректным модом 65536 ...
supercat 03 авг. 2015, в 20:50
0

... было бы достаточно для удовлетворения требований программы, однако код, который должен был выполняться только на платформах, которые соответствуют этой поведенческой модели, мог бы предложить больше возможностей оптимизации для компиляторов, которые будут придерживаться этой модели, чем код, который использовал бы только стандартные определения поведения ,
supercat 03 авг. 2015, в 21:04
1

Я считаю, что аргумент «вернуться назад во времени» немного ошибочен - компилятор может «вернуться назад» во времени только в том случае, если путь кода, ведущий к UB, не имеет видимых побочных эффектов, но в этом случае вы не сможете скажите, "вернулся" или нет. Если вы делаете что-либо наблюдаемое внутри ring_bell() (например, запись в файл), это действие должно действительно произойти до того, как будет вызван UB. Компилятор не может предположить во время компиляции, что он сможет «отменить» это действие во время выполнения, потому что нет никаких гарантий, что он сможет это сделать - вызов является внешним и, например, может даже никогда не вернуться.
Mehrdad 04 авг. 2015, в 07:13
1

Он не отвечает на вопрос «Является ли неинициализированная локальная переменная самым быстрым генератором случайных чисел?»
Hunsu 07 авг. 2015, в 07:09
0

@Mehrdad: компилятор может переупорядочить UB по побочным эффектам, если ему разрешено предполагать, что код, выполняющий побочные эффекты, не будет блокироваться постоянно или вызывать ненормальное завершение программы в зависимости от реализации (например, попытка отправить данные сломанному труба). К сожалению, немногие реализации документируют, какие операции они выполняют или не распознают как потенциально нарушающие выполнение программы, потому что это так редко имеет значение.
supercat 06 июль 2018, в 14:59
0

@supercat: Я говорил, что проблема в том, что «если» не может быть удовлетворено в реальности, потому что компилятор не имеет представления о том, что система, которая фактически завершает работу программы, будет делать в результате этого побочного эффекта (программа не содержит Достаточно информации об этом! Это внешний мир, который по определению ненаблюдаем!) и, следовательно, нет представления о том, сколько времени займет это действие (если оно является конечным) или возможно ли вообще отменить результат (если таковой имеется). Поэтому он вынужден вызывать побочный эффект и не может оптимизировать UB.
Mehrdad 06 июль 2018, в 18:42
0

@Mehrdad: Реализации не обязаны указывать какую-либо конкретную связь между тем, что происходит в абстрактной машине, и тем, что происходит в реальном мире. Реализация не может быть полезной для чего-либо, если она не может гарантировать какие-то значимые отношения, но авторы Standard заявляют, что не считают необходимым избегать возможности соответствия, но бесполезные реализации.
supercat 06 июль 2018, в 18:50
0

@supercat: Мы говорили о компиляторе (принимает исходный код, выплевывает какой-то перевод для последующей реализации в некоторой реализации), а не о самой абстрактной «реализации» (принимает исходный код, выполняет его каким-то абстрактным образом). Вы не можете назвать это компилятором, если это последняя сущность, выполняющая код; Вы бы назвали это «переводчиком» или чем-то еще.
Mehrdad 06 июль 2018, в 18:55
0

@Mehrdad: Стандарт не может сказать ничего значащего о том, что происходит, если вывод компилятора выполняется в среде, которая не соответствует требованиям. Соответствующий компилятор может указать, что он подходит только для использования в средах, которые обещают, что каждый лицевой корректный вызов fwrite будет возвращаться, и что он не дает никаких обещаний о том, что произойдет, если вызов fwrite не сможет это сделать. Компилятор, который задает вещи таким образом, может свободно переупорядочивать операции, которые могут вызывать UB через вызовы fwrite (), даже если fwrite () имеет наблюдаемые побочные эффекты.
supercat 06 июль 2018, в 19:03
0

@supercat: Да, и я не думаю, что это противоречит тому, что я сказал. Я только когда-либо говорил о программе, которую может создать компилятор ; даже не имеет смысла говорить об «оптимизации» кода, когда речь идет о чисто абстрактной машине. Вам нужен промежуточный самоанализ. Действительно, компилятор может выдавать выходные данные, которые сообщают системе времени выполнения «вот что вы делаете, если вы априори знаете, что может делать fwrite , и вот что вы делаете, если нет», и реализация может использовать это, если это так . Но мы знаем, что это бессмысленно для наших реализаций, поэтому нам важен только случай «если нет».
Mehrdad 06 июль 2018, в 19:48
0

@supercat: Как примечание, стандарт не должен ничего явно говорить о выводе компилятора. Как бы то ни компилятор производит должен быть логически вытекает из исходной программы , если выполняется с правильными входами и стандарт есть , что сказать по этому поводу, и это очень нетривиальная ограничение. (Но опять же, обратите внимание, что я все время говорил о компиляторе, а не об окончательной абстрактной машине: «оптимизация» не имеет смысла, если вы не можете предположить что-то конкретное, что вы можете проанализировать.)
Mehrdad 06 июль 2018, в 19:50
0

@Mehrdad: рассмотрим void test(FILE *f, unsigned x) { for (int i=0; i<10; i++) { char temp= !x; fwrite(&temp, 1, 1, f); temp = 1/x; fwrite(&temp, 1, 1, f); } } функции void test(FILE *f, unsigned x) { for (int i=0; i<10; i++) { char temp= !x; fwrite(&temp, 1, 1, f); temp = 1/x; fwrite(&temp, 1, 1, f); } } . Если компилятор указывает, что он подходит только для сред, в которых всегда будет возвращаться верный лицевой fwrite , он может поднять вычисление 1/x вне цикла. Такая оптимизация часто была бы полезна, но могла бы заставить UB путешествовать во времени при первом вызове fwrite. Даже если сгенерированный код для 1/x фактически не перехватывается, когда x == 0 (например, компилятор может заменить 1/x на x==1 ) ...
supercat 06 июль 2018, в 20:35
0

... компилятор может предположить, что выражение !x не будет достижимо при x==0 .
supercat 06 июль 2018, в 20:36
0

@supercat: Да, я считаю, что это утверждение согласуется с тем, что я только что сказал, и что компилятор не сможет выполнить эту оптимизацию из-за того, что я только что объяснил.
Mehrdad 06 июль 2018, в 20:39
0

@ Mehrdad: Я не понимаю, почему вы думаете, что компилятор не сможет сделать такую оптимизацию. Я не уверен, что это можно сделать с помощью fwrite , но если заменить fwrite на хранилище на энергозависимый объект, gcc сделает эту оптимизацию, даже если на многих платформах энергозависимое хранилище может иметь внешние наблюдаемые эффекты.
supercat 06 июль 2018, в 20:53
0

@supercat: Разрешено ли GCC по закону предполагать, что запись в volatile гарантированно завершится за конечное время при любой реализации, на которую ориентируется GCC? Если это так, то я могу ошибаться (я никогда не читал ничего такого, что утверждало бы это). Если нет, и если GCC на самом деле делает это, я бы сказал, что это не соответствует требованиям, причинами которых являются все, что я изложил. Не могли бы вы связать меня с примером, подтверждающим ваше утверждение, что GCC сделает это? У меня проблемы с воспроизведением.
Mehrdad 06 июль 2018, в 21:20
0

См. Godbolt.org/g/4EEJ57 для простого примера. Код выполняет деление перед циклом. Что касается того, допускается ли такое поведение, я думаю, что Стандарт будет рассматривать отношения последовательности между изменчивыми доступами и вещами, которые не являются изменчивыми доступами, как проблему качества реализации, и не предпринимает попыток требовать, чтобы реализации были достаточного качества, чтобы быть пригодным для любой конкретной цели.
supercat 06 июль 2018, в 21:53
0

@supercat: Интересно, спасибо. Да, я вижу это как незаконную оптимизацию. Я не вижу, как запись в volatile zzq может быть запрещена только потому, что пользователь указал x = 0 . Что если запись в zzq должна была привести к перезагрузке ЦП до завершения инструкции? Вы могли бы, вероятно, сделать реальное оборудование (или, если нет, эмулятор ...), который сделал это с ISA x86. Единственное оправдание, которое я вижу здесь, это то, что x86 запрещает такие вещи, а если нет, я об этом не знаю.
Mehrdad 06 июль 2018, в 22:49
0

@Mehrdad: Стандарт предоставляет реализации чрезвычайно широкую широту в отношении того, как они обрабатывают volatile . Я думаю, что намерение состоит в том, что если бы возникли какие-либо мыслимые обстоятельства, в которых было бы полезно, чтобы реализация, нацеленная на конкретную цель, действовала определенным образом, то реализация, нацеленная на эту цель, должна быть разрешена, если она документирует поведение , Не лишено смысла, если авторы компиляторов признают, что допуски Стандартов на необычное поведение никоим образом не подразумевают их одобрения.
supercat 06 июль 2018, в 23:13

Показать ещё 55 комментариев

Shafik Yaghmour · Answer 2 · 2015-07-31T13-10-00.000Z

Позвольте мне сказать это четко: мы не вызываем поведение undefined в наших программах. Это никогда не бывает хорошей идеей, периодом. Редкие исключения из этого правила; например, если вы являетесь разработчиком библиотеки, реализующим offsetof. Если ваше дело попадает под такое исключение, вы, вероятно, знаете это уже. В этом случае мы знаем, что использование неинициализированных автоматических переменных - это поведение undefined.

Компиляторы стали очень агрессивными с оптимизацией вокруг поведения undefined, и мы можем найти множество случаев, когда поведение undefined привело к нарушениям безопасности. Самый печально известный случай - это, вероятно, удаление нулевого указателя ядра ядра Linux, о котором я упоминаю в мой ответ на С++ ошибка компиляции?, где оптимизация компилятора вокруг поведения undefined превратила конечный цикл в бесконечный.

Мы можем читать CERT Опасные оптимизации и потеря причинности, в которых, среди прочего, говорится:

Все чаще авторы сценариев используют undefinedповедения на языках программирования C и С++ для улучшения оптимизаций.

Часто эти оптимизации мешают способность разработчиков выполнять причинно-следственный анализ на их исходный код, то есть анализ зависимости результатов ниже по течению по предыдущим результатам.

Следовательно, эти оптимизации устраняются причинности в программном обеспечении и повышают вероятность программного обеспечения ошибок, дефектов и уязвимостей.

В частности, в отношении неопределенных значений, отчет о дефекте видеть его в прямом эфире):

updateEffect(int*):                     # @updateEffect(int*)
    retq

или, возможно, получить все нули, как в случае с этим модифицированным случаем:

void updateEffect(int  arr[20]){
    for(int i=0;i<20;i++){
        int r ;    
        arr[i] = r%255 ;
    }
}

посмотреть в прямом эфире:

updateEffect(int*):                     # @updateEffect(int*)
    xorps   %xmm0, %xmm0
    movups  %xmm0, 64(%rdi)
    movups  %xmm0, 48(%rdi)
    movups  %xmm0, 32(%rdi)
    movups  %xmm0, 16(%rdi)
    movups  %xmm0, (%rdi)
    retq

Оба этих случая являются вполне приемлемыми формами поведения undefined.

Обратите внимание, что если мы находимся на Itanium, мы могли бы получить значение trap:

[...], если регистр имеет специальное значение не-вещь, чтение ловушек регистра, за исключением нескольких инструкций [...]

Другие важные примечания

Интересно отметить дисперсию между gcc и clang, отмеченную в проекте UB Canaries, о том, как они хотят использовать undefined по отношению к неинициализированной памяти. В статье отмечается (внимание мое):

Конечно, мы должны полностью понять, что любое такое ожидание не имеет ничего общего с языковым стандартом и все, что связано с тем, что делает конкретный компилятор, либо потому, что поставщики этого компилятора не хотят использовать этот UB или просто потому, что они еще не использовали его. Если нет реальной гарантии от поставщика компилятора, , мы хотели бы сказать, что пока неиспользованные UB - это бомбы замедленного действия: theyre ждет, чтобы уйти в следующем месяце или в следующем году, когда компилятор становится немного более агрессивным.

Как указывает Matthieu M. Что должен знать каждый программист C undefined Поведение № 2/3, также относится к этому вопросу. В нем говорится, среди прочего (акцент мой):

Важная и страшная вещь, которую нужно осознать, состоит в том, что практически любой оптимизация на основе поведения undefined может запускаться buggy code в любое время в будущем. Встраивание, циклическая развертка, память продвижение и другие оптимизации будут улучшаться, и значительная часть их причины для существования заключается в том, чтобы оптимизации, такие как выше.

Для меня это глубоко неудовлетворительно, частично потому, что компилятор неизбежно оказывается обвиненным, но также потому, что это означает, что огромные тела C-кода - это наземные мины, ожидающие взорваться.

Для полноты я должен, вероятно, упомянуть, что реализации могут выбрать корректное поведение undefined, например gcc позволяет вводить пул через объединения а в С++ это похоже на поведение undefined. Если это так, реализация должна документировать его, и это обычно не будет переносимым.

+ (int) (PI / 3) для примеров вывода компилятора; реальный пример того, что UB - это, ну, UB .
Использование UB фактически было торговой маркой отличного хакера. Эта традиция существует уже, вероятно, 50 лет и более. К сожалению, компьютеры теперь обязаны минимизировать влияние UB из-за плохих людей. Мне очень понравилось узнавать, как делать классные вещи с помощью машинного кода UB или чтения / записи портов и т. Д. В 90-х годах, когда ОС не была настолько способна защитить пользователя от себя.
@sfdcfox мало что документирует этот переход, по крайней мере, я не нашел его и много читал по этой теме. Кажется маловероятным, что этот джин будет возвращен в бутылку.
@TheodorosChatzigiannakis, учитывая, что мой ответ пришел спустя почти шесть часов после того, как был задан вопрос, у меня все хорошо. С этим горячим вопросом сети очень трудно преодолеть преимущество первопроходца. Я только добавил свой ответ, потому что существующие ответы действительно упустили много важных моментов. Скорее всего, единственный способ, которым я окажусь на вершине, - это если ОП примет мой ответ.
@sfdcfox, если вы делали это в машинном коде / ассемблере, это не было неопределенным поведением (это могло быть нетрадиционным поведением).
@Caleth: существует множество платформ, где определенные виды операций с указателями будут иметь полезное поведение, даже если стандарт не предъявляет к ним никаких требований. Например, void copy(char *dest, char *src { char ch; int diff = dest-src-1; while((ch = *src++) != 0); src[diff] = ch; } Ужасное неопределенное поведение , но если известно, что src и dest достаточно близки, это может дать лучший код, чем любая определенная альтернатива.
Если вы имеете в виду конкретную сборку, используйте ее и не пишите несовместимую C. Тогда все будут знать, что вы используете определенный непереносимый трюк. И это не плохие люди, которые имеют в виду, что вы не можете использовать UB, это Intel и т. Д., Делающие свои трюки на чипе.
Вы также можете указать ссылку на то, что каждый программист на Си должен знать о неопределенном поведении . Теперь давайте пожелаем, чтобы этот ответ взял верх ...
Помимо этого, возможно, глупый вопрос с простым ответом: почему операции, которые в соответствии со стандартом являются явно неопределенным поведением, не просто запрещены полностью?
@ 500-InternalServerError, потому что они не могут быть легко обнаруживаемыми или вообще не обнаруживаемыми в общем случае, и, следовательно, не будет никакого способа их запретить. Что отличается от нарушений грамматики, которые можно обнаружить. У нас также есть плохо сформированные и неправильно сформированные диагностические данные, которые, как правило, отделяют плохо сформированные программы, которые могут быть обнаружены в теории, от программ, которые в теории не могут быть надежно обнаружены.
@ 500-InternalServerError Вторая причина заключается в том, что он позволяет компиляторам поддерживать расширения ... или поддерживать поведение на платформах, которые не вызывают проблем.
@ 500-InternalServerError: рассмотрите влияние unsigned int x,y; x=getch(); y=getch(); printf("%u",x<<y); на 32-битной машине. Некоторые машины генерируют код, который сместит x влево на y раз. Другие будут использовать инструкцию shift-left, которая вычислит x<<(y & 31) . Некоторые могут вызвать аппаратную ловушку, если y превышает 32. Если бы стандарт имел мандат одного или другого из первых двух вариантов поведения, это потребовало бы от многих компиляторов генерирования дополнительного кода для обработки случая y>=32 что снизило бы производительность, даже когда y был в диапазоне от 0 до 31. Еще хуже, если ...
... например, аппаратные средства могли выполнять поведение «сдвиг влево N раз» за один цикл, и программе требовалось поведение «сдвиг влево N раз», но Стандарт предписывал «сдвиг влево (N & 31)» раз, программист должен был бы написать y >= 32 ? 0 : x << y который типичный компилятор затем, скорее всего, будет отображать как сравнение, условный переход, битовую маску и сдвиг - вполне возможно, что в четыре раза дольше, чем по инструкции «shift x left by y». В результате программисты, которые знали, что их код должен был работать только на платформе, чье поведение соответствовало их потребностям, могли ...
... воспользоваться этим. Кто-то, пишущий код для платформы, которая не соответствует их потребностям, должен был бы написать код, чтобы справиться с этим, но требовал, чтобы пользователь писал код для обработки случая y> = 32 в ситуациях, когда поведение платформы было неприемлемым, было лучше чем требовать от компиляторов примерно половины существующих платформ для генерации такого кода, даже если он часто бывает бесполезным, а иногда и просто контрпродуктивным.
Я считаю интересным связанный отчет о дефектах 451 и ответ комитета. Семантика, при которой первое чтение неинициализированных данных может считывать любое значение, но все последующие чтения должны давать одно и то же значение (отсутствующие промежуточные записи), позволяют программистам, которые знают, что алгоритм будет работать с массивом, содержащим любую комбинацию содержимого, от которого воздерживаться ненужная инициализация. Я с трудом представляю себе случаи, когда ослабление семантики до описанной степени позволило бы любым оптимизациям любых программ, написанных, вести себя осмысленно в соответствии с этой семантикой .
Есть много ситуаций, когда код получает число, которое достаточно мало для использования в качестве индекса массива, и ему нужно вычислить из этого значения, которое можно легко проверить как правильное. Извлечение значения из неинициализированного массива, определение его правильности и, если нет, вычисление значения и сохранение вычисленного значения в массиве, иногда может быть более эффективным, чем инициализация массива, особенно в ситуациях, когда только крошечная дробь элементов массива когда-либо используются. Однако чтение элементов не определено, а не определено ...
... полностью сломал бы такой алгоритм. Кстати, мне также любопытно, почему авторы ответа считают, что описание битов заполнения как «неопределенное» подразумевает, что «неопределенное» и «неопределенное» - это одно и то же? Если long равен 40 битам плюс 24 бита заполнения в конце, данный union { long l; unsigned char b[8];} u , если они не указаны, можно сказать, что каждый запуск ul=123; printf("(%d %d)", ub[7], ub[7]); должен вывести некоторое число 0-255 дважды, но каждый прогон может вывести другое число. Если сделать его неопределенным, этот код станет UB. Последнее даже отдаленно разумно?
Dangerous Optimizations and the Loss of Causality теперь найденная здесь, также видят видео
Почти любой код, который использует агрегаты, нарушает 6.5p7 и, следовательно, вызывает UB. Авторы Стандарта предположили, что любая качественная реализация должна распознавать, по крайней мере, некоторые ситуации, когда lvalue одного типа используется для получения одного из другого, и считала это настолько очевидным, что конструкции «aggregate.member» и «aggregatePtr-> member msgstr "должны поддерживаться всеми реализациями пригодного для использования качества, которые им не нужно явно упоминать.

Bathsheba · Answer 3 · 2015-07-31T08-49-00.000Z

Нет, это ужасно.

Поведение использования неинициализированной переменной undefined как в C, так и в С++, и очень маловероятно, чтобы такая схема имела желательные статистические свойства.

Если вам нужен "быстрый и грязный" генератор случайных чисел, то rand() - ваш лучший выбор. В его реализации все, что он делает, это умножение, добавление и модуль.

Самый быстрый генератор, о котором я знаю, требует использования uint32_t в качестве типа псевдослучайной переменной I и использования

I = 1664525 * I + 1013904223

для генерации последовательных значений. Вы можете выбрать любое начальное значение I (называемое семенем), которое берет ваше воображение. Очевидно, вы можете закодировать этот встроенный. В качестве модуля действует стандартно гарантированное обертывание неподписанного типа. (Численные константы отбираются у этого замечательного научного программиста Дональда Кнута.)

Представленный вами «линейный конгруэнтный» генератор хорош для простых приложений, но только для некриптографических приложений. Можно предсказать его поведение. См., Например, « Расшифровка линейного конгруэнтного шифрования » самого Дона Кнута (IEEE Transactions по теории информации, том 31).
@ Джей по сравнению с унитарной переменной для быстрого и грязного? Это гораздо лучшее решение.
rand() не подходит по назначению и должен быть полностью устаревшим, по моему мнению. В наши дни вы можете загрузить свободно лицензируемые и значительно превосходящие генераторы случайных чисел (например, Mersenne Twister), которые почти с такой же скоростью работают с максимальной легкостью, поэтому на самом деле нет необходимости продолжать использовать весьма дефектный rand()
У rand () есть еще одна ужасная проблема: он использует своего рода блокировку, вызываемую внутри потоков, которая значительно замедляет ваш код. По крайней мере, есть реентерабельная версия. И если вы используете C ++ 11, случайный API предоставляет все, что вам нужно.
Хотя rand() должен быть заполнен (иначе он не будет выглядеть случайно). Так как это обычно использует время, у вас также будет вызов sys. Тем не менее, чрезвычайно приемлемая производительность практически в любом случае (а посев - вещь разовая).
Честно говоря, он не спросил, был ли это хороший генератор случайных чисел. Он спросил, было ли это быстро. Ну, да, это, вероятно, постился. Но результаты не будут очень случайными на всех.

meaning-matters · Answer 4 · 2015-07-31T08-23-00.000Z

Хороший вопрос!

Undefined не означает, что он случайный. Подумайте об этом, значения, которые вы получили в глобальных неинициализированных переменных, оставались там системой или вашими/другими приложениями. В зависимости от того, что ваша система делает с более не используемой памятью и/или какие значения генерирует система и приложения, вы можете получить:

Всегда то же самое.
Будь одним из небольшого набора значений.
Получить значения в одном или нескольких небольших диапазонах.
См. множество значений, делящихся на 2/4/8 из указателей в 16/32/64-битной системе.
...

Значения, которые вы получите полностью, зависят от того, какие неслучайные значения оставлены системой и/или приложениями. Таким образом, действительно будет некоторый шум (если ваша система не уничтожит больше не используемую память), но пул значений, из которого вы рисуете, ни в коем случае не будет случайным.

Для локальных переменных ситуация становится намного хуже, потому что они поступают непосредственно из стека вашей собственной программы. Существует очень хороший шанс, что ваша программа будет фактически записывать эти позиции стека во время выполнения другого кода. Я оцениваю шансы на удачу в этой ситуации очень низко, и "случайное" изменение кода вы делаете попытку этой удачи.

Читайте о randomness. Как вы увидите, случайность - это очень специфическое и труднодоступное свойство. Это распространенная ошибка думать, что если вы просто возьмете то, что трудно отслеживать (например, ваше предложение), вы получите случайное значение.

... и это исключает все оптимизации компилятора, которые полностью уничтожили бы этот код.
6 ... Вы получите различную «случайность» в Debug и Release. Неопределенный означает, что вы делаете это неправильно.
Правильно. Я бы сократил или резюмировал как «неопределенный»! = «Произвольный»! = «Случайный». Все эти виды «неизвестности» имеют разные свойства.
Глобальные переменные гарантированно имеют определенное значение, независимо от того, инициализированы они или нет. Это определенно верно и в C ++, и в C.

Viktor Toth · Answer 5 · 2015-07-31T19-57-00.000Z

Много хороших ответов, но позвольте мне добавить еще один и подчеркнуть, что на детерминированном компьютере ничто не является случайным. Это справедливо как для чисел, создаваемых псевдо-RNG, так и для кажущихся "случайных" чисел, найденных в областях памяти, зарезервированных для локальных переменных C/С++ в стеке.

НО... есть решающее различие.

Цифры, генерируемые хорошим псевдослучайным генератором, обладают свойствами, которые делают их статистически подобными поистине случайным дроби. Например, распределение равномерно. Длительность цикла длинна: вы можете получить миллионы случайных чисел до того, как цикл повторится. Последовательность не автокоррелирована: например, вы не увидите, как появляются странные шаблоны, если вы берете каждое 2-е, 3-е или 27-е число или просматриваете определенные цифры в сгенерированных числах.

Напротив, "случайные" числа, оставленные в стеке, не имеют ни одного из этих свойств. Их значения и их кажущаяся случайность зависят полностью от того, как создается программа, как она компилируется и как она оптимизируется компилятором. В качестве примера, вот вариация вашей идеи как самостоятельной программы:

#include <stdio.h>

notrandom()
{
        int r, g, b;

        printf("R=%d, G=%d, B=%d", r&255, g&255, b&255);
}

int main(int argc, char *argv[])
{
        int i;
        for (i = 0; i < 10; i++)
        {
                notrandom();
                printf("\n");
        }

        return 0;
}

Когда я компилирую этот код с GCC на машине Linux и запускаю его, он оказывается довольно неприятным детерминированным:

R=0, G=19, B=0
R=130, G=16, B=255
R=130, G=16, B=255
R=130, G=16, B=255
R=130, G=16, B=255
R=130, G=16, B=255
R=130, G=16, B=255
R=130, G=16, B=255
R=130, G=16, B=255
R=130, G=16, B=255

Если вы посмотрели на скомпилированный код с дизассемблером, вы можете подробно реконструировать происходящее. Первый вызов notrandom() использовал область стека, которая ранее не использовалась этой программой; кто знает, что там было. Но после этого вызова notrandom() есть вызов printf() (который компилятор GCC фактически оптимизирует для вызова putchar(), но неважно), и это перезаписывает стек. Итак, следующее и последующее время, когда вызывается notrandom(), стек будет содержать устаревшие данные из выполнения putchar(), и поскольку putchar() всегда вызывается с теми же аргументами, эти устаревшие данные всегда будут одинаковыми, тоже.

Таким образом, нет абсолютно ничего случайного в этом поведении, равно как и числа, полученные таким образом, не имеют каких-либо желательных свойств хорошо написанного генератора псевдослучайных чисел. Фактически, в большинстве реальных сценариев их значения будут повторяться и сильно коррелироваться.

Действительно, как и другие, я бы также серьезно подумал об увольнении кого-то, кто попытался передать эту идею как "высокопроизводительный RNG".

«В детерминированном компьютере нет ничего случайного» - на самом деле это не так. Современные компьютеры содержат всевозможные датчики, которые позволяют генерировать истинную , непредсказуемую случайность без отдельных аппаратных генераторов. В современной архитектуре значения /dev/random часто отбираются из таких аппаратных источников и на самом деле являются «квантовым шумом», то есть действительно непредсказуемыми в лучшем физическом смысле этого слова.
Но ведь это не детерминированный компьютер, не так ли? Теперь вы полагаетесь на вклад окружающей среды. В любом случае, это выводит нас далеко за рамки обсуждения обычного псевдо-ГСЧ и «случайных» битов в неинициализированной памяти. Также ... посмотрите на описание / dev / random, чтобы оценить, насколько далеко зашли разработчики, чтобы убедиться, что случайные числа криптографически безопасны ... именно потому, что входные источники не являются чистым, некоррелированным квантовым шумом, но скорее, потенциально сильно коррелированные показания датчика с небольшой степенью случайности. Это тоже довольно медленно.

6502 · Answer 6 · 2015-07-31T07-56-00.000Z

Undefined поведение означает, что авторы компиляторов могут игнорировать проблему, потому что у программистов никогда не будет права жаловаться на происходящее.

Хотя в теории при входе в землю UB может случиться что-то (включая демон, летящий с вашего носа), что обычно означает, что авторам-компиляторам просто все равно, и для локальных переменных значение будет тем, что находится в памяти стека в этой точке.

Это также означает, что часто контент будет "странным", но фиксированным или слегка случайным или переменным, но с явным очевидным шаблоном (например, увеличение значений на каждой итерации).

Конечно, вы не можете ожидать, что это приличный случайный генератор.

Martijn · Answer 7 · 2015-07-31T11-54-00.000Z

26

Undefined поведение undefined. Это не означает, что вы получаете значение undefined, это значит, что программа может что-то делать и все еще соответствует спецификации языка.

Хороший оптимизирующий компилятор должен принимать

void updateEffect(){
    for(int i=0;i<1000;i++){
        int r;
        int g;
        int b;
        star[i].setColor(r%255,g%255,b%255);
        bool isVisible;
        star[i].setVisible(isVisible);
    }
}

и скомпилируйте его в noop. Это, безусловно, быстрее, чем любая альтернатива. Недостатком является то, что он ничего не сделает, но это недостаток поведения undefined.

Martijn 31 июль 2015, в 11:54

3

Многое зависит от того, является ли цель компилятора помочь программистам создавать исполняемые файлы, отвечающие требованиям домена, или же цель состоит в том, чтобы создать наиболее «эффективный» исполняемый файл, поведение которого будет соответствовать минимальным требованиям стандарта C, без Рассмотрим, будет ли такое поведение служить какой-либо полезной цели. Что касается первой цели, то использование кода, использующего некоторые произвольные начальные значения для r, g, b, или запуск ловушки отладчика, если это целесообразно, было бы более полезным, чем превращение кода в nop. Что касается последней цели ...
supercat 31 июль 2015, в 20:09
2

... оптимальный компилятор должен определить, какие входные данные вызовут выполнение вышеуказанного метода, и исключить любой код, который будет иметь значение только при получении таких входных данных.
supercat 31 июль 2015, в 20:12
1

@supercat Или его целью может быть C. для создания эффективных исполняемых файлов в соответствии со Стандартом, помогая программисту находить места, где соответствие не может быть полезным. Компиляторы могут достичь этой компромиссной цели, испуская больше диагностики, чем требует Стандарт, например, GCC -Wall -Wextra .
Damian Yerrick 02 авг. 2015, в 03:22
1

То, что значения не определены, не означает, что поведение окружающего кода не определено. Ни один компилятор не должен замкнуть эту функцию. Два вызова функций, какие бы вводимые данные они ни вводили, абсолютно ДОЛЖНЫ вызываться; первый ДОЛЖЕН вызываться с тремя числами от 0 до 255, а второй ДОЛЖЕН вызываться с истинным или ложным значением. «Хороший оптимизирующий компилятор» может оптимизировать параметры функции до произвольных статических значений, полностью избавляясь от переменных, но это далеко не так (ну, разве что сами функции могут быть сведены к нулям на определенных входах).
Dewi Morgan 03 авг. 2015, в 01:11
0

@DewiMorgan - поскольку вызываемые функции относятся к типу «установить этот параметр», они почти наверняка сводятся к noops, когда входные данные совпадают с текущим значением параметра, что компилятор может предположить, что так и есть.
Jules 03 авг. 2015, в 09:17

Показать ещё 3 комментария

Caleth · Answer 8 · 2015-07-31T10-05-00.000Z

Не упоминается, но пути к коду, вызывающие поведение undefined, позволяют делать все, что хочет компилятор, например

void updateEffect(){}

Это, безусловно, быстрее, чем ваш правильный цикл, и из-за UB, идеально соответствует.

Arne · Answer 9 · 2015-07-31T08-22-00.000Z

Из-за соображений безопасности новая память, назначенная программе, должна быть очищена, в противном случае информация может быть использована, и пароли могут протекать из одного приложения в другое. Только при повторном использовании памяти вы получаете разные значения, чем 0. И очень вероятно, что в стеке предыдущее значение просто фиксировано, потому что предыдущее использование этой памяти исправлено.

Jos · Answer 10 · 2015-07-31T15-45-00.000Z

Пример вашего конкретного кода, вероятно, не будет делать то, что вы ожидаете. Технически каждая итерация цикла повторно создает локальные переменные для значений r, g и b, на практике это то же самое пространство памяти в стеке. Следовательно, он не будет повторно рандомизирован с каждой итерацией, и вы в конечном итоге назначаете одинаковые 3 значения для каждого из 1000 цветов, независимо от того, насколько случайны r, g и b являются индивидуально и изначально.

В самом деле, если бы это сработало, мне было бы очень интересно узнать, что такое рандомизация. Единственное, о чем я могу думать, это чередование прерываний, которые могут быть поставлены на вершине этого стека, что маловероятно. Возможно, внутренняя оптимизация, которая сохранила их как регистровые переменные, а не как истинные ячейки памяти, где регистры снова используются в нижнем цикле, также будет хитростью, особенно если функция видимости в определенном режиме является голодной. Тем не менее, далеко не случайно.

Barmar · Answer 11 · 2015-08-05T16-59-00.000Z

Я выполнил очень простой тест, и он не был случайным вообще.

#include <stdio.h>

int main() {

    int a;
    printf("%d\n", a);
    return 0;
}

Каждый раз, когда я запускал программу, она печатала то же число (32767 в моем случае) - вы не можете получить гораздо менее случайное, чем это. Это, по-видимому, независимо от кода запуска в библиотеке времени выполнения, оставшейся в стеке. Так как он использует один и тот же код запуска каждый раз, когда запускается программа, и ничто другое не меняется в программе между прогонами, результаты совершенно согласованы.

Хорошая точка зрения. Результат сильно зависит от того, где этот генератор случайных чисел вызывается в коде. Это скорее непредсказуемо, чем случайно.

Frankie_C · Answer 12 · 2015-07-31T16-19-00.000Z

Действительно плохо! Плохая привычка, плохой результат. Рассмотрим:

A_Function_that_use_a_lot_the_Stack();
updateEffect();

Если функция A_Function_that_use_a_lot_the_Stack() делает всегда ту же инициализацию, она оставляет стек с теми же данными на нем. Эти данные являются тем, что мы вызываем updateEffect(): всегда одинаковое значение!.

Ali Kazmi · Answer 13 · 2015-07-31T07-52-00.000Z

11

Как большинство людей упоминает поведение undefined. undefined также означает, что вы можете получить некоторое действительное целочисленное значение (к счастью), и в этом случае это будет быстрее (поскольку вызов функции rand не выполняется). Но практически не используйте его. Я уверен, что это будет ужасным результатом, потому что удача не с вами все время.

Ali Kazmi 31 июль 2015, в 07:52

1

Очень хороший момент! Это может быть прагматический трюк, но действительно тот, который требует удачи.
meaning-matters 31 июль 2015, в 09:30
1

В этом нет абсолютно никакой удачи. Если компилятор не оптимизирует неопределенное поведение, значения, которые вы получите, будут совершенно детерминированными (= полностью зависят от вашей программы, ее входных данных, ее компилятора, используемых библиотек, времени его потоков, если у него есть потоки). Проблема в том, что вы не можете рассуждать об этих значениях, поскольку они зависят от деталей реализации.
cmaster 31 июль 2015, в 19:18
0

В отсутствие операционной системы со стеком обработки прерываний, отдельным от стека приложений, удача вполне может быть связана с тем, что прерывания часто нарушают содержимое памяти, немного превышающее текущее содержимое стека.
supercat 31 июль 2015, в 21:42

Показать ещё 1 комментарий

Zsolt Szatmari · Answer 14 · 2015-08-02T17-57-00.000Z

Вам нужно определить, что вы подразумеваете под "случайным". Разумное определение предполагает, что полученные вами значения должны иметь небольшую корреляцию. Это то, что вы можете измерить. Это также не является тривиальным для достижения в контролируемой, воспроизводимой манере. Таким образом, поведение undefined, конечно, не то, что вы ищете.

supercat · Answer 15 · 2015-07-31T17-42-00.000Z

Существуют определенные ситуации, в которых неинициализированная память может быть безопасно прочитана с использованием типа "unsigned char *" [например. буфер возвращается из malloc]. Код может читать такую память, не беспокоясь о том, что компилятор бросает причинность из окна, и бывают случаи, когда может быть более эффективным создание кода для чего-либо, что может содержать память, чем для обеспечения того, чтобы неинициализированные данные не были прочитаны ( обычным примером этого будет использование memcpy в частично инициализированном буфере, а не дискретное копирование всех элементов, содержащих содержательные данные).

Тем не менее, даже в таких случаях следует всегда предполагать, что если какая-либо комбинация байтов будет особенно досадной, чтение ее всегда будет приводить к тому, что паттерн байтов (и если какой-то образец будет досадным в производстве, но не в разработке, такой шаблон не будет отображаться до тех пор, пока код не будет создан).

Чтение неинициализированной памяти может быть полезно как часть стратегии случайного генерации во встроенной системе, где можно быть уверенным, что память никогда не была написана с существенно-неслучайным содержимым с момента последнего включения системы и если производственный процесс, используемый для памяти, приводит к тому, что состояние включения питания изменяется в полуслучайном порядке. Код должен работать, даже если все устройства всегда дают одни и те же данные, но в тех случаях, когда, например, группе узлов нужно как можно быстрее выбирать произвольные уникальные идентификаторы, имея "не очень случайный" генератор, который дает половину узлов один и тот же начальный идентификатор может быть лучше, чем не иметь никакого исходного источника случайности вообще.

«если какая-либо комбинация байтов будет особенно неприятной, ее чтение всегда будет приводить к такой схеме байтов» - пока вы не закодируете код, чтобы справиться с этим шаблоном, после чего он больше не будет раздражающим, и в будущем будет прочитан другой шаблон.
@SteveJessop: Точно. Моя линия о разработке против производства была призвана передать аналогичное понятие. Код не должен заботиться о том, что находится в неинициализированной памяти, кроме смутного понятия «некоторая случайность может быть хорошей». Если на поведение программы влияет содержимое одного фрагмента неинициализированной памяти, это, в свою очередь, может повлиять на содержимое фрагментов, которые будут получены в будущем.

Alun Thomas · Answer 16 · 2015-07-31T14-41-00.000Z

Как говорили другие, он будет быстрым, но не случайным.

То, что большинство компиляторов сделает для локальных переменных, - это захватить некоторое пространство для них в стеке, но не утруждать себя настройкой на что-либо (стандарт говорит, что им это не нужно, поэтому зачем замедлять код, который вы генерируете?).

В этом случае значение, которое вы получите, будет зависеть от того, что было ранее в стеке - если вы вызываете функцию до этого, у которой есть сотня локальных переменных char, все установлены на "Q", а затем вызывают вы будете функционировать после того, как это вернется, тогда вы, вероятно, найдете, что ваши "случайные" значения ведут себя так, как если бы вы memset() их всех в "Q".

Важно, что для вашего примера, использующего эту функцию, эти значения не меняются каждый раз, когда вы их читаете, они будут одинаковыми каждый раз. Таким образом, вы получите 100 звезд, все настроены на тот же цвет и видимость.

Кроме того, ничто не говорит о том, что компилятор не должен инициализировать это значение, поэтому будущий компилятор может это сделать.

В общем: плохая идея, не делай этого. (как много "умных" оптимизаций уровня кода действительно...)

Вы делаете серьезные прогнозы относительно того, что произойдет, хотя ничего из этого не гарантировано благодаря UB. Это также не так на практике.

DDan · Answer 17 · 2015-08-17T12-17-00.000Z

Мне нравится ваш образ мыслей. Действительно вне коробки. Однако компромисс действительно не стоит этого. Компромисс между памятью и временем выполнения, в том числе поведение undefined для среды выполнения не.

Это должно дать вам очень тревожное ощущение, что вы используете такие "случайные", как ваша бизнес-логика. Я этого не сделаю.

Mantosh Kumar · Answer 18 · 2015-08-11T17-39-00.000Z

Не хорошая идея полагаться на нашу логику поведения языка undefined. В дополнение к тому, что упоминалось/обсуждалось в этом посте, я хотел бы упомянуть, что с современным подходом/стилем С++ такая программа не может компилироваться.

Это было упомянуто в моем предыдущем посте, в котором содержится преимущество функции Авто и полезной ссылки для нее.

https://stackoverflow.com/questions/6434971/how-much-is-too-much-with-c11-auto-keyword

Итак, если мы изменим приведенный выше код и заменим фактические типы авто, программа даже не будет компилироваться.

void updateEffect(){
    for(int i=0;i<1000;i++){
        auto r;
        auto g;
        auto b;
        star[i].setColor(r%255,g%255,b%255);
        auto isVisible;
        star[i].setVisible(isVisible);
    }
}

Glenn Teitelbaum · Answer 19 · 2015-08-11T04-17-00.000Z

Используйте 7757 каждое место, в которое вы соблазняетесь использовать неинициализированные переменные. Я выбрал его случайным образом из списка простых чисел:

определяется поведение
гарантировано не всегда 0
это просто
он, скорее всего, будет статистически случайным, как uninitualized переменные
он, вероятно, будет быстрее, чем неинициализированные переменные, поскольку его значение известно во время компиляции

Для сравнения посмотрите результаты в этом ответе: stackoverflow.com/a/31836461/2963099

cyriel · Answer 20 · 2015-07-31T14-23-00.000Z

Как уже упоминалось, это поведение undefined (UB), но оно может "работать".

За исключением проблем, уже упомянутых другими, я вижу еще одну проблему (недостаток) - она не будет работать ни на одном другом языке, кроме C и С++. Я знаю, что этот вопрос касается С++, но если вы можете написать код, который будет хорошим С++ и Java-кодом, и это не проблема, то почему бы и нет? Возможно, когда-нибудь кому-то придется переносить его на другой язык и искать ошибки, вызванные ~~"волшебными трюками"~~ UB, как это определенно будет кошмаром (особенно для неопытного разработчика C/С++).

Здесь возникает вопрос о другом подобном UB. Представьте себе, что вы пытаетесь найти такую ошибку, не зная об этом UB. Если вы хотите больше узнать о таких странных вещах в C/С++, прочитайте ответы на вопрос из ссылки и посмотрите this GREAT слайд-шоу. Это поможет вам понять, что под капотом и как оно работает; это не просто еще одно слайд-шоу, полное "магии". Я вполне уверен, что даже большинство опытных программистов на C/С++ могут многое узнать из этого.

prakharsingh95 · Answer 21 · 2015-07-31T20-11-00.000Z

Есть еще одна возможность рассмотреть.

Современные компиляторы (ahem g++) настолько умны, что они просматривают ваш код, чтобы увидеть, какие инструкции влияют на состояние, а что нет, и если инструкция гарантированно НЕ влияет на состояние, g++ просто удалит эту инструкцию.

Итак, вот что будет. g++ обязательно увидит, что вы читаете, выполняете арифметику, сохраняете, что по сути является значением для мусора, которое производит больше мусора. Поскольку нет никакой гарантии, что новый мусор более полезен, чем старый, он просто избавится от вашей петли. Bloop!

Этот метод полезен, но вот что я буду делать. Объедините UB (Undefined Поведение) с частотой rand().

Конечно, уменьшите rand(), но смешайте их, чтобы компилятор не делал ничего, что вам не нужно.

И я не убью тебя.

Мне очень трудно поверить, что компилятор может решить, что ваш код делает что-то глупое, и удалить это. Я ожидаю, что это только оптимизирует неиспользуемый код , а не нежелательный код. У вас есть воспроизводимый контрольный пример? В любом случае, рекомендация UB опасна. Кроме того, GCC не единственный компетентный компилятор, поэтому несправедливо выделять его как «современный».

dbush · Answer 22 · 2015-07-31T17-24-00.000Z

Использование неинициализированных данных для случайности не обязательно является плохим, если все сделано правильно. Фактически, OpenSSL делает именно это, чтобы засеять его PRNG.

По-видимому, это использование не было хорошо документировано, потому что кто-то заметил, что Valgrind жалуется на использование неинициализированных данных и "фиксирует" его, вызывая ошибку в PRNG.

Итак, вы можете это сделать, но вам нужно знать, что вы делаете, и убедиться, что кто-то, читающий ваш код, понимает это.

Это будет зависеть от вашего компилятора, который ожидается с неопределенным поведением, как мы можем видеть из моего ответа, Clang сегодня не будет делать то, что они хотят.
То, что OpenSSL использовал этот метод как вход энтропии, не говорит о том, что это было хорошо. В конце концов, единственным другим источником энтропии, который они использовали, был PID . Не совсем хорошее случайное значение. От человека, который полагается на такой плохой источник энтропии, я не буду ожидать хорошего суждения об их другом источнике энтропии. Я просто надеюсь, что люди, которые в настоящее время поддерживают OpenSSL, ярче.