Почему эти конструкции используют неопределенное поведение до и после приращения?

Question

Почему эти конструкции используют неопределенное поведение до и после приращения?

704

#include <stdio.h>

int main(void)
{
   int i = 0;
   i = i++ + ++i;
   printf("%d\n", i); // 3

   i = 1;
   i = (i++);
   printf("%d\n", i); // 2 Should be 1, no ?

   volatile int u = 0;
   u = u++ + ++u;
   printf("%d\n", u); // 1

   u = 1;
   u = (u++);
   printf("%d\n", u); // 2 Should also be one, no ?

   register int v = 0;
   v = v++ + ++v;
   printf("%d\n", v); // 3 (Should be the same as u ?)

   int w = 0;
   printf("%d %d %d\n", w++, ++w, w); // shouldn't this print 0 2 2

   int x[2] = { 5, 8 }, y = 0;
   x[y] = y ++;
   printf("%d %d\n", x[0], x[1]); // shouldn't this print 0 8? or 5 0?
}

PiX 04 июнь 2009, в 08:39

Источник

42

Домашнее задание? Не пытайтесь быть больно, но вы никогда не должны писать код с такими выражениями. Они обычно приводятся в качестве академических примеров, иногда показывая, что разные компиляторы дают разные результаты.
Jarrett Meyer 04 июнь 2009, в 10:30
11

@Jarett, нет, просто нужно несколько указателей на «точки последовательности». Работая, я нашел фрагмент кода с i = i ++, но я подумал: «Это не изменяет значение i». Я проверял и задавался вопросом, почему. С тех пор я удалил этот статус и заменил его на i ++;
PiX 04 июнь 2009, в 18:24
23

Объясните эти неопределенные поведения? Объясните что с ними? Как они себя ведут, не определено.
Jesse Millikan 10 июль 2009, в 15:44
190

Я думаю, что интересно, что все ВСЕГДА предполагают, что такие вопросы задаются, потому что спрашивающий хочет ИСПОЛЬЗОВАТЬ рассматриваемую конструкцию. Мое первое предположение состояло в том, что PiX знает, что это плохо, но любопытно, почему они ведут себя так, как на том компиляторе, который он / она использовал ... И да, что сказал unwind ... он не определен, он может делать все что угодно. .. в том числе JCF (Прыгать и загораться)
Brian Postow 24 май 2010, в 13:41
31

Мне любопытно: почему компиляторы не предупреждают о таких конструкциях, как "u = u ++ + ++ u;" если результат не определен?
Learn OpenGL ES 20 сен. 2012, в 16:23
0

Также читайте: stackoverflow.com/questions/13615243/…
claws 28 нояб. 2012, в 22:29
0

Почему вы ожидаете, что i = (i ++) будет равен 1? Скобки переопределяют естественный порядок приоритета оценки, поэтому все, что в них происходит, будет происходить первым. Таким образом, сначала произойдет i ++ (естественно, i ++ произойдет после присваивания), и тогда его значение будет равно 2. 2. мне 2.
swampf0etus 12 июль 2013, в 09:50
5

(i++) прежнему оценивается в 1, независимо от скобок
Drew McGowen 19 июль 2013, в 14:55
1

Все, что i = (i++); было задумано, есть, конечно, более четкий способ написать это. Это было бы правдой, даже если бы оно было четко определено. Даже в Java, которая определяет поведение i = (i++); Это все еще плохой код. Просто напишите i++;
Keith Thompson 15 авг. 2013, в 21:07
0

Просто мои центы: такие заявления - неопределенное поведение, потому что вы читаете и пишете одну и ту же переменную (область памяти). Это позволяет компилятору творить чудеса, называемые «оптимизацией», т.е. убирать собственный беспорядок. Естественно, это имеет некоторые ограничения. Чтение из памяти МЕДЛЕННО, поэтому регистры используются и затем синхронизируются с реальной памятью. Побочным эффектом является то, что компилятор теперь не уверен, какое значение использовать: значение из памяти или значение из регистра, которое уже было изменено. (Мне нравится это так объяснять, имеет смысл)
friendzis 16 дек. 2013, в 08:56
1

@LearnOpenGLES: они делают.
Lightness Races in Orbit 04 июль 2014, в 12:06
1

Я написал статью об идентификации неопределенного поведения в выражениях, которая охватывает много похожих примеров, но определяется в терминах правил секвенирования C ++ 11. Возможно, некоторые из читателей здесь найдут это полезным.
Joseph Mansfield 22 сен. 2014, в 23:13
1

Это напоминает мне вопросы об интервью, задаваемые многими компаниями-разработчиками программного обеспечения в Индии. Хотя поведение не определено, они все еще пытаются навязать логику на выходе. Также подобные вопросы упоминаются во многих книгах С Yashwant Kanetkar. От таких вопросов меня тошнит :(
i_am_zero 29 дек. 2014, в 05:01
1

@LearnOpenGLES: Мой компилятор (gcc 4.8.1) предупреждает меня о таких конструкциях, как u = u ++ & j = i ++ + ++ i;
Destructor 05 июль 2015, в 06:32
0

Хотя этот вопрос касается C , он может представлять интерес для некоторых аспектов, которые могут измениться в следующей версии C++ , с гарантированным порядком оценки в C ++ 17 (P0145R2). Подробнее: stackoverflow.com/questions / 38501587 / ...
Johan Lundberg 21 июль 2016, в 09:28
0

Как упоминалось в некоторых комментариях, C / C ++ не имеет явных правил порядка вычислений. Некоторые другие языки делают, и в этом случае это не будет проблемой. Наиболее необычным случаем является APL (язык программирования), который оценивает выражения справа налево (который допускает несколько назначений в одной строке), с круглыми скобками, используемыми для переопределения порядок оценки.
rcgldr 19 июнь 2017, в 22:28
0

Выход компилятора Си отличается от компилятора Java: int i=5; System.out.printf(",%d,%d,%d,%d,%d",i++,i--,++i,--i,i); gcc 5.3.0: вывод: 4,5,5,5,5 Java1,8 вывод: 5,6,6,5,5
Akhilesh Dhar Dubey 30 сен. 2017, в 18:10
0

@i_am_zero: тот факт, что Стандарт не предписывает поведение в некоторой ситуации, не означает, что никакие реализации не будут указывать, как они обрабатывают код достаточно подробно, чтобы только одно возможное поведение соответствовало спецификации. Одна из проблем стандарта заключается в том, что он никогда не пытался занести в каталог все случаи, когда реализация должна была бы изо всех сил не вести себя предсказуемым образом (например, использовать memcpy в тех случаях, когда источник и назначение могут иногда совпадать, например, потому что стоимость случайной избыточной копии будет меньше, чем ...
supercat 17 янв. 2018, в 19:38
0

... стоимость проверки на каждую операцию, была ли копия необходима). ИМХО, Стандарт был бы лучше, если бы он указывал базовую модель выполнения, а затем виды оптимизации, которые могут включить программисты. Дано x=(*p)++ + (*q)++; b=*p; c=*p; Например, может быть разумно сказать, что при включенной оптимизации некоторые функции компилятора могут по своему усмотрению независимо обрабатывать b и c либо как удерживающие единицу плюс значение, прочитанное до приращения *p , либо как удерживающие значение, которое читается из *p в любое время между приращением и присвоением b или c .
supercat 17 янв. 2018, в 19:47
0

@i_am_zero: Такие правила дадут компиляторам почти всю полезную гибкость, которую они имеют в соответствии с настоящим стандартом, но в сочетании со способами преобразования неопределенных значений в произвольные значения могут позволить писать некоторые виды кода более эффективно, чем это возможно в настоящее время.
supercat 17 янв. 2018, в 19:49

Показать ещё 18 комментариев

Теги:

c

increment

undefined-behavior

order-of-evaluation

sequence-points

15 ответов

73

Просто скомпилируйте и разобщите свою строку кода, если вы так склонны знать, как именно вы получаете то, что получаете.

Это то, что я получаю на своей машине вместе с тем, что, как я думаю, происходит:

$ cat evil.c
void evil(){
  int i = 0;
  i+= i++ + ++i;
}
$ gcc evil.c -c -o evil.bin
$ gdb evil.bin
(gdb) disassemble evil
Dump of assembler code for function evil:
   0x00000000 <+0>:   push   %ebp
   0x00000001 <+1>:   mov    %esp,%ebp
   0x00000003 <+3>:   sub    $0x10,%esp
   0x00000006 <+6>:   movl   $0x0,-0x4(%ebp)  // i = 0   i = 0
   0x0000000d <+13>:  addl   $0x1,-0x4(%ebp)  // i++     i = 1
   0x00000011 <+17>:  mov    -0x4(%ebp),%eax  // j = i   i = 1  j = 1
   0x00000014 <+20>:  add    %eax,%eax        // j += j  i = 1  j = 2
   0x00000016 <+22>:  add    %eax,-0x4(%ebp)  // i += j  i = 3
   0x00000019 <+25>:  addl   $0x1,-0x4(%ebp)  // i++     i = 4
   0x0000001d <+29>:  leave  
   0x0000001e <+30>:  ret
End of assembler dump.

(I... предположим, что команда 0x00000014 была какой-то оптимизацией компилятора?)

badp 24 май 2010, в 15:25

0

как я могу получить машинный код? Я использую Dev C ++, и я поэкспериментировал с опцией «Генерация кода» в настройках компилятора, но не выводил никаких дополнительных файлов или консольного вывода
bad_keypoints 24 сен. 2012, в 14:11
4

@ronnieaka gcc evil.c -c -o evil.bin и gdb evil.bin → disassemble evil , или каковы бы ни были их эквиваленты в Windows :)
badp 24 сен. 2012, в 18:20
0

-0x4 (% ebp) = 4 в конце?
kchoi 20 сен. 2013, в 16:07
17

Этот ответ на самом деле не отвечает на вопрос, Why are these constructs undefined behavior? ,
Shafik Yaghmour 01 июль 2014, в 14:00
0

@ShafikYaghmour Я отвечаю на вопросы в теле вопроса («почему я не получаю результаты, которые я получаю?»), См. Комментарии в коде. Учитывая, что это неопределенное поведение, я могу только показать, как получить фактическую сборку, которую он скомпилировал.
badp 01 июль 2014, в 16:27
0

Возможно, ответ есть, но я думаю, что большинство не сможет понять это без какой-либо проработки. Просто добавьте пояснительный текст, и он станет ответом.
Shafik Yaghmour 01 июль 2014, в 18:12
0

@ShafikYaghmour Я должен признать, что сборка немного сбивает меня с толку; особенно инструкция на +20. Но почему я пытаюсь понять это?
badp 01 июль 2014, в 23:21
8

Кроме того, будет проще скомпилировать сборку (с помощью gcc -S evil.c ), и это все, что здесь нужно. Сборка и разборка это всего лишь окольный способ сделать это.
Kat 27 июль 2015, в 20:32
40

Для справки: если по какой-то причине вы задаетесь вопросом, что делает данная конструкция - и особенно если есть подозрение, что это может быть неопределенное поведение - извечный совет «просто попробуйте с вашим компилятором и посмотрите»: потенциально довольно опасно. В лучшем случае вы узнаете, что он делает в этой версии вашего компилятора, в этих условиях сегодня . Вы мало что узнаете о том, что он гарантированно сделает. В общем, «просто попробуйте с вашим компилятором» приводит к непортативным программам, которые работают только с вашим компилятором.
Steve Summit 16 фев. 2016, в 21:26

Показать ещё 7 комментариев

58

Я думаю, что соответствующими частями стандарта C99 являются 6.5 Выражения, §2

Между предыдущей и следующей точкой последовательности объект должен иметь сохраненное значение не более чем один раз, оценивая выражение. Кроме того, предыдущее значение должны быть прочитаны только для определения сохраняемого значения.

и 6.5.16 Операторы присваивания, §4:

Порядок оценки операндов не определен. Если делается попытка изменить результат оператора присваивания или доступа к нему после следующей точки последовательности, поведение undefined.

Christoph 04 июнь 2009, в 10:47

2

Означает ли приведенное выше, что «i = i = 5;» будет неопределенным поведением?
supercat 20 нояб. 2011, в 21:41
1

@ Supercat, насколько я знаю, i=i=5 также неопределенное поведение
dhein 23 сен. 2013, в 15:39
2

@Zaibis: логическое обоснование, которое мне нравится использовать для большинства мест, заключается в том, что теоретически многопроцессорная платформа может реализовывать что-то вроде A=B=5; как «Блокировка записи A; Блокировка записи B; Сохранить 5 в A; Сохранить 5 в B; Разблокировать B; Разблокировать A;», и оператор типа C=A+B; как «Блокировка чтения A; Блокировка чтения B; Вычислить A + B; Разблокировать A и B; Блокировка записи C; Сохранить результат; Разблокировать C;». Это гарантировало бы, что если бы один поток сделал A=B=5; в то время как другой сделал C=A+B; последний поток будет либо видеть обе записи как выполненные, либо ни одну из них. Потенциально полезная гарантия. Если один поток сделал I=I=5; , тем не мение, ...
supercat 23 сен. 2013, в 16:18
1

... и компилятор не заметил, что обе записи были в одном и том же месте (если одно или оба значения содержат указатели, что может быть трудно определить), сгенерированный код может зайти в тупик. Я не думаю, что какие-либо реальные реализации реализуют такую блокировку как часть их нормального поведения, но это было бы допустимо в соответствии со стандартом, и если бы аппаратное обеспечение могло реализовывать такое поведение дешево, это могло бы быть полезно. На современном оборудовании такое поведение было бы слишком дорого для реализации по умолчанию, но это не значит, что так будет всегда.
supercat 23 сен. 2013, в 16:19
1

@supercat, но не будет ли достаточно правила доступа к точке последовательности c99, чтобы объявить его неопределенным поведением? Так что не имеет значения, что технически может реализовать аппаратное обеспечение?
dhein 23 сен. 2013, в 16:40
1

@Zaibis: правила, которые характеризуют действия как неопределенное поведение, не должны существовать просто для того, чтобы реализации могли вести себя враждебно. Предполагается, что они существуют, чтобы позволить разработчикам делать что-то более эффективно или более полезно, чем было бы возможно в их отсутствие. Чтобы понять, почему спецификации характеризуют что-то как UB, полезно определить что-то полезное, что правило позволит реализациям делать то, что в противном случае они не могут.
supercat 23 сен. 2013, в 16:48
0

@supercat Я абсолютно согласен с тем, что вы говорите о поведении неопределенного поведения (^^). Но это не меняет смысла в том, что если что-то в стандарте указано как UB, вы можете ожидать, что оно хорошо определено только потому, что его было бы легко реализовать как хорошо определенную конструкцию. Если в стандарте говорится, что это UB, то ответ на вопрос - это UB? «Да!», а не «Это могло бы ... [...]».
dhein 23 сен. 2013, в 16:56
0

@Zaibis: ответ почти на любой вопрос вида «Почему X в языке / структуре Y Неопределенное поведение» - «Потому что так говорит стандарт для Y», но это вряд ли поучительно. Однако в большинстве случаев тот, кто задает такой вопрос, действительно хочет знать: «Почему разработчики стандарта указали это». В большинстве случаев вещи указываются как UB (а не частично определенные поведения), чтобы обеспечить возможность реализации, которая может сделать что-то неожиданное. Например, спецификация могла бы сказать, что p1=malloc(4); p2=malloc(5); r=p1>p2; ...
supercat 23 сен. 2013, в 17:49
0

... может привести к тому, что r произвольно удерживает 1 или 0, без гарантии того, что значение будет каким-либо образом связано с будущими сравнениями одного и того же или разных операндов. Такая спецификация (возвращающая произвольные 0 или 1) позволила бы memmove эффективный memmove переносимым способом [если dest > src , применить копию сверху вниз, иначе снизу вверх; если регионы не перекрываются, то сработает так, чтобы результат сравнения не имел значения]. Я полагаю, что стандарт говорит, что такое сравнение - UB, однако; если бы каждая машина могла - в худшем случае - произвольно выдавать 0 или 1, не было бы никаких причин не говорить об этом.
supercat 23 сен. 2013, в 17:55

Показать ещё 7 комментариев

49

Большинство ответов здесь цитируется на стандарте C, подчеркивая, что поведение этих конструкций undefined. Чтобы понять , почему поведение этих конструкций undefined, давайте сначала понимать эти термины в свете стандарта C11:

Последовательность: (5.1.2.3)

При любых двух оценках A и B, если A секвенировано до B, то выполнение A должно предшествовать выполнению B.

Unsequenced:

Если A не секвенируется до или после B, то A и B не имеют значения.

Оценки могут быть одной из двух вещей:

вычисления значений, которые определяют результат выражения; и
побочные эффекты, которые являются модификациями объектов.

Точка последовательности:

Наличие точки последовательности между оценкой выражений A и B подразумевает, что каждое вычисление значения и побочный эффект, связанные с A, секвенируются перед каждым вычислением значения и побочным эффектом, связанным с B.

Теперь, перейдя к вопросу, для выражений типа

int i = 1;
i = i++;

стандарт говорит, что:

6.5 Выражения:

Если побочный эффект на скалярном объекте не влияет на или на другой побочный эффект на один и тот же скалярный объект или вычисление значения с использованием значения одного и того же скаляра object, поведение undefined. [...]

Следовательно, вышеупомянутое выражение вызывает UB, потому что два побочных эффекта на один и тот же объект i не зависит от другого. Это означает, что он не секвенирован, будет ли побочный эффект при назначении i выполняться до или после побочного эффекта на ++.
В зависимости от того, будет ли выполняться до или после приращения, будут созданы разные результаты и один из примеров поведения undefined.

Давайте переименуем i слева от назначения be il и справа от присваивания (в выражении i++) будет ir, тогда выражение будет выглядеть как

il = ir++     // Note that suffix l and r are used for the sake of clarity.
              // Both il and ir represents the same object.

Важным моментом в отношении оператора Postfix ++ является то, что:

только потому, что ++ появляется после того, как переменная не означает, что приращение происходит позднее. Приращение может произойти уже в самом компиляторе до тех пор, пока компилятор гарантирует, что используется исходное значение.

Это означает, что выражение il = ir++ может быть оценено как

temp = ir;      // i = 1
ir = ir + 1;    // i = 2   side effect by ++ before assignment
il = temp;      // i = 1   result is 1

или

temp = ir;      // i = 1
il = temp;      // i = 1   side effect by assignment before ++
ir = ir + 1;    // i = 2   result is 2

что приводит к двум различным результатам 1 и 2, которые зависят от последовательности побочных эффектов путем присваивания и ++ и, следовательно, вызывает UB.

haccks 27 июнь 2015, в 00:45

46

Поведение не может быть объяснено, потому что оно вызывает как неуказанное поведение, так и undefined, поэтому мы не можем делать какие-либо общие прогнозы относительно этого кода, хотя, если вы прочтете работу Олве Модала, например Deep C и Unspecified и Undefined иногда вы можете делать хорошие догадки в очень специфических случаях с конкретным компилятором и средой, но, пожалуйста, не делайте этого что где-нибудь рядом с производством.

Итак, переходим к неуказанному поведению, в черновик c99 standard раздел 6.5 в пункте 3 говорится (внимание мое):

Группирование операторов и операндов обозначается синтаксисом .74) За исключением случаев, указанных в позже (для функций-вызовов(), &, ||,?: и операторов запятой), порядок оценки подвыражений и порядок, в котором происходят побочные эффекты, являются неуточненными.

Итак, когда у нас есть такая строка:

i = i++ + ++i;

мы не знаем, будет ли сначала оцениваться i++ или ++i. Это главным образом для предоставления компилятору лучших вариантов оптимизации.

Здесь также существует поведение undefined, так как программа несколько раз модифицирует переменные (i, u и т.д.) более чем один раз между точки последовательности. Из проекта стандартного раздела 6.5, параграф 2 (ударный удар):

Между предыдущей и следующей точкой последовательности объект должен иметь сохраненное значение измененный не более чем один раз оценкой выражения. Кроме того, предыдущее значение должны быть прочитаны только для определения значения, которое нужно сохранить.

он приводит следующие примеры кода как undefined:

i = ++i + 1;
a[i++] = i;

Во всех этих примерах код пытается изменить объект более одного раза в одной и той же точке последовательности, которая заканчивается символом ; в каждом из этих случаев:

i = i++ + ++i;
^   ^       ^

i = (i++);
^    ^

u = u++ + ++u;
^   ^       ^

u = (u++);
^    ^

v = v++ + ++v;
^   ^       ^

Неопределенное поведение определено в черновик c99 в разделе 3.4.4 как:

использование неопределенного значения или другое поведение, если этот международный стандарт предусматривает двух или более возможностей и не налагает никаких дополнительных требований, по которым экземпляр

и undefined поведение определено в разделе 3.4.3 следующим образом:

при использовании непереносимой или ошибочной программной конструкции или ошибочных данных, для которых настоящий международный стандарт не предъявляет требований

и отмечает, что:

Возможный диапазон undefined варьируется от полного игнорирования ситуации с непредсказуемыми результатами, ведения во время перевода или выполнения программы документированным образом, характерным для среды (с выдачей диагностического сообщения или без него), до прекращения перевода или выполнение (с выдачей диагностического сообщения).

Shafik Yaghmour 15 авг. 2013, в 21:16

30

Другой способ ответить на этот вопрос, а не увязнуть в тайных деталях точек последовательности и поведения undefined, - это просто спросить, что они должны означать? Что пытался сделать программист?

Первый фрагмент, о котором нас спрашивают, i = i++ + ++i, в моей книге довольно сумасшедший. Никто не мог бы написать его в реальной программе, неясно, что он делает, нет никакого мыслимого алгоритма, который кто-то мог бы попытаться закодировать, что привело бы к этой конкретной надуманной последовательности операций. И поскольку для вас и меня не очевидно, что он должен делать, это прекрасно в моей книге, если компилятор не может понять, что он должен делать.

Второй фрагмент i = i++, немного легче понять. Кто-то явно пытается увеличить я и присвоить результат i. Но есть несколько способов сделать это в C. Самый простой способ добавить 1 в я и присвоить результат обратно i, тот же почти на любом языке программирования:

i = i + 1

C, конечно, имеет удобный ярлык:

i++

Это означает, что "добавьте 1 в я и присвойте результат обратно i". Поэтому, если мы построим мешанин из двух, написав

i = i++

то, что мы на самом деле говорим, это "добавить 1 к я и присвоить результат обратно я и присвоить результат обратно i". Мы сбиты с толку, поэтому меня это слишком беспокоит, если компилятор тоже запутался.

Реально, единственный раз, когда эти сумасшедшие выражения записываются, когда люди используют их в качестве искусственных примеров того, как должен работать сайт ++. И, конечно же, важно понимать, как работает ++. Но одно практическое правило для использования ++: "Если не очевидно, что означает выражение с использованием ++, не пишите его".

Мы проводили бесчисленные часы на comp.lang.c, обсуждая такие выражения, и почему они undefined. Два моих более длинных ответа, которые пытаются объяснить, почему, архивируются в Интернете:

Steve Summit 18 июнь 2015, в 13:20

1

Довольно неприятный глюк в отношении неопределенного поведения является то , что в то время как он используется , чтобы быть безопасными на 99,9% трансляторы использовать *p=(*q)++; означать, if (p!=q) *p=(*q)++; else *p= __ARBITRARY_VALUE; Это уже не так. Для гиперсовременного C потребовалось бы написать что-то похожее на последнюю формулировку (хотя нет стандартного способа указать, что коду не важно, что находится в *p ), чтобы достичь уровня эффективности, используемого компиляторами для первого (пункт else необходим в чтобы позволить компилятору оптимизировать, if это потребуется некоторым новым компиляторам).
supercat 30 июнь 2015, в 16:14
1

Я видел по крайней мере 5 подобных вопросов об этих ++ и - безумии на прошлой неделе или около того. Кажется, это любимая тема некоторых профессоров, чтобы озадачивать своих студентов.
artm 08 фев. 2016, в 07:49

22

Хотя маловероятно, что какие-либо компиляторы и процессоры действительно это сделают, было бы законно в соответствии со стандартом C компилятору реализовать "i ++" с последовательностью:

In a single operation, read `i` and lock it to prevent access until further notice
Compute (1+read_value)
In a single operation, unlock `i` and store the computed value

В то время как я не думаю, что какие-либо процессоры поддерживают аппаратное обеспечение, позволяющее делать такую вещь эффективно, можно легко представить ситуации, в которых такое поведение упростило бы многопоточный код (например, это гарантировало бы, что если два потока попытаются выполните описанную выше последовательность одновременно, i будет увеличиваться на два), и совершенно немыслимо, чтобы какой-то будущий процессор мог предоставить что-то вроде этого.

Если компилятор должен был написать i++, как указано выше (законно по стандарту), и должен был интерпретировать приведенные выше инструкции в ходе оценки общего выражения (также законного), и если бы не было отмечено, что одна из других инструкций имела доступ к i, было бы возможно (и законно) для компилятора генерировать последовательность инструкций, которые бы зашли в тупик. Разумеется, компилятор почти наверняка обнаружит проблему в том случае, когда в обоих местах используется одна и та же переменная i, но если подпрограмма принимает ссылки на два указателя p и q и использует (*p) и (*q) в приведенном выше выражении (вместо использования i дважды) компилятору не требуется распознавать или избегать тупика, который произошел бы, если бы тот же адрес объекта был передан как для p, так и q.

supercat 05 дек. 2012, в 19:55

20

Часто этот вопрос связан как дубликат вопросов, связанных с кодом типа

printf("%d %d\n", i, i++);

или

printf("%d %d\n", ++i, i++);

или аналогичных вариантов.

В то время как это также undefined поведение, как уже было сказано, существуют тонкие различия, когда printf() участвует в сравнении с утверждением как:

   x = i++ + i++;

В следующем утверждении:

printf("%d %d\n", ++i, i++);

порядок оценки аргументов в printf() unspecified. Это означает, что выражения i++ и ++i могут быть оценены в любом порядке. стандарт C11 содержит некоторые соответствующие описания:

Приложение J, неуказанное поведение

Порядок, в котором обозначение функции, аргументы и подвыражения в аргументах вычисляются в вызове функции (6.5.2.2).

3.4.4, неуказанное поведение

Использование неопределенного значения или другое поведение, когда это Международный стандарт предоставляет две или более возможности и налагает никакие дополнительные требования к которым не выбраны ни в одном случае.

ПРИМЕР Пример неуказанного поведения - это порядок, в котором аргументы функции оцениваются.

Неуказанное поведение само по себе НЕ является проблемой. Рассмотрим этот пример:

printf("%d %d\n", ++x, y++);

Это тоже неуказанное поведение, потому что порядок оценки ++x и y++ не указан. Но это совершенно законное и достоверное утверждение. В этом выражении нет поведения undefined. Поскольку модификации (++x и y++) выполняются для разных объектов.

Что делает следующий оператор

printf("%d %d\n", ++i, i++);

как поведение undefined заключается в том, что эти два выражения изменяют один и тот же объект i без промежуточной точки .

Другая деталь заключается в том, что запятая, участвующая в вызове printf(), является разделителем, а не запятой.

Это важное различие, потому что оператор запятой вводит точку последовательности между оценкой их операндов, что делает следующий законным:

int i = 5;
int j;

j = (++i, i++);  // No undefined behaviour here because the comma operator 
                 // introduces a sequence point between '++i' and 'i++'

printf("i=%d j=%d\n",i, j); // prints: i=7 j=6

Оператор запятой оценивает свои операнды слева направо и дает только значение последнего операнда. Таким образом, в j = (++i, i++);, ++i увеличивается i до 6 и i++ дает старое значение i (6), которое присваивается j. Тогда i становится 7 из-за пост-приращения.

Итак, если запятая в вызове функции должна быть оператором запятой, то

printf("%d %d\n", ++i, i++);

не будет проблемой. Но он вызывает поведение undefined, потому что здесь запятая является разделителем.

Для тех, кто не знаком с undefined, было бы полезно прочитать Что должен знать каждый программист C undefined Behavior, чтобы понять концепции и многих других вариантов поведения undefined в C.

Это сообщение: Undefined, неуказанное и определенное по реализации поведение также имеет значение.

P.P. 30 дек. 2015, в 22:08

0

Эта последовательность int a = 10, b = 20, c = 30; printf("a=%db=%dc=%d\n", (a = a + b + c), (b = b + b), (c = c + c)); похоже, дает стабильное поведение (оценка аргумента справа налево в gcc v7.3.0; результат "a = 110 b = 40 c = 60"). Это потому, что назначения рассматриваются как «полные операторы» и, таким образом, вводят точку последовательности? Разве это не должно приводить к оценке аргумента / утверждения слева направо? Или это просто проявление неопределенного поведения?
kavadias 17 окт. 2018, в 20:20
0

@kavadias Этот оператор printf использует неопределенное поведение по той же причине, что и описанная выше. Вы пишете b и c в 3-м и 4-м аргументах соответственно и читаете во 2-м аргументе. Но между этими выражениями нет последовательности (2-й, 3-й и 4-й аргументы). У gcc / clang есть опция -Wsequence-point которая также может помочь найти их.
P.P. 18 окт. 2018, в 08:40

13

В стандарте C говорится, что переменная должна назначаться не более одного раза между двумя точками последовательности. Например, точка с запятой - это точка последовательности.
Итак, каждое утверждение вида:

i = i++;
i = i++ + ++i;

и т.д. нарушают это правило. В стандарте также указано, что поведение undefined и не определено. Некоторые компиляторы обнаруживают их и приводят к некоторому результату, но это не соответствует стандарту.

Тем не менее, две разные переменные могут увеличиваться между двумя точками последовательности.

while(*src++ = *dst++);

Вышеприведенное является общей практикой кодирования при копировании/анализе строк.

Nikhil Vidhani 11 сен. 2014, в 14:22

0

Конечно, это не относится к разным переменным в одном выражении. Это было бы полным провалом дизайна, если бы это произошло! Все, что вам нужно во 2-м примере, - это чтобы оба увеличивались между окончанием оператора и следующим началом, и это гарантировано именно благодаря концепции точек последовательности в центре всего этого.
underscore_d 19 июль 2016, в 18:55

11

Хотя синтаксис выражений, как a = a++ или a++ + a++ является законным, поведение этих конструкций не определен, так как ни в стандарте C не выполняется. C99 6.5p2:

Между предыдущей и следующей точкой последовательности объект должен иметь значение, которое его хранимое значение изменялось не более одного раза путем оценки выражения. [72] Кроме того, предыдущее значение должно быть считано только для определения значения, которое необходимо сохранить [73]

В сноске 73 далее разъясняется, что

Этот параграф отображает неопределенные выражения операторов, такие как
i = ++i + 1;
a[i++] = i;
позволяя
i = i + 1;
a[i] = i;

Различные пункты последовательности перечислены в Приложении C к C11 (и C99):

Ниже приведены точки последовательности, описанные в 5.1.2.3:

Между оценками имени функции и фактическими аргументами в вызове функции и фактическим вызовом. (6.5.2.2).

Между оценками первого и второго операндов следующих операторов: логическое AND && (6.5.13); логический ИЛИ || (6.5.14); запятая, (6.5.17).

Между оценками первого операнда условного? : оператор и в зависимости от второго и третьего операндов (6.5.15).

Конец полного декларатора: деклараторы (6.7.6);

Между оценкой полного выражения и следующим полным выражением, которое должно быть оценено. Ниже приведены полные выражения: инициализатор, не являющийся частью составного литерала (6.7.9); выражение в выражении выражения (6.8.3); управляющее выражение оператора выбора (if или switch) (6.8.4); управляющее выражение while или do (6.8.5); каждое из (необязательных) выражений оператора for (6.8.5.3); (необязательное) выражение в операторе return (6.8.6.4).

Непосредственно перед возвратом функции библиотеки (7.1.4).

После действий, связанных с каждым форматированным спецификатором преобразования функции ввода/вывода (7.21.6, 7.29.2).

Непосредственно перед и сразу после каждого вызова функции сравнения, а также между любым вызовом функции сравнения и любым перемещением объектов, переданных в качестве аргументов для этого вызова (7.22.5).

Формулировка того же абзаца на С11:

Если побочный эффект скалярного объекта не зависит от другого побочного эффекта для одного и того же скалярного объекта или вычисления значения с использованием значения одного и того же скалярного объекта, поведение не определено. Если имеется несколько допустимых порядков подвыражений выражения, поведение не определено, если такой необратимый побочный эффект возникает в любом из заказов.84)

Вы можете обнаружить такие ошибки в программе, например, используя последнюю версию GCC с -Wall и -Werror, а затем GCC полностью откажется от компиляции вашей программы. Ниже приведен вывод gcc (Ubuntu 6.2.0-5ubuntu12) 6.2.0 20161005:

% gcc plusplus.c -Wall -Werror -pedantic
plusplus.c: In function ‘main:
plusplus.c:6:6: error: operation on ‘i may be undefined [-Werror=sequence-point]
    i = i++ + ++i;
    ~~^~~~~~~~~~~
plusplus.c:6:6: error: operation on ‘i may be undefined [-Werror=sequence-point]
plusplus.c:10:6: error: operation on ‘i may be undefined [-Werror=sequence-point]
    i = (i++);
    ~~^~~~~~~
plusplus.c:14:6: error: operation on ‘u may be undefined [-Werror=sequence-point]
    u = u++ + ++u;
    ~~^~~~~~~~~~~
plusplus.c:14:6: error: operation on ‘u may be undefined [-Werror=sequence-point]
plusplus.c:18:6: error: operation on ‘u may be undefined [-Werror=sequence-point]
    u = (u++);
    ~~^~~~~~~
plusplus.c:22:6: error: operation on ‘v may be undefined [-Werror=sequence-point]
    v = v++ + ++v;
    ~~^~~~~~~~~~~
plusplus.c:22:6: error: operation on ‘v may be undefined [-Werror=sequence-point]
cc1: all warnings being treated as errors

Важная часть состоит в том, чтобы знать, что точка последовательности - и что такое точка последовательности, а что нет. Например, оператор запятой является точкой последовательности, поэтому

j = (i ++, ++ i);

хорошо определен и будет увеличивать i на единицу, уступая старому значению, отбрасывать это значение; затем в операторе запятой уложите побочные эффекты; а затем увеличивать i на единицу, и полученное значение становится значением выражения - т.е. это просто ухищренный способ написать j = (i += 2) что еще раз является "умным" способом записи

i += 2;
j = i;

Однако , в функциональных списках аргументов не является оператором запятая, и нет никакого смысла последовательности между оценками различных аргументов; вместо этого их оценки не зависят от друг друга; поэтому вызов функции

int i = 0;
printf("%d %d\n", i++, ++i, i);

имеет неопределенное поведение, потому что нет никакой точки последовательности между оценками i++ и ++i в аргументах функции, поэтому значение i поэтому изменяется дважды, как i++ и ++i, между предыдущим и следующим точка последовательности.

Antti Haapala 26 март 2017, в 16:17

9

В https://stackoverflow.com/questions/949433/why-are-these-constructs-using-pre-and-post-increment-undefined-behavior кто-то спросил об утверждении вроде:

int k[] = {0,1,2,3,4,5,6,7,8,9,10};
int i = 0;
int num;
num = k[++i+k[++i]] + k[++i];
printf("%d", num);

который печатает 7... OP ожидал, что он напечатает 6.

Приращения ++i не гарантируются, чтобы все было выполнено до остальных вычислений. Фактически, разные компиляторы получат разные результаты. В примере, который вы предоставили, были выполнены первые 2 ++i, затем были прочитаны значения k[], затем последний ++i, затем k[].

num = k[i+1]+k[i+2] + k[i+3];
i += 3

Современные компиляторы оптимизируют это очень хорошо. На самом деле, возможно, лучше, чем код, который вы изначально писали (предполагая, что он работал так, как вы надеялись).

TomOnTime 08 апр. 2015, в 03:39

5

Хорошее объяснение того, что происходит в такого рода вычислениях, представлено в документе n1188 с сайта ISO W14.

Я объясняю идеи.

Основное правило из стандарта ISO 9899, которое применяется в этой ситуации, - 6.5p2.

Между предыдущей и следующей точкой последовательности объект должен иметь свое сохраненное значение, измененное не более одного раза путем оценки выражения. Кроме того, предыдущее значение должно быть только для чтения, чтобы определить значение, которое будет сохранено.

Точки последовательности в выражении типа i=i++ находятся перед i= и после i++.

В статье, которую я цитировал выше, объясняется, что вы можете понять, что программа состоит из маленьких прямоугольников, каждый из которых содержит инструкции между двумя последовательными точками последовательности. Точки последовательности определены в приложении C к стандарту, в случае i=i++ есть 2 точки последовательности, которые ограничивают полное выражение. Такое выражение синтаксически эквивалентно записи expression-statement в форме грамматики Бэкуса-Наура (грамматика приведена в приложении А к Стандарту).

Таким образом, порядок инструкций внутри коробки не имеет четкого порядка.

i=i++

можно интерпретировать как

tmp = i
i=i+1
i = tmp

или как

tmp = i
i = tmp
i=i+1

поскольку обе эти формы для интерпретации кода i=i++ являются действительными, и поскольку обе генерируют разные ответы, поведение не определено.

Таким образом, точка последовательности может быть видна в начале и в конце каждого блока, составляющего программу [блоки представляют собой атомные единицы в C], а внутри блока порядок инструкций определяется не во всех случаях. Изменяя этот порядок, можно иногда изменить результат.

РЕДАКТИРОВАТЬ:

Другим хорошим источником для объяснения такой неоднозначности являются записи с сайта c-faq (также опубликованные в виде книги), а именно здесь, здесь и здесь.

alinsoar 13 окт. 2017, в 15:44

0

Как этот ответ добавил новые к существующим ответам? Также объяснения для i=i++ очень похожи на этот ответ .
haccks 24 нояб. 2017, в 07:00
0

@ haccks Я не читал другие ответы. Я хотел объяснить на своем родном языке, что я узнал из упомянутого документа с официального сайта ISO 9899 open-std.org/jtc1/sc22/wg14/www/docs/n1188.pdf
alinsoar 24 нояб. 2017, в 12:14

3

Возможно, ваш вопрос не был следующим: "Почему эти конструкции не определяют поведение в C?". Вероятно, ваш вопрос: "Почему этот код (используя ++) не дал мне того значения, которое я ожидал?", И кто-то пометил ваш вопрос как дубликат и отправил вас сюда.

Этот ответ пытается ответить на этот вопрос: почему ваш код не дал вам ответ, который вы ожидали, и как вы можете научиться распознавать (и избегать) выражения, которые не будут работать должным образом.

Я предполагаю, что вы уже слышали базовое определение операторов C ++ и -- и как префиксная форма ++x отличается от x++ формы x++. Но этим операторам сложно думать, поэтому, чтобы убедиться, что вы поняли, возможно, вы написали небольшую небольшую пробную программу, в которой участвовали что-то вроде

int x = 5;
printf("%d %d %d\n", x, ++x, x++);

Но, к вашему удивлению, эта программа не помогла вам понять - она напечатала какой-то странный, неожиданный, необъяснимый результат, предполагая, что, возможно, ++ делает что-то совершенно другое, совсем не то, что вы думали.

Или, возможно, вы смотрите на трудно понятное выражение, например

int x = 5;
x = x++ + ++x;
printf("%d\n", x);

Возможно, кто-то дал вам этот код как загадку. Этот код также не имеет смысла, особенно если вы его запустили - и если вы скомпилируете и запустите его под двумя разными компиляторами, вы, вероятно, получите два разных ответа! Что с этим? Какой ответ правильный? (И ответ в том, что они оба, или ни один из них).

Как вы уже слышали, все эти выражения не определены, а это означает, что язык C не гарантирует, что они сделают. Это странный и удивительный результат, потому что вы, вероятно, думали, что любая программа, которую вы могли бы написать, до тех пор, пока она скомпилирована и запущена, создаст уникальный, четко определенный вывод. Но в случае неопределенного поведения это не так.

Что делает выражение неопределенным? Являются ли выражения с участием ++ и -- всегда неопределенными? Конечно, нет: это полезные операторы, и если вы используете их правильно, они отлично определены.

Для выражений мы говорим о том, что делает их неопределенными, когда происходит слишком много, когда мы не уверены, что произойдет в порядке вещей, но когда порядок имеет значение для результата, который мы получаем.

Вернемся к двум примерам, которые я использовал в этом ответе. Когда я написал

printf("%d %d %d\n", x, ++x, x++);

возникает вопрос, перед вызовом printf компилятор вычисляет значение x сначала, или x++, или, возможно, ++x? Но, оказывается, мы не знаем. В C нет правила, в котором говорится, что аргументы функции оцениваются слева направо или справа налево или в каком-то другом порядке. Поэтому мы не можем сказать, будет ли сначала компилятор x, затем ++x, затем x++ или x++ затем ++x затем x или какой-либо другой порядок. Но порядок явно имеет значение, потому что в зависимости от того, какой заказ использует компилятор, мы явно получим разные результаты, напечатанные printf.

Как насчет этого сумасшедшего выражения?

x = x++ + ++x;

Проблема с этим выражением состоит в том, что он содержит три разные попытки изменить значение x: (1) часть x++ пытается добавить 1 в x, сохранить новое значение в x и вернуть старое значение x; (2) часть ++x пытается добавить 1 в x, сохранить новое значение в x и вернуть новое значение x; и (3) x = часть пытается присвоить сумму двух других обратно x. Какое из этих трех попыток присваивания "выиграет"? Какое из трех значений будет фактически присвоено x? Опять же, и, возможно, удивительно, что в C нет правила говорить нам.

Вы можете себе представить, что приоритет или ассоциативность или оценка слева направо говорит вам, в каком порядке происходят события, но они этого не делают. Вы можете мне не верить, но, пожалуйста, запомните мое слово, и я скажу еще раз: приоритет и ассоциативность не определяют каждый аспект порядка оценки выражения в C. В частности, если внутри одного выражения есть несколько разные места, где мы пытаемся присвоить новое значение чему-то вроде x, приоритет и ассоциативность, не говорят нам, какая из этих попыток происходит сначала, или последняя, или что-то еще.

Итак, со всем этим фоном и введением в сторону, если вы хотите, чтобы все ваши программы были четко определены, какие выражения вы можете писать, а какие из них вы не можете написать?

Эти выражения все в порядке:

y = x++;
z = x++ + y++;
x = x + 1;
x = a[i++];
x = a[i++] + b[j++];
x[i++] = a[j++] + b[k++];
x = *p++;
x = *p++ + *q++;

Эти выражения не определены:

x = x++;
x = x++ + ++x;
y = x + x++;
a[i] = i++;
a[i++] = i;
printf("%d %d %d\n", x, ++x, x++);

И последний вопрос: как вы можете определить, какие выражения хорошо определены и какие выражения не определены?

Как я сказал ранее, неопределенные выражения - это те, где слишком много происходит сразу, где вы не можете быть уверены, что происходит в порядке вещей и где имеет значение порядок:

Если есть одна переменная, которая будет изменена (назначена) в двух или более разных местах, как вы узнаете, какая модификация происходит первой?
Если есть переменная, которая изменяется в одном месте и имеет значение, используемое в другом месте, откуда вы знаете, использует ли она старое значение или новое значение?

В качестве примера № 1 в выражении

x = x++ + ++x;

есть три попытки изменить "x".

В качестве примера № 2 в выражении

y = x + x++;

мы оба используем значение x и модифицируем его.

Чтобы ответ: убедитесь, что в любом выражении, которое вы пишете, каждая переменная изменяется не более одного раза, и если переменная изменена, вы также не пытаетесь использовать значение этой переменной где-то еще.

Steve Summit 16 авг. 2018, в 13:48

3

Причина в том, что в программе работает поведение undefined. Проблема заключается в порядке оценки, поскольку в соответствии со стандартом С++ 98 нет никаких точек последовательности (никакие операции не секвенируются до или после другого в соответствии с терминологией С++ 11).

Однако, если вы придерживаетесь одного компилятора, вы обнаружите, что поведение постоянное, если вы не добавляете вызовы функций или указатели, что сделало бы поведение более беспорядочным.

Итак, сначала GCC: Используя Nuwen MinGW 15 GCC 7.1 вы получите:

#include<stdio.h>
int main(int argc, char ** argv)
{
int i = 0;
i = i++ + ++i;
printf("%d\n", i); // 2

i = 1;
i = (i++);
printf("%d\n", i); //1

volatile int u = 0;
u = u++ + ++u;
printf("%d\n", u); // 2

u = 1;
u = (u++);
printf("%d\n", u); //1

register int v = 0;
v = v++ + ++v;
printf("%d\n", v); //2

}

Как работает GCC? он оценивает подвыражения в порядке слева направо для правой стороны (RHS), затем присваивает значение левой стороне (LHS). Именно так ведут себя Java и С# и определяют их стандарты. (Да, эквивалентное программное обеспечение на Java и С# определило поведение). Он оценивает каждое вспомогательное выражение один за другим в Заявлении RHS в порядке слева направо; для каждого вспомогательного выражения: сначала выполняется оценка ++ c (pre-increment), затем значение c используется для операции, а затем приращение post С++).

согласно GCC С++: Операторы

В GCC С++ приоритет операторов контролирует порядок в которые оценивают отдельные операторы

эквивалентный код в определенном поведении С++, как понимает GCC:

#include<stdio.h>
int main(int argc, char ** argv)
{
    int i = 0;
    //i = i++ + ++i;
    int r;
    r=i;
    i++;
    ++i;
    r+=i;
    i=r;
    printf("%d\n", i); // 2

    i = 1;
    //i = (i++);
    r=i;
    i++;
    i=r;
    printf("%d\n", i); // 1

    volatile int u = 0;
    //u = u++ + ++u;
    r=u;
    u++;
    ++u;
    r+=u;
    u=r;
    printf("%d\n", u); // 2

    u = 1;
    //u = (u++);
    r=u;
    u++;
    u=r;
    printf("%d\n", u); // 1

    register int v = 0;
    //v = v++ + ++v;
    r=v;
    v++;
    ++v;
    r+=v;
    v=r;
    printf("%d\n", v); //2
}

Затем переходим к Visual Studio. Visual Studio 2015 вы получаете:

#include<stdio.h>
int main(int argc, char ** argv)
{
    int i = 0;
    i = i++ + ++i;
    printf("%d\n", i); // 3

    i = 1;
    i = (i++);
    printf("%d\n", i); // 2 

    volatile int u = 0;
    u = u++ + ++u;
    printf("%d\n", u); // 3

    u = 1;
    u = (u++);
    printf("%d\n", u); // 2 

    register int v = 0;
    v = v++ + ++v;
    printf("%d\n", v); // 3 
}

Как работает визуальная студия, требуется другой подход, он оценивает все выражения предварительного приращения в первом проходе, затем использует значения переменных в операциях во втором проходе, назначает из RHS на LHS в третьем проходе, а затем передает его оценивает все выражения после инкремента за один проход.

Итак, эквивалент в определенном поведении С++, как понимает Visual С++:

#include<stdio.h>
int main(int argc, char ** argv)
{
    int r;
    int i = 0;
    //i = i++ + ++i;
    ++i;
    r = i + i;
    i = r;
    i++;
    printf("%d\n", i); // 3

    i = 1;
    //i = (i++);
    r = i;
    i = r;
    i++;
    printf("%d\n", i); // 2 

    volatile int u = 0;
    //u = u++ + ++u;
    ++u;
    r = u + u;
    u = r;
    u++;
    printf("%d\n", u); // 3

    u = 1;
    //u = (u++);
    r = u;
    u = r;
    u++;
    printf("%d\n", u); // 2 

    register int v = 0;
    //v = v++ + ++v;
    ++v;
    r = v + v;
    v = r;
    v++;
    printf("%d\n", v); // 3 
}

поскольку документация Visual Studio указывается в Приоритет и порядок оценки:

Если несколько операторов появляются вместе, они имеют одинаковый приоритет и оцениваются в соответствии со своей ассоциативностью. Операторы в таблице описаны в разделах, начинающихся с операторов Postfix.

Muhammad Annaqeeb 11 июнь 2017, в 00:00

1

Я отредактировал вопрос, чтобы добавить UB при оценке аргументов функции, так как этот вопрос часто используется как дубликат для этого. (Последний пример)
Antti Haapala 21 окт. 2017, в 10:46
1

Также вопрос о c сейчас, а не C ++
Antti Haapala 21 окт. 2017, в 10:47

-2

На самом деле я думаю, что это не так. Ну, иногда это основано на приоритете. Но в большинстве случаев операторы постинкрементного и декрементного действия дают существующее значение выражению, а затем увеличивают или уменьшают его. Вот пример

 i=10;
 i == i++;

вышеприведенное выражение вернет false, потому что

 here while evaluating 
   10 is given to the right hand side and then incremented 
   but the incremented 11 will be given to the left hand side
   proof : 10 == i++  will return true whereas,
           11 == i++ will return false

some IT dood 10 янв. 2019, в 11:38

Ещё вопросы

Домашнее задание? Не пытайтесь быть больно, но вы никогда не должны писать код с такими выражениями. Они обычно приводятся в качестве академических примеров, иногда показывая, что разные компиляторы дают разные результаты.
@Jarett, нет, просто нужно несколько указателей на «точки последовательности». Работая, я нашел фрагмент кода с i = i ++, но я подумал: «Это не изменяет значение i». Я проверял и задавался вопросом, почему. С тех пор я удалил этот статус и заменил его на i ++;
Объясните эти неопределенные поведения? Объясните что с ними? Как они себя ведут, не определено.
Я думаю, что интересно, что все ВСЕГДА предполагают, что такие вопросы задаются, потому что спрашивающий хочет ИСПОЛЬЗОВАТЬ рассматриваемую конструкцию. Мое первое предположение состояло в том, что PiX знает, что это плохо, но любопытно, почему они ведут себя так, как на том компиляторе, который он / она использовал ... И да, что сказал unwind ... он не определен, он может делать все что угодно. .. в том числе JCF (Прыгать и загораться)
Мне любопытно: почему компиляторы не предупреждают о таких конструкциях, как "u = u ++ + ++ u;" если результат не определен?
Также читайте: stackoverflow.com/questions/13615243/…
Почему вы ожидаете, что i = (i ++) будет равен 1? Скобки переопределяют естественный порядок приоритета оценки, поэтому все, что в них происходит, будет происходить первым. Таким образом, сначала произойдет i ++ (естественно, i ++ произойдет после присваивания), и тогда его значение будет равно 2. 2. мне 2.
(i++) прежнему оценивается в 1, независимо от скобок
Все, что i = (i++); было задумано, есть, конечно, более четкий способ написать это. Это было бы правдой, даже если бы оно было четко определено. Даже в Java, которая определяет поведение i = (i++); Это все еще плохой код. Просто напишите i++;
Просто мои центы: такие заявления - неопределенное поведение, потому что вы читаете и пишете одну и ту же переменную (область памяти). Это позволяет компилятору творить чудеса, называемые «оптимизацией», т.е. убирать собственный беспорядок. Естественно, это имеет некоторые ограничения. Чтение из памяти МЕДЛЕННО, поэтому регистры используются и затем синхронизируются с реальной памятью. Побочным эффектом является то, что компилятор теперь не уверен, какое значение использовать: значение из памяти или значение из регистра, которое уже было изменено. (Мне нравится это так объяснять, имеет смысл)
Я написал статью об идентификации неопределенного поведения в выражениях, которая охватывает много похожих примеров, но определяется в терминах правил секвенирования C ++ 11. Возможно, некоторые из читателей здесь найдут это полезным.
Это напоминает мне вопросы об интервью, задаваемые многими компаниями-разработчиками программного обеспечения в Индии. Хотя поведение не определено, они все еще пытаются навязать логику на выходе. Также подобные вопросы упоминаются во многих книгах С Yashwant Kanetkar. От таких вопросов меня тошнит :(
@LearnOpenGLES: Мой компилятор (gcc 4.8.1) предупреждает меня о таких конструкциях, как u = u ++ & j = i ++ + ++ i;
Хотя этот вопрос касается C , он может представлять интерес для некоторых аспектов, которые могут измениться в следующей версии C++ , с гарантированным порядком оценки в C ++ 17 (P0145R2). Подробнее: stackoverflow.com/questions / 38501587 / ...
Как упоминалось в некоторых комментариях, C / C ++ не имеет явных правил порядка вычислений. Некоторые другие языки делают, и в этом случае это не будет проблемой. Наиболее необычным случаем является APL (язык программирования), который оценивает выражения справа налево (который допускает несколько назначений в одной строке), с круглыми скобками, используемыми для переопределения порядок оценки.
Выход компилятора Си отличается от компилятора Java: int i=5; System.out.printf(",%d,%d,%d,%d,%d",i++,i--,++i,--i,i); gcc 5.3.0: вывод: 4,5,5,5,5 Java1,8 вывод: 5,6,6,5,5
@i_am_zero: тот факт, что Стандарт не предписывает поведение в некоторой ситуации, не означает, что никакие реализации не будут указывать, как они обрабатывают код достаточно подробно, чтобы только одно возможное поведение соответствовало спецификации. Одна из проблем стандарта заключается в том, что он никогда не пытался занести в каталог все случаи, когда реализация должна была бы изо всех сил не вести себя предсказуемым образом (например, использовать memcpy в тех случаях, когда источник и назначение могут иногда совпадать, например, потому что стоимость случайной избыточной копии будет меньше, чем ...
... стоимость проверки на каждую операцию, была ли копия необходима). ИМХО, Стандарт был бы лучше, если бы он указывал базовую модель выполнения, а затем виды оптимизации, которые могут включить программисты. Дано x=(*p)++ + (*q)++; b=*p; c=*p; Например, может быть разумно сказать, что при включенной оптимизации некоторые функции компилятора могут по своему усмотрению независимо обрабатывать b и c либо как удерживающие единицу плюс значение, прочитанное до приращения *p , либо как удерживающие значение, которое читается из *p в любое время между приращением и присвоением b или c .
@i_am_zero: Такие правила дадут компиляторам почти всю полезную гибкость, которую они имеют в соответствии с настоящим стандартом, но в сочетании со способами преобразования неопределенных значений в произвольные значения могут позволить писать некоторые виды кода более эффективно, чем это возможно в настоящее время.
как я могу получить машинный код? Я использую Dev C ++, и я поэкспериментировал с опцией «Генерация кода» в настройках компилятора, но не выводил никаких дополнительных файлов или консольного вывода
@ronnieaka gcc evil.c -c -o evil.bin и gdb evil.bin → disassemble evil , или каковы бы ни были их эквиваленты в Windows :)
Этот ответ на самом деле не отвечает на вопрос, Why are these constructs undefined behavior? ,
@ShafikYaghmour Я отвечаю на вопросы в теле вопроса («почему я не получаю результаты, которые я получаю?»), См. Комментарии в коде. Учитывая, что это неопределенное поведение, я могу только показать, как получить фактическую сборку, которую он скомпилировал.
Возможно, ответ есть, но я думаю, что большинство не сможет понять это без какой-либо проработки. Просто добавьте пояснительный текст, и он станет ответом.
@ShafikYaghmour Я должен признать, что сборка немного сбивает меня с толку; особенно инструкция на +20. Но почему я пытаюсь понять это?
Кроме того, будет проще скомпилировать сборку (с помощью gcc -S evil.c ), и это все, что здесь нужно. Сборка и разборка это всего лишь окольный способ сделать это.
Для справки: если по какой-то причине вы задаетесь вопросом, что делает данная конструкция - и особенно если есть подозрение, что это может быть неопределенное поведение - извечный совет «просто попробуйте с вашим компилятором и посмотрите»: потенциально довольно опасно. В лучшем случае вы узнаете, что он делает в этой версии вашего компилятора, в этих условиях сегодня . Вы мало что узнаете о том, что он гарантированно сделает. В общем, «просто попробуйте с вашим компилятором» приводит к непортативным программам, которые работают только с вашим компилятором.
Означает ли приведенное выше, что «i = i = 5;» будет неопределенным поведением?
@ Supercat, насколько я знаю, i=i=5 также неопределенное поведение
@Zaibis: логическое обоснование, которое мне нравится использовать для большинства мест, заключается в том, что теоретически многопроцессорная платформа может реализовывать что-то вроде A=B=5; как «Блокировка записи A; Блокировка записи B; Сохранить 5 в A; Сохранить 5 в B; Разблокировать B; Разблокировать A;», и оператор типа C=A+B; как «Блокировка чтения A; Блокировка чтения B; Вычислить A + B; Разблокировать A и B; Блокировка записи C; Сохранить результат; Разблокировать C;». Это гарантировало бы, что если бы один поток сделал A=B=5; в то время как другой сделал C=A+B; последний поток будет либо видеть обе записи как выполненные, либо ни одну из них. Потенциально полезная гарантия. Если один поток сделал I=I=5; , тем не мение, ...
... и компилятор не заметил, что обе записи были в одном и том же месте (если одно или оба значения содержат указатели, что может быть трудно определить), сгенерированный код может зайти в тупик. Я не думаю, что какие-либо реальные реализации реализуют такую блокировку как часть их нормального поведения, но это было бы допустимо в соответствии со стандартом, и если бы аппаратное обеспечение могло реализовывать такое поведение дешево, это могло бы быть полезно. На современном оборудовании такое поведение было бы слишком дорого для реализации по умолчанию, но это не значит, что так будет всегда.
@supercat, но не будет ли достаточно правила доступа к точке последовательности c99, чтобы объявить его неопределенным поведением? Так что не имеет значения, что технически может реализовать аппаратное обеспечение?
@Zaibis: правила, которые характеризуют действия как неопределенное поведение, не должны существовать просто для того, чтобы реализации могли вести себя враждебно. Предполагается, что они существуют, чтобы позволить разработчикам делать что-то более эффективно или более полезно, чем было бы возможно в их отсутствие. Чтобы понять, почему спецификации характеризуют что-то как UB, полезно определить что-то полезное, что правило позволит реализациям делать то, что в противном случае они не могут.
@supercat Я абсолютно согласен с тем, что вы говорите о поведении неопределенного поведения (^^). Но это не меняет смысла в том, что если что-то в стандарте указано как UB, вы можете ожидать, что оно хорошо определено только потому, что его было бы легко реализовать как хорошо определенную конструкцию. Если в стандарте говорится, что это UB, то ответ на вопрос - это UB? «Да!», а не «Это могло бы ... [...]».
@Zaibis: ответ почти на любой вопрос вида «Почему X в языке / структуре Y Неопределенное поведение» - «Потому что так говорит стандарт для Y», но это вряд ли поучительно. Однако в большинстве случаев тот, кто задает такой вопрос, действительно хочет знать: «Почему разработчики стандарта указали это». В большинстве случаев вещи указываются как UB (а не частично определенные поведения), чтобы обеспечить возможность реализации, которая может сделать что-то неожиданное. Например, спецификация могла бы сказать, что p1=malloc(4); p2=malloc(5); r=p1>p2; ...
... может привести к тому, что r произвольно удерживает 1 или 0, без гарантии того, что значение будет каким-либо образом связано с будущими сравнениями одного и того же или разных операндов. Такая спецификация (возвращающая произвольные 0 или 1) позволила бы memmove эффективный memmove переносимым способом [если dest > src , применить копию сверху вниз, иначе снизу вверх; если регионы не перекрываются, то сработает так, чтобы результат сравнения не имел значения]. Я полагаю, что стандарт говорит, что такое сравнение - UB, однако; если бы каждая машина могла - в худшем случае - произвольно выдавать 0 или 1, не было бы никаких причин не говорить об этом.
Довольно неприятный глюк в отношении неопределенного поведения является то , что в то время как он используется , чтобы быть безопасными на 99,9% трансляторы использовать *p=(*q)++; означать, if (p!=q) *p=(*q)++; else *p= __ARBITRARY_VALUE; Это уже не так. Для гиперсовременного C потребовалось бы написать что-то похожее на последнюю формулировку (хотя нет стандартного способа указать, что коду не важно, что находится в *p ), чтобы достичь уровня эффективности, используемого компиляторами для первого (пункт else необходим в чтобы позволить компилятору оптимизировать, if это потребуется некоторым новым компиляторам).
Я видел по крайней мере 5 подобных вопросов об этих ++ и - безумии на прошлой неделе или около того. Кажется, это любимая тема некоторых профессоров, чтобы озадачивать своих студентов.
Эта последовательность int a = 10, b = 20, c = 30; printf("a=%db=%dc=%d\n", (a = a + b + c), (b = b + b), (c = c + c)); похоже, дает стабильное поведение (оценка аргумента справа налево в gcc v7.3.0; результат "a = 110 b = 40 c = 60"). Это потому, что назначения рассматриваются как «полные операторы» и, таким образом, вводят точку последовательности? Разве это не должно приводить к оценке аргумента / утверждения слева направо? Или это просто проявление неопределенного поведения?
@kavadias Этот оператор printf использует неопределенное поведение по той же причине, что и описанная выше. Вы пишете b и c в 3-м и 4-м аргументах соответственно и читаете во 2-м аргументе. Но между этими выражениями нет последовательности (2-й, 3-й и 4-й аргументы). У gcc / clang есть опция -Wsequence-point которая также может помочь найти их.
Конечно, это не относится к разным переменным в одном выражении. Это было бы полным провалом дизайна, если бы это произошло! Все, что вам нужно во 2-м примере, - это чтобы оба увеличивались между окончанием оператора и следующим началом, и это гарантировано именно благодаря концепции точек последовательности в центре всего этого.
Как этот ответ добавил новые к существующим ответам? Также объяснения для i=i++ очень похожи на этот ответ .
@ haccks Я не читал другие ответы. Я хотел объяснить на своем родном языке, что я узнал из упомянутого документа с официального сайта ISO 9899 open-std.org/jtc1/sc22/wg14/www/docs/n1188.pdf
Я отредактировал вопрос, чтобы добавить UB при оценке аргументов функции, так как этот вопрос часто используется как дубликат для этого. (Последний пример)

unwind · Accepted Answer · 2009-06-04T10-05-00.000Z

533

Лучший ответ

C имеет концепцию поведения undefined, т.е. некоторые языковые конструкции синтаксически допустимы, но вы не можете предсказать поведение при запуске кода.

Насколько я знаю, в стандарте явно не сказано, почему существует концепция поведения undefined. На мой взгляд, это просто потому, что разработчики языка хотели, чтобы в семантике была некоторая свобода, вместо того, чтобы требовать, чтобы все реализации обрабатывали целочисленное переполнение точно таким же образом, что, скорее всего, наложило бы серьезные затраты на производительность, они просто оставили поведение undefined, чтобы, если вы пишете код, который вызывает переполнение целых чисел, все может случиться.

Итак, имея в виду, почему эти "проблемы"? Язык четко говорит о том, что определенные вещи приводят к undefined поведение. Нет проблем, нет "необходимости". Если поведение undefined изменяется, когда объявляется одна из вовлеченных переменных volatile, это ничего не доказывает или ничего не изменяет. Это undefined; вы не можете рассуждать о поведении.

Ваш наиболее интересный пример, один с

u = (u++);

- это пример текстовой книги поведения undefined (см. запись в Википедии точки последовательности).

unwind 04 июнь 2009, в 10:05

37

Я знал, что это не определено, (идея использования этого кода в производстве пугает меня :)), но я пытался понять, в чем причина этих результатов. Особенно почему u = u ++ увеличил u. Например, в java: u = u ++ возвращает 0, как и ожидалось (мой мозг) :)
PiX 04 июнь 2009, в 09:42
2

Очевидно, что из-за скобок вокруг u ++ компилятор решил усилить u, а затем вернуть его. Поскольку это неопределенное поведение в C, оно является легитимным. Другой компилятор или даже другой компьютер и тот же самый может дать другой ответ. Я не знаю Java, но, возможно, поведение четко определено.
ChrisBD 04 июнь 2009, в 10:21
8

@PiX: вещи не определены по ряду возможных причин. К ним относятся: не существует четкого «правильного результата», разные архитектуры машин будут сильно благоприятствовать различным результатам, существующая практика не соответствует или выходит за рамки стандарта (например, какие имена файлов допустимы).
Richard 04 июнь 2009, в 10:57
0

@PiX Java старается изо всех сил иметь определенные поведения для многих вещей, которые не определены в C.
Laurence Gonsalves 30 июль 2012, в 16:19
3

@PaulManta, если вы видите это, редактирование ответов не предназначено для добавления нерелевантной информации к уже принятым ответам. Это вопрос C, и ответ был хорошим, поскольку он должен был описать ситуацию в стандартах C от C90 до C11. Редактирование для исправления синтаксиса и стиля.
Pascal Cuoq 17 нояб. 2012, в 19:01
36

Дух C: Доверься программисту ... каким бы безумным он ни был.
Fiddling Bits 26 нояб. 2013, в 02:48
0

Вы называете это неопределенным поведением, но есть ли объяснение, почему это так?
user3124504 22 март 2014, в 11:13
4

@rusty Не уверен, что ты имеешь в виду. Термин «неопределенное поведение» используется в стандарте C. Это означает, что даже если некоторые конструкции синтаксически допустимы и обычно компилируются, они приводят к неопределенному поведению, то есть не имеют смысла, и его следует избегать, поскольку ваша программа не работает, если она имеет неопределенное поведение.
unwind 22 март 2014, в 20:01
0

Просто чтобы запутать всех, некоторые такие примеры теперь хорошо определены в C11, например, i = ++i + 1; ,
M.M 10 июль 2014, в 05:51
6

@MattMcNabb, который хорошо определен только в C ++ 11, а не в C11.
Shafik Yaghmour 14 июль 2014, в 01:18
0

Я отредактировал вопрос, чтобы добавить UB при оценке аргументов функции, так как этот вопрос часто используется как дубликат для этого. (Последний пример)
Antti Haapala 21 окт. 2017, в 10:46
2

Читая стандарт и опубликованное обоснование, становится понятно, почему существует концепция UB. Стандарт никогда не предназначался для полного описания всего, что должна делать реализация C, чтобы она подходила для какой-либо конкретной цели (см. Обсуждение правила «Одна программа»), но вместо этого полагается на мнение разработчиков и желание производить полезные реализации качества. Качественная реализация, подходящая для низкоуровневого системного программирования, должна определять поведение действий, которые не потребуются в высокопроизводительных числах crunching.applications. Вместо того, чтобы пытаться усложнить Стандарт ...
supercat 17 дек. 2017, в 23:12
3

... вдаваясь в подробности о том, какие угловые случаи определены или не определены, авторы Стандарта признали, что разработчикам следует лучше разбираться в том, какие типы поведения потребуются для тех программ, которые они должны поддерживать , Гипермодернистские компиляторы делают вид, что выполнение определенных действий UB подразумевало, что ни одна качественная программа не нуждается в них, но Стандарт и обоснование несовместимы с таким предполагаемым намерением.
supercat 17 дек. 2017, в 23:15
0

@supercat Хорошо, я бы порекомендовал добавить это к вашему ответу.
jrh 03 янв. 2018, в 17:56
1

@jrh: я написал этот ответ, прежде чем понял, как вышла из-под контроля гипер-модернистская философия. Что меня раздражает, так это переход от «Нам не нужно официально распознавать это поведение, потому что платформы, где это необходимо, может поддерживать его в любом случае», - «Мы можем удалить это поведение, не предоставляя замену, пригодную для использования, потому что оно никогда не распознавалось и, следовательно, любой код нуждающийся в этом был сломан ". Многие виды поведения давно должны были устареть в пользу замен, которые были во всех отношениях лучше , но для этого требовалось бы признать их законность.
supercat 03 янв. 2018, в 18:08
0

Неопределенное поведение в основном позволяет компилятору делать больше предположений об условиях, которые могут быть проверены только во время выполнения, например, предположить, что в выражении *ptr указатель действителен, потому что, если он равен нулю, программе разрешено делать что-либо, и поэтому это не так. Необходимо добавить код в программу, чтобы проверить это условие и обеспечить определенное поведение.
pqnet 04 июль 2018, в 13:55
0

В то время, когда Си был стандартизирован (1989), существовало много компиляторов Си, каждый из которых играл по несколько другим правилам. Основной целью комитета ANSI (а затем и ISO) было систематизировать существующую практику . Таким образом, во многих случаях, когда несколько компиляторов не соглашались с «правильным» семантическим поведением для явно неоднозначных случаев (в основном связанных с порядком оценки операторов выражений), комитет (мудро) предпочитал считать такие случаи «неопределенным поведением» или « Реализация определенного поведения ".
David R Tribble 31 июль 2018, в 20:39
0

Если я пишу b = (++a)+(++a)+(++a) , является значением хорошо определена? a
iBug 08 окт. 2018, в 01:33
0

@unwind For u=1; u=u++; правда ли, что неопределенным является значение u после выполнения второго оператора? Я имею в виду, что по правилам секвенирования оценки значения (в отличие от оценки побочных эффектов ) выражение u=u++ должно быть гарантировано равно 1 , верно?
stillanoob 13 окт. 2018, в 12:16
0

@stillanoob: Нет, потому что поведение любого кода, содержащего это выражение, не определено, что означает, что он может делать буквально все что угодно . Оно всегда может быть равно 42, за исключением воскресенья, когда луна набирает обороты. Он может застрять в бесконечном цикле, вместо того, чтобы вообще что-то оценивать. Он может перейти в случайное место в вашем коде. Это может привести к сбою процесса. Это может даже заставить ваш компьютер загореться и заставить демонов вылететь из вашего носа , а стандарт С все равно не будет заботиться.
Ilmari Karonen 31 янв. 2019, в 15:55

Показать ещё 18 комментариев