Почему 0 <-0x80000000?

Question

Почему 0 <-0x80000000?

255

У меня есть простая программа:

#include <stdio.h>

#define INT32_MIN        (-0x80000000)

int main(void) 
{
    long long bal = 0;

    if(bal < INT32_MIN )
    {
        printf("Failed!!!");
    }
    else
    {
        printf("Success!!!");
    }
    return 0;
}

Условие if(bal < INT32_MIN ) всегда верно. Как это возможно?

Он отлично работает, если я изменил макрос на:

#define INT32_MIN        (-2147483648L)

Может ли кто-нибудь указать на проблему?

Jayesh Bhoi 09 дек. 2015, в 15:26

Источник

3

Сколько стоит CHAR_BIT * sizeof(int) ?
5gon12eder 09 дек. 2015, в 15:37
1

Вы пробовали распечатать бал?
Ryan Fitzpatrick 09 дек. 2015, в 15:39
10

ИМХО, более интересным является то, что оно верно только для -0x80000000 , но ложно для -0x80000000L , -2147483648 и -2147483648L (gcc 4.1.2), поэтому возникает вопрос: почему int-литерал -0x80000000 отличается от int-литерала -2147483648 ?
Andreas Fester 09 дек. 2015, в 15:41
2

@Bathsheba Я просто запускаю программу на онлайн-компиляторе tutorialspoint.com/codingground.htm
Jayesh Bhoi 09 дек. 2015, в 15:42
2

Если вы когда-либо замечали, что (некоторые воплощения) <limits.h> определяют INT_MIN как (-2147483647 - 1) , теперь вы знаете, почему.
zwol 09 дек. 2015, в 18:51
0

аналогично: приведение минимального 32-разрядного целого числа (-2147483648) к числу с плавающей точкой дает положительное число (2147483648.0) , почему оно отличается между -2147483648 и (int) -2147483648 , большими отрицательными целочисленными литералами
phuclv 10 дек. 2015, в 04:58
0

Современные компиляторы предупреждают о -0x80000000
M.M 10 дек. 2015, в 05:43
0

@ LưuVĩnhPhúc В стандартной 32-битной системе, в которой предполагается наличие дубликатов, печать будет «успешной», как и ожидалось. В отличие от этого вопроса, который напечатает «не удалось», чего не ожидалось. Разница заключается в том, что в сообщении, которое вы связали, используется литерал long long со знаком, а не литерал int без знака.
Lundin 11 дек. 2015, в 07:26
0

@ LưuVĩnhPhúc Я думаю, что C ++ здесь на самом деле сильно отстает от C, так как C имел длинный тип long, который гарантировал, по крайней мере, 64 бита еще в 1999 году, но C ++, похоже, не получил его до 2011 года? Это означает, что C и C ++ показывали бы разные результаты до C ++ 11.
Lundin 11 дек. 2015, в 07:38
0

@Lundin Первое издание стандарта C ++ (C ++ 1998) было опубликовано всего за год до второго издания стандарта C (C1999). Я думаю, WG21 не видела особой спешки с выпуском второго издания C ++, несмотря на значительные изменения в C99, которые было бы неплохо поднять. Оглядываясь назад в 2015 году, это было, вероятно, ошибкой.
zwol 11 дек. 2015, в 15:32
0

Почему 1 не больше чем -0x80000000
phuclv 12 дек. 2015, в 09:39

Показать ещё 9 комментариев

Теги:

c

signed

numeric-limits

6 ответов

24

0x80000000 - это литерал unsigned со значением 2147483648.

Применение унарного минуса на этом по-прежнему дает вам неподписанный тип с ненулевым значением. (Фактически, для ненулевого значения x значение, в котором вы закончили, равно UINT_MAX - x + 1.)

Bathsheba 09 дек. 2015, в 16:30

22

Этот целочисленный литерал 0x80000000 имеет тип unsigned int.

В соответствии со стандартом C (6.4.4.1 Целочисленные константы)

5 Тип целочисленной константы является первым из соответствующих список, в котором может быть представлено его значение.

И эта целочисленная константа может быть представлена типом unsigned int.

Итак, это выражение

-0x80000000 имеет тот же тип unsigned int. Кроме того, он имеет такое же значение 0x80000000 в двух дополнительных представлениях, которые вычисляют следующий путь

-0x80000000 = ~0x80000000 + 1 => 0x7FFFFFFF + 1 => 0x80000000

Это имеет побочный эффект, если написать, например,

int x = INT_MIN;
x = abs( x );

Результат будет снова INT_MIN.

Таким образом, в этом условии

bal < INT32_MIN

сравнивается 0 с unsigned value 0x80000000, преобразованный в тип long long int в соответствии с правилами обычных арифметических преобразований.

Очевидно, что 0 меньше 0x80000000.

Vlad from Moscow 09 дек. 2015, в 15:51

11

Числовая константа 0x80000000 имеет тип unsigned int. Если взять -0x80000000 и сделать 2-х комплиментную математику на нем, мы получим следующее:

~0x80000000 = 0x7FFFFFFF
0x7FFFFFFF + 1 = 0x80000000

Итак -0x80000000 == 0x80000000. И сравнение (0 < 0x80000000) (так как 0x80000000 без знака) истинно.

dbush 09 дек. 2015, в 17:20

0

Это предполагает 32-битные int s. Хотя это очень распространенный выбор, в любой конкретной реализации int может быть либо уже, либо шире. Однако это правильный анализ для этого случая.
John Bollinger 09 дек. 2015, в 15:53
0

Это не относится к коду OP, -0x80000000 - беззнаковая арифметика. ~0x800000000 - это другой код.
M.M 10 дек. 2015, в 05:51
0

Мне кажется, это лучший и правильный ответ. @ ММ, он объясняет, как взять двойное дополнение. Этот ответ определенно обращается к тому, что отрицательный знак делает с числом.
Octopus 10 дек. 2015, в 20:06
0

@ Осьминог отрицательный знак не применяет дополнение 2 к числу (!) Хотя это кажется очевидным, оно не описывает, что происходит в коде -0x80000000 ! На самом деле дополнение 2 не имеет никакого отношения к этому вопросу полностью.
M.M 10 дек. 2015, в 20:12

Показать ещё 2 комментария

11

Точка путаницы возникает при мысли, что - является частью числовой константы.

В приведенном ниже коде 0x80000000 есть числовая константа. Его тип определяется только этим. - применяется после и не меняет тип.

#define INT32_MIN        (-0x80000000)
long long bal = 0;
if (bal < INT32_MIN )

Необработанные числовые константы положительны.

Если он десятичен, то назначенный тип является первым типом, который будет удерживать его: int, long, long long.

Если константа восьмеричная или шестнадцатеричная, она получает первый тип, который ее поддерживает: int, unsigned, long, unsigned long, long long, unsigned long long.

0x80000000, на OP система получает тип unsigned или unsigned long. В любом случае, это какой-то неподписанный тип.

-0x80000000 также является некоторым ненулевым значением и является некоторым неподписанным типом, оно больше 0. Когда код сравнивает это с long long, значения не изменяются на 2 сторонах сравнения, поэтому 0 < INT32_MIN истинно.

Альтернативное определение избегает этого любопытного поведения

#define INT32_MIN        (-2147483647 - 1)

Пойдем в фантастическую землю на некоторое время, когда int и unsigned являются 48-битными.

Тогда 0x80000000 вписывается в int, а также тип int. -0x80000000 - это отрицательное число, и результат распечатки отличается.

[Вернуться к реальному слову]

Так как 0x80000000 подходит к некоторому неподписанному типу перед подписанным типом, так как он больше, чем some_signed_MAX, но внутри some_unsigned_MAX, это какой-то неподписанный тип.

chux 09 дек. 2015, в 17:03

7

C имеет правило, что целочисленный литерал может быть signed или unsigned зависит от того, подходит ли он в signed или unsigned (целая продвижение). На 32 -битовой машине буква 0x80000000 будет unsigned. 2 дополнения -0x80000000 составляет 0x80000000 на 32-битной машине. Поэтому сравнение bal < INT32_MIN находится между signed и unsigned, и перед сравнением в соответствии с правилом C unsigned int будет преобразовано в long long.

C11: 6.3.1.8/1:

[...] В противном случае, если тип операнда со знаком целочисленного типа может представлять все значения типа операнда с беззнаковым целым типом, то операнд с целым числом без знака преобразуется в тип операнд со знаком целочисленного типа.

Следовательно, bal < INT32_MIN всегда true.

haccks 09 дек. 2015, в 17:07

Ещё вопросы

ИМХО, более интересным является то, что оно верно только для -0x80000000 , но ложно для -0x80000000L , -2147483648 и -2147483648L (gcc 4.1.2), поэтому возникает вопрос: почему int-литерал -0x80000000 отличается от int-литерала -2147483648 ?
@Bathsheba Я просто запускаю программу на онлайн-компиляторе tutorialspoint.com/codingground.htm
Если вы когда-либо замечали, что (некоторые воплощения) <limits.h> определяют INT_MIN как (-2147483647 - 1) , теперь вы знаете, почему.
аналогично: приведение минимального 32-разрядного целого числа (-2147483648) к числу с плавающей точкой дает положительное число (2147483648.0) , почему оно отличается между -2147483648 и (int) -2147483648 , большими отрицательными целочисленными литералами
Современные компиляторы предупреждают о -0x80000000
@ LưuVĩnhPhúc В стандартной 32-битной системе, в которой предполагается наличие дубликатов, печать будет «успешной», как и ожидалось. В отличие от этого вопроса, который напечатает «не удалось», чего не ожидалось. Разница заключается в том, что в сообщении, которое вы связали, используется литерал long long со знаком, а не литерал int без знака.
@ LưuVĩnhPhúc Я думаю, что C ++ здесь на самом деле сильно отстает от C, так как C имел длинный тип long, который гарантировал, по крайней мере, 64 бита еще в 1999 году, но C ++, похоже, не получил его до 2011 года? Это означает, что C и C ++ показывали бы разные результаты до C ++ 11.
@Lundin Первое издание стандарта C ++ (C ++ 1998) было опубликовано всего за год до второго издания стандарта C (C1999). Я думаю, WG21 не видела особой спешки с выпуском второго издания C ++, несмотря на значительные изменения в C99, которые было бы неплохо поднять. Оглядываясь назад в 2015 году, это было, вероятно, ошибкой.
Это предполагает 32-битные int s. Хотя это очень распространенный выбор, в любой конкретной реализации int может быть либо уже, либо шире. Однако это правильный анализ для этого случая.
Это не относится к коду OP, -0x80000000 - беззнаковая арифметика. ~0x800000000 - это другой код.
Мне кажется, это лучший и правильный ответ. @ ММ, он объясняет, как взять двойное дополнение. Этот ответ определенно обращается к тому, что отрицательный знак делает с числом.
@ Осьминог отрицательный знак не применяет дополнение 2 к числу (!) Хотя это кажется очевидным, оно не описывает, что происходит в коде -0x80000000 ! На самом деле дополнение 2 не имеет никакого отношения к этому вопросу полностью.

Lundin · Accepted Answer · 2015-12-09T17-48-00.000Z

Это довольно тонко.

Каждый целочисленный литерал в вашей программе имеет тип. Какой тип, который он имеет, регулируется таблицей в 6.4.4.1:

Suffix      Decimal Constant    Octal or Hexadecimal Constant

none        int                 int
            long int            unsigned int
            long long int       long int
                                unsigned long int
                                long long int
                                unsigned long long int

Если литеральный номер не может помещаться внутри стандартного типа int, он попытается сделать следующий более крупный тип, как указано в приведенной выше таблице. Поэтому для регулярных десятичных целочисленных литералов это выглядит так:

Попробуйте int
Если он не подходит, попробуйте long
Если он не подходит, попробуйте long long.

Шестнадцатеричные литералы ведут себя по-разному! Если литерал не может вписываться в подписанный тип типа int, сначала попробуйте unsigned int, прежде чем переходить к более сложным типам. См. Разницу в приведенной выше таблице.

Итак, в 32-битной системе ваш литерал 0x80000000 имеет тип unsigned int.

Это означает, что вы можете применить унарный оператор - в литерале, не вызывая поведение, определяемое реализацией, как это было бы иначе при переполнении целого числа со знаком. Вместо этого вы получите значение 0x80000000, положительное значение.

bal < INT32_MIN вызывает обычные арифметические преобразования, а результат выражения 0x80000000 продвигается от unsigned int до long long. Значение 0x80000000 сохраняется и 0 меньше 0x80000000, следовательно результат.

Когда вы заменяете литерал 2147483648L, вы используете десятичную нотацию, и поэтому компилятор не выбирает unsigned int, а пытается поместить его внутри long. Также суффикс L говорит, что вы хотите long, если это возможно. Суффикс L фактически имеет схожие правила, если вы продолжаете читать указанную таблицу в 6.4.4.1: если номер не помещается внутри запрошенного long, чего нет в 32-битном случае, компилятор даст вам a long long, где он будет соответствовать только штрафу.

«... замените литерал на -2147483648L, который вы явно получите long, который подписан». Хммм, В 32-битной long системе 2147483648L , не уместились в long , так что становится long long , то - применяются - или так я думал.
почему не может 0x80000000 вписаться в int в 32-битной системе ??
@ASH Поскольку максимальное число, которое может иметь int, будет 0x7FFFFFFF . Попробуйте сами: #include <limits.h> printf("%X\n", INT_MAX);
Я знаю, это максимальное положительное число. вопрос, когда вы указываете число в шестнадцатеричном формате, должно ли оно быть положительным?
@ASH Не путайте шестнадцатеричное представление целочисленных литералов в исходном коде с базовым двоичным представлением числа со знаком. Литерал 0x7FFFFFFF при записи в исходном коде всегда является положительным числом, но ваша переменная int может, конечно, содержать необработанные двоичные числа вплоть до значения 0xFFFFFFFF.
Извините, я все еще в замешательстве. ìnt n = 0xFFFFFFFF; cout << n; отображает -1 . Также ìnt n = 0x80000000; cout << n; отображает -2147483648 . Я подвергаю сомнению утверждение "не может вписаться в подписанный тип как int" . Это, вероятно, нуждается в дальнейшем копании или быть указано по-другому.
@ASH ìnt n = 0x80000000 преобразование литерала без знака в тип со ìnt n = 0x80000000 . Что произойдет, зависит от вашего компилятора - это поведение, определяемое реализацией. В этом случае он решил показать весь литерал в int , переписав знаковый бит. В других системах может быть невозможно представить тип, и вы вызываете неопределенное поведение - программа может аварийно завершить работу. Вы получите то же самое поведение, если вы сделаете int n=2147483648; так что это никак не связано с шестнадцатеричным обозначением.
Вот почему вы можете найти такой код в стандартных заголовках C : #define INT_MIN (-INT_MAX - 1)
Поведение «обтекания» беззнаковых чисел фиксируется стандартом C ++. Это не имеет ничего общего с дополнением 2 (и только с sizeof(unsigned) ). Вы уверены, что это отличается от C?
«Вместо этого в системе дополнения до двух» - фактически система представления отрицательных чисел не влияет на арифметику без знака, которая определяется в терминах модульной арифметики. В случае 32-битного -0x80000000 всегда равно 0x80000000 .
@Lundin вне диапазона от целочисленного типа до целочисленного типа со знаком всегда определяется реализацией ; нет случаев UB
@ ММ Я полагаю, что стандарт что-то говорит о том, что «может быть получен сигнал, определяемый реализацией». Что это за сигнал или что происходит, если он не обрабатывается, стандартом не предусматривается. Но конечно, я могу редактировать эту часть.
Поведение сигналов является частью стандарта; обработка по умолчанию для каждого сигнала также определяется реализацией (7.14 / 4)
Я удивлен, что это слишком сложное объяснение так популярно. Оказывается, что сравнение (<) не имеет к этому никакого отношения, ваши последние два абзаца кажутся совершенно неуместными. Просто попробуйте вывести значение INT32_MIN, чтобы увидеть, как оно представлено.
@Octopus Уместен параграф о неявном продвижении: предположим, что long - это 32 бита, и у нас есть почти идентичный пример, где другой операнд - это long с любым случайно выбранным значением. Тогда обычные арифметические преобразования вместо этого заставили бы этот операнд преобразовываться в unsigned, и выражение было бы оценено совершенно другим способом. Что касается последнего абзаца, то он отвечает на вопрос.
Объяснение того, как унарное - применяется к целым числам без знака, можно немного расширить. Я всегда предполагал (хотя, к счастью, никогда не полагался на предположение), что значения без знака будут «повышены» до значений со знаком, или, возможно, результат будет неопределенным. (Честно говоря, это должна быть ошибка компиляции; что вообще значит - 3u ?)