С массивами, почему это так, что a [5] == 5 [a]?

Question

С массивами, почему это так, что a [5] == 5 [a]?

1456

Как указывает Джоэл в подкасте Qaru # 34, на языке программирования C (aka: K & R) упоминается это свойство массивов в C: a[5] == 5[a]

Джоэл говорит, что это из-за арифметики указателя, но я до сих пор не понимаю. Почему a[5] == 5[a]?

Dinah 19 дек. 2008, в 16:11

Источник

39

что-то вроде [+] также будет работать как * (a ++) ИЛИ * (++ a)?
Egon 13 май 2010, в 16:14
40

@Egon: Это очень креативно, но, к сожалению, так работают не компиляторы. Компилятор интерпретирует a[1] как серию токенов, а не строк: * ({целочисленное расположение} a {operator} + {integer} 1) совпадает с * ({целое число} 1 {оператор} + {целочисленное местоположение of} a), но не совпадает с * ({целочисленное расположение} a {operator} + {operator} +)
Dinah 13 май 2010, в 17:24
0

Язык C решил реализовать доступ к массиву исключительно как синтаксический сахар . Вот почему компилятор не может проверить, является ли левая часть указателем. Затем случается так, что арифметика с указателями делает результирующую программу действительной, даже если это не так.
Eldritch Conundrum 23 март 2012, в 10:54
1

@EldritchConundrum: я не согласен с тем, что он недействителен. Сам Ричи говорит, что это так. Это может быть непреднамеренным следствием, но я считаю, что это все еще действует.
Dinah 24 май 2012, в 00:23
11

Интересный составной вариант этого проиллюстрирован в нелогичном доступе к массиву , где у вас есть char bar[]; int foo[]; и foo[i][bar] используется как выражение.
Jonathan Leffler 17 окт. 2012, в 06:38
4

@EldritchConundrum, почему вы думаете, что «компилятор не может проверить, является ли левая часть указателем»? Да, оно может. Это правда, что a[b] = *(a + b) для любых данных a и b , но это был свободный выбор проектировщиков языка для + должен быть определен как коммутативный для всех типов. Ничто не может помешать им запретить i + p то же время позволяя p + i .
ach 14 март 2014, в 19:46
1

@ Андрей Они могли бы запретить i+p , но нарушение коммутативности вредит интуиции. Запрещение i[p] имело бы больше смысла, потому что скобки визуально предлагают доступ к массиву.
Eldritch Conundrum 17 март 2014, в 13:11
0

@EldritchConundrum, для меня, это коммутативность в этом случае вредит интуиции. В случае указателей оператор + означает смещение, а не сложение; его аргументы имеют различную природу, и поэтому в них нет симметрии. Мы не можем написать i - p , не так ли?
ach 17 март 2014, в 14:58
12

@Andrey Один обычно ожидает, что + будет коммутативным, поэтому, возможно, реальная проблема состоит в том, чтобы сделать операции указателя похожими на арифметику, вместо того, чтобы разрабатывать отдельный оператор смещения.
Eldritch Conundrum 18 март 2014, в 10:36
1

@ach Re "Мы не можем написать i - p": Вы предполагаете, что вычитание обычно коммутативно? ;-)
Peter A. Schneider 14 окт. 2017, в 20:15
0

Это не только a[5] == 5[a] , но даже &a[5] == &5[a] , т. Е. Они не просто имеют одно и то же значение, это один и тот же объект.
Peter A. Schneider 14 окт. 2017, в 20:17
1

@ Питер, ты упустил мою точку зрения. Это не знаки операций, которые являются коммутативными, а операции, обозначаемые ими. Использование + для обозначения смещения само по себе хорошо, но смещение, в отличие от сложения, не является коммутативным. Вы можете применить смещение в 7 шагов на север к старому дубу, чтобы найти сокровище, но вы не можете применить старый дуб на 7 шагов к северу.
ach 14 окт. 2017, в 20:56
0

@ да, конечно, вы можете; это просто сложение векторов по своей природе (вы можете сначала переместить вектор к дереву, а затем смещение или сначала смещение, а затем тот же вектор; оно полностью коммутативно), в математике и в программировании (если мы рассмотрим адресное пространство (одномерный вектор). Вычитания, очевидно, нет: ни в природе, ни в математике, ни в программировании. Ни одно обстоятельство не удивительно.
Peter A. Schneider 15 окт. 2017, в 07:08
0

Примечание: не всегда плодотворно пытаться понять, почему C делает вещи определенным образом, если вы не помните / не учитываете его историю. C был создан для переноса Unix, Unix был создан для запуска C - это помогло распространить Unix на многие платформы. Таким образом, язык был в основном разработан для создания простого в реализации компилятора портов. В наши дни большинство языковых синтаксисов разработаны с различными целями, такими как читабельность и согласованность или скорость реализации или уменьшение количества ошибок или всего вышеперечисленного), и поэтому вы не найдете таких функций, которые имеют много смысла.
Bill K 27 нояб. 2017, в 16:51
0

Джоэл кто? * * *
7vujy0f0hy 14 янв. 2019, в 23:35

Показать ещё 13 комментариев

Теги:

arrays

c

pointers

pointer-arithmetic

18 ответов

273

Поскольку доступ к массиву определяется с точки зрения указателей. a[i] определяется как означающий *(a + i), который является коммутативным.

David Thornley 19 дек. 2008, в 17:50

37

Массивы не определяются с точки зрения указателей, но доступ к ним есть.
Lightness Races in Orbit 12 май 2011, в 23:20
5

Я бы добавил «так что оно равно *(i + a) , что можно записать как i[a] ».
Jim Balter 05 апр. 2013, в 22:11
3

Я бы предложил вам включить цитату из стандарта, которая выглядит следующим образом: 6.5.2.1: 2 Постфиксное выражение, за которым следует выражение в квадратных скобках [], это подписанное обозначение элемента объекта массива. Определение оператора индекса [] заключается в том, что E1 [E2] идентична (* ((E1) + (E2))). Из-за правил преобразования, которые применяются к бинарному оператору +, если E1 является объектом массива (эквивалентно указателю на начальный элемент объекта массива), а E2 является целым числом, E1 [E2] обозначает E2-й элемент Е1 (считая с нуля).
Vality 17 фев. 2015, в 21:41
0

Чтобы быть более правильным: массивы распадаются на указатели, когда вы получаете к ним доступ.
12431234123412341234123 14 май 2018, в 16:11

Показать ещё 2 комментария

199

Я думаю, что что-то упускают другие ответы.

Да, p[i] по определению эквивалентен *(p+i), который (поскольку добавление является коммутативным) эквивалентен *(i+p), который (опять же, по определению оператора []) эквивалентен i[p].

(И в array[i] имя массива неявно преобразуется в указатель на первый элемент массива.)

Но коммутативность сложения в этом случае не так очевидна.

Если оба операнда одного типа или даже разные числовые типы, которые продвигаются до общего типа, коммутативность имеет смысл: x + y == y + x.

Но в этом случае мы говорим конкретно об арифметике указателя, где один операнд является указателем, а другой - целым числом. (Integer + integer - это другая операция, а указатель + указатель - глупость.)

Стандартное описание оператора + C (N1570 6.5.6) гласит:

Для добавления оба операнда должны иметь арифметический тип или один операнд должен быть указателем на полный тип объекта, а другой должен иметь целочисленный тип.

Можно так же легко сказать:

Для добавления оба операнда должны иметь арифметический тип или левый операнд должен быть указателем на полный тип объекта и правый операнд должен иметь целочисленный тип.

и в этом случае оба i + p и i[p] были бы незаконными.

В терминах С++ у нас действительно есть два набора перегруженных операторов +, которые можно условно описать как:

pointer operator+(pointer p, integer i);

и

pointer operator+(integer i, pointer p);

из которых действительно необходимо только первое.

Так почему это так?

С++ унаследовал это определение из C, которое получило его из B (коммутативность индексации массива явно упоминается в 1972 Ссылка для пользователей на B), которая получила это от BCPL (руководство от 1967 г.), которое, возможно, получило его из более ранних языков (CPL? Algol?).

Итак, идея о том, что индексирование массива определяется с точки зрения добавления, и что добавление, даже указателя и целого числа, является коммутативным, возвращается много десятилетий к языкам языков предков.

Эти языки были гораздо менее строго типизированы, чем современный C. В частности, различие между указателями и целыми числами часто игнорировалось. (Ранние программисты C иногда использовали указатели как целые числа без знака, до того, как к языку было добавлено ключевое слово unsigned.) Таким образом, идея сделать добавочную некоммутативную, поскольку операнды разных типов, вероятно, не возникли бы у разработчиков эти языки. Если пользователь хотел добавить две "вещи", независимо от того, являются ли эти "целые" целые числа, указатели или что-то еще, это не зависит от языка, чтобы предотвратить его.

И с годами любое изменение этого правила нарушило бы существующий код (хотя стандарт ANSI C 1989 года, возможно, был хорошей возможностью).

Смена C и/или С++ требует ввода указателя слева, а целое справа может сломать некоторый существующий код, но не будет потери реальной выразительной мощности.

Итак, теперь мы имеем arr[3] и 3[arr], что означает одно и то же, хотя последняя форма никогда не должна появляться вне IOCCC.

Keith Thompson 23 авг. 2013, в 02:12

11

Фантастическое описание этой недвижимости. С точки зрения высокого уровня, я думаю, что 3[arr] - интересный артефакт, но его следует использовать редко, если когда-либо использовать. Принятый ответ на этот вопрос (< stackoverflow.com/q/1390365/356> ), который я задал некоторое время назад, изменил мой взгляд на синтаксис. Хотя технически зачастую нет правильного и неправильного способа сделать эти вещи, такие функции заставляют вас думать не так, как о деталях реализации. Этот способ мышления имеет преимущество, которое частично теряется, когда вы зацикливаетесь на деталях реализации.
Dinah 24 авг. 2013, в 01:01
3

Дополнение коммутативно. Для стандарта C определить его иначе было бы странно. Вот почему не так просто сказать: «Кроме того, либо оба операнда должны иметь арифметический тип, либо левый операнд должен быть указателем на полный тип объекта, а правый операнд должен иметь целочисленный тип». - Это не имеет смысла для большинства людей, которые добавляют вещи.
iheanyi 21 апр. 2014, в 17:54
8

@iheanyi: сложение, как правило, коммутативное, и оно обычно занимает два операнда одного типа. Добавление указателя позволяет добавить указатель и целое число, но не два указателя. ИМХО, это уже достаточно странный особый случай, когда требование указателя быть левым операндом не будет значительным бременем. (Некоторые языки используют «+» для конкатенации строк; это, конечно, не коммутативно.)
Keith Thompson 21 апр. 2014, в 18:13
0

Верно на примере строки! В этом свете это выглядит как решение о языке, основанное на аспектах реализации, а не на дизайне.
iheanyi 21 апр. 2014, в 19:53
0

@iheanyi: Добавление чисел коммутативно, но это не означает, что сложение должно быть коммутативно с вещами, которые не являются числами. Для ассемблеров нередко требовалось, чтобы каждый адрес, включающий перемещаемый символ, имел точную форму "rel_symbol", "rel_symbol + number" или "rel_symbol - number", поскольку компоновщик ожидал список исправлений, каждый из которых идентифицировал «базовый» символ и место, где он использовался (предварительно фиксированный код будет содержать число, которое будет добавлено к символу).
supercat 20 окт. 2014, в 16:08
0

@iheanyi: Я думаю, что с точки зрения правил лучше сказать, что второй операнд оператора сложения должен быть числом, а тип результата будет соответствовать первому операнду, чем пытаться сказать, что «хотя бы один» операнд должен быть число. Кстати, много неприятностей, связанных с неподписанными типами, можно было бы устранить, если бы оператор сложения всегда возвращал тип своего левого операнда, вместо того чтобы сказать, что данный uint32_t x=0; значение x-1 в некоторых реализациях должно давать 4294967295, а в других - -1.
supercat 20 окт. 2014, в 16:18
3

@supercat, это еще хуже. Это будет означать, что иногда х + 1! = 1 + х. Это полностью нарушило бы ассоциативное свойство сложения.
iheanyi 21 окт. 2014, в 16:34
2

@iheanyi: я думаю, что вы имели в виду коммутативную собственность; сложение уже не ассоциативно, так как в большинстве реализаций (1LL + 1U) -2! = 1LL + (1U-2). Действительно, изменение сделало бы некоторые ситуации ассоциативными, которых в настоящее время нет, например, 3U + (UINT_MAX-2L) будет равно (3U + UINT_MAX) -2. Однако лучше всего было бы, чтобы в языке были добавлены новые различные типы для целых чисел и «обертывающих» алгебраических колец, так что добавление 2 к ring16_t содержащему 65535, привело бы к ring16_t со значением 1, независимо от размера int .
supercat 21 окт. 2014, в 16:46
0

@supercat - спасибо за этот ответ. Это проясняет проблемы под рукой с хорошим примером :)
iheanyi 21 окт. 2014, в 16:59

Показать ещё 7 комментариев

177

И, конечно,

 ("ABCD"[2] == 2["ABCD"]) && (2["ABCD"] == 'C') && ("ABCD"[2] == 'C')

Основная причина этого заключалась в том, что еще в 70-х годах, когда C был разработан, у компьютеров не было много памяти (64KB было много), поэтому компилятор C не проводил много синтаксической проверки. Следовательно, "X[Y]" был скорее слепо переведен в "*(X+Y)"

Это также объясняет синтаксисы "+=" и "++". Все в форме "A = B + C" имело ту же скомпилированную форму. Но если B был тем же объектом, что и A, тогда была доступна оптимизация уровня сборки. Но компилятор не был достаточно ярким, чтобы распознать его, поэтому разработчику пришлось (A += C). Аналогично, если C был 1, была доступна другая оптимизация уровня сборки, и разработчик должен был сделать это явным, потому что компилятор не узнал его. (Совсем недавно компиляторы делают, поэтому в наши дни эти синтаксисы в значительной степени не нужны)

James Curran 19 дек. 2008, в 18:48

126

На самом деле, это оценивается как ложное; первый термин "ABCD" [2] == 2 ["ABCD"] оценивается как true, или 1, и 1! = 'C': D
Jonathan Leffler 19 дек. 2008, в 17:16
8

@Jonathan: та же самая двусмысленность приводит к редактированию оригинального названия этого поста. Являемся ли мы равными знаками математической эквивалентности, синтаксиса кода или псевдокода. Я утверждаю математическую эквивалентность, но поскольку мы говорим о коде, мы не можем избежать того, что мы рассматриваем все с точки зрения синтаксиса кода.
Dinah 19 дек. 2008, в 17:26
19

Разве это не миф? Я имею в виду, что операторы + = и ++ были созданы для упрощения компилятора? Некоторый код становится понятнее с ними, и это полезный синтаксис, независимо от того, что с ним делает компилятор.
Thomas Padron-McCarthy 19 дек. 2008, в 17:44
6

+ = и ++ имеет еще одно существенное преимущество. если левая часть изменяет некоторую переменную во время оценки, изменение будет сделано только один раз. а = а + ...; сделаю это дважды.
Johannes Schaub - litb 19 дек. 2008, в 17:49
3

Слышал, что + = уменьшает вероятность ошибок, когда вы пишете имена переменных два раза, а не три ...
Liran Orevi 21 апр. 2009, в 08:02
1

a = a + с объектами часто приводит к неоптимизированным копиям объектов, потому что это должно сделать копию a. + = не требует копии, она оценивается напрямую.
jkeys 12 авг. 2009, в 21:49
0

не "ABCD" [2] не разрешает "CD"? если вы хотите, чтобы он преобразовывался в 'C', вы должны использовать разыменование, т.е. *("ABCD"[2]) == 'C')
knittl 21 сен. 2009, в 10:05
8

Нет - "ABCD" [2] == * ("ABCD" + 2) = * ("CD") = 'C'. Разыменование строки дает вам символ, а не подстроку
MSalters 21 сен. 2009, в 10:34
4

«Это будет легче реализовать таким образом», имеет гораздо больше смысла, чем «математически это работает, поэтому, даже если оно не служит никакой практической цели, давайте добавим его к языку» как рациональное.
Dennis Zickefoose 19 июнь 2011, в 09:44
0

Насколько я помню, algol68 был источником комбинированных операторов арифметики и присваивания, как в foo +:= bar , произносится как «foo plus-and-gets bar». Я полагаю, что обоснование заключалось в том, что это больше напоминало то, что в первую очередь хотелось сделать, а именно «добавить бар в foo» (хотя почему мы не получили bar =:+ foo из этой логики, я не знаю ).
dave 03 май 2012, в 02:26
4

@ ThomasPadron-McCarthy: отсюда : «Во время разработки [Thompson] постоянно боролся с ограничениями памяти: каждое добавление языка приводило к тому, что компилятор едва ли подходил, но каждое переписывание с использованием этой функции уменьшало его размер. Например, B представил обобщенные операторы присваивания, использующие x = + y для добавления y к x ... Томпсон пошел дальше, придумав операторы ++ и - ... более сильной мотивацией для нововведения было, вероятно, его наблюдение, что перевод ++ х был меньше, чем у х = х + 1 ".
John Bode 03 май 2012, в 15:19
3

@dave: это x += 5; а не x =+ 5; потому что последний будет проанализирован как x = (+5);
James Curran 24 янв. 2013, в 14:14
2

@JamesCurran Я уверен, что все начиналось как LHS =- RHS; и был в конце концов поменялся местами -= .
Vatine 18 апр. 2013, в 15:58
1

++ часто отображается на одну машинную инструкцию, в то время как x = x + 1 может быть больше одного. x + = 3 соответствует меньшему количеству машинных инструкций, что x = x + 3, так как известно, что каждый подберет x один раз, добавит три к нему и уронит обратно вниз. register int x = 3 относится к той же эпохе, когда компиляторы были не так умны, как сегодня.
EvilTeach 07 окт. 2013, в 02:30
0

@JamesCurran унарный + не существовал в начале C.
Miles Rout 17 июнь 2014, в 15:57
1

@MilesRout: Возможно, нет, но унарный минус определенно сделал, что привело к той же проблеме.
James Curran 01 июль 2014, в 19:22
1

Мини-компьютер PDP11 (PDP использовался для первой операционной системы C и UNIX) имел инструкции по сборке для + = - = ++ - так что, хотя в Algol могли быть предшественники, было некоторое сопоставление 1-к-1 между набором команд и языковыми возможностями.
Soren 27 авг. 2014, в 23:33
2

@ Ватина прав, это было =+ до += . Язык программирования B (который я удивлен читать, все еще используется), предок C, использует форму =+ . IIRC, основной причиной изменения было то, что i=-1; был неоднозначным. Не неоднозначно для компилятора, но для читателей-людей, у которых были проблемы с пониманием, должно ли это уменьшить i на 1 (и, следовательно, правильно написано), или это должно было присвоить -1 для i (и, следовательно, ошибка в коде) , Отказ от ответственности: мое воспоминание может быть ошибочным.
user743382 15 нояб. 2014, в 12:33
0

@JohnBode Процитированное предложение, начинающееся с «более сильной мотивации для инноваций ...» - это просто круговые рассуждения. Он не мог этого заметить, пока не придумал это. Дело в том, что у PDP-11 были инструкции как до, так и после декремента, или, наоборот, прошло 37 лет.
user207421 25 янв. 2016, в 22:47
3

Итак, если ++ в значительной степени не нужен, является ли C ++ в значительной степени ненужным? Я сам держусь за C ###.
user4624979 11 июль 2016, в 18:45
0

@Dinah, согласился, отредактировал соответственно
franji1 28 июль 2017, в 17:54

Показать ещё 19 комментариев

51

Одна вещь, кажется, не упоминала о проблеме Дины с sizeof:

Вы можете добавить целое число в указатель, вы не можете добавить два указателя вместе. Таким образом, при добавлении указателя на целое число или целое число в указатель, компилятор всегда знает, какой бит имеет размер, который необходимо принять во внимание.

user30364 11 фев. 2009, в 17:15

1

В комментариях к принятому ответу об этом довольно исчерпывающий разговор. Я сослался на упомянутый разговор в редакторе на исходный вопрос, но не обратился напрямую к вашей очень важной проблеме sizeof. Не уверен, как лучше сделать это в SO. Должен ли я сделать еще одно редактирование в ориг. вопрос?
Dinah 21 апр. 2009, в 13:51

45

Чтобы ответить на вопрос буквально. Не всегда верно, что x == x

double zero = 0.0;
double a[] = { 0,0,0,0,0, zero/zero}; // NaN
cout << (a[5] == 5[a] ? "true" : "false") << endl;

печатает

false

Peter Lawrey 11 авг. 2011, в 15:00

27

На самом деле «nan» не равен самому себе: cout << (a[5] == a[5] ? "true" : "false") << endl; false
TrueY 23 апр. 2013, в 09:34
7

@TrueY: Он утверждал, что специально для случая NaN (и, в частности, что x == x не всегда верно). Я думаю, что это было его намерение. Так что он технически правильный (и, возможно, как говорится, лучший вид правильного!).
Tim Čas 13 фев. 2015, в 01:04
2

Вопрос о C, ваш код не является C-кодом. В <math.h> также есть NAN , который лучше, чем 0.0/0.0 , потому что 0.0/0.0 - это UB, когда __STDC_IEC_559__ не определен (большинство реализаций не определяют __STDC_IEC_559__ , но в большинстве реализаций 0.0/0.0 все еще будет работать)
12431234123412341234123 14 май 2018, в 16:02

Показать ещё 1 комментарий

24

Хороший вопрос/ответы.

Просто хочу указать, что C-указатели и массивы не совпадают, хотя в этом случае разница не является существенной.

Рассмотрим следующие объявления:

int a[10];
int* p = a;

В a.out символ a находится по адресу, который начинается с массивом, а символ p находится по адресу, где хранится указатель, а значение указателя в этой ячейке памяти является началом массив.

PolyThinker 20 дек. 2008, в 09:49

2

Нет, технически они не одинаковы. Если вы определите некоторое b как int * const и сделаете его указателем на массив, это все еще указатель, означающий, что в таблице символов b ссылается на область памяти, в которой хранится адрес, который, в свою очередь, указывает на то, где находится массив ,
PolyThinker 22 дек. 2008, в 05:42
3

Очень хороший момент. Я помню очень неприятную ошибку, когда я определил глобальный символ как char s [100] в одном модуле, объявив его как extern char * s; в другом модуле. После связывания всего этого программа вела себя очень странно. Поскольку модуль, использующий объявление extern, использовал начальные байты массива в качестве указателя на символ.
Giorgio 02 май 2012, в 18:15
0

Первоначально, в BCPL дедушки C, массив был указателем. То есть то, что вы получили, когда писали (я транслитерировал на C) int a[10] был указатель с именем 'a', который указывал на достаточно места для хранения 10 целых чисел в другом месте. Таким образом, a + i и j + i имели одинаковую форму: добавьте содержимое пары ячеек памяти. На самом деле, я думаю, что BCPL был без типа, поэтому они были идентичны. И масштабирование по типу не применимо, поскольку BCPL был ориентирован исключительно на слова (также на машинах с адресной адресацией).
dave 03 май 2012, в 02:33
0

Я думаю, что лучший способ понять разницу - сравнить int*p = a; для int b = 5; В последнем случае «b» и «5» оба являются целыми числами, но «b» является переменной, а «5» является фиксированным значением. Аналогично, «p» и «a» оба являются адресами символа, но «a» является фиксированным значением.
James Curran 12 март 2013, в 16:34

Показать ещё 2 комментария

22

Я просто узнаю, что этот уродливый синтаксис может быть "полезным" или, по крайней мере, очень забавным, когда вы хотите иметь дело с массивом индексов, которые относятся к позициям в один и тот же массив. Он может заменить вложенные квадратные скобки и сделать код более читаемым!

int a[] = { 2 , 3 , 3 , 2 , 4 };
int s = sizeof a / sizeof *a;  //  s == 5

for(int i = 0 ; i < s ; ++i) {  

           cout << a[a[a[i]]] << endl;
           // ... is equivalent to ... 
           cout << i[a][a][a] << endl;  // but I prefer this one, it easier to increase the level of indirection (without loop)

}

Конечно, я совершенно уверен, что в реальном коде нет смысла использовать, но мне все равно было интересно:)

Frédéric Terrazzoni 10 июнь 2012, в 20:16

6

О Боже!!! как кто-то может сказать, что предпочитает эту запись !!! Мне больно глаза !!!
Luis Colorado 19 сен. 2014, в 13:14
0

Когда вы видите i[a][a][a] вы думаете, что я либо указатель на массив, либо массив указателя на массив или массив ... а a - это индекс. Когда вы видите a[a[a[i]]] , вы думаете, что a - указатель на массив или массив, а i - индекс.
12431234123412341234123 14 май 2018, в 11:58
1

Вот Это Да! Это очень крутое использование этой "глупой" функции. Может быть полезен в алгоритмическом конкурсе в некоторых задачах))
Serge Breusov 28 июнь 2018, в 08:53

Показать ещё 1 комментарий

17

Для указателей в C имеем

a[5] == *(a + 5)

а также

5[a] == *(5 + a)

Следовательно, верно, что a[5] == 5[a].

user1287577 23 март 2012, в 07:56

14

Не ответ, а просто пища для размышлений. Если класс имеет перегруженный индекс/индексный оператор, выражение 0[x] не будет работать:

class Sub
{
public:
    int operator [](size_t nIndex)
    {
        return 0;
    }   
};

int main()
{
    Sub s;
    s[0];
    0[s]; // ERROR 
}

Так как мы не имеем доступа к классу int, это не может быть сделано:

class int
{
   int operator[](const Sub&);
};

Ajay 19 июнь 2011, в 09:28

2

class Sub { public: int operator[](size_t nIndex) const { return 0; } friend int operator[](size_t nIndex, const Sub& This) { return 0; } };
Ben Voigt 05 апр. 2013, в 17:23
1

Вы на самом деле пытались его скомпилировать? Существует множество операторов, которые не могут быть реализованы вне класса (то есть как нестатические функции)!
Ajay 05 апр. 2013, в 21:10
3

ой, ты прав. « operator[] должен быть нестатической функцией-членом с одним параметром». Я был знаком с этим ограничением на operator= , не думаю, что оно применяется к [] .
Ben Voigt 05 апр. 2013, в 21:21
1

Конечно, если вы измените определение оператора [] , оно никогда не будет эквивалентным снова ... если a[b] равно *(a + b) и вы измените это, вам придется перегружать также int::operator[](const Sub&); и int это не класс ...
Luis Colorado 19 сен. 2014, в 13:18
5

Это ... не ... C.
MD XF 13 дек. 2016, в 07:13

Показать ещё 3 комментария

9

У него очень хорошее объяснение в учебном пособии по баллам и атакам в C Тедом Дженсеном.

Тед Дженсен объяснил это как:

На самом деле это верно, то есть где бы ни пишут a[i], это может быть заменяется на *(a + i) без каких-либо проблем. Фактически, компилятор создаст тот же код в любом случае. Таким образом, мы видим, что указатель арифметика - это то же самое, что индексирование массива. Любой синтаксис дает тот же результат.

Это НЕ говорит, что указатели и массивы это одно и то же, их нет. Мы только говорим, что для определения данный элемент массива имеет выбор из двух синтаксисов: один используя индексирование массива, а другое - с помощью арифметики указателя, которая дают идентичные результаты.

Теперь, глядя на это последнее выражение, его часть.. (a + i), является простым дополнением, использующим + оператора и правил состояния C, что такое выражение коммутативной. То есть (a + i) идентично (i + a). Таким образом, мы могли бы пишите *(i + a) так же легко, как *(a + i). Но *(i + a) мог бы прийти от i[a]! Из всего этого возникает любопытный правда, что если:
char a[20];
писать
a[3] = 'x';
совпадает с записью
3[a] = 'x';

A.s. Bhullar 27 сен. 2013, в 07:57

3

+ Я НЕ простое дополнение, потому что это арифметика указателя. если размер элемента a равен 1 (символ), то да, это как целое число +. Но если это (например) целое число, то оно может быть эквивалентно + 4 * i.
Alex Brown 04 дек. 2015, в 20:17
0

@AlexBrown Да, это арифметика указателей, и именно поэтому ваше последнее предложение неверно, если только вы сначала не приведете «a» к (char *) (при условии, что int равно 4 символам). Я действительно не понимаю, почему так много людей зацикливаются на фактическом значении результата арифметики с указателями. Вся цель арифметики указателей состоит в том, чтобы абстрагироваться от базовых значений указателя и позволить программисту думать об объектах, которыми манипулируют, а не об адресных значениях.
jschultz410 21 март 2018, в 16:11

6

Я знаю, что на вопрос ответили, но я не мог не согласиться с этим объяснением.

Я помню Принципы проектирования компилятора, Предположим, что a является массивом int, а размер int равен 2 байтам, & Амп; Базовый адрес для a - 1000.

Как a[5] будет работать →

Base Address of your Array a + (5*size of(data type for array a))
i.e. 1000 + (5*2) = 1010

Итак,

Аналогично, когда код c разбивается на 3-адресный код, 5[a] станет →

Base Address of your Array a + (size of(data type for array a)*5)
i.e. 1000 + (2*5) = 1010

Таким образом, в основном оба оператора указывают на одно и то же место в памяти и, следовательно, a[5] = 5[a].

Это объяснение также является причиной того, что отрицательные индексы в массивах работают в C.

то есть. если я получаю доступ к a[-5], он даст мне

Base Address of your Array a + (-5 * size of(data type for array a))
i.e. 1000 + (-5*2) = 990

Он вернет мне объект в точке 990.

Ajinkya Patil 04 май 2016, в 10:02

4

в компиляторе c

a[i]
i[a]
*(a+i)

- это разные способы обращения к элементу массива! (НЕ НА ВСЕ ВРЕМЯ)

AVIK DUTTA 29 окт. 2014, в 10:12

4

В массивы C, arr[3] и 3[arr] совпадают, а их эквивалентные обозначения указателей *(arr + 3) - *(3 + arr), Но, наоборот, [arr]3 или [3]arr неверно и приведет к синтаксической ошибке, так как (arr + 3)* и (3 + arr)* являются недопустимыми выражениями. Причина заключается в том, что оператор разыменования должен быть помещен перед адресом, заданным выражением, а не после адреса.

Krishan 17 дек. 2013, в 11:37

0

В C-языке указатель и массив очень близки друг к другу, массив можно разделить в виде pointer. Имя массива является указателем на его первый элемент. Поэтому, если acData является массивом символов, то "acData" будет адресом его первого элемента. Вы также можете сказать, что "acData" похож на & acData [0].

В соответствии со стандартом C мы можем представить 1D-массив в виде указателя.

См. приведенное ниже выражение

acData [i] = * (acData + i); --------- > 1D массив в виде указателя

Итак, если я = 5;

cData [5] = * (acData +5);

Мы можем также представить выражение в форме ниже,

cData [5] = * (5 + acData);

Итак, теперь мы можем написать

cData [5] = 5 [cData];

См. приведенный ниже код

#include <stdio.h>

int main(int argc, char *argv[]) {

 char cData  [] = {'w', 'o', 'r', 'l' ,'d' }; // character array

 int index = 0;

 for(index = 0; index < sizeof(cData ); ++index)
 {
     printf("Array element access by pointer = %c\n\n",cData[index]);

     printf("Array element access by   array = %c\n\n",index[cData]);
 }


    return 0;
}

Литература, https://aticleworld.com/array-in-c/

amlendra mishra 18 апр. 2018, в 07:01

0

Ну, это функция, которая возможна только из-за поддержки языка.

Компилятор интерпретирует a[i] как *(a+i), а выражение 5[a] оценивается как *(5+a). Так как сложение коммутативно, оказывается, что оба они равны. Следовательно, выражение оценивается как true.

Harsha JK 02 апр. 2018, в 20:00

0

В C

 int a[]={10,20,30,40,50};
 int *p=a;
 printf("%d\n",*p++);//output will be 10
 printf("%d\n",*a++);//will give an error

Указатель представляет собой "переменную"

имя массива - это "мнемонический" или "синоним"

p++; действителен, но a++ недействителен

a[2] равно 2 [a], потому что внутренняя операция на обоих из них

"Арифметика указателей" внутренне рассчитана как

*(a+3) равно *(3+a)

Jayghosh Wankar 12 фев. 2017, в 15:34

-3

типы указателей

1) указатель на данные

int *ptr;

2) указатель const на данные

int const *ptr;

3) указатель const для данных const

int const *const ptr;

и массивы являются типом (2) из нашего списка
Когда вы определяете массив за один раз, этот адрес инициализируется в этом указателе
Как мы знаем, мы не можем изменить или изменить значение const в нашей программе, потому что он генерирует ERROR во время компиляции

Основная разница, которую я нашел, - это...

Мы можем повторно инициализировать указатель по адресу, но не в том же случае с массивом.

======
и вернемся к вашему вопросу...
a [5] - это не что иное, как * (a + 5)
вы можете легко понять
a - содержащий адрес (люди называют его базовым адресом), как и указатель типа (2) в нашем списке
[] - этот оператор может быть заменен указателем *.

так наконец...

a[5] == *(a +5) == *(5 + a) == 5[a]

Jeet Parikh 13 июль 2018, в 09:03

2

Массивы не указатели.
melpomene 02 окт. 2018, в 05:06

Ещё вопросы

что-то вроде [+] также будет работать как * (a ++) ИЛИ * (++ a)?
@Egon: Это очень креативно, но, к сожалению, так работают не компиляторы. Компилятор интерпретирует a[1] как серию токенов, а не строк: * ({целочисленное расположение} a {operator} + {integer} 1) совпадает с * ({целое число} 1 {оператор} + {целочисленное местоположение of} a), но не совпадает с * ({целочисленное расположение} a {operator} + {operator} +)
Язык C решил реализовать доступ к массиву исключительно как синтаксический сахар . Вот почему компилятор не может проверить, является ли левая часть указателем. Затем случается так, что арифметика с указателями делает результирующую программу действительной, даже если это не так.
@EldritchConundrum: я не согласен с тем, что он недействителен. Сам Ричи говорит, что это так. Это может быть непреднамеренным следствием, но я считаю, что это все еще действует.
Интересный составной вариант этого проиллюстрирован в нелогичном доступе к массиву , где у вас есть char bar[]; int foo[]; и foo[i][bar] используется как выражение.
@EldritchConundrum, почему вы думаете, что «компилятор не может проверить, является ли левая часть указателем»? Да, оно может. Это правда, что a[b] = *(a + b) для любых данных a и b , но это был свободный выбор проектировщиков языка для + должен быть определен как коммутативный для всех типов. Ничто не может помешать им запретить i + p то же время позволяя p + i .
@ Андрей Они могли бы запретить i+p , но нарушение коммутативности вредит интуиции. Запрещение i[p] имело бы больше смысла, потому что скобки визуально предлагают доступ к массиву.
@EldritchConundrum, для меня, это коммутативность в этом случае вредит интуиции. В случае указателей оператор + означает смещение, а не сложение; его аргументы имеют различную природу, и поэтому в них нет симметрии. Мы не можем написать i - p , не так ли?
@Andrey Один обычно ожидает, что + будет коммутативным, поэтому, возможно, реальная проблема состоит в том, чтобы сделать операции указателя похожими на арифметику, вместо того, чтобы разрабатывать отдельный оператор смещения.
@ach Re "Мы не можем написать i - p": Вы предполагаете, что вычитание обычно коммутативно? ;-)
Это не только a[5] == 5[a] , но даже &a[5] == &5[a] , т. Е. Они не просто имеют одно и то же значение, это один и тот же объект.
@ Питер, ты упустил мою точку зрения. Это не знаки операций, которые являются коммутативными, а операции, обозначаемые ими. Использование + для обозначения смещения само по себе хорошо, но смещение, в отличие от сложения, не является коммутативным. Вы можете применить смещение в 7 шагов на север к старому дубу, чтобы найти сокровище, но вы не можете применить старый дуб на 7 шагов к северу.
@ да, конечно, вы можете; это просто сложение векторов по своей природе (вы можете сначала переместить вектор к дереву, а затем смещение или сначала смещение, а затем тот же вектор; оно полностью коммутативно), в математике и в программировании (если мы рассмотрим адресное пространство (одномерный вектор). Вычитания, очевидно, нет: ни в природе, ни в математике, ни в программировании. Ни одно обстоятельство не удивительно.
Примечание: не всегда плодотворно пытаться понять, почему C делает вещи определенным образом, если вы не помните / не учитываете его историю. C был создан для переноса Unix, Unix был создан для запуска C - это помогло распространить Unix на многие платформы. Таким образом, язык был в основном разработан для создания простого в реализации компилятора портов. В наши дни большинство языковых синтаксисов разработаны с различными целями, такими как читабельность и согласованность или скорость реализации или уменьшение количества ошибок или всего вышеперечисленного), и поэтому вы не найдете таких функций, которые имеют много смысла.
Массивы не определяются с точки зрения указателей, но доступ к ним есть.
Я бы добавил «так что оно равно *(i + a) , что можно записать как i[a] ».
Я бы предложил вам включить цитату из стандарта, которая выглядит следующим образом: 6.5.2.1: 2 Постфиксное выражение, за которым следует выражение в квадратных скобках [], это подписанное обозначение элемента объекта массива. Определение оператора индекса [] заключается в том, что E1 [E2] идентична (* ((E1) + (E2))). Из-за правил преобразования, которые применяются к бинарному оператору +, если E1 является объектом массива (эквивалентно указателю на начальный элемент объекта массива), а E2 является целым числом, E1 [E2] обозначает E2-й элемент Е1 (считая с нуля).
Чтобы быть более правильным: массивы распадаются на указатели, когда вы получаете к ним доступ.
Фантастическое описание этой недвижимости. С точки зрения высокого уровня, я думаю, что 3[arr] - интересный артефакт, но его следует использовать редко, если когда-либо использовать. Принятый ответ на этот вопрос (< stackoverflow.com/q/1390365/356> ), который я задал некоторое время назад, изменил мой взгляд на синтаксис. Хотя технически зачастую нет правильного и неправильного способа сделать эти вещи, такие функции заставляют вас думать не так, как о деталях реализации. Этот способ мышления имеет преимущество, которое частично теряется, когда вы зацикливаетесь на деталях реализации.
Дополнение коммутативно. Для стандарта C определить его иначе было бы странно. Вот почему не так просто сказать: «Кроме того, либо оба операнда должны иметь арифметический тип, либо левый операнд должен быть указателем на полный тип объекта, а правый операнд должен иметь целочисленный тип». - Это не имеет смысла для большинства людей, которые добавляют вещи.
@iheanyi: сложение, как правило, коммутативное, и оно обычно занимает два операнда одного типа. Добавление указателя позволяет добавить указатель и целое число, но не два указателя. ИМХО, это уже достаточно странный особый случай, когда требование указателя быть левым операндом не будет значительным бременем. (Некоторые языки используют «+» для конкатенации строк; это, конечно, не коммутативно.)
Верно на примере строки! В этом свете это выглядит как решение о языке, основанное на аспектах реализации, а не на дизайне.
@iheanyi: Добавление чисел коммутативно, но это не означает, что сложение должно быть коммутативно с вещами, которые не являются числами. Для ассемблеров нередко требовалось, чтобы каждый адрес, включающий перемещаемый символ, имел точную форму "rel_symbol", "rel_symbol + number" или "rel_symbol - number", поскольку компоновщик ожидал список исправлений, каждый из которых идентифицировал «базовый» символ и место, где он использовался (предварительно фиксированный код будет содержать число, которое будет добавлено к символу).
@iheanyi: Я думаю, что с точки зрения правил лучше сказать, что второй операнд оператора сложения должен быть числом, а тип результата будет соответствовать первому операнду, чем пытаться сказать, что «хотя бы один» операнд должен быть число. Кстати, много неприятностей, связанных с неподписанными типами, можно было бы устранить, если бы оператор сложения всегда возвращал тип своего левого операнда, вместо того чтобы сказать, что данный uint32_t x=0; значение x-1 в некоторых реализациях должно давать 4294967295, а в других - -1.
@supercat, это еще хуже. Это будет означать, что иногда х + 1! = 1 + х. Это полностью нарушило бы ассоциативное свойство сложения.
@iheanyi: я думаю, что вы имели в виду коммутативную собственность; сложение уже не ассоциативно, так как в большинстве реализаций (1LL + 1U) -2! = 1LL + (1U-2). Действительно, изменение сделало бы некоторые ситуации ассоциативными, которых в настоящее время нет, например, 3U + (UINT_MAX-2L) будет равно (3U + UINT_MAX) -2. Однако лучше всего было бы, чтобы в языке были добавлены новые различные типы для целых чисел и «обертывающих» алгебраических колец, так что добавление 2 к ring16_t содержащему 65535, привело бы к ring16_t со значением 1, независимо от размера int .
@supercat - спасибо за этот ответ. Это проясняет проблемы под рукой с хорошим примером :)
На самом деле, это оценивается как ложное; первый термин "ABCD" [2] == 2 ["ABCD"] оценивается как true, или 1, и 1! = 'C': D
@Jonathan: та же самая двусмысленность приводит к редактированию оригинального названия этого поста. Являемся ли мы равными знаками математической эквивалентности, синтаксиса кода или псевдокода. Я утверждаю математическую эквивалентность, но поскольку мы говорим о коде, мы не можем избежать того, что мы рассматриваем все с точки зрения синтаксиса кода.
Разве это не миф? Я имею в виду, что операторы + = и ++ были созданы для упрощения компилятора? Некоторый код становится понятнее с ними, и это полезный синтаксис, независимо от того, что с ним делает компилятор.
+ = и ++ имеет еще одно существенное преимущество. если левая часть изменяет некоторую переменную во время оценки, изменение будет сделано только один раз. а = а + ...; сделаю это дважды.
Слышал, что + = уменьшает вероятность ошибок, когда вы пишете имена переменных два раза, а не три ...
a = a + с объектами часто приводит к неоптимизированным копиям объектов, потому что это должно сделать копию a. + = не требует копии, она оценивается напрямую.
не "ABCD" [2] не разрешает "CD"? если вы хотите, чтобы он преобразовывался в 'C', вы должны использовать разыменование, т.е. *("ABCD"[2]) == 'C')
Нет - "ABCD" [2] == * ("ABCD" + 2) = * ("CD") = 'C'. Разыменование строки дает вам символ, а не подстроку
«Это будет легче реализовать таким образом», имеет гораздо больше смысла, чем «математически это работает, поэтому, даже если оно не служит никакой практической цели, давайте добавим его к языку» как рациональное.
Насколько я помню, algol68 был источником комбинированных операторов арифметики и присваивания, как в foo +:= bar , произносится как «foo plus-and-gets bar». Я полагаю, что обоснование заключалось в том, что это больше напоминало то, что в первую очередь хотелось сделать, а именно «добавить бар в foo» (хотя почему мы не получили bar =:+ foo из этой логики, я не знаю ).
@ ThomasPadron-McCarthy: отсюда : «Во время разработки [Thompson] постоянно боролся с ограничениями памяти: каждое добавление языка приводило к тому, что компилятор едва ли подходил, но каждое переписывание с использованием этой функции уменьшало его размер. Например, B представил обобщенные операторы присваивания, использующие x = + y для добавления y к x ... Томпсон пошел дальше, придумав операторы ++ и - ... более сильной мотивацией для нововведения было, вероятно, его наблюдение, что перевод ++ х был меньше, чем у х = х + 1 ".
@dave: это x += 5; а не x =+ 5; потому что последний будет проанализирован как x = (+5);
@JamesCurran Я уверен, что все начиналось как LHS =- RHS; и был в конце концов поменялся местами -= .
++ часто отображается на одну машинную инструкцию, в то время как x = x + 1 может быть больше одного. x + = 3 соответствует меньшему количеству машинных инструкций, что x = x + 3, так как известно, что каждый подберет x один раз, добавит три к нему и уронит обратно вниз. register int x = 3 относится к той же эпохе, когда компиляторы были не так умны, как сегодня.
@JamesCurran унарный + не существовал в начале C.
@MilesRout: Возможно, нет, но унарный минус определенно сделал, что привело к той же проблеме.
Мини-компьютер PDP11 (PDP использовался для первой операционной системы C и UNIX) имел инструкции по сборке для + = - = ++ - так что, хотя в Algol могли быть предшественники, было некоторое сопоставление 1-к-1 между набором команд и языковыми возможностями.
@ Ватина прав, это было =+ до += . Язык программирования B (который я удивлен читать, все еще используется), предок C, использует форму =+ . IIRC, основной причиной изменения было то, что i=-1; был неоднозначным. Не неоднозначно для компилятора, но для читателей-людей, у которых были проблемы с пониманием, должно ли это уменьшить i на 1 (и, следовательно, правильно написано), или это должно было присвоить -1 для i (и, следовательно, ошибка в коде) , Отказ от ответственности: мое воспоминание может быть ошибочным.
@JohnBode Процитированное предложение, начинающееся с «более сильной мотивации для инноваций ...» - это просто круговые рассуждения. Он не мог этого заметить, пока не придумал это. Дело в том, что у PDP-11 были инструкции как до, так и после декремента, или, наоборот, прошло 37 лет.
Итак, если ++ в значительной степени не нужен, является ли C ++ в значительной степени ненужным? Я сам держусь за C ###.
@Dinah, согласился, отредактировал соответственно
В комментариях к принятому ответу об этом довольно исчерпывающий разговор. Я сослался на упомянутый разговор в редакторе на исходный вопрос, но не обратился напрямую к вашей очень важной проблеме sizeof. Не уверен, как лучше сделать это в SO. Должен ли я сделать еще одно редактирование в ориг. вопрос?
На самом деле «nan» не равен самому себе: cout << (a[5] == a[5] ? "true" : "false") << endl; false
@TrueY: Он утверждал, что специально для случая NaN (и, в частности, что x == x не всегда верно). Я думаю, что это было его намерение. Так что он технически правильный (и, возможно, как говорится, лучший вид правильного!).
Вопрос о C, ваш код не является C-кодом. В <math.h> также есть NAN , который лучше, чем 0.0/0.0 , потому что 0.0/0.0 - это UB, когда __STDC_IEC_559__ не определен (большинство реализаций не определяют __STDC_IEC_559__ , но в большинстве реализаций 0.0/0.0 все еще будет работать)
Нет, технически они не одинаковы. Если вы определите некоторое b как int * const и сделаете его указателем на массив, это все еще указатель, означающий, что в таблице символов b ссылается на область памяти, в которой хранится адрес, который, в свою очередь, указывает на то, где находится массив ,
Очень хороший момент. Я помню очень неприятную ошибку, когда я определил глобальный символ как char s [100] в одном модуле, объявив его как extern char * s; в другом модуле. После связывания всего этого программа вела себя очень странно. Поскольку модуль, использующий объявление extern, использовал начальные байты массива в качестве указателя на символ.
Первоначально, в BCPL дедушки C, массив был указателем. То есть то, что вы получили, когда писали (я транслитерировал на C) int a[10] был указатель с именем 'a', который указывал на достаточно места для хранения 10 целых чисел в другом месте. Таким образом, a + i и j + i имели одинаковую форму: добавьте содержимое пары ячеек памяти. На самом деле, я думаю, что BCPL был без типа, поэтому они были идентичны. И масштабирование по типу не применимо, поскольку BCPL был ориентирован исключительно на слова (также на машинах с адресной адресацией).
Я думаю, что лучший способ понять разницу - сравнить int*p = a; для int b = 5; В последнем случае «b» и «5» оба являются целыми числами, но «b» является переменной, а «5» является фиксированным значением. Аналогично, «p» и «a» оба являются адресами символа, но «a» является фиксированным значением.
О Боже!!! как кто-то может сказать, что предпочитает эту запись !!! Мне больно глаза !!!
Когда вы видите i[a][a][a] вы думаете, что я либо указатель на массив, либо массив указателя на массив или массив ... а a - это индекс. Когда вы видите a[a[a[i]]] , вы думаете, что a - указатель на массив или массив, а i - индекс.
Вот Это Да! Это очень крутое использование этой "глупой" функции. Может быть полезен в алгоритмическом конкурсе в некоторых задачах))
class Sub { public: int operator[](size_t nIndex) const { return 0; } friend int operator[](size_t nIndex, const Sub& This) { return 0; } };
Вы на самом деле пытались его скомпилировать? Существует множество операторов, которые не могут быть реализованы вне класса (то есть как нестатические функции)!
ой, ты прав. « operator[] должен быть нестатической функцией-членом с одним параметром». Я был знаком с этим ограничением на operator= , не думаю, что оно применяется к [] .
Конечно, если вы измените определение оператора [] , оно никогда не будет эквивалентным снова ... если a[b] равно *(a + b) и вы измените это, вам придется перегружать также int::operator[](const Sub&); и int это не класс ...
+ Я НЕ простое дополнение, потому что это арифметика указателя. если размер элемента a равен 1 (символ), то да, это как целое число +. Но если это (например) целое число, то оно может быть эквивалентно + 4 * i.
@AlexBrown Да, это арифметика указателей, и именно поэтому ваше последнее предложение неверно, если только вы сначала не приведете «a» к (char *) (при условии, что int равно 4 символам). Я действительно не понимаю, почему так много людей зацикливаются на фактическом значении результата арифметики с указателями. Вся цель арифметики указателей состоит в том, чтобы абстрагироваться от базовых значений указателя и позволить программисту думать об объектах, которыми манипулируют, а не об адресных значениях.

Mehrdad Afshari · Accepted Answer · 2008-12-19T17-32-00.000Z

1819

Лучший ответ

Стандарт C определяет оператор [] следующим образом:

a[b] == *(a + b)

Поэтому a[5] будет оценивать:

*(a + 5)

и 5[a] будут оценивать:

*(5 + a)

a является указателем на первый элемент массива. a[5] - это значение, которое 5 элементов дальше от a, что совпадает с *(a + 5), а из математики начальной школы мы знаем, что они равны (добавление commutative).

Mehrdad Afshari 19 дек. 2008, в 17:32

310

Интересно, не похоже ли это на * ((5 * sizeof (a)) + a). Отличное объяснение.
John MacIntyre 19 дек. 2008, в 17:06
0

Я полностью анальный ... поэтому я не мог устоять. ... оператор присваивания в названии также приводит меня к бананам ... но я не собираюсь быть такой большой ручкой. ;-)
John MacIntyre 19 дек. 2008, в 17:10
1

Извините, что «оператор присваивания» сводит вас с ума, однако я спрашиваю о математической эквивалентности, которая не представляет фрагмент кода, поэтому знак равенства является правильным. Спасибо за ответы!
Dinah 19 дек. 2008, в 17:11
2

Почему sizeof () учитывается. Я думал, что указатель на «а» находится в начале массива (то есть: элемент 0). Если это правда, вам нужно только * (+ 5). Мое понимание должно быть неверным. Какая правильная причина?
Dinah 19 дек. 2008, в 17:15
4

Если у вас есть массив 4-байтовых целых чисел, a [1] - a [0] = 4 (4-байтовая зависимость между двумя указателями).
Treb 19 дек. 2008, в 17:17
82

@Dinah: С точки зрения C-компилятора, вы правы. Размер sizeof не нужен, и те выражения, которые я упомянул, те же. Тем не менее, компилятор будет учитывать sizeof при создании машинного кода. Если a является массивом int, a[5] скомпилируется в нечто вроде mov eax, [ebx+20] вместо [ebx+5]
Mehrdad Afshari 19 дек. 2008, в 17:18
11

@Dinah: А это адрес, скажем, 0x1230. Если a был в 32-битном массиве int, то a [0] в 0x1230, a [1] в 0x1234, a [2] в 0x1238 ... a [5] в x1244 и т. Д. Если мы просто добавим 5 к 0x1230, мы получаем 0x1235, что неправильно.
James Curran 19 дек. 2008, в 17:21
2

@James: бинго Вот что мне нужно было увидеть. Я продолжал видеть sizeof () и думать count () и сильно запутался. Не мой самый яркий момент. Спасибо!
Dinah 19 дек. 2008, в 17:27
0

@Dinah; комментарий оператора присваивания был просто насмешливым комментарием о том, какой я анальный. ;-) ... Я знал, что ты имел в виду, и я уверен, что все остальные сделали то же самое. Отличный вопрос, кстати, я просто слушал ТАК-подкаст, где они об этом говорили.
John MacIntyre 19 дек. 2008, в 18:25
7

Таким образом, в случае 5 [a] компилятор достаточно умен, чтобы использовать «* ((5 * sizeof (a)) + a)», а не «* (5 + (a * sizeof (5)))»? Примечание: я так думаю. Я попробовал это в GCC, и это сработало.
Harvey 22 дек. 2008, в 18:27
30

@ sr105: Это особый случай для оператора +, где один из операндов является указателем, а другой - целым числом. Стандарт гласит, что результатом будет тип указателя. Компилятор / должен быть / достаточно умным.
aib 23 дек. 2008, в 02:08
2

комментарии никогда не всплывали в моей памяти
johnc 03 март 2009, в 08:01
6

Когда вы добавляете целое число к указателю, компилятор знает, на какой тип указывает указатель (поэтому, если a - это int *, это 4 байта или что-то еще ...), поэтому он может выполнять арифметическое право. В основном, если вы делаете «p ++», тогда p следует настроить так, чтобы он указывал на следующий объект в памяти. «p ++» в основном эквивалентен «p = p + 1», поэтому определение добавления указателя все выстраивает в линию. Также обратите внимание, что вы не можете делать арифметику с указателями типа void* .
araqnid 18 апр. 2009, в 01:03
1

@litb: я понимаю вашу заботу и потенциально "вводящих в заблуждение" людей. Однако я хотел сохранить простоту ответа, поскольку в этом контексте массив распадается на указатель. Я изменил «быть указателем» на «вести себя как указатели». Я надеюсь, что все в порядке. Спасибо за комментарий, кстати.
Mehrdad Afshari 21 сен. 2009, в 16:25
0

freeworld.thc.org/root/phun/unmaintain.html упоминает это как хорошую тактику запутывания, приводя пример myfunc(6291, 8)[Array]; где myfunc - это просто функция по модулю (это эквивалентно Array[3] )
Fahad Sadah 23 май 2010, в 12:16
0

@ Mehrdad Я думаю, что главная причина того, что за этот пост проголосовали больше, чем за этот пост (который определенно заслуживает того, чтобы быть на вершине), заключается в том, что этот пост решает относительно более простую проблему и, следовательно, все больше людей склонны понимать это. Анатомия эксплойта не так проста, и большинство людей просто пропустят это :)
Amarghosh 12 нояб. 2010, в 05:33
43

«Из математики начальной школы мы знаем, что они равны» - я понимаю, что вы упрощаете, но я с теми, кто считает, что это слишком упрощает. Это не элементарно, что *(10 + (int *)13) != *((int *)10 + 13) . Другими словами, здесь происходит больше, чем арифметика в начальной школе. Коммутативность критически зависит от компилятора, который распознает, какой операнд является указателем (и какой размер объекта). Другими словами, (1 apple + 2 oranges) = (2 oranges + 1 apple) , но (1 apple + 2 oranges) != (1 orange + 2 apples) .
LarsH 01 дек. 2010, в 20:54
5

@LarsH: Ты прав. Я бы сказал, что это больше (10in + 10cm) на (10in + 10cm) , чем на яблоки и апельсины (вы можете существенно преобразовать одно в другое).
Mehrdad Afshari 01 дек. 2010, в 21:53
5

@ Mehrdad: достаточно справедливо. Возможно, лучшая аналогия - дата против временного интервала, как в (May 1st 2010 + 3 weeks) .
LarsH 01 дек. 2010, в 23:37
0

«Это прямой артефакт массивов, которые ведут себя как указатели»: нет, массивы вообще не ведут себя как указатели.
Lightness Races in Orbit 14 авг. 2011, в 15:14
1

«a» является адресом памяти »: нет, не более x - это адрес памяти, если вы пишете int x; , Однако имя массива может уменьшаться до указателя на первый элемент этого массива.
Lightness Races in Orbit 14 авг. 2011, в 15:14
2

@ Томалак, я понимаю. Есть много мест, где это было актуально, и мы это обсуждали. Тем не менее, в то время как вопрос конкретно спрашивает о причине, почему это работает так, как это работает. Я не могу представить, что это поведение 5[a] если в исходной реализации C указатели не были на самом деле двоичными файлами, представляющими адреса памяти, непосредственно понятные для процессора. Если мы хотим быть слишком педантичными, ответ (на этот вопрос и многие другие) таков: «Поскольку стандарт определяет поведение оператора [] для типов int с одной стороны и типов массивов или указателей с другой».
Mehrdad Afshari 14 авг. 2011, в 22:21
1

@Джим: Нет, это потому, что типы , а не значения, одинаковы. Кроме того, арифметика начальной школы не может быть применена вслепую к арифметическим операторам. Рассмотрим INT_MAX - 5 + 1 против INT_MAX + 1 - 5 .
Ben Voigt 05 апр. 2013, в 17:27
0

@Jim: вряд ли. Тип a и тип 99 , конечно, не совпадают в этом вопросе.
Ben Voigt 05 апр. 2013, в 21:44
0

@Jim: Как это называется, когда вы редактируете свой комментарий, чтобы мой ответ выглядел глупо? Вам просто нужно посмотреть несколько комментариев, чтобы увидеть, что этот тип имеет значение. (10 + (int *)13) != ((int *)10 + 13) и это уже было указано.
Ben Voigt 06 апр. 2013, в 00:38
1

Кроме того, мое утверждение о том, что «арифметика начальной школы не может быть применена вслепую к арифметическим операторам», нуждается только в одном примере, чтобы доказать необходимость дальнейшего рассмотрения, а не слепого применения. И я могу привести несколько примеров. Вот еще один случай, когда тип важен: T a = 7.0; double x = a / 2.0; Ясно, a ли значение a int a или double имеет огромное значение для ответа
Ben Voigt 06 апр. 2013, в 00:41
0

Возможны дополнительные примеры из-за ограниченного диапазона и точности типов с плавающей точкой. Пример, который я выбрал изначально, я выбрал, потому что он включает целочисленное сложение, так же как и обсуждаемая проблема.
Ben Voigt 06 апр. 2013, в 00:45
2

@BenVoigt На самом деле я думаю, что ваш пример должен быть double x = a / 2; , Если это 2.0 результат будет double , независимо от того , является a int или double .
Dukeling 30 июль 2013, в 10:36
1

Что именно в начальной школе говорит, что добавление значений совершенно разных типов всегда должно быть коммутативным?
hamstergene 28 июнь 2014, в 20:36
0

@hamstergene Математика в начальной школе не говорит о типах. Моим ответом на вопрос ОП для вас будет «Единственный и верный ответ»: «потому что так говорит стандарт С».
Mehrdad Afshari 30 июнь 2014, в 01:53
1

@JohnMacIntyre Даже если оно не увеличивается автоматически, не должно ли оно быть *((5 * sizeof(*a)) + a) вместо *((5 * sizeof(a)) + a) ?
Bolun Zhang 17 июль 2014, в 17:35
0

из математики начальной школы мы знаем, что они равны , хорошо, что мы узнаем, что сложение коммутативно, но в случае значений одного типа! Так что не очевидно, что добавление указателя и целого числа является коммутативной операцией! Но это определяется стандартом ... Это не менее очевидно, чем добавление 5 к адресу не дает адрес + 5, но адрес + 5 * sizeof (тип)! Таким образом, арифметика указателей не так очевидна.
Jean-Baptiste Yunès 18 нояб. 2014, в 08:19
0

@ Жан-Батист Юнес Да. Технический ответ на вопрос: «потому что в спецификации языка сказано, что *(p+5) равно *(5+p) а a[b] равно *(a+b) ». Однако логическое обоснование для *(p+5) , равного *(5+p) , действительно соответствует «математике начальной школы».
Mehrdad Afshari 19 нояб. 2014, в 03:09
1

Конечно, но в соответствии с элементарной математикой не является обязательным требованием в арифметике указателей. Сумма «набирается» с типом указателя, поэтому она не настолько «естественна», так почему вы хотите, чтобы она была коммутативной? Только потому, что код, созданный на ассемблере, не имеет типа?
Jean-Baptiste Yunès 19 нояб. 2014, в 06:58
0

@ Jean-BaptisteYunès Это не требование. Это дизайнерское решение, принятое дизайнерами языка Си, по-видимому, в соответствии с коммутативностью оператора сложения. Конечно, при проектировании языка ничего не требуется в самом строгом смысле.
Mehrdad Afshari 19 нояб. 2014, в 07:21
1

@ Jean-BaptisteYunès & Mehrdad Afshari: Может быть, стоит упомянуть, что в языках ассемблера мы иногда используем постоянный базовый адрес таблицы и вычисленное смещение для выбора элемента массива, а иногда у нас есть постоянное смещение для элемента динамически выделенная структура. И оба типа доступа, const [var] и var [const] переводятся в одну и ту же инструкцию процессора. Возможно, C, как довольно низкий уровень среди языков высокого уровня, намеренно наследует эту эквивалентность.
CiaPan 14 апр. 2016, в 09:28
2

Небольшая история может помочь объяснить, почему это так. Как отмечено здесь: gotw.ca/conv/003.htm C и C ++ берут свое начало в BCPL. BCPL используется ! (aka pling) в качестве оператора косвенности, и он принимает две формы, одинарную и двоичную. !a унарный имеет то же значение, что и *a в C / C ++, то есть унарная косвенность. Двоичный файл a!b используется для поиска в массиве, эквивалентный a[b] в C. Так как двоичный файл ! является коммутативным в BCPL и имеет тот же эффект, что и !(a + b) Я очень сильно подозреваю, что именно поэтому косвенное поведение массива имеет такое же коммутативное поведение в C / C ++.
dgnuff 18 апр. 2018, в 23:14
0

@dgnuff Ух ты, спасибо!
Mehrdad Afshari 19 апр. 2018, в 06:51
0

Почему синтаксически разрешено индексировать целочисленные литералы по стандарту? Я не понимаю, как кто-то написал бы это намеренно. Стандарт, вероятно, допускает это, потому что добавление проверки сделает парсер / лексер компилятора немного более сложным. Но я думаю, что в современном мире влияние скорости на компиляцию будет минимальным, а улавливание непреднамеренного поведения очень полезно. Более новые версии GCC даже предупреждают о сбоях в коммутаторах, которые фактически используются преднамеренно. Так что ИМХО компиляторы должны хотя бы предупредить об этом. GCC 8.2 не -Wall предупреждение даже при -Wall .
Jan Christoph Terasa 08 нояб. 2018, в 06:00

Показать ещё 37 комментариев