Почему sizeof для структуры не равен сумме sizeof каждого члена?

Question

Почему sizeof для структуры не равен сумме sizeof каждого члена?

568

Почему оператор sizeof возвращает размер, более крупный для структуры, чем общие размеры элементов структуры?

Kevin 23 сен. 2008, в 04:13

Источник

12

Смотрите этот C FAQ по памяти. c-faq.com/struct/align.esr.html
Richard Chambers 26 апр. 2013, в 12:40
43

Анекдот: Был настоящий компьютерный вирус, который поместил свой код в struct paddings в основной программе.
Elazar 02 сен. 2013, в 17:58
2

@Elazar Это впечатляет! Я никогда бы не подумал, что можно использовать такие крошечные области для чего-либо. Можете ли вы предоставить более подробную информацию?
Wilson 14 нояб. 2016, в 18:59
1

@ Уилсон - я уверен, что это связано с большим количеством JMP.
hoodaticus 27 июнь 2017, в 21:59
0

См. Структурную прокладку, упаковку : Утерянное искусство структуры упаковки C Эрик С. Рэймонд
EsmaeelE 09 дек. 2017, в 13:53
0

SO, answer , Geeks4Geeks , другая ссылка
EsmaeelE 09 дек. 2017, в 13:55
0

Существуют ли отступы между 2 структурами, чтобы первый член следующей структуры начинался с выровненного адреса?
Akshay Immanuel D 07 фев. 2018, в 04:18
0

@Akshay Обе структуры начнут выравниваться (если вы не сделаете так, чтобы они не были ... побайтовыми сериализациями и т. Д.)
Matthew M. 14 апр. 2018, в 15:26

Показать ещё 6 комментариев

Теги:

c++

c

struct

sizeof

c++-faq

11 ответов

155

Выравнивание пакетов и байтов, как описано в C FAQ здесь:

Это для выравнивания. Многие процессоры не могут получить доступ к 2- и 4-байтам количества (например, ints и long ints), если они переполнены каждый, который-путь.

Предположим, что у вас есть эта структура:
struct {
    char a[3];
    short int b;
    long int c;
    char d[3];
};
Теперь вы можете подумать, что это должно быть возможно, чтобы упаковать это структура в память:
+-------+-------+-------+-------+
|           a           |   b   |
+-------+-------+-------+-------+
|   b   |           c           |
+-------+-------+-------+-------+
|   c   |           d           |
+-------+-------+-------+-------+
Но на процессоре гораздо проще, если компилятор устраивает это примерно так:
+-------+-------+-------+
|           a           |
+-------+-------+-------+
|       b       |
+-------+-------+-------+-------+
|               c               |
+-------+-------+-------+-------+
|           d           |
+-------+-------+-------+
В упакованной версии обратите внимание, как это по крайней мере немного сложно вы и я, чтобы посмотреть, как обтекают поля b и c? В двух словах, это тоже сложно для процессора. Поэтому большинство компиляторов будут (как будто с дополнительными невидимыми полями):
+-------+-------+-------+-------+
|           a           | pad1  |
+-------+-------+-------+-------+
|       b       |     pad2      |
+-------+-------+-------+-------+
|               c               |
+-------+-------+-------+-------+
|           d           | pad3  |
+-------+-------+-------+-------+

EmmEff 23 сен. 2008, в 05:18

0

Теперь, что такое использование слотов памяти pad1, pad2 и pad3.
laki 26 дек. 2016, в 06:07
6

@YoYoYonnY это невозможно. Компилятору не разрешается изменять порядок членов структуры, хотя у gcc есть экспериментальная опция для этого
phuclv 02 март 2017, в 02:57

23

Если вы хотите, чтобы структура имела определенный размер с GCC, например, используйте __attribute__((packed)).

В Windows вы можете установить выравнивание в один байт при использовании компилятора cl.exe с параметром /Zp.

Обычно для ЦП проще получить доступ к данным, которые представляют собой несколько из 4 (или 8), зависящих от платформы, а также от компилятора.

Итак, это вопрос выравнивания в основном.

У вас должны быть веские причины для его изменения.

INS 23 сен. 2008, в 08:34

5

«веские причины» Пример: поддержание бинарной совместимости (дополнения) между 32-битной и 64-битной системами для сложной структуры в демонстрационном коде для проверки концепции, который будет продемонстрирован завтра. Иногда необходимость должна иметь приоритет над уместностью.
Mr.Ree 08 дек. 2008, в 04:58
2

Все в порядке, кроме случаев, когда вы упоминаете операционную систему. Это проблема скорости процессора, ОС вообще не задействована.
Blaisorblade 12 янв. 2009, в 02:51
3

Еще одна веская причина, если вы вставляете поток данных в структуру, например, при разборе сетевых протоколов.
ceo 20 окт. 2009, в 15:18
0

@Blaisorblade Хотя архитектура процессора является наиболее важным моментом, ОС также может иметь значение. Подумайте о процессоре x86, работающем в реальном режиме (MS-DOS) и защищенном режиме (Windows, Linux ...).
dolmen 20 авг. 2013, в 07:50
1

@dolmen Я только что отметил, что «Системе Operatin легче получать доступ к данным» неверно, поскольку ОС не имеет доступа к данным.
Blaisorblade 24 авг. 2013, в 17:44
1

@dolmen На самом деле, стоит поговорить об ABI (двоичный интерфейс приложения). Выравнивание по умолчанию (используется, если вы не меняете его в источнике) зависит от ABI, и многие ОС поддерживают несколько ABI (скажем, 32- и 64-разрядных, или для двоичных файлов из разных ОС, или для разных способов компиляции одни и те же двоичные файлы для той же ОС). OTOH, то, какое выравнивание удобно с точки зрения производительности, зависит от процессора - к памяти обращаются одинаково, независимо от того, используете ли вы 32- или 64-битный режим (я не могу комментировать реальный режим, но в настоящее время вряд ли имеет значение для производительности). IIRC Pentium начал отдавать предпочтение 8-байтовому выравниванию.
Blaisorblade 24 авг. 2013, в 17:46
1

__attribute__((packed)) в некоторых случаях потенциально небезопасен: stackoverflow.com/q/8568432/827263
Keith Thompson 10 июнь 2015, в 15:41

Показать ещё 5 комментариев

11

Это может быть связано с выравниванием и дополнением байт, так что структура выходит на четное количество байтов (или слов) на вашей платформе. Например, в C на Linux следующие 3 структуры:

#include "stdio.h"


struct oneInt {
  int x;
};

struct twoInts {
  int x;
  int y;
};

struct someBits {
  int x:2;
  int y:6;
};


int main (int argc, char** argv) {
  printf("oneInt=%zu\n",sizeof(struct oneInt));
  printf("twoInts=%zu\n",sizeof(struct twoInts));
  printf("someBits=%zu\n",sizeof(struct someBits));
  return 0;
}

У членов, размер (в байтах) которых составляет 4 байта (32 бита), 8 байтов (2x 32 бит) и 1 байт (2 + 6 бит) соответственно. Вышеупомянутая программа (в Linux с использованием gcc) печатает размеры 4, 8 и 4 - где последняя структура дополняется, так что это одно слово (4 x 8 бит байтов на моей 32-битной платформе).

oneInt=4
twoInts=8
someBits=4

Kyle Burton 23 сен. 2008, в 06:20

4

«C на Linux используя gcc» недостаточно для описания вашей платформы. Выравнивание в основном зависит от архитектуры процессора.
dolmen 20 авг. 2013, в 07:46
0

- @ Кайл Бертон. Извините, я не понимаю, почему размер структуры "someBits" равен 4, я ожидаю 8 байтов, поскольку объявлено 2 целых числа (2 * sizeof (int)) = 8 байтов. Спасибо
youpilat13 04 июль 2018, в 15:04
1

Привет @ youpilat13,: :2 и :6 на самом деле задают 2 и 6 бит, в данном случае это не 32-битные целые числа. someBits.x, будучи только 2 битами, может хранить только 4 возможных значения: 00, 01, 10 и 11 (1, 2, 3 и 4). Имеет ли это смысл? Вот статья об этой функции: geeksforgeeks.org/bit-fields-c
Kyle Burton 13 июль 2018, в 00:44

Показать ещё 1 комментарий

9

См. также:

для Microsoft Visual C:

http://msdn.microsoft.com/en-us/library/2e70t5y1%28v=vs.80%29.aspx

и совместимость GCC с компилятором Microsoft.:

http://gcc.gnu.org/onlinedocs/gcc/Structure_002dPacking-Pragmas.html

В дополнение к предыдущим ответам обратите внимание на то, что независимо от упаковки в С++ нет гарантии для членов-заказчиков. Компиляторы могут (и, конечно же, делать) добавлять в структуру элементов виртуальной таблицы и базовых структур. Даже существование виртуальной таблицы не обеспечивается стандартом (реализация виртуального механизма не указана), и поэтому можно сделать вывод, что такая гарантия просто невозможна.

Я уверен, что порядок членов гарантирован в C, но я не стал бы рассчитывать на это, когда писал кросс-платформенную или кросс-компиляторную программу.

lkanab 31 май 2011, в 10:49

3

«Я совершенно уверен, что членский ордер хрюкает в C». Да, C99 говорит: «Внутри объекта структуры члены, не являющиеся битовыми полями, и блоки, в которых находятся битовые поля, имеют адреса, которые увеличиваются в порядке их объявления». Больше стандартного совершенства в: stackoverflow.com/a/37032302/895245
Ciro Santilli 新疆改造中心六四事件法轮功 04 май 2016, в 15:39
2

в C ++ есть некоторая гарантия порядка: «Нестатические члены данных (не объединяющего) класса, объявленные без промежуточного спецификатора доступа, распределяются так, чтобы более поздние члены имели более высокие адреса в объекте класса»
jfs 10 апр. 2017, в 20:40

6

Размер структуры больше, чем сумма ее частей из-за того, что называется упаковкой. У конкретного процессора есть предпочтительный размер данных, с которым он работает. Большинство современных процессоров предпочитают размер, если 32 бит (4 байта). Доступ к памяти, когда данные находятся на этом типе границы, более эффективен, чем те, которые охватывают эту границу размера.

Например. Рассмотрим простую структуру:

struct myStruct
{
   int a;
   char b;
   int c;
} data;

Если машина является 32-разрядной машиной, а данные выровнены по 32-битной границе, мы видим немедленную проблему (при отсутствии выравнивания структуры). В этом примере предположим, что данные структуры начинаются с адреса 1024 (0x400 - обратите внимание, что младшие 2 бита равны нулю, поэтому данные выравниваются с 32-разрядной границей). Доступ к data.a будет работать нормально, потому что он начинается на границе - 0x400. Доступ к data.b также будет работать нормально, поскольку он находится по адресу 0x404 - еще одна 32-разрядная граница. Но неуравновешенная структура поставит data.c по адресу 0x405. 4 байта данных .c находятся в 0x405, 0x406, 0x407, 0x408. На 32-битной машине система считывала data.c в течение одного цикла памяти, но получала бы только 3 из 4 байтов (четвертый байт находится на следующей границе). Таким образом, системе потребуется второй доступ к памяти для получения 4-го байта,

Теперь, если вместо того, чтобы помещать data.c в адрес 0x405, компилятор заполнил структуру на 3 байта и поместил data.c по адресу 0x408, тогда системе понадобится всего 1 цикл для чтения данных, этот элемент данных на 50%. Заполняет эффективность памяти для эффективности обработки. Учитывая, что компьютеры могут иметь огромные объемы памяти (много гигабайт), компиляторы считают, что обмен (скорость по размеру) является разумным.

К сожалению, эта проблема становится убийцей при попытке отправить структуры по сети или даже записать двоичные данные в двоичный файл. Прокладка, вставленная между элементами структуры или класса, может нарушить данные, отправленные в файл или сеть. Чтобы написать переносимый код (тот, который будет использоваться для нескольких разных компиляторов), вам, вероятно, придется обращаться к каждому элементу структуры отдельно, чтобы обеспечить надлежащую "упаковку".

С другой стороны, разные компиляторы имеют разные возможности для управления упаковкой структуры данных. Например, в Visual C/С++ компилятор поддерживает команду #pragma pack. Это позволит вам настроить упаковку и выравнивание данных.

Например:

#pragma pack 1
struct MyStruct
{
    int a;
    char b;
    int c;
    short d;
} myData;

I = sizeof(myData);

Теперь я должен иметь длину 11. Без прагмы я мог бы быть чем угодно от 11 до 14 (а для некоторых систем - целых 32), в зависимости от упаковки по умолчанию компилятора.

sid1138 10 июнь 2015, в 16:48

0

Здесь обсуждаются последствия заполнения структуры, но это не отвечает на вопрос.
Keith Thompson 10 июнь 2015, в 15:39
0

« ... из-за того, что называется упаковкой ... - я думаю, что вы имеете в виду« заполнение ».« Предпочтительный размер большинства современных процессоров, если 32- битный (4 байта) »- это немного упрощение. Обычно поддерживаются размеры 8, 16, 32 и 64 бита, часто каждый размер имеет свое выравнивание, и я не уверен, что ваш ответ добавляет какую-либо новую информацию, которой еще нет в принятом ответе.
Keith Thompson 12 июнь 2015, в 16:02
1

Когда я сказал «упаковка», я имел в виду, как компилятор упаковывает данные в структуру (и это можно сделать, заполнив небольшие элементы, но он не должен заполняться, но он всегда упаковывается). Что касается размера - я говорил об архитектуре системы, а не о том, что система будет поддерживать для доступа к данным (что сильно отличается от базовой архитектуры шины). Что касается вашего последнего комментария, я дал упрощенное и расширенное объяснение одного аспекта компромисса (скорость по сравнению с размером) - основная проблема программирования. Я также описываю способ решения проблемы - этого не было в принятом ответе.
sid1138 12 июнь 2015, в 21:12
0

«Упаковка» в этом контексте обычно относится к более узкому распределению членов, чем по умолчанию, как с #pragma pack . Если члены располагаются по их выравниванию по умолчанию, я бы сказал, что структура не упакована.
Keith Thompson 12 июнь 2015, в 21:16
0

Упаковка - это перегруженный термин. Это означает, как вы помещаете элементы структуры в память. Аналогично смыслу помещения предметов в коробку (упаковка для перемещения). Это также означает помещение элементов в память без заполнения (что-то вроде короткой руки для «плотно упакованного»). Тогда есть версия команды слова в команде #pragma pack.
sid1138 13 июнь 2015, в 21:04

Показать ещё 3 комментария

5

C99 N1256 стандартная черта

http://www.open-std.org/JTC1/SC22/WG14/www/docs/n1256.pdf

6.5.3.4 Оператор sizeof:

3 При применении к операнду, который имеет структуру или тип объединения, результатом является общее количество байтов в таком объекте, включая внутреннюю и заднюю прокладку.

6.7.2.1 Спецификаторы структуры и объединения:

13... Может быть неназванный заполнение внутри объекта структуры, но не в начале.

и

15 В конце структуры или объединения может быть неназванное заполнение.

Новая функция члена C99 гибкого элемента массива (struct S {int is[];};) также может влиять на заполнение:

16 В качестве особого случая последний элемент структуры с более чем одним именованным элементом может имеют неполный тип массива; это называется гибким элементом массива. В большинстве ситуаций, гибкий элемент массива игнорируется. В частности, размер структуры выглядит так, как если бы гибкий элемент массива был исключен, за исключением того, что он может иметь более длинное дополнение, чем упущение будет означать.

Приложение J Проблемы с переносимостью повторяется:

Следующие неуказаны:...

Значение байтов заполнения при хранении значений в структурах или объединениях (6.2.6.1)

С++ 11 Стандартная черновая версия N3337

http://www.open-std.org/jtc1/sc22/wg21/docs/papers/2012/n3337.pdf

5.3.3 Размер:

2 При применении к классу, результатом является количество байтов в объекте этого класса, включая любое дополнение, требуемое для размещение объектов этого типа в массиве.

9.2 Члены класса:

Указатель на объект структуры стандартного макета, соответствующим образом преобразованный с использованием reinterpret_cast, указывает на его начальный член (или если этот элемент является битовым полем, а затем блоку, в котором он находится) и наоборот. [ Заметка: Поэтому может быть неназванное заполнение внутри объекта структуры стандартного макета, но не в его начале, по мере необходимости, для обеспечения надлежащего согласования. - конечная нота]

Я знаю только С++, чтобы понять примечание: -)

Ciro Santilli 新疆改造中心六四事件法轮功 04 май 2016, в 16:35

5

Это может быть сделано, если вы неявно или явно устанавливаете выравнивание структуры. Строка, которая выровнена 4, всегда будет кратной 4 байтам, даже если размер ее членов будет чем-то не кратным 4 байтам.

Также библиотека может быть скомпилирована в x86 с 32-битными int и вы можете сравнивать ее компоненты в 64-битном процессе, это даст вам другой результат, если вы делаете это вручную.

Orion Adrian 23 сен. 2008, в 05:34

4

В дополнение к другим ответам структура может (но обычно не имеет) иметь виртуальные функции, и в этом случае размер структуры также будет содержать пространство для vtbl.

JohnMcG 23 сен. 2008, в 14:32

8

Не совсем. В типичных реализациях в структуру добавляется указатель vtable.
Don Wakefield 18 окт. 2008, в 03:16

3

Язык C оставляет компилятору некоторую свободу в отношении расположения структурных элементов в памяти:

могут появляться отверстия памяти между любыми двумя компонентами и после последнего компонента. Это было связано с тем, что определенные типы объектов на конечном компьютере могут быть ограничены границами адресации
размер "ячеек памяти", включенный в результат оператора sizeof. Размер sizeof не включает в себя размер гибкого массива, который доступен в C/С++
Некоторые реализации языка позволяют вам управлять компоновкой памяти структур через параметры прагмы и компилятора.

Язык C предоставляет некоторую уверенность программисту в компоновке элементов в структуре:

компиляторы должны назначать последовательность компонентов, увеличивая адреса памяти
Адрес первого компонента совпадает с начальным адресом структуры
неназванные битовые поля могут быть включены в структуру в требуемые выравнивания адресов соседних элементов.

Проблемы, связанные с выравниванием элементов:

Различные компьютеры строят границы объектов по-разному.
Различные ограничения ширины битового поля
Компьютеры отличаются тем, как хранить байты в слове (Intel 80x86 и Motorola 68000).

Как работает выравнивание:

Объем, занимаемый структурой, вычисляется как размер выровненного одиночного элемента массива таких структур. Структура должна чтобы первый элемент следующей ниже структуры не нарушал требования выравнивания.

p.s Более подробная информация доступна здесь: "Сэмюэл П. Харбисон, Гай Л. Стейле C Ссылка, (5.6.2 - 5.6.7)"

bruziuz 28 июль 2015, в 22:15

2

Идея заключается в том, что для соображений скорости и кеширования операнды следует читать с адресов, соответствующих их естественному размеру. Чтобы это произошло, элементы структуры компоновщика компилируются так, чтобы следующий член или следующая структура были выровнены.

struct pixel {
    unsigned char red;   // 0
    unsigned char green; // 1
    unsigned int alpha;  // 4 (gotta skip to an aligned offset)
    unsigned char blue;  // 8 (then skip 9 10 11)
};

// next offset: 12

Архитектура x86 всегда могла получать неверные адреса. Тем не менее, он медленнее, и когда несоосность перекрывает две разные строки кэша, тогда он вытесняет две строки кэша, когда выровненный доступ будет вытеснять только один.

Некоторым архитектурам действительно приходится ловить ложные чтения и записи и ранние версии архитектуры ARM (той, которая развивалась во всех современных мобильных процессорах)... ну, на самом деле они просто вернули для них плохие данные. (Они игнорировали младшие разряды.)

Наконец, обратите внимание, что строки кэша могут быть сколь угодно большими, и компилятор не пытается угадать их или сделать компромисс между пространством и скоростью. Вместо этого решения выравнивания являются частью ABI и представляют собой минимальное выравнивание, которое в конечном итоге равномерно заполняет линию кэша.

TL; DR: выравнивание важно.

DigitalRoss 24 фев. 2016, в 08:11

Ещё вопросы

Смотрите этот C FAQ по памяти. c-faq.com/struct/align.esr.html
Анекдот: Был настоящий компьютерный вирус, который поместил свой код в struct paddings в основной программе.
@Elazar Это впечатляет! Я никогда бы не подумал, что можно использовать такие крошечные области для чего-либо. Можете ли вы предоставить более подробную информацию?
@ Уилсон - я уверен, что это связано с большим количеством JMP.
См. Структурную прокладку, упаковку : Утерянное искусство структуры упаковки C Эрик С. Рэймонд
SO, answer , Geeks4Geeks , другая ссылка
Существуют ли отступы между 2 структурами, чтобы первый член следующей структуры начинался с выровненного адреса?
@Akshay Обе структуры начнут выравниваться (если вы не сделаете так, чтобы они не были ... побайтовыми сериализациями и т. Д.)
Теперь, что такое использование слотов памяти pad1, pad2 и pad3.
@YoYoYonnY это невозможно. Компилятору не разрешается изменять порядок членов структуры, хотя у gcc есть экспериментальная опция для этого
«веские причины» Пример: поддержание бинарной совместимости (дополнения) между 32-битной и 64-битной системами для сложной структуры в демонстрационном коде для проверки концепции, который будет продемонстрирован завтра. Иногда необходимость должна иметь приоритет над уместностью.
Все в порядке, кроме случаев, когда вы упоминаете операционную систему. Это проблема скорости процессора, ОС вообще не задействована.
Еще одна веская причина, если вы вставляете поток данных в структуру, например, при разборе сетевых протоколов.
@Blaisorblade Хотя архитектура процессора является наиболее важным моментом, ОС также может иметь значение. Подумайте о процессоре x86, работающем в реальном режиме (MS-DOS) и защищенном режиме (Windows, Linux ...).
@dolmen Я только что отметил, что «Системе Operatin легче получать доступ к данным» неверно, поскольку ОС не имеет доступа к данным.
@dolmen На самом деле, стоит поговорить об ABI (двоичный интерфейс приложения). Выравнивание по умолчанию (используется, если вы не меняете его в источнике) зависит от ABI, и многие ОС поддерживают несколько ABI (скажем, 32- и 64-разрядных, или для двоичных файлов из разных ОС, или для разных способов компиляции одни и те же двоичные файлы для той же ОС). OTOH, то, какое выравнивание удобно с точки зрения производительности, зависит от процессора - к памяти обращаются одинаково, независимо от того, используете ли вы 32- или 64-битный режим (я не могу комментировать реальный режим, но в настоящее время вряд ли имеет значение для производительности). IIRC Pentium начал отдавать предпочтение 8-байтовому выравниванию.
__attribute__((packed)) в некоторых случаях потенциально небезопасен: stackoverflow.com/q/8568432/827263
«C на Linux используя gcc» недостаточно для описания вашей платформы. Выравнивание в основном зависит от архитектуры процессора.
- @ Кайл Бертон. Извините, я не понимаю, почему размер структуры "someBits" равен 4, я ожидаю 8 байтов, поскольку объявлено 2 целых числа (2 * sizeof (int)) = 8 байтов. Спасибо
Привет @ youpilat13,: :2 и :6 на самом деле задают 2 и 6 бит, в данном случае это не 32-битные целые числа. someBits.x, будучи только 2 битами, может хранить только 4 возможных значения: 00, 01, 10 и 11 (1, 2, 3 и 4). Имеет ли это смысл? Вот статья об этой функции: geeksforgeeks.org/bit-fields-c
«Я совершенно уверен, что членский ордер хрюкает в C». Да, C99 говорит: «Внутри объекта структуры члены, не являющиеся битовыми полями, и блоки, в которых находятся битовые поля, имеют адреса, которые увеличиваются в порядке их объявления». Больше стандартного совершенства в: stackoverflow.com/a/37032302/895245
в C ++ есть некоторая гарантия порядка: «Нестатические члены данных (не объединяющего) класса, объявленные без промежуточного спецификатора доступа, распределяются так, чтобы более поздние члены имели более высокие адреса в объекте класса»
Здесь обсуждаются последствия заполнения структуры, но это не отвечает на вопрос.
« ... из-за того, что называется упаковкой ... - я думаю, что вы имеете в виду« заполнение ».« Предпочтительный размер большинства современных процессоров, если 32- битный (4 байта) »- это немного упрощение. Обычно поддерживаются размеры 8, 16, 32 и 64 бита, часто каждый размер имеет свое выравнивание, и я не уверен, что ваш ответ добавляет какую-либо новую информацию, которой еще нет в принятом ответе.
Когда я сказал «упаковка», я имел в виду, как компилятор упаковывает данные в структуру (и это можно сделать, заполнив небольшие элементы, но он не должен заполняться, но он всегда упаковывается). Что касается размера - я говорил об архитектуре системы, а не о том, что система будет поддерживать для доступа к данным (что сильно отличается от базовой архитектуры шины). Что касается вашего последнего комментария, я дал упрощенное и расширенное объяснение одного аспекта компромисса (скорость по сравнению с размером) - основная проблема программирования. Я также описываю способ решения проблемы - этого не было в принятом ответе.
«Упаковка» в этом контексте обычно относится к более узкому распределению членов, чем по умолчанию, как с #pragma pack . Если члены располагаются по их выравниванию по умолчанию, я бы сказал, что структура не упакована.
Упаковка - это перегруженный термин. Это означает, как вы помещаете элементы структуры в память. Аналогично смыслу помещения предметов в коробку (упаковка для перемещения). Это также означает помещение элементов в память без заполнения (что-то вроде короткой руки для «плотно упакованного»). Тогда есть версия команды слова в команде #pragma pack.
Не совсем. В типичных реализациях в структуру добавляется указатель vtable.

Kevin · Accepted Answer · 2008-09-23T04-45-00.000Z

Это связано с добавлением дополнений, чтобы удовлетворить ограничениям выравнивания. Сопоставление структуры данных влияет как на производительность, так и на правильность программ:

Несогласованный доступ может быть жесткой ошибкой (часто SIGBUS).
Несогласованный доступ может быть мягкой ошибкой.
- Либо скорректировано на аппаратном уровне, для скромного снижения производительности.
- Или исправлено с помощью эмуляции в программном обеспечении, для серьезной деградации производительности.
- Кроме того, атомарность и другие concurrency -гаранты могут быть разбиты, что приводит к тонким ошибкам.

Здесь приведен пример типичных настроек для процессора x86 (все используемые 32 и 64-битные режимы):

struct X
{
    short s; /* 2 bytes */
             /* 2 padding bytes */
    int   i; /* 4 bytes */
    char  c; /* 1 byte */
             /* 3 padding bytes */
};

struct Y
{
    int   i; /* 4 bytes */
    char  c; /* 1 byte */
             /* 1 padding byte */
    short s; /* 2 bytes */
};

struct Z
{
    int   i; /* 4 bytes */
    short s; /* 2 bytes */
    char  c; /* 1 byte */
             /* 1 padding byte */
};

const int sizeX = sizeof(struct X); /* = 12 */
const int sizeY = sizeof(struct Y); /* = 8 */
const int sizeZ = sizeof(struct Z); /* = 8 */

Можно минимизировать размер структур, сортируя элементы путем выравнивания (сортировка по размеру достаточна для базовых типов) (например, структура Z в приведенном выше примере).

ВАЖНОЕ ЗАМЕЧАНИЕ: Стандарты C и С++ указывают, что выравнивание структуры определяется реализацией. Поэтому каждый компилятор может выбрать выравнивание данных по-разному, что приводит к разным и несовместимым макетам данных. По этой причине при работе с библиотеками, которые будут использоваться разными компиляторами, важно понять, как компиляторы выравнивают данные. Некоторые компиляторы имеют параметры командной строки и/или специальные инструкции #pragma для изменения настроек выравнивания структуры.

Я хочу отметить здесь: большинство процессоров наказывают вас за невыровненный доступ к памяти (как вы упоминали), но вы не можете забыть, что многие полностью запрещают его. В частности, большинство микросхем MIPS будут создавать исключение для неприсоединенного доступа.
Чипы x86 на самом деле довольно уникальны в том смысле, что они допускают невыровненный доступ, хотя и штрафуются; AFAIK большинство фишек будут бросать исключения, а не только некоторые. PowerPC является еще одним распространенным примером.
Включение прагм для невыровненного доступа обычно приводит к тому, что размер кода увеличивается, на процессорах, которые генерируют ошибки смещения, так как должен быть сгенерирован код для устранения каждого смещения. ARM также выбрасывает ошибки смещения.
@ Темно - полностью согласен. Но большинство настольных процессоров имеют архитектуру x86 / x64, поэтому большинство чипов не выдают ошибки выравнивания данных;)
Нераспределенный доступ к данным, как правило, есть в архитектурах CISC, и большинство архитектур RISC не включают его (ARM, MIPS, PowerPC, Cell). На самом деле, большинство микросхем НЕ являются настольными процессорами, для встроенного правила по количеству микросхем, и подавляющее большинство из них - архитектуры RISC.
Нераспределенная ловушка доступа (или, конечно, использовавшаяся) используется в реализациях функционального языка для тегирования значений, чтобы их сборщики мусора могли знать, на какую произвольную память они смотрят. В общем, очень умный взлом (слишком умный для использования в моем коде, согласно изречению Кернигана).
Быть педантичным, не гарантирует ли стандартное выравнивание, если все члены структуры имеют тип char?
@Kerrek SB: Стандарт гарантирует выравнивание для любой структуры независимо от используемых типов. Однако для символа размером 1 байт его невозможно выровнять. Таким образом, стандарт гарантирует выравнивание, если все члены структуры являются char БЕЗ КАКИХ-ЛИБО ПОДДЕРЖКИ.
@LaraDougan: да, и почему-то есть простое правило, которое мы можем обосновать, чтобы понять, почему это так. Стоимость за чип. Настольные чипы x86 - это потребительские товары на сотни долларов. Ничто не терпимо для большинства промышленных применений, обычно промышленность имеет дело с чипами менее 1 доллара или почти. Легко видеть, насколько широко это затронуто.
Почему для первого char есть 3 байта заполнения, а для следующих 2 - только 1 байт?
@WayneO Количество отступов всегда достаточно, чтобы убедиться, что все последующее выровнено в соответствии с его размером. Таким образом, в X есть 2 байта заполнения после short чтобы гарантировать, что 4 байта int начинаются на границе 4 байта. В Y после 1 char 1 байт, чтобы убедиться, что 2-байтовое short начинается на 2-байтовой границе. Поскольку компилятор не может знать, что может быть после структуры в памяти (а это может быть много разных вещей), он готовится к худшему и вставляет достаточное количество отступов, чтобы сделать структуру кратной 4 байтам. X нужно 3 байта, чтобы добраться до 12, Y нужно только 1 для 8.
«Чипы x86 имеют аппаратную поддержку для выравнивания доступа» True. «Чипы x86 не выдают ошибки выравнивания данных» False. Это зависит от инструкции, в частности, инструкции SSE имеют тенденцию к ошибкам из-за смещения (за исключением особых не выровненных вариаций).
Существуют ли отступы между 2 структурами, чтобы первый член следующей структуры начинался с выровненного адреса?
@AkshayImmanuelD: Нет, между структурами нет, это часть конца структуры. struct {long long a; char b;} обычно имеет 7 байтов заполнения в конце после b , что составляет 16 байтов. (на большинстве 64-битных архитектур yada yada)