Разница между malloc и calloc?

Question

Разница между malloc и calloc?

620

В чем разница между выполнением:

ptr = (char **) malloc (MAXELEMS * sizeof(char *));

или

ptr = (char **) calloc (MAXELEMS, sizeof(char*));

Когда полезно использовать calloc над malloc или наоборот?

user105033 08 окт. 2009, в 14:59

Источник

23

В C вы не разыгрываете результат семьи malloc
phuclv 17 фев. 2016, в 07:55
6

В C вы могли бы написать выше более обобщенно как: ptr = calloc(MAXELEMS, sizeof(*ptr));
chqrlie 26 окт. 2016, в 07:19
5

Интересный пост о разнице между calloc и malloc + memset vorpus.org/blog/why-does-calloc-exist
ddddavidee 13 дек. 2016, в 16:06
2

@ddddavidee Я тоже нашел этот блог после того, как был недоволен большим количеством ответов в сети. Натаниэль Дж. Смит заслуживает более 100 баллов за свой анализ.
lifebalance 10 апр. 2018, в 14:59
0

Связано: Может ли calloc () выделить больше, чем SIZE_MAX?
MCCCS 10 окт. 2018, в 11:07

Показать ещё 3 комментария

Теги:

c

malloc

calloc

18 ответов

341

Менее известное различие заключается в том, что в операционных системах с оптимистичным распределением памяти, например Linux, указатель, возвращаемый malloc, не поддерживается реальной памятью, пока программа не коснется его.

calloc действительно касается памяти (он записывает нули на нем), и, таким образом, вы будете уверены, что ОС поддерживает выделение с помощью фактической RAM (или свопинга). Именно поэтому он медленнее, чем malloc (не только он должен его обнулить, но и операционная система должна найти подходящую область памяти, возможно, заменяя другие процессы)

См. например этот вопрос SO для дальнейшего обсуждения поведения malloc

Isak Savo 18 окт. 2009, в 22:33

44

calloc не нужно писать нули. Если выделенный блок состоит в основном из новых нулевых страниц, предоставляемых операционной системой, он может оставить их нетронутыми. Это, конечно, требует, чтобы calloc был настроен на операционную систему, а не на общую библиотечную функцию поверх malloc . Или разработчик может заставить calloc сравнивать каждое слово с нулем, прежде чем обнулять его. Это не сэкономит время, но предотвратит загрязнение новых страниц.
R.. 04 янв. 2011, в 13:46
3

@R .. интересная заметка. Но на практике, такие реализации существуют в дикой природе?
Isak Savo 04 янв. 2011, в 14:00
10

Все реализации, dlmalloc пропускают memset если блок был получен путем mmap новых анонимных страниц (или их эквивалента). Обычно этот вид распределения используется для больших кусков, начиная с 256 КБ или около того. Я не знаю ни одной реализации, которая делает сравнение с нулем, прежде чем писать ноль, кроме моей собственной.
R.. 05 янв. 2011, в 15:57
1

omalloc также пропускает memset ; calloc не нужно когда-либо касаться страниц, которые еще не используются приложением (кеш страниц). Тем не менее, чрезвычайно примитивные реализации calloc отличаются.
mirabilos 31 март 2014, в 21:05
9

Calloc в glibc проверяет, получает ли она свежую память от ОС. Если это так, он знает, что не нужно его писать, потому что mmap (..., MAP_ANONYMOUS) возвращает память, которая уже обнулена.
Peter Cordes 07 дек. 2014, в 22:45
0

В Windows VirtualAlloc также выделяет предварительно обнуленную память.
Joe 02 март 2015, в 12:29
0

также это зависит от того, занимает ли выделение несколько страниц виртуальной памяти или нет; если она соответствует текущей странице, то чаще всего есть заголовок арены, который находится перед возвращенной памятью и который должен быть изменен, тем самым превращая страницу в грязное состояние. (связанный вопрос говорит о действительно большом распределении, которое охватывает много страниц)
MichaelMoser 27 июнь 2015, в 19:40

Показать ещё 5 комментариев

99

Одним из часто забываемых преимуществ calloc является то, что (соответствующие реализации) он поможет защитить вас от целых уязвимостей переполнения. Для сравнения:

size_t count = get_int32(file);
struct foo *bar = malloc(count * sizeof *bar);

против.

size_t count = get_int32(file);
struct foo *bar = calloc(count, sizeof *bar);

Первый может привести к крошечному распределению и последующему переполнению буфера, если count больше, чем SIZE_MAX/sizeof *bar. В этом случае последний будет автоматически терпеть неудачу, так как объект, который нельзя создать большим,

Конечно, вам, возможно, придется следить за несоответствующими реализациями, которые просто игнорируют возможность переполнения... Если это касается проблем на платформах, на которые вы нацелились, вам придется вручную выполнить проверку переполнения.

R.. 13 авг. 2010, в 18:08

17

По-видимому, именно арифметическое переполнение стало причиной дыры в OpenSSH в 2002 году. Хорошая статья от OpenBSD об опасностях этого с функциями, связанными с памятью: undeadly.org/cgi?action=article&sid=20060330071917
Komrade P. 24 апр. 2014, в 14:35
4

@ KomradeP .: Интересно. К сожалению, статья, на которую вы ссылаетесь, имеет дезинформацию в самом начале. Пример с char - это не переполнение, а преобразование, определяемое реализацией, при присваивании результата обратно в объект char .
R.. 24 апр. 2014, в 15:32
0

Это возможно только для иллюстрации. Потому что компилятор все равно может оптимизировать это. Мой компилируется в этот ассм: push 1.
Komrade P. 24 апр. 2014, в 17:22
0

Вы должны заметить где-то в этом ответе, что вы принимаете 32-битный size_t потому что я не вижу проблемы, когда size_t имеет ширину 64 бита.
Patrick Schlüter 20 сен. 2014, в 07:44
1

@tristopia: Дело не в том, что код можно использовать во всех реализациях, а в том, что он некорректен без дополнительных предположений и, следовательно, не корректно / переносимо.
R.. 20 сен. 2014, в 21:38
0

Дело в том, что некоторые люди (я) программируют исключительно на 64-битных машинах. Мне пришлось долго чесать голову, чтобы даже увидеть, где был риск переполнения. Если бы было упоминание о размере size_t это было бы очевидно. Конечно, это моя проблема, которую я сейчас разрабатываю только на 64-битных машинах, но очевидность которых не обязательно совпадает с другими (например, я действительно хорошо нахожу переполнения int в коде от людей с 32-битной ментальной моделью).
Patrick Schlüter 20 сен. 2014, в 22:59
3

@tristopia: Если ваш способ мышления - « size_t 64-битный, так что это не проблема», это ошибочный способ мышления, который может привести к ошибкам в безопасности. size_t - это абстрактный тип, представляющий размеры, и нет оснований думать, что произвольное произведение 32-битного числа и size_t (примечание: sizeof *bar в принципе может быть больше 2 ^ 32 в 64-битной реализации C! ) вписывается в size_t .
R.. 20 сен. 2014, в 23:40
0

@ PatrickSchlüter У вас не только будет проблема с 32-битным size_t , если size_t равен 16 битам (или любое другое значение между ними), у вас также будет проблема (которая является общей для встроенных микроконтроллеров, которые часто имеют общее пространство менее 64 КБ).
12431234123412341234123 26 июль 2017, в 13:43

Показать ещё 6 комментариев

28

Документация делает calloc похожим на malloc, который просто выполняет нулевую инициализацию памяти; это не главное отличие! Идея calloc состоит в том, чтобы абстрагировать семантику copy-on-write для выделения памяти. Когда вы выделяете память с помощью calloc, она сопоставляется с той же самой физической страницей, которая инициализируется нулем. Когда выделяется какая-либо из страниц выделенной памяти на физическую страницу. Это часто используется для создания HUGE хэш-таблиц, например, поскольку части хэша, которые пусты, не поддерживаются дополнительной памятью (страницами); они с радостью указывают на единственную нулевую инициализацию страницы, которая может быть разделена между процессами.

Любая запись на виртуальный адрес отображается на страницу, если эта страница является нулевой страницей, выделяется другая физическая страница, копируется нулевая страница и поток управления возвращается клиенту. Это работает так же, как файлы с отображением памяти, виртуальная память и т.д. Работает.. он использует пейджинг.

Вот одна история оптимизации по теме: http://blogs.fau.de/hager/2007/05/08/benchmarking-fun-with-calloc-and-zero-pages/

t0rakka 15 авг. 2013, в 11:43

24

Нет разницы в размере выделенного блока памяти. calloc просто заполняет блок памяти физическим шаблоном всех нулевых битов. На практике часто предполагается, что объекты, расположенные в блоке памяти, выделенные с помощью calloc, имеют начальное значение, как если бы они были инициализированы литералом 0, то есть целые числа должны иметь значение 0, переменные с плавающей запятой - значение 0.0, указатели - соответствующее значение нулевого указателя и т.д.

С педантичной точки зрения, однако, calloc (а также memset(..., 0, ...)) гарантируется только правильная инициализация (с нулями) объектов типа unsigned char. Все остальное не гарантируется надлежащим образом инициализированным и может содержать так называемое ловушечное представление, которое вызывает поведение undefined. Другими словами, для любого типа, отличного от unsigned char, вышеупомянутый all-zero-bits patterm может представлять недопустимое значение, ловушечное представление.

Позже, в одном из технических правил Corrigenda to C99, поведение было определено для всех целочисленных типов (что имеет смысл). То есть формально, на текущем языке C вы можете инициализировать только целые типы с помощью calloc (и memset(..., 0, ...)). Использование его для инициализации чего-либо еще в общем случае приводит к поведению undefined с точки зрения языка C.

На практике calloc работает, как мы все знаем:), но хотите ли вы его использовать (учитывая выше), зависит от вас. Я лично предпочитаю полностью избегать этого, вместо этого используйте malloc и выполните мою собственную инициализацию.

Наконец, еще одна важная деталь заключается в том, что calloc требуется для вычисления размера конечного блока внутри, путем умножения размера элемента на количество элементов. При этом calloc должен следить за возможным арифметическим переполнением. Это приведет к неудачному распределению (нулевой указатель), если запрошенный размер блока не может быть правильно рассчитан. Между тем, ваша версия malloc не пытается наблюдать за переполнением. Он будет выделять некоторый "непредсказуемый" объем памяти в случае переполнения.

AnT 18 окт. 2009, в 21:15

0

Согласно параграфу «еще одна важная деталь»: что делает make для memset(p, v, n * sizeof type); проблема, потому что n * sizeof type может переполниться. Думаю, мне нужно использовать for(i=0;i<n;i++) p[i]=v; цикл для надежного кода.
chux 14 фев. 2015, в 13:18
0

Было бы полезно, если бы существовали стандартные средства, с помощью которых код мог бы утверждать, что реализация должна использовать все биты-ноль в качестве нулевого указателя (в противном случае отказывается от компиляции), поскольку существуют реализации, которые используют другие представления нулевого указателя, но они сравнительно редко; код, который не должен выполняться в таких реализациях, может быть быстрее, если он может использовать calloc () или memset для инициализации массивов указателей.
supercat 13 авг. 2016, в 21:03
2

vorpus.org/blog/why-does-calloc-exist
ddddavidee 13 дек. 2016, в 16:07
0

@chux Нет, если существует массив с n элементами, где элемент имеет sizeof type size, то sizeof type n*sizeof type не может быть переполнен, поскольку максимальный размер любого объекта должен быть меньше SIZE_MAX .
12431234123412341234123 26 июль 2017, в 13:49
0

@ 12431234123412341234123 Правда о размере массива <= SIZE_MAX , но здесь нет никаких массивов . Указатель, возвращаемый calloc() может указывать на выделенную память, которая превышает SIZE_MAX . Многие реализации ограничивают произведение двух аргументов calloc() значением SIZE_MAX , но спецификация C не устанавливает этого ограничения.
chux 26 июль 2017, в 14:01

Показать ещё 3 комментария

17

из статьи Бенчмаркинг с помощью calloc() и нулевых страниц в Блог Georg Hager

При распределении памяти с помощью calloc() объем запрошенной памяти не выделяется сразу. Вместо этого все страницы, принадлежащие блоку памяти, подключены к одной странице, содержащей все нули, с помощью некоторой MMU-магии (ссылки ниже). Если такие страницы только читаются (что верно для массивов b, c и d в исходной версии теста), данные предоставляются с единственной нулевой страницы, которая, конечно же, вписывается в кеш. Так много для ядер ядра, связанных с памятью. Если страница записывается (независимо от того, как), возникает ошибка, отображается "реальная" страница, а нулевая страница копируется в память. Это называется copy-on-write, хорошо известным подходом к оптимизации (который я даже много раз преподавал в своих лекциях на С++). После этого трюк с нулевым чтением больше не работает для этой страницы, и поэтому производительность была настолько ниже после вставки цикла предположительно избыточного цикла init.

Ashish Chavan 28 авг. 2013, в 05:51

0

где ссылка?
Rupesh Yadav. 18 фев. 2017, в 10:09
2

Первая строка ответа содержит ссылку на блог Георга Хагера.
Ashish Chavan 22 фев. 2017, в 09:20

10

calloc обычно malloc+memset до 0

Обычно лучше использовать malloc+memset явно, особенно когда вы делаете что-то вроде:

ptr=malloc(sizeof(Item));
memset(ptr, 0, sizeof(Item));

Это лучше, потому что sizeof(Item) знает компилятор во время компиляции, и компилятор в большинстве случаев заменяет его наилучшими возможными инструкциями для нулевой памяти. С другой стороны, если memset происходит в calloc, размер параметра распределения не компилируется в коде calloc, и часто вызывается реальный memset, который обычно содержит код для байтов -byte заполнить до длинной границы, чем цикл, чтобы заполнить память в sizeof(long) кусках и, наконец, побайтовое заполнение оставшегося пространства. Даже если распределитель достаточно умен, чтобы вызвать некоторый aligned_memset, он все равно будет общим циклом.

Одним из примечательных исключений будет то, что вы делаете malloc/calloc из очень большой части памяти (несколько power_of_two килобайт), и в этом случае распределение может производиться непосредственно из ядра. Поскольку ядра ОС, как правило, обнуляют всю память, которую они выдают по соображениям безопасности, достаточно разумный calloc может просто вернуть его с дополнительным обнулением. Опять же - если вы просто выделяете то, что, как вы знаете, мало, вам может быть лучше с malloc + memset с точки зрения производительности.

virco 16 авг. 2014, в 22:43

0

+1 за напоминание о том, что общая реализация функциональности в системной библиотеке не обязательно быстрее, чем та же операция в пользовательском коде.
Patrick Schlüter 20 сен. 2014, в 07:30
1

Есть также вторая точка, которая делает calloc() медленнее, чем malloc() : умножение на размер. calloc() требуется для использования общего умножения (если size_t равен 64 битам, даже очень дорогая операция 64 бит * 64 бит = 64 бит), тогда как malloc () часто будет иметь постоянную времени компиляции.
Patrick Schlüter 20 сен. 2014, в 07:37
3

У glibc calloc есть некоторые умения, чтобы решить, как наиболее эффективно очистить возвращенный кусок, например, иногда только его часть нуждается в очистке, а также развернутый очистить до 9 * sizeof (size_t). Память - это память, очистка ее 3 байта за раз не будет быстрее только потому, что вы собираетесь использовать ее для хранения struct foo { char a,b,c; }; , calloc всегда лучше, чем malloc + memset , если вы всегда собираетесь очистить всю область malloc . calloc есть также тщательная, но эффективная проверка на переполнение int в элементах размера *.
Peter Cordes 07 дек. 2014, в 22:58

Показать ещё 1 комментарий

9

malloc() выделяет блок памяти заданного размера (в байтах) и возвращает указатель на начало блока.

void *malloc(size_t size);

malloc() не инициализирует выделенную память.

calloc() выделяет память, а также инициализирует выделение памяти для всех битов 0.

void *calloc(size_t num, size_t size);

geetha 26 окт. 2016, в 07:04

7

Разница 1: malloc() обычно выделяет блок памяти, и это инициализированный сегмент памяти. calloc() выделяет блок памяти и инициализирует весь блок памяти до 0.

Разница 2: если вы считаете синтаксис malloc(), для этого потребуется только один аргумент. Рассмотрим следующий пример ниже:

data_type ptr = (cast_type *) malloc (sizeof (data_type) * no_of_blocks);

Пример: если вы хотите выделить 10 блоков памяти для типа int,

      int *ptr = (int *) malloc(sizeof(int) * 10 );

Если вы рассматриваете синтаксис calloc(), это займет 2 аргумента. Рассмотрим следующий пример ниже:

data_type ptr = (cast_type *) calloc (no_of_blocks, (sizeof (data_type)));

Пример: если вы хотите выделить 10 блоков памяти для типа int и Инициализировать все, что для ZERO,

      int *ptr = (int *) calloc(10, (sizeof(int)));

Сходство:

Как malloc(), так и calloc() возвращают void * по умолчанию, если они не являются литыми.!

Shivaraj Bhat 12 янв. 2015, в 08:55

0

И почему вы сохраняете data_type и cast_type разными?
Sold Out 14 март 2018, в 09:11

6

Есть два отличия.
Во-первых, это число аргументов. malloc() принимает один аргумент (требуется память в байтах), а calloc() - два аргумента.
Во-вторых, malloc() не инициализирует выделенную память, а calloc() инициализирует выделенную память ZERO.

calloc() выделяет область памяти, длина будет продуктом ее параметров. calloc заполняет память с помощью ZERO и возвращает указатель на первый байт. Если ему не удается найти достаточное пространство, он возвращает указатель NULL.

Синтаксис: ptr_var=(cast_type *)calloc(no_of_blocks , size_of_each_block); т.е. ptr_var=(type *)calloc(n,s);

malloc() выделяет один блок памяти REQUSTED SIZE и возвращает указатель на первый байт. Если он не находит требуемый объем памяти, он возвращает нулевой указатель.

Синтаксис: ptr_var=(cast_type *)malloc(Size_in_bytes); Функция malloc() принимает один аргумент, который представляет собой количество байтов для распределения, тогда как функция calloc() принимает два аргумента, одна из которых является числом элементов, а другая - количеством байтов для распределения для каждого из этих элементов, Кроме того, calloc() инициализирует выделенное пространство нулями, а malloc() - нет.

Jainendra 14 сен. 2012, в 11:11

5

Функция calloc(), объявленная в заголовке <stdlib.h>, предлагает несколько преимуществ перед функцией malloc().

Он выделяет память как количество элементов заданного размера, а
Инициализирует память, выделенную так, что все биты ноль.

Vipin Diwakar 30 июль 2013, в 18:03

4

Разница пока не указана: ограничение размера

void *malloc(size_t size) может выделяться только до SIZE_MAX.

void *calloc(size_t nmemb, size_t size); может выделять около SIZE_MAX*SIZE_MAX.

Эта способность часто не используется во многих платформах с линейной адресацией. Такие системы ограничивают calloc() nmemb * size <= SIZE_MAX.

Рассмотрим тип 512 байтов, называемый disk_sector, и код хочет использовать множество секторов. Здесь код может использовать только до SIZE_MAX/sizeof disk_sector секторов.

size_t count = SIZE_MAX/sizeof disk_sector;
disk_sector *p = malloc(count * sizeof *p);

Рассмотрим следующее, которое допускает еще большее распределение.

size_t count = something_in_the_range(SIZE_MAX/sizeof disk_sector + 1, SIZE_MAX)
disk_sector *p = calloc(count, sizeof *p);

Теперь, если такая система может поставлять такое большое выделение, это другое дело. Сегодня больше не будет. Тем не менее, это происходило в течение многих лет, когда SIZE_MAX составлял 65535. Учитывая закон Мура, предположите, что это произойдет около 2030 года с некоторыми моделями памяти с SIZE_MAX == 4294967295 и пулы памяти в 100 GBytes.

chux 29 авг. 2015, в 23:23

2

Обычно size_t может содержать размер самого большого объекта, который может обработать программа. Система, в которой size_t равен 32 битам, вряд ли сможет обрабатывать выделение, превышающее 4294967295 байт, и систему, которая сможет обрабатывать выделения такого размера, почти наверняка сделает size_t больше 32 бит. Единственный вопрос заключается в том, можно ли полагаться на использование calloc со значениями, произведение которых превышает SIZE_MAX чтобы получить ноль, а не возвращать указатель на меньшее распределение.
supercat 13 авг. 2016, в 21:00
0

Согласитесь с вашим обобщением , но спецификация C допускает, что выделения calloc() превышают SIZE_MAX . Это происходило в прошлом с 16-битным size_t и, поскольку память продолжает дешеветь, я не вижу причин, по которым это не может произойти, даже если это не распространено .
chux 15 авг. 2016, в 01:48
1

Стандарт C позволяет коду запрашивать распределение, размер которого превышает SIZE_MAX . Это, конечно, не требует наличия каких-либо обстоятельств, при которых такое распределение может быть успешным; Я не уверен, что есть какая-то особая выгода от того, что реализации, которые не могут обрабатывать такие распределения, должны возвращать NULL (особенно учитывая, что для некоторых реализаций характерно наличие указателей возврата malloc в пространство, которое еще не зафиксировано и может быть недоступно, когда код на самом деле пытается использовать его).
supercat 15 авг. 2016, в 15:14
0

Кроме того, там, где в прошлом могли существовать системы, доступный диапазон адресов которых превышал наибольшее представимое целое число, я не вижу реальной возможности того, чтобы это когда-либо происходило снова, поскольку для этого потребовалась бы емкость в миллиарды гигабайт. Даже если бы закон Мура продолжал соблюдаться, переход от точки, в которой 32 бита перестало быть достаточным, к точке, в которой 64 бита перестало быть достаточным, потребовал бы вдвое больше времени, чем переход от точки, в которой 16 бит было достаточно, к точке, где 32 бита не было. «т.
supercat 15 авг. 2016, в 15:20
0

@supercat "Я не уверен, что есть какая-то особая выгода от того, что реализации, которые не могут обрабатывать такое распределение, должны возвращать NULL" -> Совместимая реализация C "Функция calloc возвращает либо нулевой указатель, либо указатель на выделенное пространство." Это не освобождает от математического переполнения nmemb * size > SIZE_MAX .
chux 15 авг. 2016, в 15:49
0

@supercat "Реалистичная возможность того, что это когда-либо случится снова, поскольку для этого потребуется емкость хранилища в миллиарды гигабайт" -> Объем памяти, превышающий 4 ГБ, достаточен для рассмотрения архитектур, использующих calloc() который возвращает указатели на память> SIZE_MAX (4G-1) .
chux 15 авг. 2016, в 15:50
1

Почему реализация, которая может вместить одно выделение сверх 4G, не определяет size_t для uint64_t ?
supercat 15 авг. 2016, в 17:00
0

Давайте продолжим эту дискуссию в чате .
chux 15 авг. 2016, в 17:01

Показать ещё 6 комментариев

3

malloc() и calloc() - это функции из стандартной библиотеки C, которые позволяют распределять динамическую память, что означает, что они оба позволяют распределять память во время выполнения.

Их прототипы выглядят следующим образом:

void *malloc( size_t n);
void *calloc( size_t n, size_t t)

В основном существуют два различия между ними:

Поведение: malloc() выделяет блок памяти, не инициализируя его, и чтение содержимого из этого блока приведет к значениям мусора. calloc(), с другой стороны, выделяет блок памяти и инициализирует его нулями, и, очевидно, чтение содержимого этого блока приведет к нулям.
Синтаксис: malloc() принимает 1 аргумент (размер, который нужно выделить), а calloc() принимает два аргумента (количество блоков, которые должны быть выделены, и размер каждого блока).

Возвращаемое значение из обоих значений является указателем на выделенный блок памяти, если это необходимо. В противном случае возвращается NULL с указанием отказа в распределении памяти.

Пример:

int *arr;

// allocate memory for 10 integers with garbage values
arr = (int *)malloc(10 * sizeof(int)); 

// allocate memory for 10 integers and sets all of them to 0
arr = (int *)calloc(10, sizeof(int));

Такую же функциональность, как calloc() можно достичь с помощью malloc() и memset():

// allocate memory for 10 integers with garbage values   
arr= (int *)malloc(10 * sizeof(int));
// set all of them to 0
memset(arr, 0, 10 * sizeof(int));

Обратите внимание, что malloc() предпочтительно используется над calloc() поскольку он быстрее. Если нулевая инициализация значений требуется, используйте calloc().

elmiomar 19 июнь 2018, в 13:50

2

Имя malloc и calloc() - это функции библиотеки, которые динамически распределяют память.
Это означает, что память выделяется во время выполнения (выполнение программы) из сегмента кучи.

Инициализация: malloc() выделяет блок памяти заданного размера (в байтах) и возвращает указатель на начало блока.

>  malloc() doesn’t initialize the allocated memory. If we try to access
 the content of memory block then we’ll get garbage values. void *
> malloc( size_t size );

> calloc() allocates the memory and also initializes the allocates
 memory block to zero. If we try to access the content of these blocks
 then we’ll get 0.

> void * calloc( size_t num, size_t size );

Несколько аргументов: В отличие от malloc(), calloc() принимает два аргумента: 1) Количество блоков, которые нужно выделить. 2) Размер каждого блока.

Самое важное:

Было бы лучше использовать malloc над calloc, если мы не хотим инициализации нуля, потому что malloc быстрее, чем calloc. Поэтому, если мы просто хотите скопировать некоторые вещи или сделать то, что не требует заполнение блоков нулями, то malloc будет лучше выбор.

jsroyal 24 авг. 2017, в 13:19

2

Основные отличия между malloc и calloc заключаются в следующем:

malloc означает выделение памяти, тогда как calloc означает непрерывное выделение.
malloc принимает только один аргумент, размер блока, тогда как calloc принимает два аргумента, количество блоков, которые должны быть выделены, и размер каждого блока.

ptr = (cast-type *) malloc (размер байта)//malloc

ptr = (cast-type *) calloc (нет блоков, размер блока);//calloc
malloc не выполняет инициализацию памяти, и все адреса хранят значение мусора, тогда как calloc выполняет инициализацию памяти, а адреса инициализируются как значениями нуля или нулей.

Lov Verma 20 июль 2017, в 18:49

2

malloc(): выделяет запрошенный размер байтов и возвращает указатель на первый байт выделенного пространства

calloc(): выделяет пространство для элементов массива, инициализирует ноль и затем возвращает указатель на память

suresh pareek 07 июнь 2014, в 15:44

0

malloc() принимает один аргумент, а calloc() - двоичный.

Во-вторых, malloc() не инициализирует выделенную память, а calloc() инициализирует выделенную память для ZERO. Оба malloc и calloc используются на языке C для динамического распределения памяти, они динамически получают блоки памяти.

Sanjay Kumaar 24 авг. 2017, в 13:21

0

char *ptr = (char *) malloc (n * sizeof(char));

просто выделяет n bytes памяти без какой-либо инициализации (т.е. эти байты памяти будут содержать любые значения мусора).

char *ptr = (char *) malloc (n, sizeof(char));

Однако метод calloc() в c инициализирует значение 0 для всех байтов занятой памяти в дополнение к функции, которую выполняет malloc().

Но кроме этого существует очень важное различие. При вызове malloc(x) он выделяет память (равную x блокам) и возвращает указатель на выделенный первый байт. Тем не менее, он не проверяет, выделено ли ровно х блоков памяти. Это приведет к случаю переполнения памяти. Однако calloc() проверяет размер выделения. Если это не удастся при распределении памяти или проверке выделенных байтов, она просто вернет значение null.

Rahul Raina 14 май 2015, в 09:13

Ещё вопросы

В C вы не разыгрываете результат семьи malloc
В C вы могли бы написать выше более обобщенно как: ptr = calloc(MAXELEMS, sizeof(*ptr));
Интересный пост о разнице между calloc и malloc + memset vorpus.org/blog/why-does-calloc-exist
@ddddavidee Я тоже нашел этот блог после того, как был недоволен большим количеством ответов в сети. Натаниэль Дж. Смит заслуживает более 100 баллов за свой анализ.
Связано: Может ли calloc () выделить больше, чем SIZE_MAX?
calloc не нужно писать нули. Если выделенный блок состоит в основном из новых нулевых страниц, предоставляемых операционной системой, он может оставить их нетронутыми. Это, конечно, требует, чтобы calloc был настроен на операционную систему, а не на общую библиотечную функцию поверх malloc . Или разработчик может заставить calloc сравнивать каждое слово с нулем, прежде чем обнулять его. Это не сэкономит время, но предотвратит загрязнение новых страниц.
@R .. интересная заметка. Но на практике, такие реализации существуют в дикой природе?
Все реализации, dlmalloc пропускают memset если блок был получен путем mmap новых анонимных страниц (или их эквивалента). Обычно этот вид распределения используется для больших кусков, начиная с 256 КБ или около того. Я не знаю ни одной реализации, которая делает сравнение с нулем, прежде чем писать ноль, кроме моей собственной.
omalloc также пропускает memset ; calloc не нужно когда-либо касаться страниц, которые еще не используются приложением (кеш страниц). Тем не менее, чрезвычайно примитивные реализации calloc отличаются.
Calloc в glibc проверяет, получает ли она свежую память от ОС. Если это так, он знает, что не нужно его писать, потому что mmap (..., MAP_ANONYMOUS) возвращает память, которая уже обнулена.
В Windows VirtualAlloc также выделяет предварительно обнуленную память.
также это зависит от того, занимает ли выделение несколько страниц виртуальной памяти или нет; если она соответствует текущей странице, то чаще всего есть заголовок арены, который находится перед возвращенной памятью и который должен быть изменен, тем самым превращая страницу в грязное состояние. (связанный вопрос говорит о действительно большом распределении, которое охватывает много страниц)
По-видимому, именно арифметическое переполнение стало причиной дыры в OpenSSH в 2002 году. Хорошая статья от OpenBSD об опасностях этого с функциями, связанными с памятью: undeadly.org/cgi?action=article&sid=20060330071917
@ KomradeP .: Интересно. К сожалению, статья, на которую вы ссылаетесь, имеет дезинформацию в самом начале. Пример с char - это не переполнение, а преобразование, определяемое реализацией, при присваивании результата обратно в объект char .
Это возможно только для иллюстрации. Потому что компилятор все равно может оптимизировать это. Мой компилируется в этот ассм: push 1.
Вы должны заметить где-то в этом ответе, что вы принимаете 32-битный size_t потому что я не вижу проблемы, когда size_t имеет ширину 64 бита.
@tristopia: Дело не в том, что код можно использовать во всех реализациях, а в том, что он некорректен без дополнительных предположений и, следовательно, не корректно / переносимо.
Дело в том, что некоторые люди (я) программируют исключительно на 64-битных машинах. Мне пришлось долго чесать голову, чтобы даже увидеть, где был риск переполнения. Если бы было упоминание о размере size_t это было бы очевидно. Конечно, это моя проблема, которую я сейчас разрабатываю только на 64-битных машинах, но очевидность которых не обязательно совпадает с другими (например, я действительно хорошо нахожу переполнения int в коде от людей с 32-битной ментальной моделью).
@tristopia: Если ваш способ мышления - « size_t 64-битный, так что это не проблема», это ошибочный способ мышления, который может привести к ошибкам в безопасности. size_t - это абстрактный тип, представляющий размеры, и нет оснований думать, что произвольное произведение 32-битного числа и size_t (примечание: sizeof *bar в принципе может быть больше 2 ^ 32 в 64-битной реализации C! ) вписывается в size_t .
@ PatrickSchlüter У вас не только будет проблема с 32-битным size_t , если size_t равен 16 битам (или любое другое значение между ними), у вас также будет проблема (которая является общей для встроенных микроконтроллеров, которые часто имеют общее пространство менее 64 КБ).
Согласно параграфу «еще одна важная деталь»: что делает make для memset(p, v, n * sizeof type); проблема, потому что n * sizeof type может переполниться. Думаю, мне нужно использовать for(i=0;i<n;i++) p[i]=v; цикл для надежного кода.
Было бы полезно, если бы существовали стандартные средства, с помощью которых код мог бы утверждать, что реализация должна использовать все биты-ноль в качестве нулевого указателя (в противном случае отказывается от компиляции), поскольку существуют реализации, которые используют другие представления нулевого указателя, но они сравнительно редко; код, который не должен выполняться в таких реализациях, может быть быстрее, если он может использовать calloc () или memset для инициализации массивов указателей.
@chux Нет, если существует массив с n элементами, где элемент имеет sizeof type size, то sizeof type n*sizeof type не может быть переполнен, поскольку максимальный размер любого объекта должен быть меньше SIZE_MAX .
@ 12431234123412341234123 Правда о размере массива <= SIZE_MAX , но здесь нет никаких массивов . Указатель, возвращаемый calloc() может указывать на выделенную память, которая превышает SIZE_MAX . Многие реализации ограничивают произведение двух аргументов calloc() значением SIZE_MAX , но спецификация C не устанавливает этого ограничения.
Первая строка ответа содержит ссылку на блог Георга Хагера.
+1 за напоминание о том, что общая реализация функциональности в системной библиотеке не обязательно быстрее, чем та же операция в пользовательском коде.
Есть также вторая точка, которая делает calloc() медленнее, чем malloc() : умножение на размер. calloc() требуется для использования общего умножения (если size_t равен 64 битам, даже очень дорогая операция 64 бит * 64 бит = 64 бит), тогда как malloc () часто будет иметь постоянную времени компиляции.
У glibc calloc есть некоторые умения, чтобы решить, как наиболее эффективно очистить возвращенный кусок, например, иногда только его часть нуждается в очистке, а также развернутый очистить до 9 * sizeof (size_t). Память - это память, очистка ее 3 байта за раз не будет быстрее только потому, что вы собираетесь использовать ее для хранения struct foo { char a,b,c; }; , calloc всегда лучше, чем malloc + memset , если вы всегда собираетесь очистить всю область malloc . calloc есть также тщательная, но эффективная проверка на переполнение int в элементах размера *.
И почему вы сохраняете data_type и cast_type разными?
Обычно size_t может содержать размер самого большого объекта, который может обработать программа. Система, в которой size_t равен 32 битам, вряд ли сможет обрабатывать выделение, превышающее 4294967295 байт, и систему, которая сможет обрабатывать выделения такого размера, почти наверняка сделает size_t больше 32 бит. Единственный вопрос заключается в том, можно ли полагаться на использование calloc со значениями, произведение которых превышает SIZE_MAX чтобы получить ноль, а не возвращать указатель на меньшее распределение.
Согласитесь с вашим обобщением , но спецификация C допускает, что выделения calloc() превышают SIZE_MAX . Это происходило в прошлом с 16-битным size_t и, поскольку память продолжает дешеветь, я не вижу причин, по которым это не может произойти, даже если это не распространено .
Стандарт C позволяет коду запрашивать распределение, размер которого превышает SIZE_MAX . Это, конечно, не требует наличия каких-либо обстоятельств, при которых такое распределение может быть успешным; Я не уверен, что есть какая-то особая выгода от того, что реализации, которые не могут обрабатывать такие распределения, должны возвращать NULL (особенно учитывая, что для некоторых реализаций характерно наличие указателей возврата malloc в пространство, которое еще не зафиксировано и может быть недоступно, когда код на самом деле пытается использовать его).
Кроме того, там, где в прошлом могли существовать системы, доступный диапазон адресов которых превышал наибольшее представимое целое число, я не вижу реальной возможности того, чтобы это когда-либо происходило снова, поскольку для этого потребовалась бы емкость в миллиарды гигабайт. Даже если бы закон Мура продолжал соблюдаться, переход от точки, в которой 32 бита перестало быть достаточным, к точке, в которой 64 бита перестало быть достаточным, потребовал бы вдвое больше времени, чем переход от точки, в которой 16 бит было достаточно, к точке, где 32 бита не было. «т.
@supercat "Я не уверен, что есть какая-то особая выгода от того, что реализации, которые не могут обрабатывать такое распределение, должны возвращать NULL" -> Совместимая реализация C "Функция calloc возвращает либо нулевой указатель, либо указатель на выделенное пространство." Это не освобождает от математического переполнения nmemb * size > SIZE_MAX .
@supercat "Реалистичная возможность того, что это когда-либо случится снова, поскольку для этого потребуется емкость хранилища в миллиарды гигабайт" -> Объем памяти, превышающий 4 ГБ, достаточен для рассмотрения архитектур, использующих calloc() который возвращает указатели на память> SIZE_MAX (4G-1) .
Почему реализация, которая может вместить одно выделение сверх 4G, не определяет size_t для uint64_t ?
Давайте продолжим эту дискуссию в чате .

Fred Larson · Accepted Answer · 2009-10-08T16-49-00.000Z

772

Лучший ответ

calloc() zero инициализирует буфер, а malloc() оставляет память неинициализированной.

EDIT:

Отбрасывание памяти может занять немного времени, поэтому вы, вероятно, захотите использовать malloc(), если эта производительность является проблемой. Если инициализация памяти важнее, используйте calloc(). Например, calloc() может сэкономить вам вызов memset().

Fred Larson 08 окт. 2009, в 16:49

210

Варианты * alloc являются довольно мнемоническими - clear-alloc, memory-alloc, re-alloc.
Cascabel 08 окт. 2009, в 15:07
40

Используйте malloc (), если вы собираетесь установить все, что вы используете в выделенном пространстве. Используйте calloc (), если вы собираетесь оставить части данных неинициализированными, и было бы полезно обнулить ненастроенные части.
Jonathan Leffler 08 окт. 2009, в 15:16
257

calloc не обязательно дороже, так как ОС может сделать некоторые трюки, чтобы ускорить его. Я знаю, что FreeBSD, когда он получает какое-то время простоя ЦП, использует его для запуска простого процесса, который просто обходит и обнуляет освобожденные блоки памяти и помечает блоки, таким образом, процессами с флагом. Поэтому, когда вы делаете calloc , он сначала пытается найти один из таких предварительно обнуленных блоков и просто отдаст его вам - и, скорее всего, найдет один.
Pavel Minaev 08 окт. 2009, в 15:18
3

Использование calloc (), вероятно, в целом является более безопасной ставкой, если только вы не пытаетесь оптимизировать каждый последний кусочек вашего кода (и даже тогда, как уже отмечали другие, ваши усилия могут оказаться тщетными).
Andrew Song 08 окт. 2009, в 15:32
26

Я склонен считать, что если ваш код становится «более безопасным» в результате нулевого выделения ресурсов по умолчанию, то ваш код недостаточно безопасен, независимо от того, используете ли вы malloc или calloc. Использование malloc является хорошим индикатором того, что данные должны быть инициализированы - я использую calloc только в тех случаях, когда эти 0 байтов действительно значимы. Также обратите внимание, что calloc не обязательно делает то, что вы думаете для не-char типов. Никто на самом деле больше не использует представления ловушек или плавающие не-IEEE, но это не повод думать, что ваш код действительно переносим, когда это не так.
Steve Jessop 08 окт. 2009, в 15:51
3

«Безопаснее», вероятно, является преувеличением, это больше похоже на «больше вероятности сбоя, чем молчаливого повреждения данных», что все еще имеет отношение к безопасности кода (как последний барьер защиты), и оно определенно облегчает отладку сбоев. Тем не менее, очень хорошее замечание о float (и других типах, для которых all-bits-0 может не означать того, что вы думаете, что они имеют в виду).
Pavel Minaev 08 окт. 2009, в 19:25
1

@Pavel: char *foo = malloc(foolen); assert(foo && memset(foo,0,foolen)); покрывает аспект отладки, или вы можете использовать бросающийся в глаза байт, отличный от 0. Из последней строки POV безопасности, возможно, было бы лучше связать с версией malloc, которая очищает байты (или устанавливает их на глаз -catcher значение размером с указатель, которое отображается как нечитаемое и недоступное для записи), вместо того, чтобы иметь политику для вызова calloc вместо этого?
Steve Jessop 12 окт. 2009, в 15:30
0

@ Стив: Мне нравится эта идея. Я подумываю о том, чтобы написать простой ориентированный на отладку malloc используя mmap для каждого выделения с защитной страницей сразу после последнего выделенного байта, и я мог бы также включить вашу идею для заполнения памяти специальным значением указателя, вызывающего сбой.
R.. 05 янв. 2011, в 16:02
0

@Jefromi просто хотел пожаловаться на «Книгу на C», которая описывает calloc как «Выделение смежного пространства». "с" для "смежных", а? Bizarre. «Очистить» имеет смысл. Керниган думает, что это значит ясно, тоже quora.com/C-programming-language/…
13ren 16 май 2013, в 13:30
0

и некоторый ранний источник комментариев calloc - allocate and clear memory block minnie.tuhs.org/cgi-bin/utree.pl?file=V7M/src/libc/gen/calloc.c Из комментария JimBalter здесь stackoverflow.com/a / 12555996/50979
13ren 16 май 2013, в 13:35
16

@SteveJessop "Безопаснее" не правильное слово. Я думаю, что «детерминист» - лучший термин. Код, который является более детерминированным, чем наличие сбоев, зависящих от синхронизации и последовательности данных, будет легче изолировать сбои. Calloc - иногда простой способ получить этот детерминизм по сравнению с явной инициализацией.
dennis 04 май 2014, в 13:57
0

@dennis, люди говорят о том, что если поведение вашего кода или даже путь выполнения зависят от содержимого неинициализированной памяти, это обычно является проблемой. В некоторых случаях вы можете доказать, что это нормально, например, research.swtch.com/sparse , но это исключение.
Peter Cordes 07 дек. 2014, в 16:22
1

@ Денис, полностью согласен. Я думаю, что определенно лучше отдать предпочтение детерминированному коду, чем недетерминированному коду. Павел высказал подобное мнение. Если у вас есть ошибка, которая непреднамеренно читает неинициализированную память, вы бы предпочли ее чтение случайных данных или нулевых данных?
Darren Smith 16 дек. 2014, в 19:11
3

Просто добавьте: calloc добавляет еще одну защитную меру: обычно она сохраняется против целочисленного переполнения, например, в glibc они проверяют, что размер, умноженный на количество элементов, не превышает максимальный предел size_t. Обычно вы не проверяете переполнение при вызове malloc и умножаете размер элемента на количество элементов, но calloc делает это за вас и не выполняет вызов, если произойдет переполнение; (на самом деле это то, что может быть использовано, если вы выведете эти значения из сообщения, которое вы только что прочитали в сети).
MichaelMoser 25 июнь 2015, в 07:32
1

@PavelMinaev О том процессе FreeBSD, который обнуляет память. У вас есть какие-либо ссылки на это? Я нахожу эту идею очень интересной ...
Enzo Ferber 16 сен. 2015, в 01:46
0

Я написал надуманный сценарий о malloc и безопасности. Если malloc не обнуляет память, то, как я понимаю, ядро есть.
Braden Best 15 окт. 2015, в 19:13
1

@ B1KMusic: В вашей ОС, с вашим компилятором, с этой версией компилятора, с указанными вами опциями компиляции, это может иметь место. Не рассчитывай на что-то важное.
Fred Larson 15 окт. 2015, в 19:58
2

Вы можете добавить примечание по этому поводу: хотя большинство современных платформ представляют нулевой указатель как все биты ноль, стандарт C не гарантирует, что элементы массива, выделенные calloc() могут быть безопасно инициализированы указателем NULL .
chqrlie 26 окт. 2016, в 07:23
0

Правильно ли говорить, что память, выделенная как в случае отключения calloc и malloc является смежной по своей природе. Я читал здесь, что - The only difference between malloc() and calloc() is that, malloc() allocates single block of memory whereas calloc() allocates multiple blocks of memory each of same size and sets all bytes to zero. Я считаю, что это неправильно. Не так ли? Я полагаю, что calloc получил свое имя из clear allocated memory то есть обнулил выделенную память, что является единственным отличием, когда я сравниваю его с malloc .
RBT 09 фев. 2017, в 02:45
0

"может спасти вас вызов в memset(..) " Интересно, какой из них быстрее 1. malloc(..) & memset(..) или calloc(..) .
Nik-Lz 16 фев. 2017, в 21:26
0

Я, конечно, мог представить себе выделение, за которым следует цикл до 0000 0000 всех байтов. Там, где я хотел получить такой результат, один Calloc кажется лучше.
alan2here 09 сен. 2017, в 19:12
1

@ Nik-Lz На этот вопрос ddddavidee ответил на исходный вопрос. Оказывается, calloc может быть намного быстрее (в 100 раз). Статья была действительно хорошо прочитана. Там также было еще одно большое отличие: пропуск 2 операндов позволяет calloc проверять ошибки больших выделений, когда malloc просто переполняется и возвращает буфер с меньшим объемом памяти, чем вы просили.
Bill K 19 март 2018, в 23:12

Показать ещё 20 комментариев