Почему компиляция C ++ занимает так много времени?

Question

Почему компиляция C ++ занимает так много времени?

483

Компиляция С++ файла занимает очень много времени по сравнению с С# и Java. Для компиляции файла С++ требуется значительно больше времени, чем для запуска обычного размера Python script. В настоящее время я использую VС++, но это то же самое с любым компилятором. Почему это?

Две причины, о которых я мог думать, - это загружать файлы заголовков и запускать препроцессор, но это не похоже на то, что должно объяснять, почему это так долго.

Dan Goldstein 25 нояб. 2008, в 17:10

Источник

55

VC ++ поддерживает предварительно скомпилированные заголовки. Использование их поможет. Много.
Brian 25 нояб. 2008, в 19:21
1

Да, в моем случае (в основном C с несколькими классами - без шаблонов) предварительно скомпилированные заголовки ускоряются примерно в 10 раз
Lothar 08 сен. 2009, в 10:13
0

@ Брайан, я бы никогда не использовал предварительно скомпилированную голову в библиотеке
Cole Johnson 26 нояб. 2012, в 00:05
0

Попробуйте TinyCC, однако, он просто оптимизирован ОЧЕНЬ мало
Christian Irwan Hadi Wicaksana 19 янв. 2015, в 09:49
0

Вы можете использовать предварительно скомпилированные заголовки и код C ++. Когда вы компилируете свой код, он будет обновлять только файлы с изменениями. Это занимает очень мало времени. Перекомпиляция всего проекта может занять в 10 раз больше времени.
Evan Carslake 03 фев. 2016, в 17:06
7

It takes significantly longer to compile a C++ file - вы имеете в виду 2 секунды по сравнению с 1 секундой? Конечно, это вдвое длиннее, но вряд ли значимо. Или вы имеете в виду 10 минут по сравнению с 5 секундами? Пожалуйста, количественно.
Nick Gammon 21 июнь 2016, в 10:38
0

OT: используйте ccache для ускорения :-)
pevik 22 июль 2016, в 22:24
0

#pragma один раз
Sachin Joseph 04 март 2017, в 22:47
0

Я сделал ставку на модули; Я не ожидаю, что проекты на C ++ будут создаваться быстрее, чем на других языках программирования, только с модулями, но он может быть очень близок для большинства проектов с некоторым управлением. Надеюсь увидеть хороший менеджер пакетов с артефактной интеграцией после модулей
Abdurrahim 08 дек. 2018, в 03:50

Показать ещё 7 комментариев

Теги:

c++

performance

compiler-construction

compilation

14 ответов

36

Замедление не обязательно совпадает с любым компилятором.

Я не использовал Delphi или Kylix, но в дни MS-DOS программа Turbo Pascal собиралась почти мгновенно, тогда как эквивалентная программа Turbo С++ просто сканировала бы.

Двумя основными отличиями были очень сильная модульная система и синтаксис, допускающий однопроходную компиляцию.

Конечно, возможно, что скорость компиляции просто не была приоритетом для разработчиков компилятора С++, но в синтаксисе C/С++ также есть некоторые присущие сложности, которые усложняют процесс обработки. (Я не эксперт на C, но Уолтер Брайт, и после создания различных коммерческих компиляторов C/С++, он создал язык D. Одна из его изменений заключалась в обеспечении использования контекстно-свободной грамматики, чтобы облегчить анализ языка.)

Кроме того, вы заметите, что обычно создаются Makefile, так что каждый файл скомпилирован отдельно на C, поэтому, если 10 исходных файлов используют один и тот же файл include, который включает файл, обрабатывается 10 раз.

tangentstorm 25 нояб. 2008, в 20:09

35

Интересно сравнить Паскаль, так как Никлаус Вирт использовал время, которое потребовалось компилятору, чтобы скомпилировать себя в качестве эталона при разработке своих языков и компиляторов. Существует история о том, что после тщательного написания модуля для быстрого поиска символов он заменил его простым линейным поиском, потому что уменьшенный размер кода заставил компилятор работать быстрее.
Dietrich Epp 17 дек. 2012, в 04:15
0

@DietrichEpp Эмпиризм окупается.
Tomas Zubiri 15 фев. 2019, в 16:46

34

Анализ и генерация кода на самом деле довольно быстро. Реальная проблема - открытие и закрытие файлов. Помните, что даже с включением охранников компилятор все еще открыл файл .H и прочитал каждую строку (а затем проигнорировал ее).

Друг однажды (в то время как скучал на работе), взял свое приложение компании и поместил все - все исходные и заголовочные файлы - в один большой файл. Время компиляции сократилось с 3 часов до 7 минут.

James Curran 25 нояб. 2008, в 20:59

13

Конечно, в этом есть доступ к файлам, но, как сказал Джальф, главной причиной этого будет нечто иное, а именно повторный анализ многих, многих, многих (вложенных!) Заголовочных файлов, которые полностью выпадают в вашем случае.
Konrad Rudolph 25 нояб. 2008, в 19:06
8

Именно в этот момент ваш друг должен установить предварительно скомпилированные заголовки, разорвать зависимости между различными заголовочными файлами (старайтесь избегать одного заголовка, включая другой, вместо прямого объявления) и получить более быстрый жесткий диск. Это в стороне, довольно удивительный показатель.
Tom Leys 25 нояб. 2008, в 19:49
6

Если весь заголовочный файл (за исключением возможных комментариев и пустых строк) находится внутри защиты заголовка, gcc может запомнить файл и пропустить его, если задан правильный символ.
CesarB 26 нояб. 2008, в 01:03
11

Разбор это большое дело. Для N пар исходных / заголовочных файлов одинакового размера с взаимозависимостями существует O (N ^ 2) проходов через заголовочные файлы. Помещение всего текста в один файл сокращает этот повторный анализ.
Tom 07 дек. 2008, в 07:07
8

Небольшое примечание: Включает защиту от нескольких разборов на единицу компиляции. Не против нескольких разборов в целом.
Marco van de Voort 12 янв. 2012, в 11:52
1

Кому-то нужны PCH
Russell Greene 19 июль 2015, в 01:24
0

ВОТ ЭТО ДА ! тесты !!!
Fennekin 22 окт. 2015, в 17:34
2

Добавляя к @MarcovandeVoort, некоторые компиляторы распознают, что они включают в себя средства защиты, что позволяет компилятору вообще не открывать файл заново. Другие (в данный момент большинство) используют #pragma once для явного выполнения того, что неявные защитники делают неявно (помечая файл как включаемый только один раз), что позволяет избежать повторного открытия файлов. Но ничто из этого не решает проблему отдельных модулей компиляции; каждый исходный файл C / C ++ будет перечитывать все эти заголовки по одному разу, включая guard и #pragma once просто означает, что они не перечитывают их много раз каждый.
ShadowRanger 15 июнь 2016, в 14:06
0

@Tom Ввод / вывод - это большое дело, а наличие заголовочных файлов само по себе очень важно. Не разбирается. У меня была секция компилятора, предназначенная только для синтаксического анализа, работающая со скоростью 50 000 строк в секунду в 1988 году на процессоре с частотой 2 МГц. Чуть позже я использовал поздний компилятор Watcom C, который показывал количество строк, и это показало, что около 95% любой данной компиляции были заголовками. Вот почему мы прекомпилируем заголовки.
user207421 28 янв. 2018, в 06:03

Показать ещё 7 комментариев

16

С++ скомпилирован в машинный код. Таким образом, у вас есть предварительный процессор, компилятор, оптимизатор и, наконец, ассемблер, все из которых должны выполняться.

Java и С# скомпилированы в байт-код/IL, а виртуальная машина Java/.NET Framework выполняет (или JIT-компиляцию в машинный код) до выполнения.

Python - интерпретируемый язык, который также скомпилирован в байт-код.

Я уверен, что есть и другие причины для этого, но в целом, не имея необходимости компилировать на родной машинный язык, экономит время.

Alan 25 нояб. 2008, в 19:06

15

Стоимость, добавленная предварительной обработкой, тривиальна. Основная «другая причина» замедления заключается в том, что компиляция разбита на отдельные задачи (по одной на объектный файл), поэтому общие заголовки обрабатываются снова и снова. Это O (N ^ 2) наихудший случай, по сравнению с большинством других языков O (N) время разбора.
Tom 07 дек. 2008, в 07:05
1

Кроме того, связывание занимает много времени, верно?
Eric Meadows-Jönsson 18 янв. 2009, в 11:46
11

Из той же аргументации можно сказать, что компиляторы C, Pascal и т. Д. Работают медленно, что в среднем неверно. Это больше связано с грамматикой C ++ и огромным состоянием, которое должен поддерживать компилятор C ++.
Sebastian Mach 10 июнь 2011, в 08:40
2

С медленно. Он страдает от той же проблемы разбора заголовка, что и принятое решение. Например, возьмите простую программу Windows GUI, которая включает в себя windows.h в несколько единиц компиляции, и измеряйте производительность компиляции при добавлении (коротких) единиц компиляции.
Marco van de Voort 02 дек. 2014, в 12:18

Показать ещё 2 комментария

15

Другая причина заключается в использовании предварительного процессора C для поиска объявлений. Даже с защитой заголовков,.h все равно нужно разбирать снова и снова, каждый раз, когда они включаются. Некоторые компиляторы поддерживают предварительно скомпилированные заголовки, которые могут помочь с этим, но они не всегда используются.

См. также: Часто задаваемые ответы С++

Dave Ray 25 нояб. 2008, в 18:38

0

Я думаю, что вы должны выделить комментарий к предварительно скомпилированным заголовкам, чтобы указать на эту ВАЖНУЮ часть вашего ответа.
Kevin 25 нояб. 2008, в 18:37
5

Если весь заголовочный файл (за исключением возможных комментариев и пустых строк) находится внутри защиты заголовка, gcc может запомнить файл и пропустить его, если задан правильный символ.
CesarB 26 нояб. 2008, в 01:02
5

@CesarB: он все еще должен обработать его полностью один раз на единицу компиляции (файл .cpp).
Sam Harwell 25 март 2010, в 17:38

Показать ещё 1 комментарий

11

Самые большие проблемы:

1) Бесконечный перехват заголовков. Уже упоминалось. Смягчения (например, #pragma один раз) обычно работают только на единицу компиляции, а не на сборку.

2) Тот факт, что инструментальная цепочка часто разделяется на несколько двоичных файлов (make, preprocessor, compiler, ассемблер, архиватор, impdef, компоновщик и dlltool в крайних случаях), все они должны повторно инициализировать и перезагружать все состояние все время для каждый вызов (компилятор, ассемблер) или каждая пара файлов (архиватор, компоновщик и dlltool).

См. также обсуждение на comp.compilers: http://compilers.iecc.com/comparch/article/03-11-078 специально этот:

http://compilers.iecc.com/comparch/article/02-07-128

Обратите внимание, что Джон, модератор comp.compilers, похоже, согласен, и это означает, что для C тоже можно добиться одинаковых скоростей, если вы полностью интегрируете инструментальную цепочку и реализуете прекомпилированные заголовки. Многие коммерческие компиляторы C делают это в некоторой степени.

Обратите внимание, что Unix-модель факторинга всего в отдельный двоичный файл является своего рода худшей моделью для Windows (с ее медленным процессом создания). Это очень примечательно при сравнении времени сборки GCC между Windows и * nix, особенно если система make/configure также вызывает некоторые программы только для получения информации.

Marco van de Voort 02 май 2009, в 12:45

9

Building C/С++: что действительно происходит и почему так долго

Относительно большая часть времени разработки программного обеспечения не расходуется на запись, выполнение, отладку или даже разработку кода, но ожидание завершения компиляции. Чтобы все было быстро, мы сначала должны понять, что происходит при компиляции программного обеспечения C/С++. Шаги примерно следующие:

Конфигурация
Сборка встроенного инструмента
Проверка зависимостей
Подборка
Связь

Теперь мы рассмотрим каждый шаг более подробно, сосредоточив внимание на том, как их можно сделать быстрее.

Конфигурация

Это первый шаг при создании. Обычно это означает, что вы запускаете configure script или CMake, Gyp, SCons или какой-либо другой инструмент. Это может занять от одной секунды до нескольких минут за очень большие скрипты configure на основе Autotools.

Этот шаг происходит относительно редко. Его нужно запускать только при изменении конфигураций или изменении конфигурации сборки. За исключением изменений систем сборки, сделать этот шаг не так много.

Сборка встроенного инструмента

Это то, что происходит, когда вы запускаете make или щелкните значок сборки на IDE (обычно это псевдоним для make). Двоичный инструмент сборки запускает и считывает его файлы конфигурации, а также конфигурацию сборки, которые, как правило, одно и то же.

В зависимости от сложности и размера сборки это может занять от доли секунды до нескольких секунд. Само по себе это было бы не так уж плохо. К сожалению, большинство систем построения на основе make заставляют make быть вызваны от десятков до сотен раз для каждой отдельной сборки. Обычно это вызвано рекурсивным использованием make (что плохо).

Следует отметить, что причина Make настолько медленна, что это не ошибка реализации. Синтаксис Make файлов имеет некоторые причуды, которые делают очень быструю реализацию практически невозможной. Эта проблема еще более заметна в сочетании со следующим шагом.

Проверка зависимостей

Как только инструмент сборки прочитает его конфигурацию, он должен определить, какие файлы были изменены, а какие нужно перекомпилировать. Файлы конфигурации содержат ориентированный ациклический граф, описывающий зависимости сборки. Этот график обычно создается на этапе настройки. Время запуска встроенного инструмента и сканер зависимостей выполняются на каждой отдельной сборке. Их комбинированное время выполнения определяет нижнюю границу цикла редактирования-компиляции-отладки. Для небольших проектов это время обычно составляет несколько секунд или около того. Это терпимо. Существуют альтернативы Make. Самый быстрый из них - Ninja, который был построен инженерами Google для Chromium. Если вы используете CMake или Gyp для сборки, просто переключитесь на их резервные копии Ninja. Вам не нужно ничего менять в самих файлах сборки, просто наслаждайтесь ускорением. Однако ниндзя не упакован в большинстве дистрибутивов, поэтому вам, возможно, придется установить его самостоятельно.

Компиляция

В этот момент мы, наконец, вызываем компилятор. Вырезая несколько углов, вот приблизительные шаги.

Слияние включает
Разбор кода
Генерация/оптимизация кода

Вопреки распространенному мнению, компиляция С++ на самом деле не настолько медленная. STL медленный, и большинство инструментов сборки, используемых для компиляции С++, медленны. Однако есть более быстрые инструменты и способы смягчения медленных частей языка.

Использование их требует немного смазки локтя, но преимущества неоспоримы. Более быстрое время сборки приводит к более счастливым разработчикам, большей гибкости и, в конечном итоге, лучшему коду.

Ravindra Acharya 23 апр. 2015, в 16:24

7

Скомпилированный язык всегда будет требовать больших начальных накладных расходов, чем интерпретируемый язык. Кроме того, возможно, вы не очень хорошо структурировали свой код на С++. Например:

#include "BigClass.h"

class SmallClass
{
   BigClass m_bigClass;
}

Компилируется намного медленнее, чем:

class BigClass;

class SmallClass
{
   BigClass* m_bigClass;
}

Andy Brice 25 нояб. 2008, в 20:31

2

Особенно верно, если BigClass включает в себя еще 5 файлов, которые он использует, в конечном итоге включая весь код в вашей программе.
Tom Leys 25 нояб. 2008, в 19:50
7

Это, возможно, одна из причин. Но Паскаль, например, просто занимает десятую часть времени компиляции, что эквивалентна программе на С ++. Это не потому, что оптимизация gcc: s занимает больше времени, а в том, что Pascal легче анализировать и ему не нужно иметь дело с препроцессором. Также см. Digital Mars D компилятор.
Daniel O 27 март 2009, в 10:20
2

Это не простой синтаксический анализ, это модульность, позволяющая избежать повторной интерпретации windows.h и множества других заголовков для каждого модуля компиляции. Да, Pascal анализирует проще (хотя зрелые, такие как Delphi, снова стали более сложными), но это не то, что делает большую разницу.
Marco van de Voort 29 нояб. 2013, в 15:34
1

Методика, показанная здесь, которая предлагает улучшение скорости компиляции, называется предварительным объявлением .
DavidRR 08 апр. 2015, в 13:51
0

написание классов в одном файле. не будет ли это грязным кодом?
Fennekin 22 окт. 2015, в 17:33

Показать ещё 3 комментария

5

Легкий способ сократить время компиляции в больших проектах на С++ состоит в том, чтобы включить файл .cpp include, содержащий все файлы cpp в вашем проекте и скомпилировать его. Это уменьшает проблему взрыва заголовка до одного раза. Преимущество этого заключается в том, что ошибки компиляции будут по-прежнему ссылаться на правильный файл.

Например, предположим, что у вас есть a.cpp, b.cpp и c.cpp.. создайте файл: everything.cpp:

#include "a.cpp"
#include "b.cpp"
#include "c.cpp"

Затем скомпилируйте проект, просто сделав все .cpp

rileyberton 03 март 2013, в 22:58

3

Я не вижу возражений против этого метода. Предполагая, что вы генерируете включения из скрипта или Makefile, это не проблема обслуживания. Фактически это ускоряет компиляцию, не запутывая проблемы компиляции. Вы могли бы поспорить о потреблении памяти при компиляции, но это редко является проблемой на современном компьютере. Так в чем же цель этого подхода (помимо утверждения, что это неправильно)?
rileyberton 04 март 2013, в 01:33
0

хорошо, если вы добавите ссылку на это: stackoverflow.com/questions/543697/… у вас, возможно, не будет так много отрицательных отзывов: P Конечно, это быстрее, но я очень не рекомендую это. Я ненавижу "#include спагетти"
user1182183 04 март 2013, в 07:35
8

@rileyberton (так как кто-то проголосовал за ваш комментарий), позвольте мне изложить его: нет, это не ускоряет компиляцию. Фактически, он гарантирует, что любая компиляция занимает максимальное количество времени , не изолируя единицы перевода. Самое замечательное в них то, что вам не нужно перекомпилировать все .cpp-ы, если они не изменились. (Это без учета стилистических аргументов). Правильное управление зависимостями и, возможно, предварительно скомпилированные заголовки намного лучше.
sehe 04 март 2013, в 08:55
0

Что за объект? Это явно медленнее. Duh.
Bartek Banachewicz 04 март 2013, в 08:57
6

Извините, но это может быть очень эффективным методом для ускорения компиляции, потому что вы (1) в значительной степени исключаете ссылки, и (2) нужно обрабатывать обычно используемые заголовки только один раз. Кроме того, это работает на практике , если вы пытаетесь это попробовать. К сожалению, это делает невозможным постепенное перестроение, поэтому каждая сборка полностью с нуля. Но полное восстановление с помощью этого метода намного быстрее , чем то , что вы получите , в противном случае
jalf 04 март 2013, в 09:00
0

@jalf Как часто происходит полная перестройка по сравнению с частичной? Когда я писал медленнее , я имел в виду «время, потраченное на составление среднего проекта, будет больше». И мы обсуждали это в Lounge некоторое время назад, вы можете выкопать архивы.
Bartek Banachewicz 04 март 2013, в 09:02
4

@BartekBanachewicz конечно, но вы сказали, что «это не ускоряет компиляцию», без квалификаторов. Как вы сказали, каждая компиляция занимает максимальное количество времени (без частичной перестройки), но в то же время значительно снижает максимальную по сравнению с тем, что было бы иначе. Я просто говорю, что это немного больше нюансов, чем "не делай этого"
jalf 04 март 2013, в 09:04
0

@jalf Согласен. Я тщательно выбрал формулировку «он гарантирует, что любая компиляция займет максимальное количество времени». Если это может означать, что этот «максимум» несколько уменьшен по сравнению с модульным полным перестроением ... Хорошо. Я недавно не работал над чем-то не связанным с игрушкой, где это было бы победой. В С ++ . В C баланс может быть другим.
sehe 04 март 2013, в 09:14
2

Веселитесь со статическими переменными и функциями. Если мне нужен большой модуль компиляции, я создам большой файл .cpp.
gnasher729 27 март 2014, в 09:17
0

@ gnasher729 Я включил все, и это сработало как шарм. Таким образом, в моем небольшом проекте полная компиляция была быстрее, чем раздельная компиляция двух файлов .cpp, так что это почти всегда было чистой победой. В то время gcc уже реализовал предварительно скомпилированные заголовки, а заголовки STL заняли гораздо больше времени, чем мой код. Я также сохранил классический make-файл, на всякий случай ...
maaartinus 18 июль 2018, в 17:42

Показать ещё 8 комментариев

4

Вы получаете то, что программа работает быстрее. Это может быть холодным комфортом для вас во время разработки, но это может иметь большое значение после завершения разработки, и программа просто управляется пользователями.

T.E.D. 31 дек. 2008, в 16:17

4

Некоторые причины:

1) С++-грамматика сложнее, чем С# или Java, и занимает больше времени для разбора.

2) (Более важно) Компилятор С++ создает машинный код и выполняет все оптимизации во время компиляции. С# и Java идут на полпути и оставляют эти шаги в JIT.

Nemanja Trifunovic 25 нояб. 2008, в 19:30

2

Большинство ответов несколько неясны, говоря о том, что С# всегда будет работать медленнее из-за стоимости выполнения действий, которые на С++ выполняются только один раз во время компиляции, эта производительность также зависит от зависимостей времени выполнения (больше вещей для загрузки чтобы иметь возможность запускать), не говоря уже о том, что программы на С# всегда будут иметь больший объем памяти, что приводит к тому, что производительность более тесно связана с возможностями доступного оборудования. То же самое относится к другим языкам, которые интерпретируются или зависят от виртуальной машины.

Panic 20 июнь 2009, в 06:52

1

Есть две проблемы, которые я могу думать о том, что это может повлиять на скорость, с которой компилируются ваши программы на С++.

ВОЗМОЖНЫЙ ВЫПУСК № 1 - СОСТАВЛЕНИЕ ГОЛОВЫ: (Это может быть или не быть уже рассмотрено другим ответом или комментарием.) Microsoft Visual С++ (AKA VС++) поддерживает предварительно скомпилированные заголовки, которые я очень высоко рекомендовать. Когда вы создаете новый проект и выбираете тип программы, которую вы создаете, на вашем экране должно появиться окно мастера установки. Если вы нажмете кнопку "Далее > " в нижней части окна, окно переместит вас на страницу с несколькими списками функций; убедитесь, что флажок рядом с опцией "Предварительно скомпилированный заголовок" отмечен. (ПРИМЕЧАНИЕ. Это был мой опыт работы с консольными приложениями Win32 на С++, но это может быть не в случае со всеми типами программ на С++.)

ВОЗМОЖНЫЙ ВЫПУСК № 2 - РАСПОЛОЖЕНИЕ, СОБИРАЕМАЯ ДЛЯ: Этим летом я взял курс программирования, и нам пришлось хранить все наши проекты на флеш-накопителях емкостью 8 ГБ, так как компьютеры в лаборатории мы использовали, вытерли каждую ночь в полночь, что бы стерло всю нашу работу. Если вы компилируете внешнее запоминающее устройство ради переносимости/безопасности и т.д., Может потребоваться очень много времени (даже с предварительно скомпилированными заголовками, которые были упомянуты выше) для вашей программы для компиляции, особенно если ее довольно большой программа. Мой совет для вас в этом случае состоял бы в том, чтобы создавать и компилировать программы на жестком диске используемого вами компьютера, и всякий раз, когда вам нужно/нужно прекратить работу над вашим проектом (-ами) по любой причине, перенесите их на внешнее устройство хранения, а затем щелкните значок "Безопасное извлечение устройства и извлечения носителя", который должен отображаться как маленький флеш-накопитель за небольшим зеленым кругом с белой галочкой на нем, чтобы отключить его.

Надеюсь, это поможет вам; дайте мне знать, если это произойдет!:)

cjor530 18 авг. 2016, в 03:50

0

Как уже отмечалось, компилятор тратит много времени на создание экземпляра и снова создает шаблоны. До такой степени, что есть проекты, которые сосредоточены на этом конкретном предмете, и требуют наблюдаемого 30-кратного ускорения в некоторых действительно благоприятных случаях. См. http://www.zapcc.com.

akim 26 май 2015, в 11:04

Ещё вопросы

VC ++ поддерживает предварительно скомпилированные заголовки. Использование их поможет. Много.
Да, в моем случае (в основном C с несколькими классами - без шаблонов) предварительно скомпилированные заголовки ускоряются примерно в 10 раз
@ Брайан, я бы никогда не использовал предварительно скомпилированную голову в библиотеке
Попробуйте TinyCC, однако, он просто оптимизирован ОЧЕНЬ мало
Вы можете использовать предварительно скомпилированные заголовки и код C ++. Когда вы компилируете свой код, он будет обновлять только файлы с изменениями. Это занимает очень мало времени. Перекомпиляция всего проекта может занять в 10 раз больше времени.
It takes significantly longer to compile a C++ file - вы имеете в виду 2 секунды по сравнению с 1 секундой? Конечно, это вдвое длиннее, но вряд ли значимо. Или вы имеете в виду 10 минут по сравнению с 5 секундами? Пожалуйста, количественно.
OT: используйте ccache для ускорения :-)
Я сделал ставку на модули; Я не ожидаю, что проекты на C ++ будут создаваться быстрее, чем на других языках программирования, только с модулями, но он может быть очень близок для большинства проектов с некоторым управлением. Надеюсь увидеть хороший менеджер пакетов с артефактной интеграцией после модулей
Интересно сравнить Паскаль, так как Никлаус Вирт использовал время, которое потребовалось компилятору, чтобы скомпилировать себя в качестве эталона при разработке своих языков и компиляторов. Существует история о том, что после тщательного написания модуля для быстрого поиска символов он заменил его простым линейным поиском, потому что уменьшенный размер кода заставил компилятор работать быстрее.
Конечно, в этом есть доступ к файлам, но, как сказал Джальф, главной причиной этого будет нечто иное, а именно повторный анализ многих, многих, многих (вложенных!) Заголовочных файлов, которые полностью выпадают в вашем случае.
Именно в этот момент ваш друг должен установить предварительно скомпилированные заголовки, разорвать зависимости между различными заголовочными файлами (старайтесь избегать одного заголовка, включая другой, вместо прямого объявления) и получить более быстрый жесткий диск. Это в стороне, довольно удивительный показатель.
Если весь заголовочный файл (за исключением возможных комментариев и пустых строк) находится внутри защиты заголовка, gcc может запомнить файл и пропустить его, если задан правильный символ.
Разбор это большое дело. Для N пар исходных / заголовочных файлов одинакового размера с взаимозависимостями существует O (N ^ 2) проходов через заголовочные файлы. Помещение всего текста в один файл сокращает этот повторный анализ.
Небольшое примечание: Включает защиту от нескольких разборов на единицу компиляции. Не против нескольких разборов в целом.
Добавляя к @MarcovandeVoort, некоторые компиляторы распознают, что они включают в себя средства защиты, что позволяет компилятору вообще не открывать файл заново. Другие (в данный момент большинство) используют #pragma once для явного выполнения того, что неявные защитники делают неявно (помечая файл как включаемый только один раз), что позволяет избежать повторного открытия файлов. Но ничто из этого не решает проблему отдельных модулей компиляции; каждый исходный файл C / C ++ будет перечитывать все эти заголовки по одному разу, включая guard и #pragma once просто означает, что они не перечитывают их много раз каждый.
@Tom Ввод / вывод - это большое дело, а наличие заголовочных файлов само по себе очень важно. Не разбирается. У меня была секция компилятора, предназначенная только для синтаксического анализа, работающая со скоростью 50 000 строк в секунду в 1988 году на процессоре с частотой 2 МГц. Чуть позже я использовал поздний компилятор Watcom C, который показывал количество строк, и это показало, что около 95% любой данной компиляции были заголовками. Вот почему мы прекомпилируем заголовки.
Стоимость, добавленная предварительной обработкой, тривиальна. Основная «другая причина» замедления заключается в том, что компиляция разбита на отдельные задачи (по одной на объектный файл), поэтому общие заголовки обрабатываются снова и снова. Это O (N ^ 2) наихудший случай, по сравнению с большинством других языков O (N) время разбора.
Кроме того, связывание занимает много времени, верно?
Из той же аргументации можно сказать, что компиляторы C, Pascal и т. Д. Работают медленно, что в среднем неверно. Это больше связано с грамматикой C ++ и огромным состоянием, которое должен поддерживать компилятор C ++.
С медленно. Он страдает от той же проблемы разбора заголовка, что и принятое решение. Например, возьмите простую программу Windows GUI, которая включает в себя windows.h в несколько единиц компиляции, и измеряйте производительность компиляции при добавлении (коротких) единиц компиляции.
Я думаю, что вы должны выделить комментарий к предварительно скомпилированным заголовкам, чтобы указать на эту ВАЖНУЮ часть вашего ответа.
Если весь заголовочный файл (за исключением возможных комментариев и пустых строк) находится внутри защиты заголовка, gcc может запомнить файл и пропустить его, если задан правильный символ.
@CesarB: он все еще должен обработать его полностью один раз на единицу компиляции (файл .cpp).
Особенно верно, если BigClass включает в себя еще 5 файлов, которые он использует, в конечном итоге включая весь код в вашей программе.
Это, возможно, одна из причин. Но Паскаль, например, просто занимает десятую часть времени компиляции, что эквивалентна программе на С ++. Это не потому, что оптимизация gcc: s занимает больше времени, а в том, что Pascal легче анализировать и ему не нужно иметь дело с препроцессором. Также см. Digital Mars D компилятор.
Это не простой синтаксический анализ, это модульность, позволяющая избежать повторной интерпретации windows.h и множества других заголовков для каждого модуля компиляции. Да, Pascal анализирует проще (хотя зрелые, такие как Delphi, снова стали более сложными), но это не то, что делает большую разницу.
Методика, показанная здесь, которая предлагает улучшение скорости компиляции, называется предварительным объявлением .
написание классов в одном файле. не будет ли это грязным кодом?
Я не вижу возражений против этого метода. Предполагая, что вы генерируете включения из скрипта или Makefile, это не проблема обслуживания. Фактически это ускоряет компиляцию, не запутывая проблемы компиляции. Вы могли бы поспорить о потреблении памяти при компиляции, но это редко является проблемой на современном компьютере. Так в чем же цель этого подхода (помимо утверждения, что это неправильно)?
хорошо, если вы добавите ссылку на это: stackoverflow.com/questions/543697/… у вас, возможно, не будет так много отрицательных отзывов: P Конечно, это быстрее, но я очень не рекомендую это. Я ненавижу "#include спагетти"
@rileyberton (так как кто-то проголосовал за ваш комментарий), позвольте мне изложить его: нет, это не ускоряет компиляцию. Фактически, он гарантирует, что любая компиляция занимает максимальное количество времени , не изолируя единицы перевода. Самое замечательное в них то, что вам не нужно перекомпилировать все .cpp-ы, если они не изменились. (Это без учета стилистических аргументов). Правильное управление зависимостями и, возможно, предварительно скомпилированные заголовки намного лучше.
Что за объект? Это явно медленнее. Duh.
Извините, но это может быть очень эффективным методом для ускорения компиляции, потому что вы (1) в значительной степени исключаете ссылки, и (2) нужно обрабатывать обычно используемые заголовки только один раз. Кроме того, это работает на практике , если вы пытаетесь это попробовать. К сожалению, это делает невозможным постепенное перестроение, поэтому каждая сборка полностью с нуля. Но полное восстановление с помощью этого метода намного быстрее , чем то , что вы получите , в противном случае
@jalf Как часто происходит полная перестройка по сравнению с частичной? Когда я писал медленнее , я имел в виду «время, потраченное на составление среднего проекта, будет больше». И мы обсуждали это в Lounge некоторое время назад, вы можете выкопать архивы.
@BartekBanachewicz конечно, но вы сказали, что «это не ускоряет компиляцию», без квалификаторов. Как вы сказали, каждая компиляция занимает максимальное количество времени (без частичной перестройки), но в то же время значительно снижает максимальную по сравнению с тем, что было бы иначе. Я просто говорю, что это немного больше нюансов, чем "не делай этого"
@jalf Согласен. Я тщательно выбрал формулировку «он гарантирует, что любая компиляция займет максимальное количество времени». Если это может означать, что этот «максимум» несколько уменьшен по сравнению с модульным полным перестроением ... Хорошо. Я недавно не работал над чем-то не связанным с игрушкой, где это было бы победой. В С ++ . В C баланс может быть другим.
Веселитесь со статическими переменными и функциями. Если мне нужен большой модуль компиляции, я создам большой файл .cpp.
@ gnasher729 Я включил все, и это сработало как шарм. Таким образом, в моем небольшом проекте полная компиляция была быстрее, чем раздельная компиляция двух файлов .cpp, так что это почти всегда было чистой победой. В то время gcc уже реализовал предварительно скомпилированные заголовки, а заголовки STL заняли гораздо больше времени, чем мой код. Я также сохранил классический make-файл, на всякий случай ...

jalf · Accepted Answer · 2008-11-25T18-53-00.000Z

Некоторые причины

Заголовочные файлы

Каждый отдельный модуль компиляции требует, чтобы (1) загружались и (2) компилировались сотни или даже тысячи заголовков. Каждый из них, как правило, должен быть перекомпилирован для каждого модуля компиляции, потому что препроцессор гарантирует, что результат компиляции заголовка может отличаться для каждого модуля компиляции. (Макрос может быть определен в одном модуле компиляции, который изменяет содержимое заголовка).

Вероятно, это основная причина, поскольку для каждой единицы компиляции требуется компиляция огромного количества кода, и, кроме того, каждый заголовок должен компилироваться несколько раз (по одному разу для каждой единицы компиляции, которая его включает).

соединение

После компиляции все объектные файлы должны быть связаны друг с другом. Это в основном монолитный процесс, который не может быть очень хорошо распараллелен и должен обрабатывать весь ваш проект.

анализ

Синтаксис чрезвычайно сложен для синтаксического анализа, сильно зависит от контекста, и его очень сложно устранить. Это занимает много времени.

Шаблоны

В С# List<T> является единственным типом, который компилируется, независимо от того, сколько экземпляров List у вас есть в вашей программе. В C++ vector<int> является совершенно отдельным типом от vector<float>, и каждый из них должен быть скомпилирован отдельно.

Добавьте к этому, что шаблоны составляют полный "подъязык" на языке Тьюринга, который должен интерпретировать компилятор, и это может быть до смешного сложным. Даже относительно простой шаблон метапрограммирования шаблонов может определять рекурсивные шаблоны, которые создают десятки и десятки экземпляров шаблонов. Шаблоны могут также приводить к чрезвычайно сложным типам с нелепо длинными именами, добавляя много дополнительной работы компоновщику. (Он должен сравнивать множество имен символов, и если эти имена могут вырасти во многие тысячи символов, это может стать довольно дорогим).

И, конечно, они усугубляют проблемы с заголовочными файлами, потому что шаблоны обычно должны определяться в заголовках, что означает, что для каждого модуля компиляции нужно анализировать и компилировать гораздо больше кода. В простом C-коде заголовок обычно содержит только предварительные объявления, но очень мало реального кода. В C++ нет ничего необычного в том, что почти весь код находится в заголовочных файлах.

оптимизация

C++ допускает некоторые очень драматические оптимизации. С# или Java не позволяют полностью исключать классы (они должны быть там для целей отражения), но даже простая метапрограмма шаблона C++ может легко генерировать десятки или сотни классов, каждый из которых встроен и снова устранен в фаза оптимизации.

Более того, программа C++ должна быть полностью оптимизирована компилятором. Программа AС# может полагаться на JIT-компилятор для выполнения дополнительных оптимизаций во время загрузки, C++ не дает таких "вторых шансов". То, что генерирует компилятор, так же оптимизировано, как и собирается.

Машина

C++ компилируется в машинный код, который может быть несколько сложнее, чем использование байт-кода Java или .NET (особенно в случае x86). (Это упомянуто из-за полноты только потому, что это было упомянуто в комментариях и тому подобное. На практике этот шаг вряд ли займет больше, чем крошечная доля общего времени компиляции).

Заключение

Большинство из этих факторов разделяются кодом C, который на самом деле компилируется довольно эффективно. Этап разбора намного сложнее в C++ и может занимать значительно больше времени, но основным нарушителем, вероятно, являются шаблоны. Они полезны и делают C++ гораздо более мощным языком, но они также берут свое с точки зрения скорости компиляции.

Что касается пункта 3: компиляция C заметно быстрее, чем C ++. Это определенно интерфейс, который вызывает замедление, а не генерацию кода.
Согласен, как я уже сказал, это очень маленький фактор. Я упомянул об этом только потому, что видел, что это упоминалось в некоторых других ответах, и, упомянув это здесь из-за полноты, я мог, по крайней мере, указать, что это не имело большого значения. :)
Переместил точку 3 вниз и немного перефразировал.
Что касается шаблонов: не только вектор <int> должен компилироваться отдельно от вектора <double>, но и вектор <int> перекомпилируется в каждом модуле компиляции, который его использует. Избыточные определения устраняются компоновщиком.
dribeas: Да, но это не относится к шаблонам. Встроенные функции или все, что определено в заголовках, будет перекомпилировано везде, где оно включено. Но да, это особенно больно с шаблонами. :)
Что касается пункта 1: нельзя ли кэшировать скомпилированные заголовочные файлы, возможно, один раз для каждой конфигурации макроса?
@configurator: Да, они могут быть кэшированы. Visual Studio делает это, но я не знаю деталей. Я думаю, что gcc по умолчанию не выполняет никакого кеширования, но это кажется возможным.
@configurator: Visual Studio и gcc допускают предварительно скомпилированные заголовки, что может значительно ускорить компиляцию.
Томас: Есть ссылка для этого? Я не знал, что VS делает какую-либо форму кэширования заголовков. Это кажется очевидной оптимизацией. (если вы не имели в виду предварительно скомпилированные заголовки. Я думал, что возможно что-то более общее)
По нашему опыту, это особенно шаблоны, которые сложно (медленно) компилировать - в нашем проекте вплоть до предварительно скомпилированных заголовков больше не имеет значения. Чем больше мы используем шаблонов и чем больше мы проделываем с ними сложных вещей (например, несколько уровней инкапсуляции, черты, политики или даже метапрограммирование), тем дольше длится компиляция.
Я думаю, что первые две причины, которые вы перечислили, являются основными причинами, и создание единства просто решило бы это.
@lzprgmr: проблема со сборкой единства заключается в том, что вы должны перекомпилировать все, если у вас есть малейший шанс. Так что это тоже не серебряная пуля.
Джалф: я думал, что файлы .PCH расшифровывались как «Pre Compiled header»
@MarcovandeVoort: да, это так. Я не уверен, к чему ты клонишь. Я сказал, что это означает что-то еще?
Не забывайте фазу оптимизации на определенных сборках. (Объединение строк и т. Д.)
@ColeJohnson: но это ничем не отличается от любого другого языка. Я пытался перечислить вещи, которые являются уникальными для C ++
Использование жесткого диска значительно ускорит процесс компиляции и компоновки. Использование SSD или RAM-диска может значительно сократить время компиляции и компоновки.
Я думал, что C # сгенерирует специальный код для универсальных классов, созданных с помощью типов значений, что уменьшает упаковку и использует инструкции IL, специфичные для данного типа. В отличие от обобщений Java, которые являются просто конструкцией типа компиляции.
@GabrielGarcia, все это делается во время выполнения, даже для типов значений (источник)
@ linquize Не правда; по крайней мере, по моему опыту. Я тестировал компиляцию большой базы кода C ++ в MSVC на одной и той же машине как с твердотельным накопителем, так и без него ... SSD улучшил производительность примерно на 5% ... вместо того, чтобы компилировать за 12 минут, потребовалось 11 и более немного. В большинстве случаев центральным процессором является узкое место, перекомпилируя все эти заголовочные файлы снова и снова.
Но индикатор жесткого диска продолжает гореть дольше (особенно на этапе соединения), а не мигает.
@StephenLin Да, машинный код генерируется во время выполнения. То, что я имел в виду, было несколько неполной концепцией, представленной в оригинальном посте выше (что может привести к ряду неправильных представлений). «В C # List <T> является единственным типом, который компилируется, независимо от того, сколько экземпляров List у вас есть в вашей программе». Да, только один набор инструкций IL генерируется из кода C #. Нет, когда вы говорите о конкретизации (подразумевает выполнения), другая машина делает код компилируется из IL для каждого типа значения.
@GabrielGarcia Хорошо, это имеет смысл, и я согласен, что разъяснение важно, но чтобы быть педантичным, компилятор C # этого не делает; это часть реализации типа CLR, которая не зависит от языка :) Кроме того, я не уверен на 100%, действительно ли CLR проходит промежуточный этап генерации специфичного для типа IL из универсального IL или просто генерирует тип специфический нативный код непосредственно при JITing. Цитата из Андерса, кажется, подразумевает последнее, но он, возможно, не был на 100% точен в своей формулировке.
Не уверен, что оптимизация является проблемой, поскольку наши сборки DEBUG на самом деле медленнее, чем сборки в режиме релиза. PDB поколения также является виновником.
@GabrielGarcia: Возможно, стоит отметить, что универсальные типы и машинный код, который их использует, создаются по требованию в .NET, в то время как C ++ должен создавать во время компиляции каждый универсальный тип, который может использовать программа (независимо от того, используется ли она или нет). любой код, использующий все типы, когда-либо выполняется, когда программа получает ввод, который она фактически получает).
@jalf: Я не понял, что вы имеете в виду, говоря, что «даже простая метапрограмма шаблона C ++ может легко генерировать десятки или сотни классов, каждый из которых встроен и снова исключен на этапе оптимизации». Спасибо
Кроме того, из-за шаблонов компоновщику предстоит выполнить еще много работы, дедуплицируя экземпляры шаблонов, которые были сгенерированы много раз.
Вот история из уст лошадей, то есть кто-то, кто делает компиляторы C ++ для жизни: drdobbs.com/cpp/c-compilation-speed/228701711
Я разработал практику помещения всех моих шаблонов в отдельный заголовок и создания специализаций шаблонов с использованием заголовков без шаблонов. Это позволяет скомпилировать шаблоны в предварительно скомпилированную библиотеку, а затем использовать без необходимости компиляции. Нет больше времени компиляции для библиотеки, только приложение. Это может все еще быть проблемой с созданием плагинов DLL, но вне этого, это работает безупречно.