Расчет скорости рутин?

Question

Расчет скорости рутин?

34

Каким будет лучший и наиболее точный способ определить, сколько времени потребовалось для обработки процедуры, например, процедуры функции?

Я спрашиваю, потому что в настоящее время я пытаюсь оптимизировать несколько функций в своем приложении, когда проверяю изменения, которые трудно определить, просто посмотрев на него, если вообще не было никаких улучшений. Поэтому, если бы я мог вернуть точное или близкое точное время, которое потребовалось, чтобы обработать рутину, у меня есть более четкое представление о том, насколько хорошо, если какие-либо изменения в коде были сделаны.

Я рассматривал использование GetTickCount, но я не уверен, что это будет что-то близкое к точности?

Было бы полезно иметь восстановимую функцию/процедуру для вычисления времени подпрограммы и использовать ее примерно так:

// < prepare for calcuation of code
...
ExecuteSomeCode; // < code to test
...
// < stop calcuating code and return time it took to process

Я с нетерпением жду некоторых предложений.

Спасибо.

Craig.

RBA 17 май 2011, в 11:57

Источник

Теги:

optimization

performance

delphi

gettickcount

8 ответов

18

Попробуйте Eric Grange Пробоотборщик пробоотбора.

Ondrej Kelle 17 май 2011, в 13:04

0

+1. Это хороший профилировщик.
Cosmin Prund 17 май 2011, в 12:38
0

+1 очень хороший и эффективный профайлер.
RBA 17 май 2011, в 12:47
0

+1 Я бы всегда предпочел использовать профилировщик, чем бросать свои собственные процедуры. Тем не менее, попробуйте измерить свои наручные часы, как только вы выполните оптимизацию, чтобы проверить реальность!
David Heffernan 17 май 2011, в 12:57
0

Я прочитал объявление. По формулировке я не могу сказать, является ли она 1) выборкой стека вызовов, 2) сообщает построчно процент выборок, содержащих эту строку, 3) выборок по времени настенных часов. Вы знаете, если это так?
Mike Dunlavey 17 май 2011, в 13:19
0

Чтобы измерить ровно одну подпрограмму, профилировщик выборки может быть не лучшим выбором, лучше, когда вам нужно понять, где код медленнее, а затем выполнить детализацию. Когда речь идет об относительно небольших фрагментах кода, классический профилировщик обычно возвращает более точную информацию.
user160694 17 май 2011, в 13:34
0

@Mike: я не знаю, как это работает внутри, и я не уверен, что я даже понимаю, о чем вы спрашиваете, но я думаю, что он регулярно проверяет, какой код выполняется в настоящее время, и сохраняет количество обращений для каждой вызываемой функции / метода. Он также анализирует стек вызовов и сохраняет статистику для всех вызывающих абонентов.
Ondrej Kelle 17 май 2011, в 13:45
0

@ldsandon вы правы, если речь идет о точных измерениях, мой ответ не поможет. Профилировщик лучше показывает, какой код выполняется часто, поэтому его улучшение окажет большее влияние.
Ondrej Kelle 17 май 2011, в 13:49
0

Другими словами: предположим, что определенная строка кода foo.cpp: 37 вызывает функцию, как new , и находится в стеке 40% времени, назначает ли профилировщик 40% этой строке? Предположим, что другая строка print или cout::<< и находится в стеке 40% времени, назначает ли профилировщик 40% этой строке? (не только для функций, а не только процессорного времени)
Mike Dunlavey 18 май 2011, в 13:28

Показать ещё 6 комментариев

13

От Delphi 6 вверх вы можете использовать счетчик timestamp x86.
Это рассчитывает циклы процессора, на 1 ГГц процессоре, каждый счет занимает одну наносекунду.
Не может быть более точным.

function RDTSC: Int64; assembler;
asm
  // RDTSC can be executed out of order, so the pipeline needs to be flushed
  // to prevent RDTSC from executing before your code is finished.  
  // Flush the pipeline
  XOR eax, eax
  PUSH EBX
  CPUID
  POP EBX
  RDTSC  //Get the CPU time stamp counter.
end;

В x64 следующий код более точен, потому что он не страдает от задержки CPUID.

  rdtscp        // On x64 we can use the serializing version of RDTSC
  push rbx      // Serialize the code after, to avoid OoO sneaking in
  push rax      // subsequent instructions prior to executing RDTSCP.
  push rdx      // See: http://www.intel.de/content/dam/www/public/us/en/documents/white-papers/ia-32-ia-64-benchmark-code-execution-paper.pdf
  xor eax,eax
  cpuid
  pop rdx
  pop rax
  pop rbx
  shl rdx,32
  or rax,rdx

Используйте приведенный выше код, чтобы получить отметку времени до и после выполнения кода.
Самый точный способ возможен и легкий, как пирог.

Обратите внимание, что вам нужно запустить тест не менее 10 раз, чтобы получить хороший результат, при первом проходе кеш будет холодным, а случайные жесткие диски и прерывания могут сбросить тайминги. Поскольку эта вещь настолько точна, она может дать вам неправильную идею, если вы только время первого запуска.

Почему вы не должны использовать QueryPerformanceCounter()
QueryPerformanceCounter() дает такое же количество время, если процессор замедляется, он компенсирует потерю CPU. Пока RDTSC даст вам такое же количество циклов, если ваш процессор замедляется из-за перегрева или еще чего-то еще.
Поэтому, если ваш процессор начинает работать горячим и ему нужно дросселировать, QueryPerformanceCounter() скажет, что ваша процедура занимает больше времени (что вводит в заблуждение), и RDTSC скажет, что он принимает такое же количество циклов (что точно).
Это то, чего вы хотите, потому что вас интересует количество циклов процессора, используемых вашим кодом, а не время настенных часов.

Из последних документов Intel: http://software.intel.com/en-us/articles/measure-code-sections-using-the-enhanced-timer/?wapkw=%28rdtsc%29

Использование часов процессора

Этот таймер очень точен. В системе с процессором 3GHz этот таймер может измерять события, длившиеся менее одной наносекунды. [...] Если частота изменяется во время работы целевого кода, окончательное считывание будет избыточным, поскольку начальное и окончательное считывание не было выполнено с использованием той же тактовой частоты. Количество тактов синхронизации, которые произошли за это время, будет точным, но прошедшее время будет неизвестно.

Если не использовать RDTSC
RDTSC полезен для базового времени. Если вы используете многопоточный код на одном процессоре, RDTSC будет работать нормально. Если у вас несколько процессоров, стартовый номер может исходить от одного процессора и конечного номера от другого.
Поэтому не используйте RDTSC для многопоточного кода на многопроцессорной машине. На одном процессоре процессора он работает отлично, или однопоточный код на многопроцессорной машине тоже хорош.
Также помните, что RDTSC подсчитывает циклы процессора. Если есть что-то, что требует времени, но не использует CPU, например disk-IO или network, чем RDTSC, это не очень хороший инструмент.

Но в документации говорится, что RDTSC не точен на современных процессорах
RDTSC не инструмент для отслеживания времени, это инструмент для отслеживания циклов CPU.
Для этого он является инструментом только. Регуляции, которые отслеживают время, не точны на современном процессоре, потому что часы процессора не такие абсолютные, как раньше.

Johan 17 май 2011, в 14:31

3

RDTSC не должен использоваться в Windows с современным процессором. Фактически, его результаты зависят от текущего состояния процессора: современные процессоры могут изменять его частоту (например, технология TurboBoost), а многоядерный дизайн затрудняет получение точных результатов, поэтому rdtsc НЕ ДОЛЖЕН использоваться. QueryPerformanceCounter () IS должен использоваться вместо этого. См. Msdn.microsoft.com/en-us/library/ee417693%28VS.85%29.aspx
Arnaud Bouchez 17 май 2011, в 15:45
2

@Bouchez, это именно то, почему вы хотите использовать RDTSC! Если ваш процессор замедляется, RDTSC по-прежнему будет показывать правильное время работы в циклах. Что касается проблем с многопоточностью, стандартный код Delphi является однопоточным, поэтому проблема возникает только при использовании нескольких потоков. Это QueryPerformanceCounter() , который не дает точных результатов, когда процессор замедляется.
Johan 17 май 2011, в 16:50
0

@Johan Приложения Delphi, особенно те, которые нуждаются в профилировании, обычно являются многопоточными (например, для сервера). О QueryPerformanceCounter на странице, которую вы цитируете, говорится как раз наоборот: RDTSC не является точным в случае изменения ЦП во время выполнения потока, тогда как Etime является точным, потому что он проверяет ЦП, на котором он работает. И накладные расходы не проблема во время профилирования. Вы не хотите, чтобы ваше приложение работало так же быстро, как обычно, вы хотите точно знать, что требует времени.
Arnaud Bouchez 17 май 2011, в 20:35
0

@Bouchez, OP не говорит о серверах или потоках. Он хочет знать, как быстро его рутина. В этом случае вы хотите знать циклы, а не время настенных часов. Он хочет знать, вносит ли он изменения в рутину все быстрее или медленнее. Если у вашей функции тестирования много накладных расходов, это портит ваши настройки. Вот почему RDTSC настолько QueryPerformanceCounter() , что накладные расходы очень малы, и он точно подсчитывает циклы, а не QueryPerformanceCounter() , который может сильно колебаться в зависимости от того, работает ли ваш процессор горячим или нет.
Johan 17 май 2011, в 22:00
1

@Johan У кого сегодня есть одноядерный ПК? Какая польза от запуска приложения с привязкой потоков к ОДНОМУ ЦПУ только для использования RDTSC? QueryPerformanceCounter данные QueryPerformanceCounter НЕ являются проблемой, потому что вы будете вычислять разность временных меток. И документ, который вы цитируете, не является «последним» документом. Дата вверху страницы - это дата обновления макета страницы. Этот документ Intel посвящен Pentium II и относится к технологии SpeedStep, выпущенной в 2003 году !!!!!
Arnaud Bouchez 18 май 2011, в 05:57
1

Если вы используете CPUID, вам придется PUSH EBX перед его выполнением и POP EBX впоследствии. Это связано с тем, что CPUID (также) изменяет регистр EBX, но Delphi ожидает, что инструкции / процедуры ASM сохранят EBX.
PhiS 18 май 2011, в 07:06
1

@ A.Bouchez - вы можете установить привязку исполняющего потока к одному логическому процессору, а затем убедитесь, что вы получаете сопоставимые показания из счетчика меток времени, используя этот метод.
PhiS 18 май 2011, в 07:09
1

@Bouchez, вы упускаете суть. QueryPerformanceCounter предназначен для измерения времени настенных часов. RDTSC предназначен для измерения тактов процессора. Для использования RDTSC на многоядерных процессорах смотрите: stackoverflow.com/questions/3388134/… QueryPerformanceCounter данные QueryPerformanceCounter - большая проблема, потому что они варьируются между различными запусками.
Johan 18 май 2011, в 07:13
0

RDTSC не защищает вас от эффектов задержки памяти при изменении частоты процессора. В дополнение к настройке соответствия потоков, вам также необходимо отключить настройки частоты (режим максимальной производительности в Windows)
Eric Grange 07 июнь 2013, в 15:57
0

Большое спасибо, это как раз то, что мне нужно для тайм-аута / доступа к памяти. QueryPerformanceCounter был слишком медленным для этого, все, что он делал, это показывало 15–17 тиков, которые, вероятно, измеряли себя в микросекундах, следующие несколько обращений к себе, вероятно, были предсказаны / кэшированы, поэтому он уменьшился до 7 тиков, но в основном из-за накладных расходов микросекунд это была совершенно бессмысленная / неиспользуемая информация о времени;) Все, что я делаю, это показываю 7 микросекунд для всего, я думаю! ;) :) возможно, это немного отличается в зависимости от частоты, но это где-то в этом поле;)
Skybuck Flying 29 июль 2018, в 23:45

Показать ещё 8 комментариев

10

Вы не указали свою версию Delphi, но Delphi XE имеет TStopWatch, объявленную в модуле Diagnostics. Это позволит вам измерить время выполнения с разумной точностью.

uses
  Diagnostics;
var
  sw: TStopWatch;
begin
  sw := TStopWatch.StartNew;
  <dosomething>
  Writeln(Format('runtime: %d ms', [sw.ElapsedMilliseconds]));
end;

Uwe Raabe 17 май 2011, в 13:29

1

У меня нет Delphi XE, но я считаю, что это тот же класс, что и здесь delphi.about.com/od/windowsshellapi/a/…
RBA 17 май 2011, в 13:31
0

В XE я бы написал в AQ Time, чтобы точно понять, где важна производительность.
user160694 17 май 2011, в 13:32
0

@RBA, реализация XE основана на записи, а не на классе, но другие вещи выглядят очень похоже.
Uwe Raabe 17 май 2011, в 15:51
1

'T' из TStopWatch подсказал мне, что это класс. Полезно знать, как реализовано в XE.
RBA 18 май 2011, в 06:20
1

Зачем? Стандартное использование Delphi 'T' означает «тип», как в «это тип данных». Почти все типы начинаются с буквы T, но многие из них не являются классами. Смотрите TRect и TDateTime только для того, чтобы назвать пару.
Jon Robertson 23 янв. 2013, в 10:27

Показать ещё 3 комментария

6

Я спрашиваю, потому что в настоящее время я пытаюсь оптимизировать несколько функций

Естественно думать, что измерение - это то, как вы узнаете, что оптимизировать, но там лучший способ.

Если что-то занимает достаточно большую часть времени (F), чтобы стоить оптимизировать, тогда, если вы просто производите паузу, F - вероятность того, что вы поймаете его в действии. Сделайте это несколько раз, и вы точно поймете, почему он это делает, вплоть до точных строк кода.

Подробнее об этом. Вот пример.

Исправьте его, а затем выполните общее измерение, чтобы увидеть, сколько вы сохранили, что должно быть около F. Промыть и повторить.

Mike Dunlavey 17 май 2011, в 14:35

0

+1 за блестящее понимание. Но будьте осторожны, чтобы не оптимизировать цикл простоя :-).
Johan 17 май 2011, в 13:44
0

@Johan: Спасибо за хедз-ап. Я буду осторожен :-)
Mike Dunlavey 17 май 2011, в 16:53

1

Вот несколько процедур, которые я сделал для проверки продолжительности функции. Я застрял их в блоке, который я назвал uTesting, а затем просто бросаю в предложение uses во время моего тестирования.

Декларация

  Procedure TST_StartTiming(Index : Integer = 1);
    //Starts the timer by storing now in Time
    //Index is the index of the timer to use. 100 are available

  Procedure TST_StopTiming(Index : Integer = 1;Display : Boolean = True; DisplaySM : Boolean = False);
    //Stops the timer and stores the difference between time and now into time
    //Displays the result if Display is true
    //Index is the index of the timer to use. 100 are available

  Procedure TST_ShowTime(Index : Integer = 1;Detail : Boolean = True; DisplaySM : Boolean = False);
    //In a ShowMessage displays time
    //Uses DateTimeToStr if Detail is false else it breaks it down (H,M,S,MS)
    //Index is the index of the timer to use. 100 are available

объявленные переменные

var
  Time : array[1..100] of TDateTime;

Реализация

  Procedure TST_StartTiming(Index : Integer = 1);
  begin
    Time[Index] := Now;
  end; 

  Procedure TST_StopTiming(Index : Integer = 1;Display : Boolean = True; DisplaySM : Boolean = False);
  begin
    Time[Index] := Now - Time[Index];
    if Display then TST_ShowTime;
  end;

  Procedure TST_ShowTime(Index : Integer = 1;Detail : Boolean = True; DisplaySM : Boolean = False);
  var
    H,M,S,MS : Word;
  begin
    if Detail then
      begin
        DecodeTime(Time[Index],H,M,S,MS);
        if DisplaySM then
        ShowMessage('Hour   =   ' + FloatToStr(H)  + #13#10 +
                    'Min     =   ' + FloatToStr(M)  + #13#10 +
                    'Sec      =   ' + FloatToStr(S)  + #13#10 +
                    'MS      =   ' + FloatToStr(MS) + #13#10)
        else
        OutputDebugString(PChar('Hour   =   ' + FloatToStr(H)  + #13#10 +
                    'Min     =   ' + FloatToStr(M)  + #13#10 +
                    'Sec      =   ' + FloatToStr(S)  + #13#10 +
                    'MS      =   ' + FloatToStr(MS) + #13#10));
      end
    else
      ShowMessage(TimeToStr(Time[Index]));
      OutputDebugString(Pchar(TimeToStr(Time[Index])));
  end;

Tim 17 май 2011, в 12:31

0

clock_gettime() - это высокое решение, точное с точностью до nano секунд, вы также можете использовать rtdsc, что является точным для цикла процессора, и, наконец, вы можете просто использовать gettimeofday().

egraldlo 30 нояб. 2016, в 07:54

0

Используйте http://delphi.about.com/od/windowsshellapi/a/delphi-high-performance-timer-tstopwatch.htm

MajidTaheri 03 май 2012, в 07:22

Ещё вопросы

+1 очень хороший и эффективный профайлер.
+1 Я бы всегда предпочел использовать профилировщик, чем бросать свои собственные процедуры. Тем не менее, попробуйте измерить свои наручные часы, как только вы выполните оптимизацию, чтобы проверить реальность!
Я прочитал объявление. По формулировке я не могу сказать, является ли она 1) выборкой стека вызовов, 2) сообщает построчно процент выборок, содержащих эту строку, 3) выборок по времени настенных часов. Вы знаете, если это так?
Чтобы измерить ровно одну подпрограмму, профилировщик выборки может быть не лучшим выбором, лучше, когда вам нужно понять, где код медленнее, а затем выполнить детализацию. Когда речь идет об относительно небольших фрагментах кода, классический профилировщик обычно возвращает более точную информацию.
@Mike: я не знаю, как это работает внутри, и я не уверен, что я даже понимаю, о чем вы спрашиваете, но я думаю, что он регулярно проверяет, какой код выполняется в настоящее время, и сохраняет количество обращений для каждой вызываемой функции / метода. Он также анализирует стек вызовов и сохраняет статистику для всех вызывающих абонентов.
@ldsandon вы правы, если речь идет о точных измерениях, мой ответ не поможет. Профилировщик лучше показывает, какой код выполняется часто, поэтому его улучшение окажет большее влияние.
Другими словами: предположим, что определенная строка кода foo.cpp: 37 вызывает функцию, как new , и находится в стеке 40% времени, назначает ли профилировщик 40% этой строке? Предположим, что другая строка print или cout::<< и находится в стеке 40% времени, назначает ли профилировщик 40% этой строке? (не только для функций, а не только процессорного времени)
RDTSC не должен использоваться в Windows с современным процессором. Фактически, его результаты зависят от текущего состояния процессора: современные процессоры могут изменять его частоту (например, технология TurboBoost), а многоядерный дизайн затрудняет получение точных результатов, поэтому rdtsc НЕ ДОЛЖЕН использоваться. QueryPerformanceCounter () IS должен использоваться вместо этого. См. Msdn.microsoft.com/en-us/library/ee417693%28VS.85%29.aspx
@Bouchez, это именно то, почему вы хотите использовать RDTSC! Если ваш процессор замедляется, RDTSC по-прежнему будет показывать правильное время работы в циклах. Что касается проблем с многопоточностью, стандартный код Delphi является однопоточным, поэтому проблема возникает только при использовании нескольких потоков. Это QueryPerformanceCounter() , который не дает точных результатов, когда процессор замедляется.
@Johan Приложения Delphi, особенно те, которые нуждаются в профилировании, обычно являются многопоточными (например, для сервера). О QueryPerformanceCounter на странице, которую вы цитируете, говорится как раз наоборот: RDTSC не является точным в случае изменения ЦП во время выполнения потока, тогда как Etime является точным, потому что он проверяет ЦП, на котором он работает. И накладные расходы не проблема во время профилирования. Вы не хотите, чтобы ваше приложение работало так же быстро, как обычно, вы хотите точно знать, что требует времени.
@Bouchez, OP не говорит о серверах или потоках. Он хочет знать, как быстро его рутина. В этом случае вы хотите знать циклы, а не время настенных часов. Он хочет знать, вносит ли он изменения в рутину все быстрее или медленнее. Если у вашей функции тестирования много накладных расходов, это портит ваши настройки. Вот почему RDTSC настолько QueryPerformanceCounter() , что накладные расходы очень малы, и он точно подсчитывает циклы, а не QueryPerformanceCounter() , который может сильно колебаться в зависимости от того, работает ли ваш процессор горячим или нет.
@Johan У кого сегодня есть одноядерный ПК? Какая польза от запуска приложения с привязкой потоков к ОДНОМУ ЦПУ только для использования RDTSC? QueryPerformanceCounter данные QueryPerformanceCounter НЕ являются проблемой, потому что вы будете вычислять разность временных меток. И документ, который вы цитируете, не является «последним» документом. Дата вверху страницы - это дата обновления макета страницы. Этот документ Intel посвящен Pentium II и относится к технологии SpeedStep, выпущенной в 2003 году !!!!!
Если вы используете CPUID, вам придется PUSH EBX перед его выполнением и POP EBX впоследствии. Это связано с тем, что CPUID (также) изменяет регистр EBX, но Delphi ожидает, что инструкции / процедуры ASM сохранят EBX.
@ A.Bouchez - вы можете установить привязку исполняющего потока к одному логическому процессору, а затем убедитесь, что вы получаете сопоставимые показания из счетчика меток времени, используя этот метод.
@Bouchez, вы упускаете суть. QueryPerformanceCounter предназначен для измерения времени настенных часов. RDTSC предназначен для измерения тактов процессора. Для использования RDTSC на многоядерных процессорах смотрите: stackoverflow.com/questions/3388134/… QueryPerformanceCounter данные QueryPerformanceCounter - большая проблема, потому что они варьируются между различными запусками.
RDTSC не защищает вас от эффектов задержки памяти при изменении частоты процессора. В дополнение к настройке соответствия потоков, вам также необходимо отключить настройки частоты (режим максимальной производительности в Windows)
Большое спасибо, это как раз то, что мне нужно для тайм-аута / доступа к памяти. QueryPerformanceCounter был слишком медленным для этого, все, что он делал, это показывало 15–17 тиков, которые, вероятно, измеряли себя в микросекундах, следующие несколько обращений к себе, вероятно, были предсказаны / кэшированы, поэтому он уменьшился до 7 тиков, но в основном из-за накладных расходов микросекунд это была совершенно бессмысленная / неиспользуемая информация о времени;) Все, что я делаю, это показываю 7 микросекунд для всего, я думаю! ;) :) возможно, это немного отличается в зависимости от частоты, но это где-то в этом поле;)
У меня нет Delphi XE, но я считаю, что это тот же класс, что и здесь delphi.about.com/od/windowsshellapi/a/…
В XE я бы написал в AQ Time, чтобы точно понять, где важна производительность.
@RBA, реализация XE основана на записи, а не на классе, но другие вещи выглядят очень похоже.
'T' из TStopWatch подсказал мне, что это класс. Полезно знать, как реализовано в XE.
Зачем? Стандартное использование Delphi 'T' означает «тип», как в «это тип данных». Почти все типы начинаются с буквы T, но многие из них не являются классами. Смотрите TRect и TDateTime только для того, чтобы назвать пару.
+1 за блестящее понимание. Но будьте осторожны, чтобы не оптимизировать цикл простоя :-).
@Johan: Спасибо за хедз-ап. Я буду осторожен :-)

RBA · Accepted Answer · 2011-05-17T12-42-00.000Z

22

Лучший ответ

Насколько мне известно, наиболее точный метод - это QueryPerformanceFrequency:

код:

var
  Freq, StartCount, StopCount: Int64;
  TimingSeconds: real;
begin
  QueryPerformanceFrequency(Freq);
  QueryPerformanceCounter(StartCount);
  // Execute process that you want to time: ...
  QueryPerformanceCounter(StopCount);
  TimingSeconds := (StopCount - StartCount) / Freq;
  // Display timing: ... 
end;

RBA 17 май 2011, в 12:42

0

Я пытался так: 'процедура TForm1.Button1Click (Отправитель: TObject); var i: Integer; begin QueryPerformanceFrequency (Freq); QueryPerformanceCounter (StartCount); для i: = от 0 до 10000 начинайте ListBox1.Items.Add ('Item' + IntToStr (i)); конец; QueryPerformanceCounter (StopCount); TimingSeconds: = (StopCount - StartCount) / Freq; ShowMessage (IntToStr (Round ((TimingSeconds)))); конец;' Он возвращается как в секундах, как вернуть это в миллисекундах?
user741875 17 май 2011, в 12:32
0

здесь у вас есть полностью функциональный пример - delphi.about.com/od/windowsshellapi/a/…
RBA 17 май 2011, в 12:42
4

Преобразование секунд в миллисекунды путем деления на 1000
David Heffernan 17 май 2011, в 12:43
1

@ Давид: Вы имеете в виду умножение , не так ли?
Ken White 17 май 2011, в 12:49
0

@ Кен Да, это то, что я имел в виду!
David Heffernan 17 май 2011, в 12:52
1

@ Кен, @ Дэвид, лучше разделить делитель перед делением! То есть Freq := Freq div 1000 до TimingMilliseconds := (Stop - Start) / Freq .
Cosmin Prund 17 май 2011, в 12:58
1

о боже, почему я не думаю об этом!
user741875 17 май 2011, в 13:17
3

@RBA, накладные расходы при использовании QueryPerformanceCount составляют 19 микросекунд на вызов согласно: support.microsoft.com/kb/172338 . Если вы используете RDTSC, накладные расходы составляют несколько циклов ЦП. На коротких подпрограммах издержки QueryPerformanceCounter могут быть намного больше, чем общее время выполнения вашего кода.
Johan 17 май 2011, в 13:27
1

Если вы используете эту подпрограмму, обязательно рассчитайте накладные расходы, связанные с ее использованием, и вычтите их из времени выполнения вашей подпрограммы, чтобы получить точные результаты.
Johan 17 май 2011, в 13:29
0

спасибо за дополнительную информацию, я обязательно учту это при определении результатов.
user741875 17 май 2011, в 13:43
1

@Johan RDTSC НЕ надежен на современных процессорах с многоядерностью и изменяющейся частотой. См. Msdn.microsoft.com/en-us/library/ee417693%28VS.85%29.aspx
Arnaud Bouchez 17 май 2011, в 15:46
1

@ A.Bouchez, это ненадежно для времени, но при профилировании вас не интересует время, вы интересуетесь циклами процессора . QueryPerformanceCounter не является точным в циклах ЦП и поэтому не подходит для профилирования, см. Редактирование в моем ответе и ссылку на официальную документацию от Intel.
Johan 17 май 2011, в 17:20
0

@Cosmin: я только комментировал комментарий Дэвида, а не ответ. :)
Ken White 20 май 2011, в 00:27
0

@Johan RDTSC сам по себе также не точен по циклам: как только у вас возникнут задержки памяти в миксе, изменения частоты будут по-разному влиять на основную память и процессор. Единственный точный способ измерения - отключить изменения частоты процессора во время бенчмаркинга.
Eric Grange 07 июнь 2013, в 15:54

Показать ещё 12 комментариев