Производительность Python против MATLAB по алгоритму

Question

Производительность Python против MATLAB по алгоритму

1

У меня вопрос производительности по двум битам кода. Один реализован в python и один в MATLAB. Код вычисляет энтропию выборки временного ряда (что звучит сложно, но в основном представляет собой набор для циклов).

Я выполняю обе реализации на относительно больших временных рядах (~ 95k+) в зависимости от временных рядов. Выполнение MATLAB завершает расчет в течение ~ 45 секунд до 1 минуты. Питон в принципе никогда не заканчивается. Я бросил tqdm поверх питона для циклов, и верхний цикл двигался только примерно на 1.85s/it, что дает 50+ часы в качестве расчетного времени завершения (я разрешил ему работать для 15+ mins, и счетчик итераций был довольно последовательный).

Примеры входов и времени выполнения:

MATLAB (~ 52 с):

a = rand(1, 95000)
sampenc(a, 4, 0.1 * std(a))

Python (в настоящее время 5 минут с оценкой в 49 часов):

import numpy as np
a = np.random.rand(1, 95000)[0]
sample_entropy(a, 4, 0.1 * np.std(a))

Реализация Python:

# https://github.com/nikdon/pyEntropy
def sample_entropy(time_series, sample_length, tolerance=None):
    """Calculate and return Sample Entropy of the given time series.
    Distance between two vectors defined as Euclidean distance and can
    be changed in future releases
    Args:
        time_series: Vector or string of the sample data
        sample_length: Number of sequential points of the time series
        tolerance: Tolerance (default = 0.1...0.2 * std(time_series))
    Returns:
        Vector containing Sample Entropy (float)
    References:
        [1] http://en.wikipedia.org/wiki/Sample_Entropy
        [2] http://physionet.incor.usp.br/physiotools/sampen/
        [3] Madalena Costa, Ary Goldberger, CK Peng. Multiscale entropy analysis
            of biological signals
    """
    if tolerance is None:
        tolerance = 0.1 * np.std(time_series)

    n = len(time_series)
    prev = np.zeros(n)
    curr = np.zeros(n)
    A = np.zeros((sample_length, 1))  # number of matches for m = [1,...,template_length - 1]
    B = np.zeros((sample_length, 1))  # number of matches for m = [1,...,template_length]

    for i in range(n - 1):
        nj = n - i - 1
        ts1 = time_series[i]
        for jj in range(nj):
            j = jj + i + 1
            if abs(time_series[j] - ts1) < tolerance:  # distance between two vectors
                curr[jj] = prev[jj] + 1
                temp_ts_length = min(sample_length, curr[jj])
                for m in range(int(temp_ts_length)):
                    A[m] += 1
                    if j < n - 1:
                        B[m] += 1
            else:
                curr[jj] = 0
        for j in range(nj):
            prev[j] = curr[j]

    N = n * (n - 1) / 2
    B = np.vstack(([N], B[:sample_length - 1]))
    similarity_ratio = A / B
    se = - np.log(similarity_ratio)
    se = np.reshape(se, -1)
    return se

Реализация MATLAB:

function [e,A,B]=sampenc(y,M,r);
%function [e,A,B]=sampenc(y,M,r);
%
%Input
%
%y input data
%M maximum template length
%r matching tolerance
%
%Output
%
%e sample entropy estimates for m=0,1,...,M-1
%A number of matches for m=1,...,M
%B number of matches for m=0,...,M-1 excluding last point

n=length(y);
lastrun=zeros(1,n);
run=zeros(1,n);
A=zeros(M,1);
B=zeros(M,1);
p=zeros(M,1);
e=zeros(M,1);

for i=1:(n-1)
   nj=n-i;
   y1=y(i);
   for jj=1:nj
      j=jj+i;      
      if abs(y(j)-y1)<r
         run(jj)=lastrun(jj)+1;
         M1=min(M,run(jj));
         for m=1:M1           
            A(m)=A(m)+1;
            if j<n
               B(m)=B(m)+1;
            end            
         end
      else
         run(jj)=0;
      end      
   end
   for j=1:nj
      lastrun(j)=run(j);
   end
end
N=n*(n-1)/2;
B=[N;B(1:(M-1))];
p=A./B;
e=-log(p);

Я также пробовал несколько других реализаций python, и все они имеют одинаковый медленный результат: vectorized-sample-entropy

sampen

sampen2.py

Энтропия вершин Википедии

Я не думаю, что проблема с компьютером, поскольку она быстро управляет относительностью в MATLAB.

Насколько я могу судить, реализация обоих наборов кода одинакова. Я понятия не имею, почему реализации python настолько медленны. Я бы понял разницу в несколько секунд, но не такое большое несоответствие. Сообщите мне свои мысли о том, почему это так, или о том, как улучшить версии python.

BTW: Я использую Python 3.6.5 с numpy 1.14.5 и MATLAB R2018a.

Daniel Wendelken 18 авг. 2018, в 00:05

Источник

0

вы, кажется, не используете векторизованные возможности numpy, нарезки списков и т. д. ... пытаетесь сократить циклы python.
Jean-François Fabre♦ 17 авг. 2018, в 22:02
0

У вас, кажется, есть квадратичный и, возможно, даже кубический алгоритм. AFAIK, более поздние версии MATLAB знают, как компилировать код, а не просто интерпретировать его. Таким образом, даже петли, сделанные вручную, будут быстрыми. Вы также используете много векторизованных операций, которые будут очень быстрыми. В Python ничего этого нет. Язык интерпретируется без какой-либо фантазии, такой как JIT и т. Д. Кроме того, вы не используете какую-либо низкоуровневую векторную библиотеку, а скорее делаете все на Python. Производительность будет страдать. Хотя я должен признать, что разница довольно большая .. возможно, стоит поискать ошибку.
Horia Coman 17 авг. 2018, в 22:06
0

Некоторое время назад я обсуждал аналогичное сравнение MATLAB и numpy в Code Review, codereview.stackexchange.com/questions/17702/… . Ускорение простого кода путем замены циклов операциями «целый массив» (как того требовали более старые версии MATLAB) является частой темой SO.
hpaulj 17 авг. 2018, в 22:53
0

Matlab по умолчанию имеет jit-компилятор, а Python - нет. Вы можете использовать Numba, чтобы выполнить ваш код. Это часто превосходит Jit-компилятор Matlab, например. stackoverflow.com/a/50890174/4045774
max9111 18 авг. 2018, в 15:35
0

Я полагаю, вы используете это во многих временных рядах. Длина образца одинакова для всех серий? Поскольку это смущающе параллельно, параллелизм будет следующим шагом.
max9111 18 авг. 2018, в 18:10

Показать ещё 3 комментария

Теги:

python

numpy

performance

matlab

time-complexity

1 ответ

Ещё вопросы

вы, кажется, не используете векторизованные возможности numpy, нарезки списков и т. д. ... пытаетесь сократить циклы python.
У вас, кажется, есть квадратичный и, возможно, даже кубический алгоритм. AFAIK, более поздние версии MATLAB знают, как компилировать код, а не просто интерпретировать его. Таким образом, даже петли, сделанные вручную, будут быстрыми. Вы также используете много векторизованных операций, которые будут очень быстрыми. В Python ничего этого нет. Язык интерпретируется без какой-либо фантазии, такой как JIT и т. Д. Кроме того, вы не используете какую-либо низкоуровневую векторную библиотеку, а скорее делаете все на Python. Производительность будет страдать. Хотя я должен признать, что разница довольно большая .. возможно, стоит поискать ошибку.
Некоторое время назад я обсуждал аналогичное сравнение MATLAB и numpy в Code Review, codereview.stackexchange.com/questions/17702/… . Ускорение простого кода путем замены циклов операциями «целый массив» (как того требовали более старые версии MATLAB) является частой темой SO.
Matlab по умолчанию имеет jit-компилятор, а Python - нет. Вы можете использовать Numba, чтобы выполнить ваш код. Это часто превосходит Jit-компилятор Matlab, например. stackoverflow.com/a/50890174/4045774
Я полагаю, вы используете это во многих временных рядах. Длина образца одинакова для всех серий? Поскольку это смущающе параллельно, параллелизм будет следующим шагом.

max9111 · Answer 1 · 2018-08-18T14-46-00.000Z

Как сказано в комментариях, Matlab использует jit-компилятор по умолчанию Python этого не делает. В Python вы можете использовать Numba, чтобы сделать то же самое.

Ваш код с небольшими изменениями

import numba as nb
import numpy as np
import time

@nb.jit(fastmath=True,error_model='numpy')
def sample_entropy(time_series, sample_length, tolerance=None):
    """Calculate and return Sample Entropy of the given time series.
    Distance between two vectors defined as Euclidean distance and can
    be changed in future releases
    Args:
        time_series: Vector or string of the sample data
        sample_length: Number of sequential points of the time series
        tolerance: Tolerance (default = 0.1...0.2 * std(time_series))
    Returns:
        Vector containing Sample Entropy (float)
    References:
        [1] http://en.wikipedia.org/wiki/Sample_Entropy
        [2] http://physionet.incor.usp.br/physiotools/sampen/
        [3] Madalena Costa, Ary Goldberger, CK Peng. Multiscale entropy analysis
            of biological signals
    """
    if tolerance is None:
        tolerance = 0.1 * np.std(time_series)

    n = len(time_series)
    prev = np.zeros(n)
    curr = np.zeros(n)
    A = np.zeros((sample_length))  # number of matches for m = [1,...,template_length - 1]
    B = np.zeros((sample_length))  # number of matches for m = [1,...,template_length]

    for i in range(n - 1):
        nj = n - i - 1
        ts1 = time_series[i]
        for jj in range(nj):
            j = jj + i + 1
            if abs(time_series[j] - ts1) < tolerance:  # distance between two vectors
                curr[jj] = prev[jj] + 1
                temp_ts_length = min(sample_length, curr[jj])
                for m in range(int(temp_ts_length)):
                    A[m] += 1
                    if j < n - 1:
                        B[m] += 1
            else:
                curr[jj] = 0
        for j in range(nj):
            prev[j] = curr[j]

    N = n * (n - 1) // 2

    B2=np.empty(sample_length)
    B2[0]=N
    B2[1:]=B[:sample_length - 1]
    similarity_ratio = A / B2
    se = - np.log(similarity_ratio)
    return se

Задержки

a = np.random.rand(1, 95000)[0] #Python
a = rand(1, 95000) #Matlab
Python 3.6, Numba 0.40dev, Matlab 2016b, Core i5-3210M

Python:       487s
Python+Numba: 12.2s
Matlab:       71.1s