Почему в многопроцессорной обработке добавить список медленнее

Question

Почему в многопроцессорной обработке добавить список медленнее

1

Во время тестирования я узнаю следующее: метод MP работает немного медленнее

def eat_time(j):
    result = []
    for j in range(10**4):
        a = 0
        for i in range(1000):
            a += 101
            result.append(a)
    return result

if __name__ == '__main__':
    #MP method
    t = time.time()
    pool = Pool()
    result = []
    data = pool.map(eat_time, [i for i in range(5)])
    for d in data:
        result += d
    print(time.time()-t) #11s for my computer

    #Normal method
    t = time.time()
    integers = []
    for i in range(5):
        integers += eat_time(i)
    print(time.time()-t) #8s for my computer

Однако, если я не требую, чтобы он eat_time() данные, изменяя eat_time() на

def eat_time(j):
    result = []
    for j in range(10**4):
        a = 0
        for i in range(1000):
            a += 101
            #result.append(a)
    return result

Время MP намного быстрее, и теперь для моего компьютера просто запустите 3s, в то время как обычный метод все еще занимает 8 секунд. (Как и ожидалось)

Мне кажется странным, поскольку result объявляется индивидуально в method, я не ожидаю, что добавление полностью разрушит MP.

Могу ли я знать, есть ли правильный способ сделать это? И почему MP медленнее при подключении?

Отредактировано для комментариев

спасибо для @torek и @akhavro уточняет суть.

Да, я понимаю, что процесс создания требует времени, поэтому проблема поднялась.

На самом деле исходный код помещал for-loop вовнутрь и вызывал простой метод снова и снова, он немного быстрее обычного метода в значительно большем количестве задач (в моем случае более 10 ** 6 вызовов).

Поэтому я переставляю код внутри и делаю метод немного сложнее. Переместившись for j in range(10**4): эта строка в eat_time().

Но похоже, что код усложняет причины задержки связи из-за большего размера данных.

Таким образом, вероятно, ответ не может решить его.

MatrixTai 16 окт. 2018, в 11:33

Источник

0

Какая версия Python?
Nimeshka Srimal 16 окт. 2018, в 08:46
0

@NimeshkaSrimal, я тестировал в 2.7, 3.7, оба результата одинаковы.
MatrixTai 16 окт. 2018, в 08:47
0

Когда вы возвращаете очень большой список результатов, вы отправляете МНОГО данных обратно из дочернего (рабочего) процесса в родительский. Это займет значительное время - вероятно, примерно столько же, сколько потребовалось для создания списка.
torek 16 окт. 2018, в 08:49
0

@torek, ты имеешь в виду, что единственный способ сделать это правильно - поместить for-loop вне eat_time() ?
MatrixTai 16 окт. 2018, в 08:52
0

Вы можете отправить результат обратно другим способом, например, массивом с общей памятью, который может быть быстрее. Но в целом, всякий раз, когда вы используете пул процессов, вы должны учитывать накладные расходы на связь: сколько времени потребуется для отправки рабочих запросов и сколько времени потребуется для отправки результатов обратно? Если время связи превышает рабочее время, нет смысла пытаться переложить рабочую нагрузку.
torek 16 окт. 2018, в 08:53
0

Также процессы требуют много времени для создания, потому что каждому из них необходимо выделить свою собственную память и создать свою собственную среду (объявленные переменные). Если само задание (в данном случае добавление) недостаточно длинное, многопроцессорная обработка займет больше времени, чем простое последовательное выполнение.
akhavro 16 окт. 2018, в 08:58
0

@akhavro: правда, хотя pool амортизирует стоимость запуска по нескольким вызовам (при условии, что вы делаете много вызовов). Обратите внимание, что создание нового процесса также происходит намного быстрее в Unix-подобных системах, которые не требуют таких больших накладных расходов, как Windows.
torek 16 окт. 2018, в 09:03
0

@torek, как отредактированная часть состояния, я думаю, что вывод не является решением для этого права?
MatrixTai 16 окт. 2018, в 09:15
1

@MatrixTai Правильна ли ваша функция eat_time() ? Вы передаете ему параметр j , но это значение никогда не используется внутри функции, потому что вы переопределяете эту переменную, используя for j in range(10**4):
Ralf 16 окт. 2018, в 09:49
0

Обратите внимание, что вы добавляете 10**4 (10000) копий из 1000 чисел, следовательно, возвращаете список из десяти миллионов значений.
torek 16 окт. 2018, в 15:59
0

Это может быть глупый вопрос, но поможет ли многопоточность вместо многопоточности? Другими словами, может ли многопоточность ускорить весь процесс для этой конкретной проблемы?
Antonio 16 окт. 2018, в 23:01

Показать ещё 9 комментариев

Теги:

python

performance

multiprocessing

1 ответ

Ещё вопросы

@NimeshkaSrimal, я тестировал в 2.7, 3.7, оба результата одинаковы.
Когда вы возвращаете очень большой список результатов, вы отправляете МНОГО данных обратно из дочернего (рабочего) процесса в родительский. Это займет значительное время - вероятно, примерно столько же, сколько потребовалось для создания списка.
@torek, ты имеешь в виду, что единственный способ сделать это правильно - поместить for-loop вне eat_time() ?
Вы можете отправить результат обратно другим способом, например, массивом с общей памятью, который может быть быстрее. Но в целом, всякий раз, когда вы используете пул процессов, вы должны учитывать накладные расходы на связь: сколько времени потребуется для отправки рабочих запросов и сколько времени потребуется для отправки результатов обратно? Если время связи превышает рабочее время, нет смысла пытаться переложить рабочую нагрузку.
Также процессы требуют много времени для создания, потому что каждому из них необходимо выделить свою собственную память и создать свою собственную среду (объявленные переменные). Если само задание (в данном случае добавление) недостаточно длинное, многопроцессорная обработка займет больше времени, чем простое последовательное выполнение.
@akhavro: правда, хотя pool амортизирует стоимость запуска по нескольким вызовам (при условии, что вы делаете много вызовов). Обратите внимание, что создание нового процесса также происходит намного быстрее в Unix-подобных системах, которые не требуют таких больших накладных расходов, как Windows.
@torek, как отредактированная часть состояния, я думаю, что вывод не является решением для этого права?
@MatrixTai Правильна ли ваша функция eat_time() ? Вы передаете ему параметр j , но это значение никогда не используется внутри функции, потому что вы переопределяете эту переменную, используя for j in range(10**4):
Обратите внимание, что вы добавляете 10**4 (10000) копий из 1000 чисел, следовательно, возвращаете список из десяти миллионов значений.
Это может быть глупый вопрос, но поможет ли многопоточность вместо многопоточности? Другими словами, может ли многопоточность ускорить весь процесс для этой конкретной проблемы?

Hannu · Accepted Answer · 2018-10-16T10-35-00.000Z

Это не добавляет, что вызывает вашу медлительность, но возвращает результат с добавленными элементами. Вы можете проверить это, изменив свой код, чтобы добавить append, но возвратите только первые несколько элементов вашего результата. Теперь он должен работать намного быстрее.

Когда вы возвращаете свой результат работнику Pool, это на практике реализуется как очередь от многопроцессорности. Это работает, но это не чудо-исполнитель, безусловно, намного медленнее, чем просто манипулировать внутри памяти. Когда вы возвращаете много данных, очередь должна передавать много.

Нет простого решения. Вы можете попробовать общую память, но мне это не нравится лично из-за сложности. Лучше всего было бы перепроектировать ваше приложение, чтобы ему не нужно передавать много данных между процессами. Например, можно ли обрабатывать данные у вашего рабочего дальше, чтобы вам не нужно было возвращать все, кроме только обработанного подмножества?