Странное поведение метода keras fit_generator

Question

Странное поведение метода keras fit_generator

1

У меня есть больший набор данных, который содержит до 5 М слов. Общие слова не будут вписываться в ОЗУ, поэтому я начал использовать генераторы. Я тренировал свою модель с помощью метода fit_generator. Во время обучения в течение первой эпохи значение потерь начинается с 4.7 в конце первой эпохи, значение потерь уменьшено до 1,7. Для второй эпохи потеря должна продолжаться с 1,7, но это не так, снова начинается с 4.7. Может кто-нибудь помочь мне решить эту проблему?

Вот мой код:

https://gist.github.com/chatrapathik/fbd37f42984c6310dde200528f36c4f5

Заранее спасибо.

chatrapathi 21 июнь 2018, в 07:07

Источник

Теги:

python

tensorflow

keras

1 ответ

Ещё вопросы

Matias Valdenegro · Answer 1 · 2018-06-21T04-10-00.000Z

0

Я не вижу проблемы, потери в тренировках, которые вы видите, - это текущее среднее значение, которое является приблизительной реальной потерей обучения, и в вашем случае кажется, что некоторые примеры в начале дают более высокую потерю. Вы запустили свой код, скажем, 10 эпох и постоянно наблюдаете этот эффект?

Matias Valdenegro 21 июнь 2018, в 04:10

0

Спасибо за ваш ответ. Да, я запускаю его в течение 50 эпох, но значение потерь не обновляется. Можете ли вы помочь мне выяснить проблему здесь?
chatrapathi 21 июнь 2018, в 07:25
0

@chatrapathi Вы должны обновить свой вопрос фактическими значениями потерь, которые вы видите.
Matias Valdenegro 21 июнь 2018, в 07:35
0

Здесь я вставил значения потерь за 5 эпох. Вы можете наблюдать это здесь. Эпоха 1/100 424/423 [=====================================] - 167 с 394 мс / шаг - потеря: 1,8611 - mean_squared_error : 0.0054 Epoch 2/100 424/423 [==============================] - 161 с 379 мс / шаг - потеря: 1,8650 - mean_squared_error: 0,0055 Epoch 3/100 424/423 [====================================] - 161 с 379 мс / шаг - потеря : 1.8957 - mean_squared_error: 0.0055 Epoch 4/100 424/423 [==========================================] - 161 с 379 мс / шаг - убыток: 1,8583 - mean_squared_error: 0,0055 Те же самые значения потерь относятся к последней эпохе.
chatrapathi 21 июнь 2018, в 07:46
0

@chatrapathi Я могу только сказать, что ваша модель может быть слишком простой для имеющихся у вас данных, может быть, вам нужна более глубокая модель, больше слоев, больше нейронов и т. д., но это не проблема программирования. Вы должны настроить свою модель на ваши данные.
Matias Valdenegro 21 июнь 2018, в 07:48
0

Та же архитектура модели работает с model.fit (), уровень потерь постоянно уменьшается. Но когда я начал использовать model.fit_generator (), я столкнулся с этой проблемой. Я пробовал это как в CPU, так и в GPU, я столкнулся с одной и той же проблемой.
chatrapathi 21 июнь 2018, в 09:03
0

@chatrapathi Хорошо, тогда это указывает на проблему в генераторе, но все же есть слишком много вещей, которые могут пойти не так (тасование, фактический порядок данных и т. д.).
Matias Valdenegro 21 июнь 2018, в 09:05
0

Мы исправили эту проблему, здесь проблема заключается в том, что по умолчанию fit_generator принимает данные shuffel = True, это вызывает проблему для нас. Делая shuffel = False, значение потери уменьшается.
chatrapathi 21 июнь 2018, в 10:50

Показать ещё 5 комментариев