Пустой вывод сверточного автоэнкодера Keras

Question

Пустой вывод сверточного автоэнкодера Keras

1

Быстрая оговорка: я довольно новичок в Keras, машинах и программировании в целом.

Я пытаюсь создать базовый автокодер для (в настоящее время) одного изображения. Хотя кажется, что он работает очень хорошо, выход - это просто белое изображение. Вот что у меня есть:

img_height, img_width = 128, 128

input_img = '4.jpg'
output_img = '5.jpg'

# load image
x = load_img(input_img)
x = img_to_array(x)  # array with shape (128, 128, 3)
x = x.reshape((1,) + x.shape)  # array with shape (1, 128, 128, 3)

# define input shape
input_shape = (img_height, img_width, 3)

model = Sequential()
# encoding
model.add(Conv2D(128, (3, 3), activation='relu', input_shape=input_shape, 
padding='same'))
model.add(MaxPooling2D(pool_size=(2,2)))
model.add(Conv2D(64, (3, 3), activation='relu', padding='same'))
model.add(MaxPooling2D(pool_size=(2,2)))
model.add(Conv2D(64, (3, 3), activation='relu', padding='same'))

# decoding
model.add(Conv2D(64, (3, 3), activation='relu', padding='same'))
model.add(UpSampling2D(size=(2,2)))
model.add(Conv2D(64, (3, 3), activation='relu', padding='same'))
model.add(UpSampling2D(size=(2,2)))
model.add(Conv2D(128, (3, 3), activation='relu', padding='same'))
model.add(Conv2D(3, (3, 3), activation='sigmoid', padding='same'))

model.compile(loss='binary_crossentropy', optimizer='adam')
print(model.summary())

checkpoint = ModelCheckpoint("autoencoder-loss-{loss:.4f}.hdf5", monitor='loss', verbose=0, save_best_only=True, mode='min') 
model.fit(x, x, epochs=10, batch_size=1, verbose=1, callbacks=[checkpoint])

y = model.predict(x)

y = y[0, :, :, :]
y = array_to_img(y)
save_img(output_img, y)

Я просмотрел несколько руководств для справки, но я до сих пор не могу понять, в чем моя проблема.

Любые рекомендации/рекомендации/помощь будут высоко оценены.

Спасибо!

J Doug 30 нояб. 2018, в 05:44

Источник

Теги:

python

keras

conv-neural-network

autoencoder

1 ответ

Ещё вопросы

Dipack · Accepted Answer · 2018-11-30T01-40-00.000Z

1

Лучший ответ

это решило проблему. Код просто отсутствовал

x = x.astype('float32') / 255.

Это встроенная функция numpy для преобразования значений, содержащихся в этом векторе, в float.

Это позволяет нам получать десятичные значения, где значения делятся на 255. Значения RGB сохраняются как 8-битные целые числа, поэтому мы делим значения в векторе на 255 (2 ^ 8 - 1), чтобы представить цвет как десятичную значение между 0.0 и 1.0.

Dipack 30 нояб. 2018, в 01:40

0

Это действительно полезно. Я думаю, что я действительно ищу то же самое изображение, что и вывод. Для этого не похоже, что мне нужна какая-либо метка, поскольку выходные данные должны "соответствовать" входным данным. Можете ли вы указать мне, как я могу это сделать?
J Doug 30 нояб. 2018, в 04:42
0

А ну понятно. Оглядываясь в блоге Keras, я смог найти это руководство по сверточным автоэнкодерам. Может быть, это то, что вы ищете?
Dipack 30 нояб. 2018, в 04:59
0

Это руководство решило проблему (хотя я уже видел его около 1000 раз). Я пропустил x = x.astype('float32') / 255. который нормализует значения пикселей между 0 и 1. Спасибо за помощь!
J Doug 30 нояб. 2018, в 05:05
0

Это потрясающе! astype(..) представляет собой встроенную функцию numpy для преобразования значений, содержащихся в этом векторе, в числа с плавающей точкой. Это позволяет нам получать десятичные значения и тогда, когда значения затем делятся на 255. Значения RGB хранятся как 8-битные целые числа, поэтому мы делим значения в векторе на 255 (2 ^ 8 - 1), чтобы представить цвет как десятичное значение от 0,0 до 1,0.
Dipack 30 нояб. 2018, в 05:11
0

Этот ответ, хотя и оказался полезным для OP, неверен: model.fit(x, x, ...) - это именно то, что нужно делать, когда вы тренируете автоэнкодер ...
dedObed 30 нояб. 2018, в 10:31

Показать ещё 3 комментария