Пустой вывод сверточного автоэнкодера Keras

1

Быстрая оговорка: я довольно новичок в Keras, машинах и программировании в целом.

Я пытаюсь создать базовый автокодер для (в настоящее время) одного изображения. Хотя кажется, что он работает очень хорошо, выход - это просто белое изображение. Вот что у меня есть:

img_height, img_width = 128, 128

input_img = '4.jpg'
output_img = '5.jpg'

# load image
x = load_img(input_img)
x = img_to_array(x)  # array with shape (128, 128, 3)
x = x.reshape((1,) + x.shape)  # array with shape (1, 128, 128, 3)

# define input shape
input_shape = (img_height, img_width, 3)

model = Sequential()
# encoding
model.add(Conv2D(128, (3, 3), activation='relu', input_shape=input_shape, 
padding='same'))
model.add(MaxPooling2D(pool_size=(2,2)))
model.add(Conv2D(64, (3, 3), activation='relu', padding='same'))
model.add(MaxPooling2D(pool_size=(2,2)))
model.add(Conv2D(64, (3, 3), activation='relu', padding='same'))

# decoding
model.add(Conv2D(64, (3, 3), activation='relu', padding='same'))
model.add(UpSampling2D(size=(2,2)))
model.add(Conv2D(64, (3, 3), activation='relu', padding='same'))
model.add(UpSampling2D(size=(2,2)))
model.add(Conv2D(128, (3, 3), activation='relu', padding='same'))
model.add(Conv2D(3, (3, 3), activation='sigmoid', padding='same'))

model.compile(loss='binary_crossentropy', optimizer='adam')
print(model.summary())

checkpoint = ModelCheckpoint("autoencoder-loss-{loss:.4f}.hdf5", monitor='loss', verbose=0, save_best_only=True, mode='min') 
model.fit(x, x, epochs=10, batch_size=1, verbose=1, callbacks=[checkpoint])

y = model.predict(x)

y = y[0, :, :, :]
y = array_to_img(y)
save_img(output_img, y)

Я просмотрел несколько руководств для справки, но я до сих пор не могу понять, в чем моя проблема.

Любые рекомендации/рекомендации/помощь будут высоко оценены.

Спасибо!

Теги:
keras
conv-neural-network
autoencoder

1 ответ

1
Лучший ответ

это решило проблему. Код просто отсутствовал

x = x.astype('float32') / 255.

Это встроенная функция numpy для преобразования значений, содержащихся в этом векторе, в float.

Это позволяет нам получать десятичные значения, где значения делятся на 255. Значения RGB сохраняются как 8-битные целые числа, поэтому мы делим значения в векторе на 255 (2 ^ 8 - 1), чтобы представить цвет как десятичную значение между 0.0 и 1.0.

  • 0
    Это действительно полезно. Я думаю, что я действительно ищу то же самое изображение, что и вывод. Для этого не похоже, что мне нужна какая-либо метка, поскольку выходные данные должны "соответствовать" входным данным. Можете ли вы указать мне, как я могу это сделать?
  • 0
    А ну понятно. Оглядываясь в блоге Keras, я смог найти это руководство по сверточным автоэнкодерам. Может быть, это то, что вы ищете?
Показать ещё 3 комментария

Ещё вопросы

Сообщество Overcoder
Наверх
Меню