Вычислить среднее значение для каждой строки тензора в TensorFlow

Question

Вычислить среднее значение для каждой строки тензора в TensorFlow

1

Я новичок в тензорном потоке, и я хочу вычислить среднее значение из каждой строки из тензора. Для этого Tensorflow выполняет операцию tf.reduce_mean. Проблема заключается в том, что когда строка имеет значение nan, среднее значение для этой строки также является наном. Кроме того, я хочу реализовать это самостоятельно, чтобы лучше понять философию, основанную на тензорном потоке. Итак, как я мог реализовать это вручную? Код, который я написал:

import tensorflow as tf
import numpy as np

ratings = np.array([[7, 6, 7, 4, 5, 4], [6, 7, np.NaN, 4, 3, 4], [np.NaN, 3, 3, 1, 1, np.NaN],
                   [1, 2, 2, 3, 3, 4], [1, np.NaN, 1, 2, 3, 3]], dtype = np.float16)

tRatings = tf.convert_to_tensor(ratings, dtype = np.float16)

means = tf.get_variable("means", shape=(5), dtype=tf.float16)


with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    mean = tf.reduce_mean(tRatings, axis=1)
    print(sess.run(mean))

Theodosis Siomos 29 июль 2018, в 14:09

Источник

0

Существует два подхода: вы можете определить среднюю операцию в numpy и использовать tf.py_func для вызова функции numpy. В качестве альтернативы, определите его в самом тензорном потоке, но замените NaN на 0 по желанию. Вы можете использовать tRatings = tf.where (tf.is_nan (tRatings), tf.zeros_like (tRatings), tRatings), чтобы заменить NaN нулями.
Dinesh 29 июль 2018, в 11:45
0

Если я заменю значения nan на нули, я найду неправильное среднее значение. Я хочу вычислить среднее значение из существующих значений в каждой строке.
Theodosis Siomos 29 июль 2018, в 11:51
0

Вы можете считать nans с помощью tf.is_nan. Затем перед делением суммы вычтите число нанов.
Dinesh 29 июль 2018, в 11:57

Показать ещё 1 комментарий

Теги:

python

tensorflow

1 ответ

Ещё вопросы

Существует два подхода: вы можете определить среднюю операцию в numpy и использовать tf.py_func для вызова функции numpy. В качестве альтернативы, определите его в самом тензорном потоке, но замените NaN на 0 по желанию. Вы можете использовать tRatings = tf.where (tf.is_nan (tRatings), tf.zeros_like (tRatings), tRatings), чтобы заменить NaN нулями.
Если я заменю значения nan на нули, я найду неправильное среднее значение. Я хочу вычислить среднее значение из существующих значений в каждой строке.
Вы можете считать nans с помощью tf.is_nan. Затем перед делением суммы вычтите число нанов.

Dinesh · Accepted Answer · 2018-07-29T10-07-00.000Z

import tensorflow as tf
import numpy as np
ratings = np.array([[7, 6, 7, 4, 5, 4], [6, 7, np.NaN, 4, 3, 4], [np.NaN, 3, 3, 1, 1, np.NaN],
                       [1, 2, 2, 3, 3, 4], [1, np.NaN, 1, 2, 3, 3]], dtype = np.float16)

tRatings = tf.convert_to_tensor(ratings, dtype = np.float16)
means = tf.get_variable("means", shape=(5), dtype=tf.float16)
with tf.Session() as sess:
  sess.run(tf.global_variables_initializer())
  #mean = tf.reduce_mean(tRatings, axis=1)
  tRatings_wonan=tf.where(tf.is_nan(tRatings), tf.zeros_like(tRatings), tRatings)
  sum = tf.reduce_sum(tRatings_wonan,axis=1)
  count_nans = tf.reduce_sum(tf.cast(tf.is_nan(tRatings), tf.float16),axis=1)
  mean = tf.div(sum,tf.subtract(tf.cast(tf.shape(tRatings)[1], tf.float16),count_nans))
  print(sess.run(mean))

Большое спасибо за ответ. Если я использую tf.py_func, я теряю много эффективности?
Зависит от конкретной реализации: stackoverflow.com/questions/42927920/…