Как рассчитать скользящее среднее с индивидуальным весом в пандах?

Question

Как рассчитать скользящее среднее с индивидуальным весом в пандах?

1

У меня есть dataframe, чем два столбца a: [1,2,3,4,5]; b: [1,0.4,0.3,0.5,0.2] a: [1,2,3,4,5]; b: [1,0.4,0.3,0.5,0.2]. Как сделать столбец c таким, чтобы:

c[0] = 1  
c[i] = c[i-1]*b[i]+a[i]*(1-b[i])

так что c:[1,1.6,2.58,3.29,4.658]

Расчет:

1 = 1
1*0.4+2*0.6 = 1.6
1.6*0.3+3*0.7 = 2.58
2.58*0.5+4*0.5 = 3.29
3.29*0.2+5*0.8 = 4.658

?

serendipityo 24 авг. 2018, в 18:22

Источник

0

Пожалуйста, отформатируйте ваш вопрос соответствующим образом
user3483203 24 авг. 2018, в 16:14
0

Я не вижу ожидаемого выхода
roganjosh 24 авг. 2018, в 16:17
0

Ожидаемая выработка
serendipityo 24 авг. 2018, в 16:23
0

для цикла может быть?
WeNYoBen 24 авг. 2018, в 16:33
0

Я верю, что петля выполнима, но я думаю, что должен быть лучший / более быстрый способ сделать это в пандах.
serendipityo 24 авг. 2018, в 16:35

Показать ещё 3 комментария

Теги:

python

pandas

numpy

performance

for-loop

2 ответа

Ещё вопросы

Пожалуйста, отформатируйте ваш вопрос соответствующим образом
Я верю, что петля выполнима, но я думаю, что должен быть лучший / более быстрый способ сделать это в пандах.

jpp · Answer 1 · 2018-08-24T14-12-00.000Z

Я не вижу возможности для векторизации вашего рекурсивного алгоритма. Однако вы можете использовать numba для оптимизации вашей текущей логики. Это должно быть предпочтительнее обычного цикла.

from numba import jit

df = pd.DataFrame({'a': [1,2,3,4,5],
                   'b': [1,0.4,0.3,0.5,0.2]})

@jit(nopython=True)
def foo(a, b):
    c = np.zeros(a.shape)
    c[0] = 1
    for i in range(1, c.shape[0]):
        c[i] = c[i-1] * b[i] + a[i] * (1-b[i])
    return c

df['c'] = foo(df['a'].values, df['b'].values)

print(df)

   a    b      c
0  1  1.0  1.000
1  2  0.4  1.600
2  3  0.3  2.580
3  4  0.5  3.290
4  5  0.2  4.658

Спасибо за Ваш ответ. Логика кажется той же самой, и поэтому, почему использование numba здесь более предпочтительно?
@serendipityo, потому что numba предварительно компилирует алгоритм, а обычный цикл - чистый Python. Чтобы увидеть результат, запустите код до и после включения @jit(nopython=True) .

Vaibhav Sharma · Answer 2 · 2018-08-24T14-15-00.000Z

Там может быть более умный способ, но здесь моя попытка:

import pandas as pd

a = [1,2,3,4,5]
b = [1,0.4,0.3,0.5,0.2]

df = pd.DataFrame({'a':a , 'b': b})

for i in range(len(df)):
    if i is 0:
        df.loc[i,'c'] = 1
    else:
        df.loc[i,'c'] = df.loc[i-1,'c'] * df.loc[i,'b'] + df.loc[i,'a'] * (1 - df.loc[i,'b'])

Выход:

   a    b      c
0  1  1.0  1.000
1  2  0.4  1.600
2  3  0.3  2.580
3  4  0.5  3.290
4  5  0.2  4.658