Выберите подмножества дат в колонках Pandas

Question

Выберите подмножества дат в колонках Pandas

1

У меня есть pandas DataFrame с datetime.time по индексу и datetime.date в столбцах. Например

df =

          2006-02-01  2006-02-02     ...      2006-05-29  2009-06-01
08:00:00     1.45685     1.43830     ...         1.41020     1.42045
08:00:01     1.45685     1.43825     ...         1.41030     1.42040
08:00:02     1.45685     1.43810     ...         1.41025     1.42050
08:00:03     1.45685     1.43825     ...         1.41025     1.42060
...

Я хотел бы выбрать только столбцы с 2006 года. Как мне сделать это проще всего и быстрее?

Я нашел df.T ['2006']. Т делает трюк, но он вовлекает два транспозиции. Нельзя ли это сделать непосредственно на столбцах?

Mike 26 авг. 2018, в 17:11

Источник

1

Являются ли ваши имена столбцов строками или типом типа datetime?
Jon Clements♦ 26 авг. 2018, в 14:26
0

они являются объектами datetime.date
Mike 26 авг. 2018, в 14:32
0

И df.dtypes подтверждает?
Jon Clements♦ 26 авг. 2018, в 14:37
0

Да, df.columns дает DatetimeIndex с dtype = 'datetime64 [нс]
Mike 26 авг. 2018, в 15:10

Показать ещё 2 комментария

Теги:

python

pandas

datetime

2 ответа

Ещё вопросы

Являются ли ваши имена столбцов строками или типом типа datetime?
Да, df.columns дает DatetimeIndex с dtype = 'datetime64 [нс]

Yonatan Zax · Answer 1 · 2018-08-26T16-57-00.000Z

попробуйте этот код:

def getSubsetColumnsByYear(dataframe, year):
    df = dataframe
    try:
        startAt = df.columns.get_loc(year + '-01-01')
        endAt = df.columns.get_loc(year + '-12-31')

        return df[df.columns[startAt:endAt+1]]
    except KeyError:
        print('Not a valid year')


def testMethod():
    import pandas as pd
    data = { '2016-01-01':[1,1,1], '2016-01-02':[2,2,2], '2016-01-03':[3,3,3], '2016-01-04':[4,4,4], '2016-12-31':[31,31,31], '2017-01-01':[2,2,2],}
    df = pd.DataFrame(data=data)

    newdf = getSubsetColumnsByYear(df, '2016')
    print(newdf)

testMethod()

Полезный фрагмент, хорошая работа!

Mitchell Posluns · Answer 2 · 2018-08-26T13-39-00.000Z

если ваши столбцы являются объектами datetime.date, попробуйте:

df.loc[:, '2006-01-01':'2006-12-31']

Я хотел бы использовать только указатель года (например, 2006), как вы можете сделать в индексе. Любопытно, что это можно сделать и на cols.