Python Словарь ключей с вложенным списком в панды DataFrame

Question

Python Словарь ключей с вложенным списком в панды DataFrame

1

У меня есть словарь следующим образом:

D = {
    'd1': [[a1, a1, a1], [a2, a2, a2], [a3, a3, a3]], 
    'd2': [[b1, b1, b1], [b2, b2, b2], [b3, b3, b3]], 
    'd3': [[c1, c1, c1], [c2, c2, c2], [c3, c3, c3]], 
    'd4': [[d1, d1, d1], [d2, d2, d2], [d3, d3, d3]]
}

Как преобразовать его в dataframe так, чтобы

Столбцы из списков для ключа находятся в паре; вложенные списки - это значения времени, температуры и значения повреждений, соответственно, и данные должны иметь их в отдельных столбцах. S для [[a1, a1, a1], [a2, a2, a2], [a3, a3, a3]] вы получите строку с a1, a2, a3 (первый столбец), за которой следует строка для вторая колонка и т.д.
Строки dataframe сгруппированы путем объединения ключей со следующей клавишей, d1 сочетании с d2 составляют 6 строк (3 из d1 и 3 из d2), затем d2 объединяется с d3 чтобы сделать еще 6 строк и т.д. Итак, для 4 ключей с 3 ряда, вы получаете 3 комбинации из 6 строк == 18 строк.

Я попытался преобразовать в dataframe перед конкатенацией:

new_df = pd.DataFrame(list(D.values()), columns=['Time_sec', 'Temperature', 'Damage'])

но я все еще придерживаюсь конкатенирующей части.

Пример ожидаемого результата:

Raziur Rahman 26 сен. 2018, в 15:32

Источник

1

Так являются ли эти a1 , a2 и т. Д. Ссылками на самом деле числа с плавающей запятой?
Martijn Pieters♦ 26 сен. 2018, в 13:36
1

Не могли бы вы отредактировать пост, чтобы добавить пример того, что вы ожидаете?
Hemerson Tacon 26 сен. 2018, в 13:36
2

Можете ли вы дать нам небольшую выборку ожидаемого выхода?
Martijn Pieters♦ 26 сен. 2018, в 13:36
0

@MartijnPieters да, они числа с плавающей запятой
Raziur Rahman 26 сен. 2018, в 13:58
0

только что видел эту ссылку
vash_the_stampede 26 сен. 2018, в 13:58
0

Пожалуйста, сделайте этот текст, если это возможно.
Martijn Pieters♦ 26 сен. 2018, в 14:07
0

Правильно, поэтому вы хотите сжать вложенные списки. Обратите внимание, что словари на самом деле не упорядочены; Вам нужно отсортировать по ключам здесь?
Martijn Pieters♦ 26 сен. 2018, в 14:08
0

Я думал о цикле for для выполнения архивирования и сортировки по ключам.
Raziur Rahman 26 сен. 2018, в 14:12

Показать ещё 6 комментариев

Теги:

python

pandas

python-3.x

dictionary

concatenation

2 ответа

0

Использование перечисления

l = ['Time', 'Temperature', 'Damage']
d2 = {}

for idx, item in enumerate(l):
    for k, v in d.items():
        if item not in d2:
            d2[item] = v[idx]
        else:
            d2[item] += v[idx]

{'Time': ['a1, a1, a1', 'b1, b1, b1', 'c1, c1, c1', 'd1, d1, d1'],
'Temperature': ['a2, a2, a2', 'b2, b2, b2', 'c2, c2, c2', 'd2, d2,
d2'], 'Damage': ['a3, a3, a3', 'b3, b3, b3', 'c3, c3, c3', 'd3, d3,
d3']}

Использование псевдозначений

a1, a2, a3  = 0, 'a', '!'
b1, b2, b3  = 0, 'a', '!'
c1, c2, c3  = 0, 'a', '!'
d1, d2, d3  = 0, 'a', '!'

{'Time': [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0], 'Temperature': ['a',
'a', 'a', 'a', 'a', 'a', 'a', 'a', 'a', 'a', 'a', 'a'], 'Damage':
['!', '!', '!', '!', '!', '!', '!', '!', '!', '!', '!', '!']}

vash_the_stampede 26 сен. 2018, в 12:20

0

Нет .. Пожалуйста, посмотрите ожидаемый результат
Raziur Rahman 26 сен. 2018, в 13:58
0

Как насчет этого ?
vash_the_stampede 26 сен. 2018, в 14:12
0

Я должен был сделать ваши переменные строки, но вы бы сделали это без того, чтобы они были строки
vash_the_stampede 26 сен. 2018, в 14:12
0

@RaziurRahman Я видел, что вы не хотите, чтобы восстановить, это не подходит, снимет, если так
vash_the_stampede 26 сен. 2018, в 14:41

Показать ещё 2 комментария

Ещё вопросы

Так являются ли эти a1 , a2 и т. Д. Ссылками на самом деле числа с плавающей запятой?
Не могли бы вы отредактировать пост, чтобы добавить пример того, что вы ожидаете?
Можете ли вы дать нам небольшую выборку ожидаемого выхода?
@MartijnPieters да, они числа с плавающей запятой
Пожалуйста, сделайте этот текст, если это возможно.
Правильно, поэтому вы хотите сжать вложенные списки. Обратите внимание, что словари на самом деле не упорядочены; Вам нужно отсортировать по ключам здесь?
Я думал о цикле for для выполнения архивирования и сортировки по ключам.
Нет .. Пожалуйста, посмотрите ожидаемый результат
Я должен был сделать ваши переменные строки, но вы бы сделали это без того, чтобы они были строки
@RaziurRahman Я видел, что вы не хотите, чтобы восстановить, это не подходит, снимет, если так

Martijn Pieters · Accepted Answer · 2018-09-26T11-58-00.000Z

Вы хотите, чтобы zip() вместе каждый подсписок для заданного ключа, чтобы сформировать новые строки со значениями из каждого подсети в сочетании:

>>> list(zip(*D['d1']))
[('a1', 'a2', 'a3'), ('a1', 'a2', 'a3'), ('a1', 'a2', 'a3')]

затем примените это к каждому значению в словаре, чтобы создать сглаженную последовательность строк, где вы выбираете свои пары.

Я предполагаю, что вы хотите dN с dN+1 здесь, независимо от количества ключей. Обратите внимание, что словари на самом деле неупорядочены (хотя Python 3.6 и порядок добавления сохраняются), поэтому вы можете сначала применить некоторую сортировку:

sorted_keys = sorted(D)

после чего мы можем zip(sorted_keys, sorted_keys[1:]) их с zip(sorted_keys, sorted_keys[1:]):

>>> sorted_keys = sorted(D)
>>> list(zip(sorted_keys, sorted_keys[1:]))
[('d1', 'd2'), ('d2', 'd3'), ('d3', 'd4')]

Используйте эту последовательность, чтобы соединить строки и сгладить результирующую последовательность клавиш, затем застегнутые строки:

sorted_keys = sorted(D)
paired = (k for keys in zip(sorted_keys, sorted_keys[1:]) for k in keys)
df = pd.DataFrame(
    (row for k in paired for row in zip(*D[k])), 
    columns=['Time_sec', 'Temperature', 'Damage']
)

Это дает:

   Time_sec Temperature Damage
0        a1          a2     a3
1        a1          a2     a3
2        a1          a2     a3
3        b1          b2     b3
4        b1          b2     b3
5        b1          b2     b3
6        b1          b2     b3
7        b1          b2     b3
8        b1          b2     b3
9        c1          c2     c3
10       c1          c2     c3
11       c1          c2     c3
12       c1          c2     c3
13       c1          c2     c3
14       c1          c2     c3
15       d1          d2     d3
16       d1          d2     d3
17       d1          d2     d3

Спасибо за sugesstion, но ключи словаря должны быть сначала добавлены, а затем преобразованы в dataframe. есть разница между вашим выводом и моим ожидаемым выводом, так как вы можете видеть, что мои значения 'b' и 'c' повторяются в выводе
@RaziurRahman: тогда ваш вопрос совершенно неясен. Чем вывод в моем ответе отличается от вашего скриншота?
порядок ключей должен быть d1 d2 d2 d3 d3 d4
@RaziurRahman: это не ясно вообще. По каким правилам ключи повторяются?
@RaziurRahman: это та часть, где вы хотели, чтобы d1 + d2 был первым набором строк, затем d2 + d3 и т. Д.? Что делать, если есть 10 ключей? Или только 1?
через три раза b1 у меня снова 3 раза b1, затем прибывает c1 .. помните, я сказал d1 + d2 -> d2 + d3 ---> d3 + d4
да первый набор строк d1 + d2, за которым следуют d2 + d3 .. независимо от количества ключей .. если у меня 11 ключей, то последний ключ будет просто объединен с выходным кадром данных
@RaziurRahman: почему последний ключ не будет связан с предыдущим ключом, когда у вас есть 11?
извините за последнюю строку ... проигнорируйте это ... Я написал, потому что не мог найти способ добавить два значения двух ключей одного словаря и преобразовать их в DataFrame ..
Большое спасибо за ответ ... особенно проверенную переменную, где вы взяли пары ...
@MartijnPieters был ли мой вопрос слишком небрежным, чтобы получить -1? Я не знаю .. в любом случае, я получил то, что мне нужно .. большое спасибо человек ...
@RaziurRahman: Я не могу читать мысли людей, извините. Я не могу сказать вам, почему кто-то голосует так, как они.