Я разбираю файлы xml и сохраняю их в словаре списка, где я буду вставлять их в таблицу в posgres, используя psycopg2. Однако не все строки вставлены в таблицы (они только вставляются в самое низкое количество значений в списке). Вот фрагмент словаря списка:
dict_songs = {'title' : ['Need You Now', 'GTFO'...], 'format': ['MP4', 'MP3'...], 'type' : ['Country Pop', 'R&B Pop'..], 'year': [2010,2018..]}
dict_movie = {'title' : ['Searching', 'Sidewalk of New York'...], 'format': ['DVD', 'Blue Ray'...], 'type' : ['Thriller', 'Romcom'..], 'year': [2018..]
Когда я подсчитал длину каждого списка в словаре, выяснилось, что не весь список имеет одинаковую длину, например:
for key, value in dict_songs.items():
#print value
print(key, len([item for item in value if item]))
# The result is:
title 300000
format 189700
type 227294
year 227094
Название будет основным ключом в таблице композиций. Когда я вставил этот словарь в postgres, он отображает только 189700 записей, а не 300000. Я хочу, чтобы он был 300000 и помещал Null для значений null (none). То же самое касается dict_movie
Это код, который я использую для вставки списка dict в таблицу:
keys = ['title', 'format', 'type','year']
insert_statement = 'insert into song_table (%s) values %s'
for t in zip(*(dict_songs[key] for key in keys)):
cur.execute(insert_statement3, (AsIs(','.join(keys)),t))
myConnection.commit()
Любые идеи, почему и как это сделать? Спасибо!
Я думаю, проблема здесь в том, что вы не знаете, где значения None/NULL. Представьте эти списки:
dict_songs = {
'title' : ['Need You Now', 'GTFO', 'Titletest']
'type' : ['Country Pop', 'R&B Pop']
}
Ваша таблица может иметь значения NULL в трех положениях, и в списках нет данных, которые могли бы намекать на правильную:
+ -------------+-------------+-------------+-------------+
| title | type | type | type |
+--------------+-------------+-------------+-------------+
| Need You Now | Country Pop | Country Pop | NULL |
| GTFO | R&B Pop | NULL | Country Pop |
| Jinglebells | NULL | R&B Pop | R&B Pop |
+--------------+-------------+-------------+-------------+
Вы должны иметь значения None, поэтому вы знаете, где положить NULL в таблицу базы данных. Как это:
dict_songs = {
'title' : ['Need You Now', 'GTFO', 'Titletest']
'type' : ['Country Pop', None, 'R&B Pop']
}
None
при преобразовании данных XML в списки. Списки должны иметь значения None
в правильной позиции (я добавил примерный список в мой ответ).