Разобрать файл с объектами JSON в Python

Question

Разобрать файл с объектами JSON в Python

1

У меня есть файл с таким типом структуры:

{ 
  "key" : "A",
  "description" : "1",
  "uninterestingInformation" : "whatever"

}
{ 
  "key" : "B",
  "description" : "2",
  "uninterestingInformation" : "whatever"

}
{ 
  "key" : "C",
  "description" : "3",
  "uninterestingInformation" : "whatever"

}

Я хочу построить словарь в Python, который содержит ключ как ключ и описание как значение. У меня больше полей, но только 2 из них интересны для меня.

Этот файл не является файлом.json, это файл с большим количеством похожих объектов json.

Очевидно, json.loads не работает.

Любое предложение о том, как читать данные?

Я уже прочитал этот пост, но мой json-объект не на одной строке...

РЕДАКТИРОВАТЬ:

Если в моих объяснениях было непонятно, пример довольно точный, у меня есть много похожих объектов JSON, один за другим, разделенных новой строкой (\n) без запятой. Таким образом, в целом файл не является допустимым файлом JSON, а каждый объект является допустимым объектом JSON.

Решение, которое я применил, наконец:

api_key_file = open('mongo-config.json').read()
api_key_file = '[' + api_key_file + ']'
api_key_file= api_key_file.replace("}\n{", "},\n{")
api_key_data = json.loads(api_key_file)
api_key_description = {}
for data in api_key_data:
    api_key_description[data['apiKey']] = data['description']

Это хорошо сработало для моей ситуации. Возможно, лучшие способы сделать это объяснены в комментариях ниже.

Arhiliuc Cristina 01 авг. 2018, в 13:28

Источник

Теги:

python

json

2 ответа

Ещё вопросы

Vasilis G. · Answer 1 · 2018-08-01T09-31-00.000Z

Другим вариантом будет использование функции literal_eval из модуля ast после внесения необходимых изменений, чтобы он соответствовал формату допустимого типа:

from ast import literal_eval

inJson = '''{ 
  "key" : "A"
  "description" : "1"
  "uninterestingInformation" : "whatever"

}
{ 
  "key" : "B"
  "description" : "2"
  "uninterestingInformation" : "whatever"

}
{ 
  "key" : "C"
  "description" : "3"
  "uninterestingInformation" : "whatever"

}'''

inJson = "[" + inJson.replace("}", "},")[:-1] + "]"
inJson = inJson.replace("\"\n  ","\",")


newObject = literal_eval(inJson)
print(newObject)

Выход:

[{'key': 'A', 'description': '1', 'uninterestingInformation': 'whatever'}, {'key': 'B', 'description': '2', 'uninterestingInformation': 'whatever'}, {'key': 'C', 'description': '3', 'uninterestingInformation': 'whatever'}]

наконец, я сделал нечто подобное. Я заменил '} / n {' на '}, / n {'.

blhsing · Answer 2 · 2018-08-01T08-53-00.000Z

-2

Вы можете использовать re.split для разделения содержимого файла на соответствующие строки JSON для синтаксического анализа:

import re
import json
j='''{ 
  "key" : "A",
  "description" : "1",
  "uninterestingInformation" : "whatever"

}
{ 
  "key" : "B",
  "description" : "2",
  "uninterestingInformation" : "whatever"

}
{ 
  "key" : "C",
  "description" : "3",
  "uninterestingInformation" : "whatever"

}'''
print(list(map(json.loads, re.split(r'(?<=})\n(?={)', j))))

Эти результаты:

[{'key': 'A', 'description': '1', 'uninterestingInformation': 'whatever'}, {'key': 'B', 'description': '2', 'uninterestingInformation': 'whatever'}, {'key': 'C', 'description': '3', 'uninterestingInformation': 'whatever'}]

blhsing 01 авг. 2018, в 08:53

0

Вы запятые хотя. Это не те данные, которые есть у OP, а их разделители.
FHTMitchell 01 авг. 2018, в 11:32
0

Я основываю свои предположения на утверждении ОП: «Этот файл не совсем файл .json, это файл с большим количеством похожих объектов json.», Что означает, что файл имеет несколько допустимых объектов JSON и отсутствие запятые в его примере только из-за его быстрого набора только для иллюстрации.
blhsing 01 авг. 2018, в 12:14
0

Это плохое предположение. Я бы сказал, что гораздо лучше предположить, что пример ОП точен.
FHTMitchell 01 авг. 2018, в 12:15
0

В примере OP используются поддельные ключи и значения, поэтому совершенно очевидно, что он набрал все вручную, поэтому к его описанию файла следует относиться более серьезно, чем к его типизированной структуре.
blhsing 01 авг. 2018, в 12:16
0

Пример был верным. Возможно я не объяснил это хорошо. У меня было много объектов JSON один за другим, но их не было в списке, поэтому весь файл не был допустимым файлом JSON, но каждый отдельный объект был правильным объектом JSON. Я думаю, что я должен попытаться быть более ясным в следующий раз. ОП - девушка, кстати, но это не имеет значения.
Arhiliuc Cristina 01 авг. 2018, в 13:48
0

@ArhiliucCristina Если ваш пример был верным, то каждый объект НЕ является правильным объектом JSON из-за пропущенных запятых. Называть их «объектами json», таким образом, очень вводит в заблуждение, и, следовательно, дебаты здесь.
blhsing 01 авг. 2018, в 13:51
0

Хорошо, я виноват, ты прав. Я забыл поставить запятые в моем примере. Теперь я понимаю, о чем ты говоришь. Мои искренние извинения. Нет запятой между объектами, но запятая в объектах, я редактирую их сейчас
Arhiliuc Cristina 01 авг. 2018, в 13:55
0

@ArhiliucCristina я вижу. Мое предположение было верным в конце концов. Спасибо за разъяснения.
blhsing 01 авг. 2018, в 13:56

Показать ещё 6 комментариев