Почему Python не может проанализировать эти данные JSON?

1307

У меня этот JSON в файле:

{
    "maps": [
        {
            "id": "blabla",
            "iscategorical": "0"
        },
        {
            "id": "blabla",
            "iscategorical": "0"
        }
    ],
    "masks": [
        "id": "valore"
    ],
    "om_points": "value",
    "parameters": [
        "id": "valore"
    ]
}

Я написал этот script, который печатает весь текст json:

json_data=open(file_directory).read()

data = json.loads(json_data)
pprint(data)

Как я могу проанализировать файл и извлечь отдельные значения?

Теги:
parsing

10 ответов

2025
Лучший ответ

Я думаю, что Игнасио говорит, что ваш файл JSON неверен. У вас есть [] когда вы должны иметь {}. [] для списков, {} для словарей.

Вот как должен выглядеть ваш JSON файл, ваш JSON файл даже не загрузится для меня:

{
    "maps": [
        {
            "id": "blabla",
            "iscategorical": "0"
        },
        {
            "id": "blabla",
            "iscategorical": "0"
        }
    ],
    "masks": {
        "id": "valore"
    },
    "om_points": "value",
    "parameters": {
        "id": "valore"
    }
}

Тогда вы можете использовать свой код:

import json
from pprint import pprint

with open('data.json') as f:
    data = json.load(f)

pprint(data)

С данными теперь вы также можете найти такие значения:

data["maps"][0]["id"]
data["masks"]["id"]
data["om_points"]

Попробуйте это и посмотрите, начнет ли это иметь смысл.

  • 1
    Итак, я должен контролировать свой код, потому что этот файл JSON генерируется из объекта Java. Благодарю.
  • 0
    Сериализованные данные заключаются в [], и когда вы их читаете, вам нужна функция f.read (), то есть если вы используете стандарт.
Показать ещё 11 комментариев
280

Ваш data.json должен выглядеть следующим образом:

{
 "maps":[
         {"id":"blabla","iscategorical":"0"},
         {"id":"blabla","iscategorical":"0"}
        ],
"masks":
         {"id":"valore"},
"om_points":"value",
"parameters":
         {"id":"valore"}
}

Ваш код должен быть:

import json
from pprint import pprint

with open('data.json') as data_file:    
    data = json.load(data_file)
pprint(data)

Обратите внимание, что это работает только в Python 2.6 и выше, так как это зависит от with -statement. В Python 2.5 используйте from __future__ import with_statement, в Python <= 2.4, см. ответ Джастина Пила, на котором основан этот ответ.

Теперь вы можете также получить доступ к следующим значениям:

data["maps"][0]["id"]  # will return 'blabla'
data["masks"]["id"]    # will return 'valore'
data["om_points"]      # will return 'value'
  • 7
    Я получил понижение на этом. Может быть, было не ясно, почему я думал, что нужен другой ответ. Добавлена заметка о совместимости оператора with.
  • 0
    Извините за откат, но предлагаемый код будет держать data_file open дольше, чем необходимо.
Показать ещё 5 комментариев
68

Ответ Джастина Пила действительно полезен, но если вы используете Python 3, чтение JSON должно быть сделано так:

with open('data.json', encoding='utf-8') as data_file:
    data = json.loads(data_file.read())

Примечание: используйте json.loads вместо json.load. В Python 3 json.loads принимает строковый параметр. json.load принимает файловый параметр объекта. data_file.read() возвращает строковый объект.

  • 8
    Почему следует избегать json.load в пользу .loads в Python 3?
  • 0
    @ Zearin пожалуйста, проверьте официальный документ .
Показать ещё 8 комментариев
53
data = []
with codecs.open('d:\output.txt','rU','utf-8') as f:
    for line in f:
       data.append(json.loads(line))
  • 8
    это правильное решение, если у вас есть несколько объектов json в файле. json.loads не декодирует несколько объектов json. В противном случае вы получите ошибку «Дополнительные данные».
  • 0
    Это лучший ответ. В противном случае выдает ошибку «Дополнительные данные».
Показать ещё 1 комментарий
13

"Ultra JSON" или просто "ujson" могут обрабатывать наличие [] в вашем файле ввода JSON. Если вы читаете входной файл JSON в вашу программу в виде списка элементов JSON; например, [{[{}]}, {}, [], etc...] ujson может обрабатывать произвольный порядок списков словарей, словари списков.

Вы можете найти ujson в индексе пакета Python, и API практически идентичен встроенной библиотеке json Python.

ujson также намного быстрее, если вы загружаете большие файлы JSON. Вы можете увидеть подробности производительности по сравнению с другими библиотеками Python JSON по той же ссылке, что и предоставленная.

8

если вы находитесь в Python 3, вот как вы можете это сделать

{
  "connection1": {
    "DSN": "con1",
    "UID": "abc",
    "PWD": "1234",
    "connection_string_python":"test1"
  }
  ,
  "connection2": {
    "DSN": "con2",
    "UID": "def",
    "PWD": "1234"
  }
}

Код должен выглядеть так, как будто предполагается, что файл connection.json выглядит выше

connection_file = open('connection.json', 'r')
conn_string = json.load(connection_file)
conn_string['connection1']['connection_string_python'])
connection_file.close()
>>>test1
  • 1
    это также работает в 2.7.5
  • 14
    это оставляет дескриптор файла открытым. лучше использовать оператор with
7
   # Here you go with modified json file:
   # data.json file : 
    {
        "maps": [
            {
                "id": "blabla",
                "iscategorical": "0"
            },
            {
                "id": "blabla",
                "iscategorical": "0"
            }
        ],
        "masks": [{
            "id": "valore"
        }],
        "om_points": "value",
        "parameters": [{
            "id": "valore"
        }]
    }


   # You can call or print data on console by using below lines

    import json
    from pprint import pprint
    with open('data.json') as data_file:
        data_item = json.load(data_file)
    pprint(data_item)

    print(data_item['parameters'][0]['id'])

    #Output : 
    #pprint(data_item) output as :

    {'maps': [{'id': 'blabla', 'iscategorical': '0'},
              {'id': 'blabla', 'iscategorical': '0'}],
     'masks': [{'id': 'valore'}],
     'om_points': 'value',
     'parameters': [{'id': 'valore'}]}
    #print(data_item['parameters'][0]['id']) output as :
    valore
  • 0
    Если мы хотим добавить столбец, чтобы подсчитать, сколько наблюдений имеет «карта», как мы могли бы написать эту функцию?
4

Есть два типа в этом разборе.

  1. Разбор данных из файла по системному пути
  2. Парсинг JSON с удаленного URL.

Из файла вы можете использовать следующее

import json
json = json.loads(open('/path/to/file.json').read())
value = json['key']
print json['value']

Эта статья объясняет полный анализ и получение значений с использованием двух сценариев. Разбор JSON с использованием Python

3

Как пользователь python3,

Разница между методами load и loads важна, особенно когда вы читаете данные json из файла.

Как указано в документах:

json.load:

Десериализовать fp (текстовый файл .read() -supporting или двоичный файл, содержащий документ JSON) в объект Python, используя эту таблицу преобразования.

json.loads:

json.loads: десериализовать s (экземпляр str, bytes или bytearray, содержащий документ JSON) в объект Python, используя эту таблицу преобразования.

Метод json.load может непосредственно читать открытый документ json, так как он может читать двоичный файл.

with open('./recipes.json') as data:
  all_recipes = json.load(data)

В результате ваши данные json доступны в формате, указанном в соответствии с таблицей преобразования:

https://docs.python.org/3.7/library/json.html#json-to-py-table

0

При чтении json из файла всегда полезно очистить файлы и получить строку в файле, разделив символы новой строки и вкладки

 clean_document = json_file.read().replace('\n', '').replace('\t', '')
 json_document = json.loads(clean_document)
 print("Len of Json ", len(json_document))

Ещё вопросы

Сообщество Overcoder
Наверх
Меню