Как проанализировать текст в формате JSON в середине текстового файла

Question

Как проанализировать текст в формате JSON в середине текстового файла

1

У меня есть txt файл, содержащий простой текст и текстовый блок в стиле json. Я хочу проанализировать txt и извлечь блок json для объекта python dict.

Например, txt файл может выглядеть так:

1234567
asdfjkl
{
  "Name": {
    "given ": "kevin"
  },
  "info": [
    "asdf",
    "fda",
    "sdf"
  ]
}

и там есть один и только один законный блок json в каждом txt. Не удалось найти что-либо в пакете json. Любая помощь будет оценена.

Kevin Fang 28 сен. 2018, в 06:38

Источник

0

Эмм ... какой желаемый выход?
U10-Forward 28 сен. 2018, в 04:19
0

Может ли {или} происходить вне JSON? Всегда ли JSON находится в конце файла?
PM 2Ring 28 сен. 2018, в 04:27
0

1. Найдите номер строки '{' 2. Используйте 'dom' в minidom и проанализируйте номер этой строки. Это будет делать
Jim Todd 28 сен. 2018, в 04:30
0

@ U9-Переслать объект dict, содержащий все из блока json
Kevin Fang 28 сен. 2018, в 04:32
0

@ PM2Ring 1. Нет 2. Да
Kevin Fang 28 сен. 2018, в 04:33

Показать ещё 3 комментария

Теги:

python

json

2 ответа

0

Если вы контролируете ввод, не делайте этого так. Если парень или парень на входном конце - клиент/босс, проклинайте богов кода под вашим дыханием и напишите вспомогательную функцию следующим образом:

# returns a list of plaintext lines and a json string.
def split_text_and_json(filename):
    textlines = []
    jsonlines = []
    bracketcount = 0

    with open(filename) as f:
       for line in f.readlines():
           bracketcount += line.count('{')

           if bracketcount:
               jsonlines.append(line)
           else:
               textlines.append(line)
           bracketcount-=line.count('}')
    return (textlines, ''.join(jsonlines))

plaintextpart, jsonpart = split_text_and_json('file.txt')

Вы можете сделать это inline, если JSON всегда гарантированно будет последней частью файла.

Теперь для плохих вещей: вам нужно обрабатывать файлы, содержащие {} символы вне json. Этот скрипт будет вызывать ошибки в этом случае при попытке загрузить json.

Alex Weavers 28 сен. 2018, в 02:20

0

Спасибо! На самом деле реальный сценарий использования немного сложен, хотя я просто хочу быть ленивым, который не хочет найти оригинальный файл json: D
Kevin Fang 28 сен. 2018, в 04:45
0

Это не будет работать, если объект JSON содержит неравные числа строковых литералов { и } .
blhsing 28 сен. 2018, в 04:46
0

Чтобы подчеркнуть, op должен просто реорганизовать ввод, если это возможно, чтобы его можно было легко распутать.
Alex Weavers 28 сен. 2018, в 22:15
0

Кроме того, я только что понял, что это не будет работать, если JSON все на одной линии.
Alex Weavers 28 сен. 2018, в 22:16

Показать ещё 2 комментария

Ещё вопросы

Может ли {или} происходить вне JSON? Всегда ли JSON находится в конце файла?
1. Найдите номер строки '{' 2. Используйте 'dom' в minidom и проанализируйте номер этой строки. Это будет делать
@ U9-Переслать объект dict, содержащий все из блока json
Спасибо! На самом деле реальный сценарий использования немного сложен, хотя я просто хочу быть ленивым, который не хочет найти оригинальный файл json: D
Это не будет работать, если объект JSON содержит неравные числа строковых литералов { и } .
Чтобы подчеркнуть, op должен просто реорганизовать ввод, если это возможно, чтобы его можно было легко распутать.
Кроме того, я только что понял, что это не будет работать, если JSON все на одной линии.

U9-Forward · Accepted Answer · 2018-09-28T03-01-00.000Z

Как вы сказали, JSON всегда сзади:

from ast import literal_eval
with open('filename.txt','r') as f:
   s=f.read()
   print(literal_eval(s[s.index('{')-1:]))

Лучше использовать json.loads:

from json import loads
with open('filename.txt','r') as f:
   s=f.read()
   print(loads(s[s.index('{'):]))

Оба выхода:

{'Name': {'given ': 'kevin'}, 'info': ['asdf', 'fda', 'sdf']}

Да, я думаю, что второй лучше. Спасибо за ответ!
json.loads определенно лучше, чем literal_eval , так как он будет правильно преобразовывать JSON, поэтому JS-вещи, такие как null , true и false преобразуются в эквиваленты Python.
@ PM2Ring Конечно, это намного лучше, поэтому я сказал это :-)