Создание вложенного словаря из текстового файла

Question

Создание вложенного словаря из текстового файла

1

/tmp/bond0:

Ethernet Channel Bonding Driver: v3.7.1 (April 27, 2011)

Bonding Mode: IEEE 802.3ad Dynamic link aggregation
Transmit Hash Policy: layer2+3 (2)
MII Status: up
MII Polling Interval (ms): 100
Up Delay (ms): 0
Down Delay (ms): 0

802.3ad info
LACP rate: slow
Min links: 0
Aggregator selection policy (ad_select): stable
Active Aggregator Info:
Aggregator ID: 2
Number of ports: 2
Actor Key: 11
Partner Key: 705
Partner Mac Address: 02:1c:73:9c:3c:fe

Slave Interface: p1p1
MII Status: up
Speed: 10000 Mbps
Duplex: full
Link Failure Count: 0
Permanent HW addr: 9c:dc:71:45:eb:80
Aggregator ID: 2
Slave queue ID: 0

Slave Interface: p4p1
MII Status: up
Speed: 10000 Mbps
Duplex: full
Link Failure Count: 0
Permanent HW addr: 9c:dc:71:4d:80:20
Aggregator ID: 2
Slave queue ID: 0

У меня есть вышеуказанные текстовые выходы, и я хочу создать вложенный словарь, который выглядит так: в тексте выше может быть больше двух подчиненных интерфейсных блоков

bond0 : {
 'MII Status:' : 'up',
 'Aggregator ID:' : '2',
 'Slave Interfaces' : { 'p1p1' : { 'MII Status' : 'up',
 'Permanent HW addr' : '9c:dc:71:45:eb:80',
 'MII Status' : up },
 'p4p1' : { ''MII Status' : 'up',
 'Permanent HW addr' : '9c:dc:71:4d:80:20',
 'MII Status' : up },
 },

Я начал делать некоторую кодировку, как показано ниже, но все еще не получаю: #/usr/bin/python

из будущего импорта print_function import pprint import os import re import subprocess

class BndClass(dict):
   def __init__(self, Bnd=None):
      self['Name'] = Bnd
      self.uPdateInfo()
      super(BndClass, self).__init__()

   def uPdateInfo(self):
      OutBnd = subprocess.Popen(['cat', '/tmp/'\
    + self['Name']],shell=False,stdout=subprocess.PIPE,stderr=subprocess.PIPE)
      for line in OutBnd.stdout:
          match = re.search(r'^Cur.*?:\s+(.*?)$', line)
          if match:
              self['act_int'] = match.group(1)

          match = re.search(r'^\s*?Aggregator ID:\s+(\d)$', line)
          if match:
              self['agid'] = match.group(1)

          match = re.search(r'^Slave\sInterface:\s(.*?)$', line)
          if match:
              self.setdefault('slvs', []).append(match.group(1))


  if __name__ == '__main__':
      Y = BndClass('bond0')

  Y:

  {'Name': 'bond0', 'agid': '2', 'slvs': ['p1p1', 'p4p1']}

У меня может быть много более "связных" файлов, таких как bond1,2,3,4, и так далее. Так что я думал, что имеет смысл иметь класс, и я преобразован в классную форму. Однако это терпит неудачу. Какие-нибудь мысли?

#!/usr/bin/python
from __future__ import print_function
from collections import defaultdict
import pprint
import os
import re
import subprocess



class BndClass(dict):
    def __init__(self, Bnd=None):
        self['Name'] = Bnd
        self.uPdateInfo()
        super(BndClass, self).__init__()

    def uPdateInfo(self):
        with open(self['Name'], "r") as f:
            for line in f:
                line = line.strip()  # clean that up a bit :)
                if line.strip() == "": continue
                match = re.search(r'^\s*?(Aggregator ID):\s+(\d)$', line)
                if match:
                    self[match.group(1)] = match.group(2)
                    continue

                match = re.search(r'^(Slave\sInterface):\s(.*?)$', line)
                if match:
                    self[match.group(1)] = match.group(2)
                    while True:
                        try:
                            line = next(f).strip()
                        except:
                            break
                        if line == "":
                            break
                        slave_match = re.search(r'^(MII\sStatus):\s+(\w+)$', line)
                        if slave_match:
                            self.setdefault(match.group(1), {}).setdefault(match.group(2), {})[slave_match.group(1)] = slave_match.group(2)
                            continue
                        slave_match = re.search(r'^(Permanent\sHW\saddr):\s+(.+)$', line)
                        if slave_match:
                            self.setdefault(match.group(1), {}).setdefault(match.group(2), {})[slave_match.group(1)] = slave_match.group(2)
                            continue

if __name__ == '__main__':
   B = BndClass('bond0')

Traceback (most recent call last):
File "./bc6.py", line 47, in <module>
    B = BndClass('bond0')
 File "./bc6.py", line 14, in __init__
   self.uPdateInfo()
 File "./bc6.py", line 39, in uPdateInfo
   self.setdefault(match.group(1), {}).setdefault(match.group(2), {}) 
 [slave_match.group(1)] = slave_match.group(2)
 AttributeError: 'str' object has no attribute 'setdefault'

user3477108 25 сен. 2018, в 17:17

Источник

0

Вы забыли code balise для нужного вам слова и последней строки. (Я не могу редактировать их, так как "в основном это код")
Plopp 25 сен. 2018, в 14:43
0

Вы не предоставили работающий минимальный пример, это нормально для меня, так как это довольно хорошо объяснено, но в будущем вы должны удалить некоторые части для меньшего примера. Например, удаление класса, который бесполезен для использования, и предоставление фиктивного файла, а не полного файла (раздражает написание регулярного выражения ^^).
Plopp 25 сен. 2018, в 15:10
0

извиняюсь. Буду прилежным в следующий раз :)
user3477108 25 сен. 2018, в 19:00

Показать ещё 1 комментарий

Теги:

python

2 ответа

1

Извините, я начал, а потом сделал что-то еще и забыл...

Вот решение, это не самый сексуальный, но тем не менее он работает. Если ваш файл имеет очень строгий формат (как кажется), вы можете быть более эффективным с помощью break и continue чтобы избежать бесполезных поисков регулярных выражений.

import re
from collections import defaultdict

final_dict = defaultdict(lambda: defaultdict(str))

with open("bound0_file.txt", "r") as f:
    for line in f:
        line = line.strip()  # clean that up a bit :)
        if line.strip() == "": continue
        match = re.search(r'^\s*?(Aggregator ID):\s+(\d)$', line)
        if match:
            final_dict[match.group(1)] = match.group(2)
            continue

        match = re.search(r'^(Slave\sInterface):\s(.*?)$', line)
        if match:
            final_dict[match.group(1)][match.group(2)] = {}
            while True:
                try:
                    line = next(f).strip()
                except:
                    break
                if line == "":
                    break
                slave_match = re.search(r'^(MII\sStatus):\s+(\w+)$', line)
                if slave_match:
                    final_dict[match.group(1)][match.group(2)][slave_match.group(1)] = slave_match.group(2)
                    continue
                slave_match = re.search(r'^(Permanent\sHW\saddr):\s+(.+)$', line)
                if slave_match:
                    final_dict[match.group(1)][match.group(2)][slave_match.group(1)] = slave_match.group(2)
                    continue

    print(final_dict)

from collections import defaultdict
final_dict = defaultdict(lambda: defaultdict(str))

Здесь мы используем defaultdict который позволит нам "создать ключ по запросу", в основном, если вы ищете ключ, который не существует, defaultdict создаст его вместо повышения ошибки.

Я раскладываю два из них, потому что тот, которого я действительно хочу, является вторым, и потому, что у вас есть не более 2 уровней.

...
match = re.search(r'^\s*?(Aggregator ID):\s+(\d)$', line)
if match:
        final_dict[match.group(1)] = match.group(2)
        continue

Здесь это довольно объяснительно, если моя строка - это идентификатор агрегатора, который я просто поместил в мой final_dict. Обратите внимание на добавленную группу вокруг "идентификатора агрегатора". Тогда, поскольку я знаю, что я закончил с этой строкой, я использую оператор continue чтобы пропустить оставшуюся часть цикла и перейти к следующей строке.

...
match = re.search(r'^(Slave\sInterface):\s(.*?)$', line)
if match:
    final_dict[match.group(1)][match.group(2)] = {}

Здесь начинается сложная часть. Если предыдущее match потерпело неудачу (aka line not aggregator id), то мы попробуем это, если это не подчиненный интерфейс, мы просто перейдем к следующей строке.

Однако, если это строка, это означает, что мы вводим подчиненный блок интерфейса, который заканчивается пустой строкой (см. Бит позже).

Эта строка final_dict - это то, почему мне пришлось использовать defaultdict, потому что я буду создавать Slave interface: { 'p1p1': {} } вложенного dict Slave interface: { 'p1p1': {} } немедленно.

        ...
        while True:
            try:
                line = next(f).strip()
            except:
                break

Мы вводим "подцикл", который я использую, чтобы пройти через подчиненный блок интерфейса, чтобы искать нужные вам записи (MII Status и Permanent HW addr). Мы собираемся сделать некоторые вещи в этом подцикле (ниже), но когда мы найдем пустую строку, это означает, что мы закончили с текущим блоком. (Оператор try-expect здесь break, если мы дойдем до конца файла).

            ...
            if slave_match:
                final_dict[match.group(1)][match.group(2)][slave_match.group(1)] = slave_match.group(2)
                continue
            slave_match = re.search(r'^(Permanent\sHW\saddr):\s+(.+)$', line)
            if slave_match:
                final_dict[match.group(1)][match.group(2)][slave_match.group(1)] = slave_match.group(2)
                continue

Это то же самое, что и в первом match, мы ищем правильную линию и добавляем ее в final_dict. Однако нам нужно использовать другую переменную, так как нам нужно match чтобы получить доступ к правильной позиции в нашем dict.

Как вы можете видеть, вы были действительно рядом. Этот метод, возможно, не самый лучший.

Plopp 25 сен. 2018, в 13:50

0

Огромное спасибо. Да, самая сложная часть была в цикле while, и меня это не поразило, когда вы обрабатываете подчиненный блок. Очень признателен.
user3477108 25 сен. 2018, в 18:59

Ещё вопросы

Вы забыли code balise для нужного вам слова и последней строки. (Я не могу редактировать их, так как "в основном это код")
Вы не предоставили работающий минимальный пример, это нормально для меня, так как это довольно хорошо объяснено, но в будущем вы должны удалить некоторые части для меньшего примера. Например, удаление класса, который бесполезен для использования, и предоставление фиктивного файла, а не полного файла (раздражает написание регулярного выражения ^^).
извиняюсь. Буду прилежным в следующий раз :)
Огромное спасибо. Да, самая сложная часть была в цикле while, и меня это не поразило, когда вы обрабатываете подчиненный блок. Очень признателен.

user3477108 · Accepted Answer · 2018-10-01T10-00-00.000Z

Я придумал решение ниже, которое может сделать то, что я хочу. Спасибо

import re
import pprint
from collections import defaultdict

class AclassOfItwsOwn():
    def __init__(self, bond):
    self.bond = bond


def doIt(self):
    return self.MakeDict(self.bond)

@staticmethod
def MakeDict(bond):
    final_dict = defaultdict(lambda: defaultdict(str))

    with open(bond + '.txt', "r") as f:
        for line in f:
            line = line.strip()
            if line.strip() == "":
                continue
            match = re.search(r'^\s*?(Aggregator ID):\s+(\d)$', line)
            if match:
                final_dict[match.group(1)] = match.group(2)
                continue

            match = re.search(r'^(Slave\sInterface):\s(.*?)$', line)
            if match:
                final_dict[match.group(1)][match.group(2)] = {}
                while True:
                    try:
                        line = next(f).strip()
                    except:
                        break
                    if line == "":
                        break
                    slave_match = re.search(r'^(MII\sStatus):\s+(\w+)$', line)
                    if slave_match:
                        final_dict[match.group(1)][match.group(2)][slave_match.group(1)] = slave_match.group(2)
                        continue
                    slave_match = re.search(r'^(Permanent\sHW\saddr):\s+(.+)$', line)
                    if slave_match:
                        final_dict[match.group(1)][match.group(2)][slave_match.group(1)] = slave_match.group(2)
                        continue
    return final_dict

b0 = AclassOfItwsOwn('bond0')
b0.doIt()
b2 = AclassOfItwsOwn('bond2')
b2.doIt()