Установить диапазон допустимых типов данных / приведение типов для значений из файла в Python

Question

Установить диапазон допустимых типов данных / приведение типов для значений из файла в Python

1

Я читаю файл в строке за строкой. Строки разделены символом "|". Поскольку значения интерпретируются как строка после того, как они были прочитаны из файла, я хочу отнести их к их правильному представлению (теперь я являюсь типом данных каждого значения столбца).

Таким образом, я написал небольшой метод "translate", который выглядит следующим образом:

def translateType(self, dataType):
    if dataType == "INTEGER":
       return int
    elif dataType == "FLOAT":
       return float
    elif dataType == "STRING":
       return str

Я думаю, что это не действительно удовлетворительное решение, потому что этот код как-то не очень уродлив и получает боль, когда есть больше типов данных, которые нужно поддерживать.

Есть ли у вас какие-либо идеи о том, как сделать этот тип "настройки типа" как-то лучше и более расширяемым?

Sebastian B. 03 нояб. 2011, в 05:50

Источник

Теги:

python

dynamic

casting

types

2 ответа

Ещё вопросы

kindall · Answer 1 · 2011-11-03T03-24-00.000Z

Используйте словарь, например

def translateType(t):
    return {"INTEGER": int, "FLOAT": float, "STRING": str}.get(t, None)

Или, если производительность является обязательной (сначала профиль), определите dict в списке аргументов, поэтому его не нужно создавать каждый раз, когда вызывается функция:

def translateType(t, types={"INTEGER": int, "FLOAT": float, "STRING": str}):
    return types.get(t, None)

Ударь меня к этому. :) Хотя, диктаторский?
Вы говорите в другом месте, что типы данных указаны в файле ... Я предполагаю, что имена полей также. В этом случае вы можете создать сопоставление непосредственно из имени поля его типу Python и пропустить промежуточные типы.
Привет - jup, но при чтении второй строки файла, в которой вместо вышеупомянутых типов-посредников указываются int, float и str, чем python снова будет хранить эту информацию в строке?
Вы все еще должны передать тип чтения через словарь преобразования типов, когда вы читаете его изначально, но вам нужно сделать это только один раз, а не при обработке каждой строки. Это все, что я предлагал.

Raymond Hettinger · Answer 2 · 2011-11-03T02-17-00.000Z

Вместо строк просто используйте список типов полей напрямую:

>>> line = 'white fang|jack london|1888|7.50'
>>> types = [str, str, int, float]
>>> [t(s) for t, s in zip(types, line.split('|'))]
['white fang', 'jack london', 1888, 7.5]

Привет - да, хорошая идея ... но информация о типе полей на самом деле приходит из самого файла (вторая строка). Таким образом, я не знаю это во время "компиляции"