pandas read_csv устанавливает `dtype` по индексу столбца (не по имени)

1

file.txt имеет заголовок и четыре столбца. Но заголовки меняются все время.

что-то вроде:

,'non_standard_header_1','non_standard_header_2','non_standard_header_3'
,kdfjlkjdf, sdfdfd,,
,kdfjlkjwwdf, sdfddffd,,
,kdfjlkjwwdf,, sdfddffd,

Я хочу импортировать file.txt в pandas, и я хочу, чтобы столбцы были импортированы в качестве object. Интуитивный подход (для меня):

dtype = [object, object, object] как в:

    daily_file              = pandas.read_csv('file.txt',
                                              usecols      = [1, 2, 3],
                                              dtype        = [object, object, object])

не работает, работает выше, я получаю:

data type not understood

Как установить столбец dtype при импорте без ссылок (существующих) столбцов?

Теги:
pandas
types

1 ответ

2
Лучший ответ

pd.read_csv(..., dtype=object) будет глобально применять объект dtype для всех прочитанных столбцов, если это то, что вы ищете.

В противном случае вам нужно будет передать форму формы {'col': dtype} если вы хотите сопоставить имена dtypes с именами столбцов.

  • 0
    Почти: как вы сопоставляете dtypes с числами столбцов?
  • 1
    @ user189035 Попробуйте изменить ключи индекса. Но если это не сработает, то я боюсь, что у панд нет поддержки (пока).
Показать ещё 1 комментарий

Ещё вопросы

Сообщество Overcoder
Наверх
Меню