pandas read_csv устанавливает `dtype` по индексу столбца (не по имени)

Question

pandas read_csv устанавливает `dtype` по индексу столбца (не по имени)

1

file.txt имеет заголовок и четыре столбца. Но заголовки меняются все время.

что-то вроде:

,'non_standard_header_1','non_standard_header_2','non_standard_header_3'
,kdfjlkjdf, sdfdfd,,
,kdfjlkjwwdf, sdfddffd,,
,kdfjlkjwwdf,, sdfddffd,

Я хочу импортировать file.txt в pandas, и я хочу, чтобы столбцы были импортированы в качестве object. Интуитивный подход (для меня):

dtype = [object, object, object] как в:

    daily_file              = pandas.read_csv('file.txt',
                                              usecols      = [1, 2, 3],
                                              dtype        = [object, object, object])

не работает, работает выше, я получаю:

data type not understood

Как установить столбец dtype при импорте без ссылок (существующих) столбцов?

user189035 23 июнь 2018, в 19:13

Источник

Теги:

python

pandas

types

1 ответ

Ещё вопросы

coldspeed · Accepted Answer · 2018-06-23T15-10-00.000Z

pd.read_csv(..., dtype=object) будет глобально применять объект dtype для всех прочитанных столбцов, если это то, что вы ищете.

В противном случае вам нужно будет передать форму формы {'col': dtype} если вы хотите сопоставить имена dtypes с именами столбцов.

Почти: как вы сопоставляете dtypes с числами столбцов?
@ user189035 Попробуйте изменить ключи индекса. Но если это не сработает, то я боюсь, что у панд нет поддержки (пока).
Кажется, что индексы работают для dtype , ( use_cols имеет эту функцию для ссылки либо по имени, либо по индексу). Не уверен, что произойдет, если у вас имя столбца перекрывает индекс.