Удаление первой строки заголовка из текстового файла после чтения в python

Question

Удаление первой строки заголовка из текстового файла после чтения в python

1

Я загрузил текстовый файл с помощью следующей команды. Я хочу удалить первую строку заголовка из contents, которое было разделено \n. Как это сделать?

txtfile = open(filepath, "rt")
contents = txtfile.read()
contents
'Label  Volume(voxels)SurfArea(mm^2) Eccentricity   Elongation     Orientation    Centroid                      Axes Length                   Bounding Box                  \n  1      148766  ...

Во-вторых, как удалить \n с конца каждого элемента (т.е. Каждой строки) contents?

Спасибо

sc241 18 апр. 2019, в 11:26

Источник

Теги:

python

python-2.7

text-files

5 ответов

Ещё вопросы

DirtyBit · Answer 1 · 2019-04-18T08-09-00.000Z

Используя нарезку:

файл:

Label  Volume(voxels)SurfArea(mm^2) Eccentricity   Elongation     Orientation    Centroid                      Axes Length                   Bounding Box                  \n1
148766

Отсюда:

txtfile = open(filepath, "rt")
contents = txtfile.readlines()[1:]    # skip the first line
print(contents)

ВЫХОД:

['148766']

РЕДАКТИРОВАТЬ:

Если текст находится в одной строке, вы можете преобразовать список в строку и разделить() разделителем \n:

txtfile = open(filepath, "rt")
contents = txtfile.readlines()
print("".join(contents).split(r'\n1')[1:])

Спасибо за помощь. Как получить остальные файлы в массиве NumPy?
Вы имеете в виду содержание файлов? Вы пытаетесь извлечь содержимое из нескольких файлов?
Нет, это тот же файл, однако я хочу, чтобы остальная часть файла (т. contents ) (после удаления первой строки заголовка) была в массивном массиве, чтобы иметь доступ к определенному столбцу. Каждая строка отделяется символом \ n.
Лучше задать это как отдельный вопрос ТАК.

brunns · Answer 2 · 2019-04-18T06-30-00.000Z

1

Пытаться:

txtfile = open(filepath, "rt")
txtfile.readline()  # Discard first line
contents = txtfile.read()

brunns 18 апр. 2019, в 06:30

0

contents.splitlines() удаляет '\ n` в конце каждой строки
sc241 18 апр. 2019, в 13:48
0

Да, но вы не включили это в свой вопрос, когда я ответил на него. ;-) Обычно лучше задавать дополнительные вопросы в виде отдельных вопросов SO.
brunns 18 апр. 2019, в 13:50
0

Да, но я не могу задать ни одного вопроса из-за ограничений. f=contents.splitlines() , а затем ff=np.vstack(f) . форма ff (3,1), в которой в каждом ряду 9 других элементов (столбцов). Теперь я хочу выбрать 2-й столбец, однако, когда я пишу в dataFrame я все еще не могу получить доступ к каждому dataFrame .
sc241 18 апр. 2019, в 14:23

Показать ещё 1 комментарий

han solo · Answer 3 · 2019-04-18T08-24-00.000Z

Вы можете просто пропустить заголовок, используя next на fd,

>>> with open(filepath, "rt") as textfile:
...    next(textfile)  # Discard first line
...    contents = txtfile.read()

Matthijs990 · Answer 4 · 2019-04-18T08-11-00.000Z

пытаться:

txtfile = open(filepath, "rt")
contents = txtfile.read()
#split it and join only the items after it
after = ''.join(contents.split(r'\n1')[1:])

Reductio · Answer 5 · 2019-04-18T07-38-00.000Z

В вашем примере это может работать:

import re
#your code
content = re.sub( ".*?\n1", "", content, 1 ) #Replace the first occurance of "[Anything]\n1" with ""