Метод .strip () не удаляет загадочные пробельные символы

Question

Метод .strip () не удаляет загадочные пробельные символы

1

Я читаю некоторые данные, кодированные utf-8, из файла:

with open (filename, 'rb') as f:
    bytes= f.read(offset, length)
    #bytes is b'hello\x00\x00\x00\x00'
    text = bytes.decode('utf-8')
    #text is 'hello    '
    stripped_text = text.strip()
    #stripped_text is 'hello    '

Вы можете воссоздать это с помощью простой строки, например

thing = b'hello\x00\x00\x00\x00'.decode('utf8').strip()
print(thing)
#the output is 'hello    '

Как вы можете видеть, конечные нулевые символы не разделяются - я предполагаю, что это имеет какое-то отношение к '\ x00', которое не распознается.strip(), но везде, где я выгляжу, кажется, кажется, что это должно быть. Что дает? Как я могу удалить эти символы без необходимости делать что-то очень неуклюжие?

Я не мог найти сообщение, которое рассматривало бы эту проблему.

Nate 29 авг. 2018, в 18:08

Источник

Теги:

python

string

strip

1 ответ

Ещё вопросы

jwodder · Accepted Answer · 2018-08-29T14-31-00.000Z

5

Лучший ответ

NUL не являются пробелами, поэтому strip() без аргументов не будет их лишать. Вместо этого вы должны использовать strip('\0'):

>>> 'hello\0\0\0\0'.strip('\0')
'hello'

jwodder 29 авг. 2018, в 14:31

0

Спасибо - это работает, но что за аргумент '\ 0'? строка, на которую вызывается strip (), называется 'hello'. '\ 0' интерпретируется как нулевой символ? Где в документах это?
Nate 29 авг. 2018, в 16:18
0

@Nate: аргумент strip() - это набор символов для удаления. '\0' - это еще один способ обозначения '\x00' , символа NUL (первый использует восьмеричный escape, второй - шестнадцатеричный escape; см. Таблицы здесь для получения дополнительной информации).
jwodder 29 авг. 2018, в 16:20
0

Спасибо - я не знал, что вы можете указать NUL в строке таким образом.
Nate 29 авг. 2018, в 16:26
0

@Nate Любопытно, что я не вижу никакой документации для escape-последовательностей \<number> в соответствующем разделе о строковых литералах .
Aran-Fey 29 авг. 2018, в 16:30
0

@ Аран-Фей: Это линия \ooo в нижней части первого стола.
jwodder 29 авг. 2018, в 16:31
0

@jwodder Интересно! Я понятия не имел, что \8 и \9 не были escape-последовательностями.
Aran-Fey 29 авг. 2018, в 16:33

Показать ещё 4 комментария