Почему текстовые файлы должны заканчиваться символом новой строки?

Question

Почему текстовые файлы должны заканчиваться символом новой строки?

1235

Я предполагаю, что все здесь знакомы с пословицей, что все текстовые файлы должны заканчиваться новой строкой. Я знаю об этом "правиле" в течение многих лет, но я всегда задавался вопросом - почему?

Will Robertson 08 апр. 2009, в 14:16

Источник

23

просто придурок. это не «новая строка» в конце файла. Это «разрыв строки» в конце последней строки. Также, посмотрите лучший ответ на связанный вопрос: stackoverflow.com/questions/16222530/…
gcb 10 июль 2013, в 16:52
288

Просто чтобы придираться еще, он на самом деле не написал «новую строку», он написал «новую строку», что правильно.
sindrenm 05 июнь 2014, в 18:28
5

не знакомо, но мне интересно, потому что число случаев, когда этот лишний перевод строки ломает вещи, слишком велико для меня
tobibeer 13 фев. 2015, в 16:09
0

Я не слышал эту пословицу до сегодняшнего дня. Я знал, что POSIX требует этого, потому что многие старые инструменты предполагают это, но я обычно живу в мире без POSIX, где большинство инструментов не заботятся.
Adrian McCarthy 22 июль 2015, в 23:04
2

В настоящее время я использую потоки Node.js для построчного анализа текстовых данных, и отсутствие терминального разрыва строки раздражает, так как я должен добавить дополнительную логику, когда закончится входная сторона потока / закрыто, чтобы гарантировать, что последняя строка будет обработана.
Mark K Cowan 12 сен. 2015, в 13:01
13

Unix рассматривает свое общее поведение в конце файлов следующим образом: \ n символы не начинают строки; вместо этого они заканчивают их. Таким образом, \ n является разделителем строки, а не разделителем строки. Первая строка (как и все строки) не нуждается в \ n для ее запуска. Последняя строка (как и все строки) нуждается в \ n для ее завершения. \ N в конце файла не создает дополнительную строку. Однако иногда текстовые редакторы добавляют туда видимую пустую строку. Даже Emacs делает это, по желанию .
MarkDBlackwell 28 авг. 2016, в 16:31
1

@sindrenm Я полагаю, что вся эта путаница словесная. Чтобы избежать этого, разработчики языка C и Unix вместо этого могли бы назвать символ перевода строки ASCII EOL или endOfLine. Следуя этой идее, \l будет ее естественным сокращением ( \l не используется в C). Однако, очевидно, эта строчная буква L не сильно отличается от цифры «1» (к сожалению). И \1 используется в регулярных выражениях.
MarkDBlackwell 28 авг. 2016, в 16:49
0

@MarkDBlackwell Ну да. Но почему ты поднимаешь это сейчас? :П
sindrenm 09 сен. 2016, в 14:03
1

@sindrenm Я поднимаю это, чтобы помочь людям. Если бы люди помнили «символ конца строки» в качестве его имени, они бы не задавались вопросом, почему в последней строке файла он есть. Поскольку разработчики ухватились за следующую лучшую вещь (назвав ее «символ новой строки» - что является небольшим неправильным обозначением), естественно, они задаются вопросом, почему он не выполняет свою очевидную функцию, и создают новую строку там.
MarkDBlackwell 09 сен. 2016, в 17:35
0

@MarkDBlackwell Я абсолютно согласен с вами, что название довольно ужасное в отношении того, для чего оно на самом деле существует.
sindrenm 10 сен. 2016, в 22:50
0

@MarkDBlackwell Конечно, вы могли бы сказать, что это тоже спорная семантика. Конечно, '\n' в C - это перевод строки. Но опять же в ascii(7) он имеет: 012 10 0A LF '\n' (new line) . Так это перевод строки, перевод строки или что-то еще? Ну, это зависит от того, кого вы спрашиваете. Я знаю, что вы говорите, хотя: если main() заканчивается на: printf("\nTest\n"); тогда строка под «Test» будет приглашением оболочки. Это тонко, но все же стоит упомянуть в моей голове. (Конечно, putchar('\n'); просто покажет пустую строку над приглашением.)
Pryftan 14 апр. 2018, в 19:56

Показать ещё 9 комментариев

Теги:

file

unix

newline

text-files

18 ответов

268

Каждая строка должна быть прервана символом новой строки, включая последнюю. Некоторые программы имеют проблемы с обработкой последней строки файла, если она не завершена новой строкой.

GCC предупреждает об этом не потому, что не может обработать файл, а потому, что он должен быть частью стандарта.

В стандарте C-языка Исходный файл, который не является пустым, должен заканчиваться символом новой строки, которому не следует сразу же следовать символ обратной косой черты.

Так как это предложение "должно", мы должны исправить диагностическое сообщение для нарушения этого правила.

Это в разделе 2.1.1.2 стандарта ANSI C 1989. Раздел 5.1.1.2 стандарта ISO C 1999 (и, возможно, также стандарта ISO C 1990).

Ссылка: Архив сообщений GCC/GNU.

Bill the Lizard 08 апр. 2009, в 12:29

9

пожалуйста, напишите хорошие программы, которые либо позволяют вставлять эту новую строку, где это необходимо при обработке, либо способны правильно обрабатывать «пропущенные» ... которые, по сути, не отсутствуют
tobibeer 13 фев. 2015, в 16:12
4

@BilltheLizard, Какие есть примеры «У некоторых программ возникают проблемы с обработкой последней строки файла, если он не завершен переводом строки» ?
Pacerier 03 июль 2015, в 04:39
3

@Pacerier wc -l не будет считать последнюю строку файла, если он не завершен новой строкой. Кроме того, cat объединит последнюю строку файла с первой строкой следующего файла в одну, если последняя строка первого файла не завершена новой строкой. Практически любая программа, которая ищет переводы строк в качестве разделителя, может испортить это.
Bill the Lizard 03 июль 2015, в 11:17
2

@BilltheLizard, я имею в виду wc уже упоминалось ....
Pacerier 03 июль 2015, в 14:38
0

@Pacerier Я не вижу твоей точки зрения.
Bill the Lizard 03 июль 2015, в 14:49
2

@BilltheLizard, мой плохой, чтобы уточнить: каковы некоторые примеры программ, у которых есть проблемы с обработкой последней строки файла, если он не завершен новой строкой (кроме тех, которые уже были упомянуты в потоке как массовые, такие как cat и wc ) ?
Pacerier 04 июль 2015, в 05:52
0

Visual Studio Resource Compiler (rc) дросселирует, если последняя строка не заканчивается символом конца строки.
Adrian McCarthy 22 июль 2015, в 22:50
0

@BilltheLizard: Итак, эта программа вызывает UB при компиляции в виде кода C ++ 98 и C ++ 03. Смотрите программу: ideone.com/jswwf9
Destructor 31 июль 2015, в 07:00
0

Стандарт C ++ 14 говорит что-то немного другое: «Исходный файл, который не является пустым и не заканчивается символом новой строки ... должен обрабатываться так, как если бы к файлу был добавлен дополнительный символ новой строки » [выделение добавлено]. Это кажется излишним, так как фаза 1 перевода требует вставки «символов новой строки для индикаторов конца строки» [lex.phases].
Adrian McCarthy 26 янв. 2017, в 23:03
0

Я думаю, что вопрос не связан с gcc .... Стандарт C говорит о правильном окончании файлов, но с точки зрения исходного кода. Компилятору разрешено размещать символы исходного кода для работы с файлами, у которых нет конца последней строки. Цель форсирования конца строки в последней строке файла (логическая) предназначена для анализа (можно добавить два токена, если между ними нет разделителя)
Luis Colorado 22 нояб. 2017, в 09:07

Показать ещё 8 комментариев

98

Этот ответ является попыткой получить технический ответ, а не мнение.

Если мы хотим быть пуристами POSIX, мы определяем строку как:

Последовательность из нуля или более символов и lt; новых символов > плюс символ завершающей < новой строки.

Источник: http://pubs.opengroup.org/onlinepubs/9699919799/basedefs/V1_chap03.html#tag_03_206

Неполная строка как:

Последовательность одного или нескольких символов не в алфавитном порядке в конце файла.

Источник: http://pubs.opengroup.org/onlinepubs/9699919799/basedefs/V1_chap03.html#tag_03_195

Текстовый файл как:

Файл, содержащий символы, помещенные в ноль или более строк. Строки не содержат символов NUL, и ни одна из них не может превышать длину {LINE_MAX} байтов, включая символ <newline> . Хотя POSIX.1-2008 не различает текстовые файлы и двоичные файлы (см. Стандарт ISO C), многие утилиты производят только предсказуемый или значимый вывод при работе с текстовыми файлами. Стандартные утилиты, которые имеют такие ограничения, всегда указывают "текстовые файлы" в своих разделах STDIN или INPUT FILES.

Источник: http://pubs.opengroup.org/onlinepubs/9699919799/basedefs/V1_chap03.html#tag_03_397

Строка как:

Сопряженная последовательность байтов, заканчивающаяся и включающая первый нулевой байт.

Источник: http://pubs.opengroup.org/onlinepubs/9699919799/basedefs/V1_chap03.html#tag_03_396

Из этого можно сделать вывод, что единственный раз, когда мы будем сталкиваться с любым типом проблем, мы имеем дело с концепцией строки файла или файла в виде текстового файла (поскольку текстовый файл является организация нулевой или более строк, а строка, которую мы знаем, должна заканчиваться символом <newline> ).

Пример: wc -l filename.

Из руководства wc мы читаем:

Строка определяется как строка символов, помеченных символом <newline> .

Каковы последствия для файлов JavaScript, HTML и CSS, а затем они являются текстовыми файлами?

В браузерах, современных IDE и других front-end приложениях нет проблем с пропуском EOL в EOF. Приложения будут правильно анализировать файлы. Это связано с тем, что не все операционные системы соответствуют стандарту POSIX, поэтому для инструментов без ОС (например, для браузеров) было бы нецелесообразно обрабатывать файлы в соответствии со стандартом POSIX (или любым стандартом уровня ОС).

В результате мы можем быть уверены в том, что EOL в EOF практически не окажет негативного влияния на уровень приложения - независимо от того, работает ли он на ОС UNIX.

На этом этапе мы можем с уверенностью сказать, что пропуск EOL в EOF безопасен при работе с JS, HTML, CSS на стороне клиента. Фактически, мы можем констатировать, что минирование любого из этих файлов, содержащее не <newline> , безопасно.

Мы можем сделать еще один шаг и сказать, что в отношении NodeJS он также не может придерживаться стандарта POSIX, поскольку он может работать в средах, не совместимых с POSIX.

Что мы оставили с этим? Инструмент уровня системы.

Это означает, что единственные проблемы, которые могут возникнуть, - это инструменты, которые прилагают усилия для привязки их функциональности к семантике POSIX (например, определение строки, как показано в wc).

Тем не менее, не все оболочки будут автоматически привязываться к POSIX. Bash, например, не выполняет по умолчанию поведение POSIX. Существует переключатель, чтобы включить его: POSIXLY_CORRECT.

Пища для размышлений о значении EOL, которое <newline> : http://www.rfc-editor.org/EOLstory.txt

Оставаясь на инструментальной дорожке, для всех практических целей и целей, рассмотрим это:

Позвольте работать с файлом, который не имеет EOL. На момент написания файла в этом примере показан миниатюрный JavaScript без EOL.

curl http://cdnjs.cloudflare.com/ajax/libs/AniJS/0.5.0/anijs-min.js -o x.js
curl http://cdnjs.cloudflare.com/ajax/libs/AniJS/0.5.0/anijs-min.js -o y.js

$ cat x.js y.js > z.js

-rw-r--r--  1 milanadamovsky   7905 Aug 14 23:17 x.js
-rw-r--r--  1 milanadamovsky   7905 Aug 14 23:17 y.js
-rw-r--r--  1 milanadamovsky  15810 Aug 14 23:18 z.js

Обратите внимание, что размер файла cat - это точно сумма его отдельных частей. Если конкатенация файлов JavaScript является проблемой для JS файлов, более подходящей задачей было бы запустить каждый файл JavaScript с точкой с запятой.

Как кто-то еще упомянул в этом потоке: что, если вы хотите cat два файла, выход которых становится только одной строкой вместо двух? Другими словами, cat выполняет то, что он должен делать.

man of cat только упоминает ввод чтения до EOF, а не <newline> . Обратите внимание, что переключатель -n cat также распечатает строку с завершающей линией (или неполной линией) в качестве строки - это то, что счетчик начинается с 1 (согласно man.)

-n Число строк вывода, начиная с 1.

Теперь, когда мы понимаем, как POSIX определяет строку, это поведение становится неоднозначным или действительно несовместимым.

Понимание заданного целевого инструмента и его соответствия поможет определить, насколько важно для конечных файлов использовать EOL. В C, С++, Java (JAR) и т.д. Некоторые стандарты будут определять новую строку для достоверности - такой стандарт не существует для JS, HTML, CSS.

Например, вместо использования wc -l filename можно было бы сделать awk '{x++}END{ print x}' filename и быть уверенным, что успех задачи не подвержен угрозе с помощью файла, который мы, возможно, захотим обработать, который мы не записали (например, сторонняя библиотека, такая как минимальный JS we curl d) - если только мы не намерены считать строки в соответствии с понятием POSIX.

Заключение

Будет очень мало случаев использования в реальной жизни, когда пропускание EOL в EOF для определенных текстовых файлов, таких как JS, HTML и CSS, будет иметь негативное влияние - если вообще. Если мы полагаемся на присутствие <newline> , мы ограничиваем надежность нашего инструментария только теми файлами, которые мы создаем, и открываем себе потенциальные ошибки, внесенные сторонними файлами.

Мораль истории: инженерная техника, которая не имеет слабости от EOL в EOF.

Не стесняйтесь публиковать примеры использования, поскольку они применяются к JS, HTML и CSS, где мы можем проверить, как пропуск EOL оказывает неблагоприятное воздействие.

Milan Adamovsky 15 авг. 2014, в 07:24

3

Ссылка на rfc-editor должна быть rfc-editor.org/old/EOLstory.txt
gcali 31 март 2016, в 09:39
0

POSIX не помечен в вопросе ... Что насчет окончаний строк в MVS / OS? или окончания строк MS-DOS? Между прочим, все известные системы posix допускают текстовые файлы без окончательного окончания строки (не найдено ни одного случая для системы подачи заявок, соответствующей posix, в которой «текстовый файл» имеет специальную обработку в ядре для вставки правильной новой строки в случае, если она не имеет Это)
Luis Colorado 22 нояб. 2017, в 09:09
0

Я исправил ссылку на EOLstory.txt, но так как я только добавил / старый, это не позволило мне сохранить его.
user34660 24 март 2018, в 04:51

Показать ещё 1 комментарий

59

Это может быть связано с разница между:

текстовый файл (каждая строка должна заканчиваться в конце строки)
(нет истинных "строк", о которых нужно говорить, и длина файла должна быть сохранена)

Если каждая строка заканчивается в конце строки, это позволяет избежать, например, того, что объединение двух текстовых файлов сделает последнюю строку первого запуска в первой строке второй.

Кроме того, редактор может проверить при загрузке, заканчивается ли файл в конце строки, сохраняет его в своей локальной опции "eol" и использует это при записи файла.

Несколько лет назад (2005) многие редакторы (ZDE, Eclipse, Scite,...) "забыли", что окончательный EOL, который не был очень ценится.
Не только это, но они неправильно интерпретировали этот окончательный EOL, так как "начали новую строку" и фактически начали отображать другую строку, как если бы она уже существовала.
Это было прекрасно видно с помощью "правильного" текстового файла с хорошо подобранным текстовым редактором, например, vim, по сравнению с открытием его в одном из вышеупомянутых редакторов. Он отобразил дополнительную строку под реальной последней строкой файла. Вы видите что-то вроде этого:

1 first line
2 middle line
3 last line
4

VonC 08 апр. 2009, в 13:35

9

+1. Я нашел этот ТАК вопрос, испытывая эту самую проблему. Eclipse очень раздражает, когда показывает эту «фальшивую» последнюю строку, и если я удаляю ее, то жалуется git (и все другие инструменты Unix, ожидающие EOL). Также обратите внимание, что это происходит не только в 2005 году: в Eclipse 4.2 Juno эта проблема все еще существует.
MestreLion 28 авг. 2013, в 08:57
0

@MestreLion, продолжение на stackoverflow.com/questions/729692/…
Pacerier 03 июль 2015, в 14:34

40

Некоторые инструменты ожидают этого. Например, wc ожидает следующее:

$ echo -n "Line not ending in a new line" | wc -l
0
$ echo "Line ending with a new line" | wc -l
1

Flimm 12 окт. 2011, в 14:20

18

Я бы не сказал «некоторые», я говорю, что большинство инструментов ожидают, что для текстовых файлов, если не все. cat, git, diff, wc, grep, sed ... список огромный
MestreLion 28 авг. 2013, в 09:02
0

Может быть, можно сказать, что wc этого не ожидает , поскольку он просто работает в POSIX-определении «line», в отличие от интуитивного понимания «line» большинством людей.
Guildenstern 10 май 2016, в 11:08
0

@Guildenstern Интуитивное определение будет для wc -l для печати 1 в обоих случаях, но некоторые люди могут сказать, что второй случай должен печатать 2 .
Flimm 10 май 2016, в 14:22
0

@Flimm Если вы думаете о \n как об окончании строки, а не как о разделителе строк, как это делает POSIX / UNIX, то ожидать, что второй случай выведет 2, просто безумие.
semicolon 05 апр. 2017, в 03:17

Показать ещё 2 комментария

18

В основном существует много программ, которые не будут обрабатывать файлы правильно, если они не получат окончательный EOL EOF.

GCC предупреждает вас об этом, поскольку он ожидается как часть стандарта C. (см. раздел 5.1.1.2)

"Нет новой строки в конце файла" предупреждение компилятора

cgp 08 апр. 2009, в 13:14

5

GCC не способен обработать файл, он должен выдавать предупреждение как часть стандарта C.
Bill the Lizard 08 апр. 2009, в 12:27
0

Хороший вопрос, обновил с соответствующим разделом)
cgp 08 апр. 2009, в 12:31
0

IIRC, MSVC 2005 жаловался на файлы C, которые заканчивались неполными строками и, возможно, отказывались компилировать их.
Mark K Cowan 16 сен. 2016, в 09:41

Показать ещё 1 комментарий

12

Это происходит с самых первых дней использования простых терминалов. Новая строка char использовалась для запуска "сброса" переданных данных.

Сегодня новая строка char больше не требуется. Конечно, во многих приложениях все еще есть проблемы, если новая строка не существует, но я считаю, что ошибка в этих приложениях.

Если у вас есть формат текстового файла, где требуется новая строка, вы получите простую проверку данных очень дешево: если файл заканчивается строкой, в которой нет новой строки в конце, вы знаете, файл сломан. Имея только один дополнительный байт для каждой строки, вы можете обнаруживать разбитые файлы с высокой точностью и почти без процессорного времени.

Stefan 08 апр. 2009, в 13:18

12

в настоящее время новая строка в EOF для текстовых файлов может не требоваться, но это полезное соглашение, которое заставляет большинство инструментов Unix работать вместе с согласованными результатами. Это совсем не ошибка.
MestreLion 28 авг. 2013, в 09:08
10

Многие из нас вообще не используют инструменты Unix, и нам все равно.
DaveWalley 05 авг. 2014, в 16:59
10

Это не просто инструменты Unix, любой инструмент будет работать лучше и / или будет проще кодироваться, если он может принимать разумные форматы файлов.
Sam Watkins 04 дек. 2014, в 02:25
1

@ Сэм Уоткинс Согласитесь, хорошо иметь простые четко определенные форматы . Тем не менее, код все еще нуждается в достоверности и не предполагает, что данные соответствуют формату.
chux 20 июнь 2015, в 14:54
5

@MestreLion Это бесполезное наследие из набора плохих инструментов, соответствующих глупым стандартам. Эти артефакты экстремистского программирования (т. Е. Все файлы! Все должно быть простым текстом!) Не умерли вскоре после их изобретения, потому что они были единственными доступными инструментами подобного рода в определенный момент истории. C был заменен C ++, он не является частью POSIX, он не требует EOL в EOF, и его использование (очевидно) не поощряется * nix luddists.
polkovnikov.ph 05 дек. 2016, в 13:25
4

@ polkovnikov.ph "C был заменен на C ++"
minexew 06 янв. 2017, в 17:13
0

@ polkovnikov.ph На самом деле, форматы данных и становятся все более и более текстовыми с годами. XML / HTML, JSON, YAML, а также протоколы, такие как HTTP, RPC, SOAP, REST. Это не унаследовано, и твердое соглашение о том, как инструменты должны обрабатывать строки, не является ни бесполезным, ни глупым.
MestreLion 06 фев. 2017, в 16:38
1

Программирование @MestreLion становится все менее научным. Все больше и больше необразованных людей начинают называть себя программистами. Крупные компании, как правило, создают больше технических долгов в отрасли, чтобы убить малый бизнес. Вот как эти протоколы были созданы. Наличие твердого соглашения «никого не волнует» не является ни бесполезным, ни глупым. Имея соглашение «мы должны заканчивать каждый файл невидимым символом».
polkovnikov.ph 06 фев. 2017, в 18:25

Показать ещё 6 комментариев

11

Отдельный прецедент: когда ваш текстовый файл контролируется версией (в данном случае специально под git, хотя это относится и к другим). Если содержимое добавлено в конец файла, тогда строка, которая была ранее последней строкой, будет отредактирована, чтобы включить символ новой строки. Это означает, что blame файл, чтобы узнать, когда эта строка была отредактирована последним, покажет добавление текста, а не фиксацию до того, что вы действительно хотели увидеть.

Robin Whittleton 05 сен. 2016, в 14:31

10

В дополнение к приведенным выше практическим соображениям меня не удивило бы, если бы создатели Unix (Thompson, Ritchie и др.) или их предшественники Multics поняли, что существует теоретическая причина использовать ограничители строк, а не разделители строк: С терминаторами строк вы можете кодировать все возможные файлы строк. С разделителями строк нет никакой разницы между файлом нулевых строк и файлом, содержащим одну пустую строку; оба они закодированы как файл, содержащий нулевые символы.

Итак, причины таковы:

Потому что это определяет POSIX.
Потому что некоторые инструменты ожидают этого или "плохо себя ведут" без него. Например, wc -l не будет считать окончательную "строку", если она не заканчивается новой строкой.
Потому что это просто и удобно. В Unix cat работает, и он работает без осложнений. Он просто копирует байты каждого файла, без необходимости интерпретации. Я не думаю, что эквивалент DOS для cat. Использование copy a+b c приведет к объединению последней строки файла a с первой строкой файла b.
Поскольку файл (или поток) нулевых строк можно отличить от файла одной пустой строки.

John Wiersba 25 сен. 2015, в 13:33

10

Также существует проблема с программированием с файлами, в которых нет новых строк: встроенный read Bash (я не знаю о других реализациях read) работает не так, как ожидалось:

printf $'foo\nbar' | while read line
do
    echo $line
done

Отпечатывается только foo! Причина в том, что когда read встречается с последней строкой, он записывает содержимое в $line, но возвращает код выхода 1, поскольку он достиг EOF. Это нарушает цикл while, поэтому мы никогда не достигаем части echo $line. Если вы хотите справиться с этой ситуацией, вы должны сделать следующее:

while read line || [ -n "${line-}" ]
do
    echo $line
done < <(printf $'foo\nbar')

То есть, echo, если read не удалось из-за непустой строки в конце файла. Естественно, в этом случае на выходе будет еще одна новая строка, которая не была на входе.

l0b0 04 нояб. 2011, в 11:59

9

Предположительно просто, чтобы какой-то код синтаксического анализа ожидал, что он будет там.

Я не уверен, что считаю это "правилом", и это, безусловно, не то, что я придерживаюсь религиозно. Наиболее разумный код будет знать, как разбор текста (включая кодировки) по очереди (любой выбор окончаний строк), с или без новой строки в последней строке.

В самом деле, если вы закончите с новой строкой: существует ли (теоретически) пустая конечная строка между EOL и EOF? Один, чтобы обдумать...

Marc Gravell 08 апр. 2009, в 13:29

11

Это не правило, это соглашение: строка - это то, что заканчивается концом строки . Так что нет, между EOL и EOF нет «пустой финальной линии».
MestreLion 28 авг. 2013, в 09:11
3

@MestreLion: Но рассматриваемый символ не называется «конец строки», он называется «перевод строки» и / или «перевод строки». Разделитель строк, а не разделитель строк. И результат - окончательная пустая строка.
Ben Voigt 20 июнь 2015, в 16:46
2

Ни один (нормальный) инструмент не будет считать последний EOL (CR, LF и т. Д.) Файла как дополнительную пустую строку. И все инструменты POSIX не будут считать последние символы файла как строку, если нет конечного EOL. Вне зависимости от названия символа EOL является «линия подачей» или «возврат каретки» (нет никакого символа имени «новой строка»), для всех практических курсовых разумных средств лечения как признак конца строки, а не в качестве разделителя строк.
MestreLion 30 июнь 2015, в 06:50
2

@MestreLion, вы уверены, что "терминатор строки" вменяемый? Возьмите несколько непрограммистов и сделайте быстрый опрос. Вы быстро поймете, что концепция линий ближе к понятию «разделители строк». Понятие «ограничитель строки» просто странно .
Pacerier 03 июль 2015, в 14:36
0

@MestreLion, если никакой «нормальный» инструмент не посчитает последний EOL как создатель новой пустой строки, как пользователь перейдет к следующей строке, чтобы добавить к ней контент? Я думаю, по вашему мнению, всегда есть дополнительный EOL, даже в полностью "пустом" файле?
Dave Cousineau 09 окт. 2015, в 17:59
4

@Sahuagin: Это не мое мнение, это то, как стандарт POSIX определяет линию. Пустой файл с 0 байт имеет 0 строк, следовательно , нет EOL, и файл будет рассматриваться как имеющий только одну пустую строку, она действительно требует EOL. Также обратите внимание, что это уместно, только если вы хотите посчитать строки в файле, так как очевидно, что любой редактор позволит вам «перейти» на следующую (или первую) строку независимо от того, есть ли там EOL.
MestreLion 13 окт. 2015, в 12:03
0

@MestreLion, поэтому пользователь может перейти к несуществующей строке, и в файле могут быть данные, для которых не существует строки. Я понимаю, что это стандарт, но вы подразумевали, что не делать что-либо таким образом было "безумно". на самом деле, кажется, что многие ситуации становятся недопустимыми, что с такой же легкостью могло бы быть допустимым, позволяя приложениям, которые обрабатывают файлы, вести себя плохо, если им выдан ненужный «недействительный» текстовый файл.
Dave Cousineau 14 окт. 2015, в 16:17
0

@Sahuagin: возможно, «нормальный» был резким словом, но моя точка зрения такова: если существует соглашение, формально определенное стандартом, нет никаких причин не принимать его. И, используя принцип надежности «будь консервативен в том, что ты отправляешь, будь либерален в том, что ты принимаешь» , инструменты, обрабатывающие текст (парсеры, компиляторы, фильтры), должны иметь возможность обрабатывать оба случая, когда это возможно, но текстовые редакторы должны пытаться создать файлы с завершающим EOL для каждой строки, включая последнюю.
MestreLion 15 окт. 2015, в 09:07

Показать ещё 6 комментариев

7

Почему текстовые файлы заканчиваются символом новой строки?

Также выражается многими, потому что:

Многие программы не ведут себя хорошо, или без них.
Даже в программах, которые хорошо обрабатывают файл, нет конца '\n', функциональность инструмента может не соответствовать ожиданиям пользователей, что может быть неясно в этом случае.
Программы редко запрещают окончательный '\n' (я ничего не знаю).

Но это вызывает следующий вопрос:

Что должен делать код с текстовыми файлами без новой строки?

Самое главное - Не писать код, предполагающий, что текстовый файл заканчивается новой строкой. Предполагая, что файл соответствует формату, он приводит к повреждению данных, хакерским атакам и сбоям. Пример:
```
// Bad code
while (fgets(buf, sizeof buf, instream)) {
  // What happens if there is no \n, buf[] is truncated leading to who knows what
  buf[strlen(buf) - 1] = '\0';  // attempt to rid trailing \n
  ...
}
```
Если требуется конечный трейлинг '\n', предупредите пользователя об его отсутствии и предпринятом действии. IOW, проверьте формат файла. Примечание. Это может включать ограничение на максимальную длину строки, кодировку символов и т.д.
Четко определить документ, обработать код отсутствующего окончательного '\n'.
Невозможно создать файл, в котором отсутствует окончание '\n'.

chux 20 июнь 2015, в 15:39

6

Я сам это задавался годами. Но сегодня я столкнулся с серьезной причиной.

Представьте файл с записью на каждой строке (например: файл CSV). И что компьютер записывал записи в конце файла. Но он внезапно упал. Джи была последней строкой? (не хорошая ситуация)

Но если мы всегда завершаем последнюю строку, тогда мы бы знали (просто проверьте, завершена ли последняя строка). В противном случае нам, вероятно, придется каждый раз отбрасывать последнюю строку, чтобы быть в безопасности.

symbiont 05 март 2016, в 21:55

3

Здесь очень поздно, но я столкнулся с одной ошибкой в обработке файлов, которая произошла из-за того, что файлы не заканчивались пустым переводом строки. Мы обрабатывали текстовые файлы с помощью sed и sed опускал последнюю строку в выводе, что приводило к неправильной структуре json и отправляло остальную часть процесса в состояние сбоя.

Все, что мы делали, было:

Есть один пример файла: foo.txt с некоторым содержанием json внутри.

[{
    someProp: value
},
{
    someProp: value
}] <-- No newline here

Файл был создан на машине вдов, и оконные скрипты обрабатывали этот файл с помощью команд powershall. Все хорошо.

[{
    someProp: value
},
{
    someProp: value

и бум, он отказал остальным процессам из-за недопустимого JSON.

Поэтому всегда полезно заканчивать свой файл пустой новой строкой.

Arpit 23 нояб. 2018, в 08:28

3

У меня всегда было впечатление, что правило исходило из тех дней, когда синтаксический анализ файла без окончания новой строки был затруднен. То есть, вы закончите писать код, где конец строки был задан символом EOL или EOF. Просто было проще предположить, что линия закончилась EOL.

Однако я верю, что правило выведено из компиляторов C, требующих новую строку. И как указано в "Нет новой строки в конце файла" , предупреждение компилятора, #include не добавит новую строку.

he_the_great 01 июль 2009, в 18:08

0

Представьте, что файл обрабатывается, пока файл все еще создается другим процессом.

Это может быть связано с этим? Флаг, который указывает, что файл готов к обработке.

Pippen_001 08 апр. 2009, в 13:10

-3

Мне лично нравятся новые строки в конце файлов исходного кода.

Возможно, это связано с Linux или всеми UNIX-системами. Я помню там ошибки компиляции (gcc, если я не ошибаюсь), потому что файлы исходного кода не заканчивались пустой пустой строкой. Почему это было сделано так, что вам интересно.

User 08 апр. 2009, в 13:06

-8

ИМХО, это вопрос личного стиля и мнения.

В старые времена я не ставил эту новую строку. Сохраненный символ означает большую скорость через этот 14.4K модем.

Позже я поместил эту новую строку, чтобы было легче выбрать финальную строку с помощью shift + downarrow.

Torben Gundtofte-Bruun 08 апр. 2009, в 13:20

4

Я серьезно лох на последней линии, ха-ха
Spets 29 фев. 2016, в 07:51

Ещё вопросы

просто придурок. это не «новая строка» в конце файла. Это «разрыв строки» в конце последней строки. Также, посмотрите лучший ответ на связанный вопрос: stackoverflow.com/questions/16222530/…
Просто чтобы придираться еще, он на самом деле не написал «новую строку», он написал «новую строку», что правильно.
не знакомо, но мне интересно, потому что число случаев, когда этот лишний перевод строки ломает вещи, слишком велико для меня
Я не слышал эту пословицу до сегодняшнего дня. Я знал, что POSIX требует этого, потому что многие старые инструменты предполагают это, но я обычно живу в мире без POSIX, где большинство инструментов не заботятся.
В настоящее время я использую потоки Node.js для построчного анализа текстовых данных, и отсутствие терминального разрыва строки раздражает, так как я должен добавить дополнительную логику, когда закончится входная сторона потока / закрыто, чтобы гарантировать, что последняя строка будет обработана.
Unix рассматривает свое общее поведение в конце файлов следующим образом: \ n символы не начинают строки; вместо этого они заканчивают их. Таким образом, \ n является разделителем строки, а не разделителем строки. Первая строка (как и все строки) не нуждается в \ n для ее запуска. Последняя строка (как и все строки) нуждается в \ n для ее завершения. \ N в конце файла не создает дополнительную строку. Однако иногда текстовые редакторы добавляют туда видимую пустую строку. Даже Emacs делает это, по желанию .
@sindrenm Я полагаю, что вся эта путаница словесная. Чтобы избежать этого, разработчики языка C и Unix вместо этого могли бы назвать символ перевода строки ASCII EOL или endOfLine. Следуя этой идее, \l будет ее естественным сокращением ( \l не используется в C). Однако, очевидно, эта строчная буква L не сильно отличается от цифры «1» (к сожалению). И \1 используется в регулярных выражениях.
@MarkDBlackwell Ну да. Но почему ты поднимаешь это сейчас? :П
@sindrenm Я поднимаю это, чтобы помочь людям. Если бы люди помнили «символ конца строки» в качестве его имени, они бы не задавались вопросом, почему в последней строке файла он есть. Поскольку разработчики ухватились за следующую лучшую вещь (назвав ее «символ новой строки» - что является небольшим неправильным обозначением), естественно, они задаются вопросом, почему он не выполняет свою очевидную функцию, и создают новую строку там.
@MarkDBlackwell Я абсолютно согласен с вами, что название довольно ужасное в отношении того, для чего оно на самом деле существует.
@MarkDBlackwell Конечно, вы могли бы сказать, что это тоже спорная семантика. Конечно, '\n' в C - это перевод строки. Но опять же в ascii(7) он имеет: 012 10 0A LF '\n' (new line) . Так это перевод строки, перевод строки или что-то еще? Ну, это зависит от того, кого вы спрашиваете. Я знаю, что вы говорите, хотя: если main() заканчивается на: printf("\nTest\n"); тогда строка под «Test» будет приглашением оболочки. Это тонко, но все же стоит упомянуть в моей голове. (Конечно, putchar('\n'); просто покажет пустую строку над приглашением.)
пожалуйста, напишите хорошие программы, которые либо позволяют вставлять эту новую строку, где это необходимо при обработке, либо способны правильно обрабатывать «пропущенные» ... которые, по сути, не отсутствуют
@BilltheLizard, Какие есть примеры «У некоторых программ возникают проблемы с обработкой последней строки файла, если он не завершен переводом строки» ?
@Pacerier wc -l не будет считать последнюю строку файла, если он не завершен новой строкой. Кроме того, cat объединит последнюю строку файла с первой строкой следующего файла в одну, если последняя строка первого файла не завершена новой строкой. Практически любая программа, которая ищет переводы строк в качестве разделителя, может испортить это.
@BilltheLizard, я имею в виду wc уже упоминалось ....
@Pacerier Я не вижу твоей точки зрения.
@BilltheLizard, мой плохой, чтобы уточнить: каковы некоторые примеры программ, у которых есть проблемы с обработкой последней строки файла, если он не завершен новой строкой (кроме тех, которые уже были упомянуты в потоке как массовые, такие как cat и wc ) ?
Visual Studio Resource Compiler (rc) дросселирует, если последняя строка не заканчивается символом конца строки.
@BilltheLizard: Итак, эта программа вызывает UB при компиляции в виде кода C ++ 98 и C ++ 03. Смотрите программу: ideone.com/jswwf9
Стандарт C ++ 14 говорит что-то немного другое: «Исходный файл, который не является пустым и не заканчивается символом новой строки ... должен обрабатываться так, как если бы к файлу был добавлен дополнительный символ новой строки » [выделение добавлено]. Это кажется излишним, так как фаза 1 перевода требует вставки «символов новой строки для индикаторов конца строки» [lex.phases].
Я думаю, что вопрос не связан с gcc .... Стандарт C говорит о правильном окончании файлов, но с точки зрения исходного кода. Компилятору разрешено размещать символы исходного кода для работы с файлами, у которых нет конца последней строки. Цель форсирования конца строки в последней строке файла (логическая) предназначена для анализа (можно добавить два токена, если между ними нет разделителя)
Ссылка на rfc-editor должна быть rfc-editor.org/old/EOLstory.txt
POSIX не помечен в вопросе ... Что насчет окончаний строк в MVS / OS? или окончания строк MS-DOS? Между прочим, все известные системы posix допускают текстовые файлы без окончательного окончания строки (не найдено ни одного случая для системы подачи заявок, соответствующей posix, в которой «текстовый файл» имеет специальную обработку в ядре для вставки правильной новой строки в случае, если она не имеет Это)
Я исправил ссылку на EOLstory.txt, но так как я только добавил / старый, это не позволило мне сохранить его.
+1. Я нашел этот ТАК вопрос, испытывая эту самую проблему. Eclipse очень раздражает, когда показывает эту «фальшивую» последнюю строку, и если я удаляю ее, то жалуется git (и все другие инструменты Unix, ожидающие EOL). Также обратите внимание, что это происходит не только в 2005 году: в Eclipse 4.2 Juno эта проблема все еще существует.
@MestreLion, продолжение на stackoverflow.com/questions/729692/…
Я бы не сказал «некоторые», я говорю, что большинство инструментов ожидают, что для текстовых файлов, если не все. cat, git, diff, wc, grep, sed ... список огромный
Может быть, можно сказать, что wc этого не ожидает , поскольку он просто работает в POSIX-определении «line», в отличие от интуитивного понимания «line» большинством людей.
@Guildenstern Интуитивное определение будет для wc -l для печати 1 в обоих случаях, но некоторые люди могут сказать, что второй случай должен печатать 2 .
@Flimm Если вы думаете о \n как об окончании строки, а не как о разделителе строк, как это делает POSIX / UNIX, то ожидать, что второй случай выведет 2, просто безумие.
GCC не способен обработать файл, он должен выдавать предупреждение как часть стандарта C.
Хороший вопрос, обновил с соответствующим разделом)
IIRC, MSVC 2005 жаловался на файлы C, которые заканчивались неполными строками и, возможно, отказывались компилировать их.
в настоящее время новая строка в EOF для текстовых файлов может не требоваться, но это полезное соглашение, которое заставляет большинство инструментов Unix работать вместе с согласованными результатами. Это совсем не ошибка.
Многие из нас вообще не используют инструменты Unix, и нам все равно.
Это не просто инструменты Unix, любой инструмент будет работать лучше и / или будет проще кодироваться, если он может принимать разумные форматы файлов.
@ Сэм Уоткинс Согласитесь, хорошо иметь простые четко определенные форматы . Тем не менее, код все еще нуждается в достоверности и не предполагает, что данные соответствуют формату.
@MestreLion Это бесполезное наследие из набора плохих инструментов, соответствующих глупым стандартам. Эти артефакты экстремистского программирования (т. Е. Все файлы! Все должно быть простым текстом!) Не умерли вскоре после их изобретения, потому что они были единственными доступными инструментами подобного рода в определенный момент истории. C был заменен C ++, он не является частью POSIX, он не требует EOL в EOF, и его использование (очевидно) не поощряется * nix luddists.
@ polkovnikov.ph На самом деле, форматы данных и становятся все более и более текстовыми с годами. XML / HTML, JSON, YAML, а также протоколы, такие как HTTP, RPC, SOAP, REST. Это не унаследовано, и твердое соглашение о том, как инструменты должны обрабатывать строки, не является ни бесполезным, ни глупым.
Программирование @MestreLion становится все менее научным. Все больше и больше необразованных людей начинают называть себя программистами. Крупные компании, как правило, создают больше технических долгов в отрасли, чтобы убить малый бизнес. Вот как эти протоколы были созданы. Наличие твердого соглашения «никого не волнует» не является ни бесполезным, ни глупым. Имея соглашение «мы должны заканчивать каждый файл невидимым символом».
Это не правило, это соглашение: строка - это то, что заканчивается концом строки . Так что нет, между EOL и EOF нет «пустой финальной линии».
@MestreLion: Но рассматриваемый символ не называется «конец строки», он называется «перевод строки» и / или «перевод строки». Разделитель строк, а не разделитель строк. И результат - окончательная пустая строка.
Ни один (нормальный) инструмент не будет считать последний EOL (CR, LF и т. Д.) Файла как дополнительную пустую строку. И все инструменты POSIX не будут считать последние символы файла как строку, если нет конечного EOL. Вне зависимости от названия символа EOL является «линия подачей» или «возврат каретки» (нет никакого символа имени «новой строка»), для всех практических курсовых разумных средств лечения как признак конца строки, а не в качестве разделителя строк.
@MestreLion, вы уверены, что "терминатор строки" вменяемый? Возьмите несколько непрограммистов и сделайте быстрый опрос. Вы быстро поймете, что концепция линий ближе к понятию «разделители строк». Понятие «ограничитель строки» просто странно .
@MestreLion, если никакой «нормальный» инструмент не посчитает последний EOL как создатель новой пустой строки, как пользователь перейдет к следующей строке, чтобы добавить к ней контент? Я думаю, по вашему мнению, всегда есть дополнительный EOL, даже в полностью "пустом" файле?
@Sahuagin: Это не мое мнение, это то, как стандарт POSIX определяет линию. Пустой файл с 0 байт имеет 0 строк, следовательно , нет EOL, и файл будет рассматриваться как имеющий только одну пустую строку, она действительно требует EOL. Также обратите внимание, что это уместно, только если вы хотите посчитать строки в файле, так как очевидно, что любой редактор позволит вам «перейти» на следующую (или первую) строку независимо от того, есть ли там EOL.
@MestreLion, поэтому пользователь может перейти к несуществующей строке, и в файле могут быть данные, для которых не существует строки. Я понимаю, что это стандарт, но вы подразумевали, что не делать что-либо таким образом было "безумно". на самом деле, кажется, что многие ситуации становятся недопустимыми, что с такой же легкостью могло бы быть допустимым, позволяя приложениям, которые обрабатывают файлы, вести себя плохо, если им выдан ненужный «недействительный» текстовый файл.
@Sahuagin: возможно, «нормальный» был резким словом, но моя точка зрения такова: если существует соглашение, формально определенное стандартом, нет никаких причин не принимать его. И, используя принцип надежности «будь консервативен в том, что ты отправляешь, будь либерален в том, что ты принимаешь» , инструменты, обрабатывающие текст (парсеры, компиляторы, фильтры), должны иметь возможность обрабатывать оба случая, когда это возможно, но текстовые редакторы должны пытаться создать файлы с завершающим EOL для каждой строки, включая последнюю.
Я серьезно лох на последней линии, ха-ха

Konrad Rudolph · Accepted Answer · 2009-04-08T14-35-00.000Z

Потому что так стандарт POSIX определяет строку:

3.206 Линия

Последовательность из нуля или более non- символов <newline> плюс завершающий символ <newline>.

Следовательно, строки, не заканчивающиеся символом новой строки, не считаются фактическими. Вот почему у некоторых программ возникают проблемы с обработкой последней строки файла, если он не завершен новой строкой.

При работе с эмулятором терминала есть по крайней мере одно серьезное преимущество для этого руководства: все инструменты Unix ожидают этого соглашения и работают с ним. Например, при объединении файлов с помощью cat файл, оканчивающийся символом новой строки, будет иметь другой эффект, чем файл без:

$ more a.txt
foo
$ more b.txt
bar$ more c.txt
baz
$ cat {a,b,c}.txt
foo
barbaz

И, как показывает предыдущий пример, при отображении файла в командной строке (например, через more) файл с завершающей строкой приводит к правильному отображению. Неправильно завершенный файл может быть искажен (вторая строка).

Для согласованности очень полезно следовать этому правилу - в противном случае потребуется дополнительная работа при работе со стандартными инструментами Unix.

Подумайте об этом по-другому: если строки не заканчиваются символом новой строки, сделать такие команды, как cat полезными, гораздо сложнее: как сделать команду для объединения файлов таким образом, чтобы

каждый файл начинается с новой строки, что вам нужно в 95% случаев; но
это позволяет объединить последнюю и первую строку двух файлов, как в примере выше между b.txt и c.txt?

Конечно, это решаемо, но вам нужно сделать использование cat более сложным (добавив позиционные аргументы командной строки, например, cat a.txt --no-newline b.txt c.txt), а теперь команду, а не каждого отдельного человека. Файл управляет тем, как он вставляется вместе с другими файлами. Это почти наверняка не удобно.

... Или вам нужно ввести специальный символ стража, чтобы отметить строку, которая должна быть продолжена, а не завершена. Что ж, теперь вы застряли в той же ситуации, что и в POSIX, за исключением перевернутого (продолжение строки, а не символ завершения строки).

_{Теперь, в не POSIX-совместимых системах (в настоящее время это в основном Windows), смысл состоит в том, что файлы обычно не заканчиваются символом новой строки, и (неофициальное) определение строки может, например, быть "текстом, разделенным символами новой строки" (примечание Акцент).}_{Это полностью верно.}_{Однако для структурированных данных (например, программного кода) это делает синтаксический анализ минимально более сложным: обычно это означает, что анализаторы должны быть переписаны.}_{Если синтаксический анализатор изначально был написан с учетом определения POSIX, то может быть проще изменить поток токенов, чем синтаксический анализатор - другими словами, добавить токен "искусственного перевода строки" в конец ввода.}

Хотя в настоящее время исправление довольно непрактично, ясно, что POSIX допустил ошибку при определении линии - в качестве доказательства по количеству вопросов, касающихся этой проблемы. Строка должна быть определена как ноль или более символов, оканчивающихся на <eol>, <eof> или <eol> <eof>. Сложность парсера не является действительной проблемой. Сложность, где это возможно, должна быть перенесена из головы программистов в библиотеку.
@DougCoburn В этом ответе шла исчерпывающая техническая дискуссия, объясняющая, почему это не так и почему POSIX поступил правильно. К сожалению, эти комментарии были, по-видимому, недавно удалены чрезмерно усердным модератором. Вкратце, речь идет не о разборе сложности; скорее, из-за вашего определения гораздо сложнее создавать такие инструменты, как cat , которые будут полезны и последовательны.
Достаточно справедливо - жаль, что они были удалены. Мне было бы интересно узнать причину, почему это все еще считается "правильным".
@KonradRudolph Я ничего не вижу в истории редактирования. Разве это не должно быть в истории редактирования? Или это было до того, как появилась история? Это было еще в 09 ...
@adjenks Не в ответе, а в комментариях.
О, я вижу, "Этот комментарий редактировался 3 раза." ... Но вы не можете просматривать историю.
@adjenks Ранее было около 20 комментариев под этим ответом, обсуждающих это. Они были удалены, а не отредактированы. В любом случае, я только что отредактировал ответ, чтобы добавить объяснение того, почему определение новой строки POSIX является более практичным, и как альтернативное определение должно выглядеть одинаково удобным (предложенное Дагом недостаточно).
Решение проблемы конкатенации состоит в том, чтобы не обрабатывать файлы, как если бы они все были в одной кодировке. Если мы говорим о файлах исходного кода, почти никогда не имеет смысла объединять их так, чтобы последняя строка первого файла и первая строка второго файла были объединены в одну строку. Контекст имеет значение. Попытка собрать все так, чтобы оно соответствовало вашему 5% -ному сценарию использования, почти наверняка плохой вызов. Unix и linux никогда не уклонялись от флагов командной строки, зачем отказываться от использования -r (для raw) или чего-то с cat ? Я думаю, что POSIX действительно допустил ошибку здесь
Программное обеспечение должно обрабатывать крайние случаи должным образом, вместо того, чтобы предписывать людям соблюдать такие глупые правила (есть так много глупостей, которые тратят впустую жизнь).
@Leon Правило POSIX - все о сокращении числа крайних случаев. И это так красиво. На самом деле я немного растерялся, потому что люди не понимают этого: это самое простое, самосогласованное определение линии.
@BT Я думаю, вы предполагаете, что причиной этого решения является мой пример более удобного рабочего процесса. Это не так, это просто следствие. Причина в том, что правило POSIX - это простейшее правило, которое упрощает обработку строк в парсере. Единственная причина, по которой мы ведем дискуссию, заключается в том, что Windows делает это по-другому, и, как следствие, существует множество инструментов, которые не работают с файлами POSIX. Если бы все делали POSIX, не было бы никаких проблем. Тем не менее, люди жалуются на POSIX, а не на Windows.
@KonradRudolph Если файл заканчивается, конечно, последняя строка заканчивается. ИМО это все ожидания. Файл закончен, но вы ожидаете продолжения строки - это странно. В любом случае, я не могу изменить поведение sed , wc и т. Д.
@Leon Вам не нужно изменять поведение любого из этих инструментов, они уже ведут себя корректно и согласованно при использовании с любым файлом, созданным такими инструментами, или иным образом следуя рекомендациям POSIX. Как бы вы даже создали текстовый файл, который не делает? Это уже не тривиально в системах GNU / BSD / POSIX.
Дело не в окнах, не строй соломенного человечка. Буквально никто кроме вас не говорит об окнах здесь. Я согласен с тем, что принудительное завершение каждого файла новой строкой упрощает разбор строк (незначительно). Я также согласен с тем, что выполнение этого упрощает объединение файлов, которые могут представлять куски, не разбитые на строки (незначительно). С чем я не согласен, так это то, что сделать синтаксический анализ немного проще, стоит заставлять почти всех добавлять в конце своего файла обычно ненужные символы новой строки. Также нет оправдания для написания программ, которые опускаются для файла без завершающей строки.
@BT Я имею в виду только Windows, чтобы указать на случаи, когда правила POSIX не имеют смысла (другими словами, я бросил вам кость). Я более чем счастлив никогда больше не упоминать об этом в этой дискуссии. Но тогда ваше утверждение имеет еще меньший смысл: на платформах POSIX просто не имеет смысла обсуждать текстовые файлы с различными соглашениями об окончании строк, потому что нет причин создавать их. В чем преимущество? Там буквально нет. - В общем, я действительно не понимаю ненависти, которую вызывает этот ответ (или правило POSIX). Честно говоря, это совершенно иррационально.