Почему iostream :: eof внутри условия цикла считается неправильным?

Question

Почему iostream :: eof внутри условия цикла считается неправильным?

498

Я только что нашел комментарий в этом, отвечая тем, что использование iostream::eof в условиях цикла является "почти наверняка неправильным". Обычно я использую что-то вроде while(cin>>n), которое, как я предполагаю, неявно проверяет EOF, почему проверка того, что eof явно использует iostream::eof неправильно?

Как это отличается от использования scanf("...",...)!=EOF в C (который я часто использую без проблем)?

MAK 09 апр. 2011, в 12:37

Источник

15

scanf(...) != EOF также не будет работать в C, потому что scanf возвращает количество полей, успешно проанализированных и назначенных. Правильное условие: scanf(...) < n где n - количество полей в строке формата.
Ben Voigt 05 апр. 2012, в 16:50
5

@Ben Voigt, он вернет отрицательное число (которое EOF обычно определяется как таковое) в случае достижения EOF
Sebastian 23 нояб. 2012, в 23:44
16

@SebastianGodelet: На самом деле, он вернет EOF если конец файла встречается до первого преобразования поля (успешно или нет). Если между полями достигнут конец файла, он вернет количество полей, успешно преобразованных и сохраненных. Что делает сравнение с EOF неправильным.
Ben Voigt 24 нояб. 2012, в 15:06
1

@SebastianGodelet: Нет, не совсем. Он ошибается, когда говорит, что «после цикла нет (простого) способа отличить правильный вход от неправильного». На самом деле это так же просто, как проверка .eof() после выхода из цикла.
Ben Voigt 24 нояб. 2012, в 16:52
2

@Ben Да, для этого случая (читая простое int). Но можно легко придумать сценарий, в котором цикл while(fail) заканчивается как фактическим отказом, так и eof. Подумайте, требуется ли вам 3 дюйма за итерацию (скажем, вы читаете точку xyz или что-то в этом роде), но в потоке ошибочно только два целых числа.
sly 24 нояб. 2012, в 19:47
0

Эта проблема аналогична и имеет тот же ответ, что и вопрос C: почему while(!feof(file)) всегда неверен? , Потому что флаг устанавливается только после нажатия EOF.
legends2k 21 март 2014, в 09:25
0

Вот часто задаваемые вопросы C ++ по тому же вопросу.
legends2k 21 март 2014, в 09:33
0

@sly: сценарий "3-ints" неправильно обрабатывается с помощью while (in >> x) { if (in >> y >> z) use(x, y, z); else FATAL("got an int not followed by 2 more!"); } if (!eof()) FATAL("didn't get integer where expected"); ? Если нет, то для какого потокового контента это не сработает?
Tony Delroy 07 нояб. 2014, в 10:36

Показать ещё 6 комментариев

Теги:

c++

iostream

c++-faq

4 ответа

84

Верх нижней части: При правильной обработке белого пространства, как eof можно использовать (и даже быть более надежным, чем fail() для проверки ошибок):

while( !(in>>std::ws).eof() ) {  
   int data;
   in >> data;
   if ( in.fail() ) /* handle with break or throw */; 
   // now use data
}

(Спасибо Tony D за предложение выделить ответ. См. его комментарий ниже для примера, почему это более надежное.)

Основной аргумент против использования eof(), похоже, не содержит важной тонкости в отношении роли белого пространства. Мое предложение состоит в том, что проверка eof() явно не только не всегда "всегда ошибочна", что, по-видимому, является основным мнением в этом и подобном потоке SO, но при правильном обращении с белым пространством он обеспечивает чище и более надежная обработка ошибок, и это всегда правильное решение (хотя и не обязательно tersest).

Подводя итог тому, что предлагается, поскольку "правильное" окончание и порядок чтения следующие:

int data;
while(in >> data) {  /* ... */ }

// which is equivalent to 
while( !(in >> data).fail() )  {  /* ... */ }

Ошибка, вызванная попыткой чтения за пределами eof, принимается за условие завершения. Это означает, что нет простого способа отличить успешный поток и тот, который действительно терпит неудачу по другим причинам, кроме eof. Возьмите следующие потоки:

1 2 3 4 5<eof>
1 2 a 3 4 5<eof>
a<eof>

while(in>>data) завершается с набором failbit для всех трех входных данных. В первом и третьем также устанавливается eofbit. Таким образом, за циклом нужна очень уродливая дополнительная логика, чтобы отличить правильный вход (1-й) от неправильных (2-й и 3-й).

Принимая во внимание следующее:

while( !in.eof() ) 
{  
   int data;
   in >> data;
   if ( in.fail() ) /* handle with break or throw */; 
   // now use data
}

Здесь in.fail() проверяет, что до тех пор, пока есть что прочитать, он правильный. Цель - не просто терминатор цикла.

До сих пор так хорошо, но что происходит, если в потоке есть конечное пространство - что звучит как основная проблема с eof() как терминатором?

Нам не нужно сдавать свою обработку ошибок; просто съешь белое пространство:

while( !in.eof() ) 
{  
   int data;
   in >> data >> ws; // eat whitespace with std::ws
   if ( in.fail() ) /* handle with break or throw */; 
   // now use data
}

std::ws пропускает любое потенциальное (ноль или более) конечное пространство в потоке при установке eofbit и не failbit. Таким образом, in.fail() работает так, как ожидалось, пока есть хотя бы одна информация для чтения. Если все пустые потоки также приемлемы, то правильная форма:

while( !(in>>ws).eof() ) 
{  
   int data;
   in >> data; 
   if ( in.fail() ) /* handle with break or throw */; 
   /* this will never fire if the eof is reached cleanly */
   // now use data
}

Сводка: Правильно построенный while(!eof) не только возможен, но и ошибочен, но позволяет локализовать данные в пределах области действия и обеспечивает более чистое разделение проверки ошибок от бизнеса, как обычно. При этом while(!fail) является, несомненно, более распространенной и краткой идиомой, и может быть предпочтительнее в простых (одиночных данных для типа чтения).

sly 23 нояб. 2012, в 23:45

6

« Таким образом, после цикла нет (простого) способа отличить правильный ввод от неправильного. » За исключением того, что в одном случае установлены и eofbit и failbit , в другом - только failbit . Вам нужно проверить это только один раз после завершения цикла, а не на каждой итерации; он выйдет из цикла только один раз, поэтому вам нужно только проверить, почему он вышел из цикла один раз. while (in >> data) отлично работает для всех пустых потоков.
Jonathan Wakely 25 фев. 2013, в 14:09
3

То, что вы говорите (и высказанное ранее замечание), состоит в том, что плохо отформатированный поток может быть идентифицирован как !eof & fail past loop. Есть случаи, в которых нельзя на это положиться. Смотрите выше комментарий ( goo.gl/9mXYX ). В любом случае, я не предлагаю eof -check как всегда лучшую альтернативу. Я просто говорю, что это возможно , и (в некоторых случаях более подходящим) способ сделать это, а не «безусловно , не так!» как это обычно утверждается здесь, в SO.
sly 25 фев. 2013, в 15:58
1

«В качестве примера рассмотрим, как вы будете проверять наличие ошибок, когда данные представляют собой структуру с перегруженным оператором >> считывание нескольких полей одновременно» - гораздо более простой случай, подтверждающий вашу точку, - это stream >> my_int где поток содержит, например, «- ": eofbit и failbit установлены. Это хуже, чем сценарий operator>> , где предоставленная пользователем перегрузка, по крайней мере, имеет возможность очистить eofbit перед возвратом, чтобы помочь в поддержке while (s >> x) . В более общем смысле, в этом ответе может использоваться очистка - только последний while( !(in>>ws).eof() ) как правило, устойчив и в конце while( !(in>>ws).eof() ) .
Tony Delroy 25 фев. 2015, в 06:09
1

.. в самом деле. Благодарю. Я обновил ответ.
sly 26 фев. 2015, в 14:49

Показать ещё 2 комментария

57

Потому что, если программисты не пишут while(stream >> n), они, возможно, напишут это:

while(!stream.eof())
{
    stream >> n;
    //some work on n;
}

Здесь проблема заключается в том, что вы не можете выполнить some work on n, не проверив, действительно ли чтение потока было успешным, потому что если оно не увенчалось успехом, ваш some work on n приведет к нежелательному результату.

Все дело в том, что eofbit, badbit или failbit устанавливаются после попытки чтения из потока. Так что если stream >> n не удается, тогда eofbit, badbit или failbit устанавливается немедленно, поэтому его более идиоматично, если вы пишете while (stream >> n), потому что возвращенный объект stream преобразуется в false, если был некоторый сбой при чтении из потока и, следовательно цикл останавливается. И он преобразуется в true, если чтение было успешным, и цикл продолжается.

Nawaz 09 апр. 2011, в 13:58

1

Помимо упомянутого «нежелательного результата» при выполнении работы с неопределенным значением n , программа может также попасть в бесконечный цикл , если сбойная операция потока не потребляет никакого ввода.
mastov 27 апр. 2018, в 13:33

-3

1 while (!read.fail()) {
2     cout << ch;
3     read.get(ch);
4 }

Если вы используете строку 2 в 3 и строку 3 в 2, вы дважды печатаете ch. Итак, cout перед чтением.

Mohammed Younus 10 март 2017, в 19:39

4

Каково значение ch на первой итерации?
Lightness Races in Orbit 10 июль 2017, в 11:50

Ещё вопросы

scanf(...) != EOF также не будет работать в C, потому что scanf возвращает количество полей, успешно проанализированных и назначенных. Правильное условие: scanf(...) < n где n - количество полей в строке формата.
@Ben Voigt, он вернет отрицательное число (которое EOF обычно определяется как таковое) в случае достижения EOF
@SebastianGodelet: На самом деле, он вернет EOF если конец файла встречается до первого преобразования поля (успешно или нет). Если между полями достигнут конец файла, он вернет количество полей, успешно преобразованных и сохраненных. Что делает сравнение с EOF неправильным.
@SebastianGodelet: Нет, не совсем. Он ошибается, когда говорит, что «после цикла нет (простого) способа отличить правильный вход от неправильного». На самом деле это так же просто, как проверка .eof() после выхода из цикла.
@Ben Да, для этого случая (читая простое int). Но можно легко придумать сценарий, в котором цикл while(fail) заканчивается как фактическим отказом, так и eof. Подумайте, требуется ли вам 3 дюйма за итерацию (скажем, вы читаете точку xyz или что-то в этом роде), но в потоке ошибочно только два целых числа.
Эта проблема аналогична и имеет тот же ответ, что и вопрос C: почему while(!feof(file)) всегда неверен? , Потому что флаг устанавливается только после нажатия EOF.
Вот часто задаваемые вопросы C ++ по тому же вопросу.
@sly: сценарий "3-ints" неправильно обрабатывается с помощью while (in >> x) { if (in >> y >> z) use(x, y, z); else FATAL("got an int not followed by 2 more!"); } if (!eof()) FATAL("didn't get integer where expected"); ? Если нет, то для какого потокового контента это не сработает?
« Таким образом, после цикла нет (простого) способа отличить правильный ввод от неправильного. » За исключением того, что в одном случае установлены и eofbit и failbit , в другом - только failbit . Вам нужно проверить это только один раз после завершения цикла, а не на каждой итерации; он выйдет из цикла только один раз, поэтому вам нужно только проверить, почему он вышел из цикла один раз. while (in >> data) отлично работает для всех пустых потоков.
То, что вы говорите (и высказанное ранее замечание), состоит в том, что плохо отформатированный поток может быть идентифицирован как !eof & fail past loop. Есть случаи, в которых нельзя на это положиться. Смотрите выше комментарий ( goo.gl/9mXYX ). В любом случае, я не предлагаю eof -check как всегда лучшую альтернативу. Я просто говорю, что это возможно , и (в некоторых случаях более подходящим) способ сделать это, а не «безусловно , не так!» как это обычно утверждается здесь, в SO.
«В качестве примера рассмотрим, как вы будете проверять наличие ошибок, когда данные представляют собой структуру с перегруженным оператором >> считывание нескольких полей одновременно» - гораздо более простой случай, подтверждающий вашу точку, - это stream >> my_int где поток содержит, например, «- ": eofbit и failbit установлены. Это хуже, чем сценарий operator>> , где предоставленная пользователем перегрузка, по крайней мере, имеет возможность очистить eofbit перед возвратом, чтобы помочь в поддержке while (s >> x) . В более общем смысле, в этом ответе может использоваться очистка - только последний while( !(in>>ws).eof() ) как правило, устойчив и в конце while( !(in>>ws).eof() ) .
.. в самом деле. Благодарю. Я обновил ответ.
Помимо упомянутого «нежелательного результата» при выполнении работы с неопределенным значением n , программа может также попасть в бесконечный цикл , если сбойная операция потока не потребляет никакого ввода.
Каково значение ch на первой итерации?

Xeo · Accepted Answer · 2011-04-09T14-13-00.000Z

448

Лучший ответ

Потому что iostream::eof возвращает только true после прочтения конца потока. Он не указывает, что следующее чтение будет концом потока.

Рассмотрим это (и предположим, что следующее чтение будет в конце потока):

while(!inStream.eof()){
  int data;
  // yay, not end of stream yet, now read ...
  inStream >> data;
  // oh crap, now we read the end and *only* now the eof bit will be set (as well as the fail bit)
  // do stuff with (now uninitialized) data
}

Против этого:

int data;
while(inStream >> data){
  // when we land here, we can be sure that the read was successful.
  // if it wasn't, the returned stream from operator>> would be converted to false
  // and the loop wouldn't even be entered
  // do stuff with correctly initialized data (hopefully)
}

И на ваш второй вопрос: Потому что

if(scanf("...",...)!=EOF)

совпадает с

if(!(inStream >> data).eof())

и не, как

if(!inStream.eof())
    inFile >> data

Xeo 09 апр. 2011, в 14:13

11

Стоит отметить, что if (! (InStream >> data) .eof ()) тоже ничего полезного не делает. Ошибка 1: Не будет введено условие, если после последнего фрагмента данных не было пробелов (последний элемент данных не будет обработан). Ошибка 2: Он войдет в условие, даже если чтение данных не удалось, до тех пор, пока EOF не был достигнут (бесконечный цикл, обработка одних и тех же старых данных снова и снова).
Tronic 20 янв. 2013, в 16:20
0

Немного не по теме, но позвольте мне это выразить. Если кто-то использует ленивую оценку, будет ли этот подход успешным без проблем?
Dilawar 25 фев. 2013, в 03:58
3

Я думаю, что стоит отметить, что этот ответ немного вводит в заблуждение. При извлечении int с или std::string S или подобное, то бит EOF устанавливается , когда вы извлекаете один прямо до конца и добыча попадает в конец. Вам не нужно читать снова. Причина, по которой он не устанавливается при чтении из файлов, заключается в том, что в конце есть дополнительный \n . Я рассказал об этом в другом ответе . Чтение char - это другое дело, потому что оно извлекает только по одному за раз и не доходит до конца.
Joseph Mansfield 06 апр. 2013, в 16:59
69

Основная проблема в том, что если мы не достигли EOF, это не означает, что следующее чтение будет успешным .
Joseph Mansfield 06 апр. 2013, в 17:03
1

@sftrabbit: все верно, но не очень полезно ... даже если конечного пробела нет, \ \ 'разумно, чтобы другие конечные пробелы обрабатывались согласованно с другими пробелами в файле (то есть пропускались). Кроме того, тонкое последствие «когда вы извлекаете тот, что раньше» - это while (!eof()) что while (!eof()) не будет «работать» с int s или std::string s, когда вход полностью пустой, так что даже зная, что есть нет необходимости в конце \n .
Tony Delroy 23 апр. 2013, в 03:34
2

@TonyD Полностью согласен. Причина, по которой я это говорю, заключается в том, что я думаю, что большинство людей, когда они читают это и подобные ответы, подумают, что если поток содержит "Hello" (без завершающего пробела или \n ) и извлечена std::string , он извлечет буквы от H до o прекращают извлекаться, а затем не устанавливают бит EOF. Фактически, он установит бит EOF, потому что это был EOF, который остановил извлечение. Просто в надежде прояснить это для людей.
Joseph Mansfield 23 апр. 2013, в 08:23
1

Этот ответ должен быть вики, а не день, когда кто-то не публикует этот антипаттерн.
user657267 27 июль 2014, в 12:27
1

Также стоит упомянуть. Если на входе есть недопустимые данные, чтение может привести к тому, что поток перейдет в плохое состояние. Это предотвратит дальнейшее чтение (если явно не очищено). Тест while(!inStream.eof()) перейдет в бесконечный цикл (поскольку данные не читаются и никогда не достигают eof).
Martin York 13 май 2015, в 20:26
1

// do stuff with (now uninitialized) data Это больше не относится к C ++ 11, см. stackoverflow.com/a/13379073/3002139
Baum mit Augen♦ 21 авг. 2016, в 18:20

Показать ещё 7 комментариев