C ++ мусор в конце файла

Question

C ++ мусор в конце файла

0

У меня проблема, и я не знаю, как ее решить. Проблема заключается в следующем:

char * ary = new Char[];

ifstream fle;
fle.open(1.txt, ios_base::binary);
fle.seekg(fle.end);
long count = fle.tellg();
fle.seek(fle.beg);

вот в чем проблема: Файл 1.txt содержит: Hello world !.

когда я выполняю:

ary = new char(count);
fle.read(ary, count);

ари заполнили вот так: Привет, мир! @T # ^ @$ @FF (мусор)

Файл ничего не содержит в нем ничего, что выше.

Платформа: Win 7, VS 2012

Любая идея, как решить эту проблему. (Раскрыты)

(Проблема 2) Теперь я столкнулся с другой проблемой: fle.read иногда читает больше, чем размер, который я дал. Например, если я прошел как fle.read(buffer, 1000), он заканчивается в некоторых случаях (strlen (buffer) = 1500. Как я могу это решить?

С Уважением,

nothing 08 окт. 2013, в 15:01

Источник

Теги:

c++

7 ответов

5

char [] -strings в C обычно заканчиваются нулем. Они являются одним байтом дольше, чем необходимо, а последний байт установлен в 0x00. Это необходимо, потому что C не имеет возможности рассказать длину массива.

Когда вы читаете двоичные данные из файла, в строку не считывается завершающий нулевой символ. Это означает, что функция типа printf, которая работает с char-массивами неизвестной длины, выведет массив и любые данные, которые происходят после него в памяти, пока не встретит нулевой символ.

Решение: выделите char [] -buffer на один байт дольше, чем длина данных, и установите последний байт в 0 вручную.

Лучшее решение: не используйте char-массивы C-стиля. Сделайте это объектно-ориентированным способом и используйте класс std :: string для представления строк.

Philipp 08 окт. 2013, в 09:47

2

Наилучшая проблема заключается в том, что вы выделяете с помощью new char(count), который выделяет один char, инициализированный count. То, что вы, вероятно, пытались сделать, это new char[count]. Что вам действительно нужно:

std::vector<char> arr( count );
fle.read( &arr[0], count );

Или, может быть, count + 1 в распределении, если вы хотите получить '\0' в буфере.

РЕДАКТИРОВАТЬ:

Поскольку у вас все еще есть проблемы: fle.read никогда не будет читать больше, чем fle.read. Что fle.gcount() после чтения?

Если вы это сделаете:

std::vector<char> arr( count );
fle.read( &arr[0], count );
arr.resize( fle.gcount() );

вы должны иметь вектор с точно количеством char которое вы прочитали. Если вы хотите, чтобы они были строкой, вы можете построить ее из arr.begin(), arr.end() или даже использовать std::string вместо std::vector<char>.

Если вам нужна строка с завершением '\0' (для интерфейса с устаревшим программным обеспечением), тогда просто создайте свой вектор с размером count + 1 вместо count, а &arr[0] будет вашей строкой '\0'.

Не пытайтесь использовать new char[count] здесь. Это очень сложно сделать правильно. (Например, для этого потребуется блок try и catch.)

James Kanze 08 окт. 2013, в 11:23

2

Большинство других ответов пропускают очень важный момент: когда вы делаете ary = new char(count); вы выделяете A SINGLE CHARACTER, инициализированный символом с count кода ASCII. Вы должны написать это: ary = new char[count + 1];

Roman Zavalov 08 окт. 2013, в 09:52

0

Два нита (потому что у вас есть правильный ответ, в отличие от всех остальных): нет ASCII участвует здесь. char - это просто другой тип малого целого числа, и вы инициализируете его интегральным значением count (конечно, преобразованным в char ). И то, что он должен написать, больше похоже на std::vector<char> ary( count + 1); ,
James Kanze 08 окт. 2013, в 13:31
0

@James Почему не участвует ASCII? Когда вы напишите char(32) вы получите пробел внутри, потому что 32 - это код ASCII для пробела, не так ли?
Roman Zavalov 09 окт. 2013, в 08:39
0

То, что вы получите на выходе, зависит от устройства вывода. Как вы интерпретируете это внутренне, зависит от вас; если вы интерпретируете его как символ, а 32 является точкой кода для пробела в используемой вами кодировке (что, вероятно, имеет место, даже если сам ASCII в значительной степени мертв и нигде не используется), тогда вы будете интерпретировать его как пространство. Но, в конце концов, char является целочисленным типом данных, который содержит интегральные значения. И в таком выражении, как new char(count) , нечего сказать, что count следует интерпретировать как кодовую точку, а не как обычное целое значение.
James Kanze 09 окт. 2013, в 13:18

Показать ещё 1 комментарий

1

Мы должны угадать немного здесь, но, скорее всего, это сводится к проблеме с вашей отладкой. Буфер заполнен правильно, но вы неправильно проверяете его содержимое.

Теперь, ary объявлен как char* и я подозреваю, что при попытке проверить содержимое ary вы используете некоторый метод печати, который ожидает массив с нулевым завершением. Но вы не завершаете нулевой массив. И у вас есть переполнение буфера.

Если бы у вас были только напечатанные count, вы бы не переполнили. И вы не могли бы, если бы у вас был нуль-завершенный массив, не забывая выделять дополнительный символ для нулевого терминатора.

Вместо использования сырых массивов и new, было бы гораздо разумнее прочитать буфер в std::string. Вы должны стараться избегать строк с нулевым завершением как можно больше. Вы используете их при взаимодействии с библиотеками, отличными от С++.

David Heffernan 08 окт. 2013, в 10:18

0

Вы читаете символы count для файла, вам нужно выделить один дополнительный символ, чтобы указать ограничитель строки (\0).

ary = new char[count + 1];
ary[count] = '\0';

Laurent LA RIZZA 08 окт. 2013, в 11:10

0

Это все еще только выделяет один char . (Что ему действительно нужно, так это std::vector<char> ary( count + 1 ); )
James Kanze 08 окт. 2013, в 13:20
0

Правильно. Исправленный.
Laurent LA RIZZA 08 окт. 2013, в 14:14

0

Попробуй это

ary = new char[count + 1];
fle.read(ary,count);
ary[count] = '\0';

Конечный нулевой символ отсутствовал - его нет в файле, его нужно добавить потом

Ole Dittmann 08 окт. 2013, в 09:36

Ещё вопросы

Два нита (потому что у вас есть правильный ответ, в отличие от всех остальных): нет ASCII участвует здесь. char - это просто другой тип малого целого числа, и вы инициализируете его интегральным значением count (конечно, преобразованным в char ). И то, что он должен написать, больше похоже на std::vector<char> ary( count + 1); ,
@James Почему не участвует ASCII? Когда вы напишите char(32) вы получите пробел внутри, потому что 32 - это код ASCII для пробела, не так ли?
То, что вы получите на выходе, зависит от устройства вывода. Как вы интерпретируете это внутренне, зависит от вас; если вы интерпретируете его как символ, а 32 является точкой кода для пробела в используемой вами кодировке (что, вероятно, имеет место, даже если сам ASCII в значительной степени мертв и нигде не используется), тогда вы будете интерпретировать его как пространство. Но, в конце концов, char является целочисленным типом данных, который содержит интегральные значения. И в таком выражении, как new char(count) , нечего сказать, что count следует интерпретировать как кодовую точку, а не как обычное целое значение.
Это все еще только выделяет один char . (Что ему действительно нужно, так это std::vector<char> ary( count + 1 ); )

Maxime Chéramy · Accepted Answer · 2013-10-08T10-43-00.000Z

Я думаю, что ваша проблема заключается не в том, что ваш массив содержит мусор, а в том, что вы забыли положить символ нулевого терминатора в конце, а ваш оператор печати не знает, когда остановиться.

Кроме того, вы написали new char(count) вместо new char[count]. В первом случае, вы только экземпляр один char со значением count в то время как во втором случае вы создаете буфер count символов.

Попробуй это:

ary = new char[count+1];
fle.read(ary, count);
ary[count] = '\0';

Спасибо. Это сделало то, что я хочу, вместо того, чтобы увеличивать буфер, я просто сделал ary [count -1] = '\ 0', иначе мне придется изменить размер буфера приемника, если я не ошибаюсь.
Если вы выполните ary[count-1] = '\0' , вы потеряете последний байт.
Да, но я изменил размер чтения на -1, чтобы сохранить этот байт пустым. Теперь я сталкиваюсь с другой проблемой: иногда fle.read читает больше, чем размер, который я дал. Например, если я прошел как fle.read (destination, 1000), он заканчивается в некоторых случаях 1500. Как я могу решить это?
Это не сработает. Он все еще выделяет только один байт.
Да, но ... зачем использовать new char[] , когда std::vector<char> намного лучше. (Посмотрите, что произойдет, если fle.read исключение.)
Было бы лучше упомянуть проблему распределения в ответе. Если это просто исправлено в коде, читатель может легко пропустить этот важный момент.