Как читать не ASCII файл?

Question

Как читать не ASCII файл?

1

У меня есть txt файл с кириллическими символами. Вот как я читал:

        String csvFile = "C:\\Users\\dolgopolov.a\\Desktop\\Список рассылки 14 07 2014.txt";
        BufferedReader br = null;
        String line = "";
        String cvsSplitBy = "\t";

        try {

            br = new BufferedReader(new FileReader(csvFile));
            while ((line = br.readLine()) != null) {

                // use comma as separator
                String[] country = line.split(cvsSplitBy);

                System.out.println("Номер: " + country[0]
                        + " , Сообщение: " + country[1] + "");

            }

        } catch (FileNotFoundException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        } finally {
            if (br != null) {
                try {
                    br.close();
                } catch (IOException e) {
                    e.printStackTrace();
                }
            }
        }

Но результат прост:

Номер: 9047120386 , Сообщение: ��������� �������! �� ����� ����� ������� ������������� � ������� 2,98   ���., ������� ���������� �������� � ������� 3 ����

Итак, как я могу избежать этого? Нужно ли мне менять тип кодировки или что-то еще?

Tony 30 июль 2014, в 15:52

Источник

0

Да, вы должны установить кодировку UTF-8 и повторить попытку.
duffymo 30 июль 2014, в 13:05
0

Посмотри здесь
Jens 30 июль 2014, в 13:09
0

Не имеет значения, какие символы содержит файл. Вы всегда должны знать, какой набор символов и кодировка используются для их размещения.
Tom Blodget 30 июль 2014, в 17:06

Показать ещё 1 комментарий

Теги:

java

encoding

2 ответа

1

StreamReader sr = новый StreamReader (поток, Encoding.Unicode);

или

string convert = Encoding.BigEndianUnicode.GetString(dataArray); где dataArray - ваш массив байтов

Thakur 30 июль 2014, в 11:41

0

Вопрос помечен Java, а код в вопросе Java.
VGR 30 июль 2014, в 13:54

Ещё вопросы

Да, вы должны установить кодировку UTF-8 и повторить попытку.
Не имеет значения, какие символы содержит файл. Вы всегда должны знать, какой набор символов и кодировка используются для их размещения.
Вопрос помечен Java, а код в вопросе Java.

gtgaxiola · Accepted Answer · 2014-07-30T10-48-00.000Z

FileReader использует кодировку по умолчанию, поэтому вы должны использовать InputStreamReader

new InputStreamReader(new FileInputStream(filePath), encoding)

Я сделал это br = new BufferedReader(new InputStreamReader(new FileInputStream(csvFile), "UTF-8"));
Вероятно, это кодировка ... попробуйте "Cp1251" или "Cp866"