Javascript конвертировать Var в UTF8 строку

Question

Javascript конвертировать Var в UTF8 строку

1

Я столкнулся с странной ситуацией, из-за которой я просто не могу понять, откуда я. У меня есть строка, содержащая символы UTF8 (экранированные). Я пробовал decodeURIComponent (escape (str)) вместе с кучей других предложенных исправлений, пока не получив успеха.

Я написал эту функцию, чтобы взять строку, найти экранированные символы и заменить их на прямой UTF8.

var unescapeUTF8 = function(str) {
    var matches = str.match(/\\u.{4}/g);
    if (matches == null) return str;
    for (var item of matches)
    {
        // testing
        console.log(new String(item));
    }
    ....
    ....
    ....
};

Из тестирования я знаю, что если я new String("\u0123") я вернусь к строковому объекту String {0: "ģ", length: 1, [[PrimitiveValue]]: "ģ"}

Кажется, что независимо от того, что я делаю с строкой в вышеприведенной функции, я не могу заставить ее конвертировать из нее \u0123 в ģ

Мне удалось "создать" проблему в моем браузере, открыв инструменты разработчика и выполнив следующие

var x = "\\u0123";
console.log(x); // == "\u0123"
new String(x); // == String {0: "\", 1: "u", 2: "1", 3: "3", 4: "2", 5: "4", length: 6, [[PrimitiveValue]]: "\u1324"}

Может ли кто-нибудь понять, как преобразовать "х" в символ UTF8, пожалуйста...

TolMera 25 окт. 2017, в 17:27

Источник

0

и new String((new String("\\u0123")).toString()) не работает, кажется, что-то удерживает этот префикс \ где-то.
TolMera 25 окт. 2017, в 14:32
0

Как мне декодировать строку с помощью экранированного юникода? ?
Alex K. 25 окт. 2017, в 14:34
1

new String("\u0123") является ложным следом, поскольку строка уже является этим символом. new String("\u0123") == "\u0123" является true .
Alex K. 25 окт. 2017, в 14:35
0

\u.... это не "кодированный символ UTF-8", это escape-последовательность Unicode. Вы не можете сказать, закодирована ли строка в UTF-8 или что-то еще, просто взглянув на нее; однако вы можете сказать, что символы в строке представляют некоторый escape-формат.
deceze♦ 25 окт. 2017, в 14:41
0

перечитайте вопрос new String("\\u0123") == ģ false НО new String("\u0123") == 'ģ' true . НО снова ... var x = "\\u0123"; new String(x) == '\u0123' false
TolMera 25 окт. 2017, в 14:42

Показать ещё 3 комментария

Теги:

javascript

ecmascript-6

string

utf-8

1 ответ

Ещё вопросы

и new String((new String("\\u0123")).toString()) не работает, кажется, что-то удерживает этот префикс \ где-то.
Как мне декодировать строку с помощью экранированного юникода? ?
new String("\u0123") является ложным следом, поскольку строка уже является этим символом. new String("\u0123") == "\u0123" является true .
\u.... это не "кодированный символ UTF-8", это escape-последовательность Unicode. Вы не можете сказать, закодирована ли строка в UTF-8 или что-то еще, просто взглянув на нее; однако вы можете сказать, что символы в строке представляют некоторый escape-формат.
перечитайте вопрос new String("\\u0123") == ģ false НО new String("\u0123") == 'ģ' true . НО снова ... var x = "\\u0123"; new String(x) == '\u0123' false

deceze · Accepted Answer · 2017-10-25T12-40-00.000Z

Поскольку эти escape-последовательности являются, поначалу, красными действительными escape-последовательностями JSON, самым простым методом является синтаксический анализ строки как строки JSON:

var x = "\\u0123";
console.log(JSON.parse('"' + x + '"'));

Подчеркивание: этот ответ не имеет ничего общего с UTF-8, что имеет смысл, поскольку кажется, что вопрос не имеет ничего общего с UTF-8 (как отмечено в комментарии к вопросу). Экранированные символы, отформатированные как "\ uABCD", предназначены для кодовых блоков UTF-16, что JavaScript и JSON используют в строках.