Python3 показывает символы Unicode, загруженные из Mysql

Question

Python3 показывает символы Unicode, загруженные из Mysql

0

У меня есть строки (английские слова + иностранное слово + emojis), хранящиеся в БД Mysql.

Данные загружаются

charset = 'latin1'

Затем я предварительно обрабатываю данные с помощью

str = str.encode('latin-1').decode('utf-8')

После этого все выглядит хорошо, за исключением символов Unicode, которые выглядят как \u '******'

Буду признателен за любую помощь.

com 21 май 2018, в 01:22

Источник

0

Можете ли вы привести пример того, как выглядит такая строка и как она должна выглядеть? И, пожалуйста, уточните, как вы «смотрите» на вывод ( print в терминал, запись в файл или что-то еще).
lenz 21 май 2018, в 05:25
0

Примечание: выполнение .encode('latin-1').decode('utf-8') - это не то, что вам нужно делать в обычном режиме, но это типичный .encode('latin-1').decode('utf-8') для восстановления после ошибочного кодирования с предыдущего шага.
lenz 21 май 2018, в 05:27
0

@lenz, я вывожу строки в веб-форму, и они выглядят следующим образом: «98 \ ud83d \ udc2f \ ud83d \ udc95Puipui Chan»
com 21 май 2018, в 23:17
0

Итак, это происходит внутри серверного скрипта, верно? Это CGI или WSGI (или что-то еще)? Можете ли вы обновить сообщение с помощью некоторого кода, который показывает все операции, которые происходят с данными (выборка, де / кодирование, запись)?
lenz 22 май 2018, в 05:37

Показать ещё 2 комментария

Теги:

mysql

unicode

utf-8

python-3.6

1 ответ

Ещё вопросы

Можете ли вы привести пример того, как выглядит такая строка и как она должна выглядеть? И, пожалуйста, уточните, как вы «смотрите» на вывод ( print в терминал, запись в файл или что-то еще).
Примечание: выполнение .encode('latin-1').decode('utf-8') - это не то, что вам нужно делать в обычном режиме, но это типичный .encode('latin-1').decode('utf-8') для восстановления после ошибочного кодирования с предыдущего шага.
@lenz, я вывожу строки в веб-форму, и они выглядят следующим образом: «98 \ ud83d \ udc2f \ ud83d \ udc95Puipui Chan»
Итак, это происходит внутри серверного скрипта, верно? Это CGI или WSGI (или что-то еще)? Можете ли вы обновить сообщение с помощью некоторого кода, который показывает все операции, которые происходят с данными (выборка, де / кодирование, запись)?

Rick James · Answer 1 · 2018-05-22T18-57-00.000Z

Не используйте кодировку/декодирование, это только добавляет к вашим бедам.

Ваше описание не ясное на пути, предпринятом для Эмодзи. Правильно ли они были закодированы в UTF-8, но затем искажены, когда они хранятся в столбце latin1 в таблице?

Или это было что-то еще?

См. "Лучшая практика" в проблеме с символами UTF-8; я не вижу того, что я хранил

Если ошибочно храниться в столбце latin1, см. "CHARACTER SET latin1", но в нем есть utf8 байт, оставьте байты в одиночку при исправлении кодировки "в http://mysql.rjweb.org/doc.php/charcoll#fixes_for_various_cases