У меня есть база данных MYSQL. Текст в настоящее время хранится в charset latin1
, сопоставление latin1_swedish_ci
. Это значения по умолчанию, и это не было проблемой в тот день, когда база данных была изначально создана.
Я хочу перейти на UTF8, чтобы текстовая кодировка в базе данных соответствовала текстовой кодировке, используемой в другом месте на веб-сайте, который использует базу данных.
Мой вопрос в том, какие проблемы я получу при преобразовании данных и что я должен искать, когда я это делаю. Большинство нашего текста вписывается в простой acsii, но, вероятно, есть случайные символы с акцентом...
Я думаю, было бы также разумно просить совета относительно наилучшего способа изменения данных.
Если вы переходите с ASCII на UTF-8, я ожидаю, что помимо некоторых акцентированных символов вы будете в порядке. Возвращение назад - это проблема, по моему опыту.
Будьте внимательны, если вы переместите данные в другую таблицу. Если кодирование таблицы будет, например, latin1, и вы случайно поставили там сырой UTF8, это будет боль, чтобы перекодировать его в правильное кодирование (если у вас нет исходных данных).