Python CJKLIB: нет тонов пиньинь

1

Я работаю с CJKLIB, используя getReadingForCharacter, для перевода китайских символов в пиньинь. Однако есть ли способ

readings = cjk.getReadingForCharacter(c, 'Pinyin')

Проблема в том, что он возвращает пиньинь с тонами на них, чего я не хочу. Например, я хочу "Пекин", а не "Běijīng" - со всеми тонами.

Кто-нибудь знает, как я могу получить результат без тонов? Благодарю!

  • 0
    Одним из вариантов будет удаление диакритических знаков, поскольку их количество ограничено.
  • 0
    Как можно "раздеть" диакритику? Просто глобальный поиск / замена после того, как я закончу?
Теги:
cjk

2 ответа

2

Решение просто:

>>> cjk.getReadingForCharacter(u'北', 'Pinyin', toneMarkType='none')
[u'bei']

Вы можете узнать больше о возможных вариантах здесь: http://cjklib.org/0.3/library/cjklib.reading.operator.PinyinOperator.html#cjklib.reading.operator.PinyinOperator

0

Возможно, использование более простой библиотеки подходит вашей задаче лучше и быстрее, cjklib не предоставляет API для преобразования китайского языка в пиньинь без тона.

такой python lib выглядит следующим образом:

Ещё вопросы

Сообщество Overcoder
Наверх
Меню