Python Unicode% HH-выход

1

Все,

Я работаю над приложением, которое содержит смесь стандартных latin- 1 символов и других языков. Я хотел бы преобразовать все в один и тот же "формат", чтобы переводчик Bing мог его понять. Есть две статьи, на которые я смотрел.

Мой метод довольно прост...

    for w in wiki:
        q = (w[0])
        u = unicode(q, 'utf=8', errors='ignore')
        h = ''
        for c in u:
            h += do something amazing

        doTranslate(h)

Может ли кто-нибудь помочь пролить свет на то, что мне здесь не хватает?

Теги:
unicode

1 ответ

2

urllib может помочь. По крайней мере, этот фрагмент работает:

#! /usr/bin/env python
# -*- coding: utf-8 -*-

import urllib

w = 'ar.wikipedia.org/wiki/حاسوب'
print urllib.quote (w)

Выход

ar.wikipedia.org/wiki/%D8%AD%D8%A7%D8%B3%D9%88%D8%A8

В зависимости от того, какая кодировка ваших входных строк вам может потребоваться, вызовите encode ('utf- 8') перед тем, как передать его в quote()

  • 0
    Большое спасибо! А что если моя строка частично арабская и частично латинская? 'وب (ar)' Как мне обойти это?
  • 0
    Но моя строка ввода наполовину латинская и наполовину арабская.
Показать ещё 1 комментарий

Ещё вопросы

Сообщество Overcoder
Наверх
Меню