В python я использую win32com для преобразования текстовых документов в HTML:
from win32com import client as wc
import os
word = wc.Dispatch('Word.Application')
doc = word.Documents.Open(wordFullName)
doc.SaveAs(htmlFullName, 10)
Но получающаяся в результате кодировка HTML - gb2312:
<meta http-equiv=Content-Type content="text/html; charset=gb2312" >
Как вы управляете опцией кодирования полученного HTML?