Я читаю голландскую веб-страницу:
HttpWebRequest oReq = (HttpWebRequest)WebRequest.Create(website);
oReq.Method = "GET";
HttpWebResponse resp = (HttpWebResponse)oReq.GetResponse();
HtmlDocument doc;
doc.Load(resp.GetResponseStream(), Encoding.GetEncoding("iso-8859-1"));
Когда я получаю текст некоторого случайного элемента внутри страницы, я получаю некоторые странные символы, а не голландские, которые я вижу в Chrome:
HtmlNode node = doc.DocumentNode.SelectSingleNode(xpath);
if(node != null)
{
MessageBox.Show(node.InnerText, "--- just scrapped some xpath ---");
}
Вместо кафе я получаю кафе
Как я могу это решить? Я получаю тот же текст при написании файла в файл, когда я назначаю его richtextbox и т.д. И т.д., Тот же сломанный текст.
Измените кодировку на Unicode, например, utf-8