webBrowser получает только первый атрибут в элементе (когда все классы имеют одинаковые имена)

Question

webBrowser получает только первый атрибут в элементе (когда все классы имеют одинаковые имена)

0

Я сделал html grabber для webbrowser в С#, но я застрял. Веб-страница выглядит следующим образом:

<tbody class="first class"
  <tc class="second class">
    <td class=" ">abcdefg</td>
    <td class=" ">1233456</td>
    <td class=" ">qwertyo</td>
  </tc>

Я использую этот код, чтобы получить содержимое трех классов внутри "второго класса":

HtmlElementCollection theElementCollection = default(HtmlElementCollection);
        theElementCollection = webBrowser1.Document.GetElementsByTagName("tbody");
        foreach (HtmlElement curElement in theElementCollection)
        {                
            curElement.GetElementsByTagName("tc");
            curElement.GetElementsByTagName("td");                

                label1.Text = curElement.GetAttribute("InnerText");
                return;

        }

Проблема в том, что в этом хранилище содержится ВСЕ 3 содержимого в label1, поэтому он выглядит так:

abcdefg123456qwerto

Поскольку все классы имеют одинаковое имя, я не могу захватить только один контент.

Есть ли способ захватить только первый контент внутри элемента, чтобы он выглядел так?

abcdefg

John 14 дек. 2013, в 15:14

Источник

1

Вы пробовали curElement.GetElementsByTagName ("td") [0]? Вы должны выполнить цикл foreach для тега <td>.
Alex Tape 14 дек. 2013, в 14:12
0

Когда я вставляю это, это дает мне ошибку «Только 1», присваивание, вызов, инкремент и т. Д., А когда помещается в цикл foreach, он говорит, что идентификатор ожидается, но я не уверен, какой идентификатор.
John 14 дек. 2013, в 14:22
0

curElement.GetElementsByTagName("tc") вы не используете возвращаемый элемент.
L.B 14 дек. 2013, в 14:33

Показать ещё 1 комментарий

Теги:

c#

html

1 ответ

Ещё вопросы

Вы пробовали curElement.GetElementsByTagName ("td") [0]? Вы должны выполнить цикл foreach для тега <td>.
Когда я вставляю это, это дает мне ошибку «Только 1», присваивание, вызов, инкремент и т. Д., А когда помещается в цикл foreach, он говорит, что идентификатор ожидается, но я не уверен, какой идентификатор.
curElement.GetElementsByTagName("tc") вы не используете возвращаемый элемент.

Alex Tape · Accepted Answer · 2013-12-14T12-16-00.000Z

непроверенной

HtmlDocument document = WebBrowser.Document;
if (document != null) {                    
    HtmlElementCollection tableCollection = document.GetElementsByTagName("tbody");
    foreach (HtmlElement table in tableCollection) {
        HtmlElementCollection trColl = table.GetElementsByTagName("tc");
        foreach (HtmlElement row in trColl) {
            tds = row.GetElementsByTagName("td");
            if (tds != null && tds.Count > 1) {

                string neededText = tds[0].InnerText;
                // 1.iteration: neededText == abcdefg
                // 2.iteration: neededText == 123456
                // 3.iteration: neededText == qwertyo

            }
        }
    }
}

он должен работать нормально, но он говорит, что tds не существует в текущем контексте, и когда я объявляю его как int, он ошибается. Каким должен быть тдс?
В основном, tds - это массив, хранящий ваши объекты td. WebBrowser.Document должен быть эквивалентен вашему webBrowser1.Document.
Я взял какой-то ваш код, и все заработало. Благодарю.