HTML парсер в DOM в Ruby

3

Есть ли в Ruby HTML-парсер, который читает HTML-документ в DOM-дерево и представляет HTML-теги как элементы DOM?

Я знаю Nokogiri, но он не анализирует HTML в дереве DOM.

  • 4
    По умолчанию Nokogiri выглядит для меня как дерево DOM, почему вы говорите, что это не так?
Теги:
dom
html-parsing
nokogiri

1 ответ

6
Лучший ответ

Несмотря на ваше замечание, Нокогири - это путь:

doc = Nokogiri::HTML('<body><p>Hello, worlds!</body>')

Он анализирует даже недействительный HTML и возвращает дерево DOM:

>> doc.class
=> Nokogiri::HTML::Document
>> doc.root.class
=> Nokogiri::XML::Element
>> doc.root.children.class
=> Nokogiri::XML::NodeSet
>> doc.root.children.first.content
=> "Hello, worlds!"
  • 0
    Я буду смотреть больше на это. Спасибо.
  • 0
    @qlinux, пожалуйста! Если вы столкнетесь с большим количеством вопросов, просто разместите их на SO и пометьте их nokogiri, я следую за этим тегом. Нокогири - это мощная и веселая жемчужина!
Показать ещё 1 комментарий

Ещё вопросы

Сообщество Overcoder
Наверх
Меню