Есть ли в Ruby HTML-парсер, который читает HTML-документ в DOM-дерево и представляет HTML-теги как элементы DOM?
Я знаю Nokogiri, но он не анализирует HTML в дереве DOM.
Несмотря на ваше замечание, Нокогири - это путь:
doc = Nokogiri::HTML('<body><p>Hello, worlds!</body>')
Он анализирует даже недействительный HTML и возвращает дерево DOM:
>> doc.class
=> Nokogiri::HTML::Document
>> doc.root.class
=> Nokogiri::XML::Element
>> doc.root.children.class
=> Nokogiri::XML::NodeSet
>> doc.root.children.first.content
=> "Hello, worlds!"