У меня есть программа на C с бесчисленными исходными файлами, и я запускаю Doxygen, создавая HTML. Затем я хочу сгенерировать некоторый код на основе того, что я нашел в HTML.
Я создал сценарий с Mojo :: Dom. Я могу извлечь большую часть информации, которую хочу получить из файла, но я не вижу хорошего способа следить за ссылками для загрузки дополнительных HTML файлов, которые меня интересуют. В коде вроде этого:
<p>
<p>
<h3><a class="anchor" name="index_v">- v -</a></h3><ul>
<li>VarName1
: <a class="el" href="source1_8c.html#f8724fb54bfdf8ce9871043027ba1032">source1.c</a>
<li>VarName2
: <a class="el" href="source1_8c.html#6d7c65255b62c7394c75bee4895e465c">source1.c</a>
...
Что такое простой, чистый способ загрузить source1_8c.html? Более конкретно, части, на которые ссылаются hrefs?
Я пытаюсь избежать использования регулярного выражения perl, так как я ожидаю найти более высокий уровень поддержки того, что я хочу. Но я буду, если понадобится.
Благодарю!
Если href указывает на локальный файл, используйте Mojo::Util::slurp
для чтения в файле, а затем создайте объект Mojo::DOM
.