Я пытаюсь извлечь встроенный javascript, который уникально отличается на тысячах URL-адресов и вложен в код на разных уровнях.
Как я знакомлюсь с синтаксисом XPATH, я пытаюсь понять, знает ли кто-нибудь хороший способ настроить javascript. Например:
<script type="text/javascript"> ...data_#...</script>
<script type="text/javascript"> ...data_#...</script>
<script type="text/javascript"> ...data_n...</script>
<script type="text/javascript"> ...data_#...</script>
<script type="text/javascript"> ...data_#...</script>
Единственный уникальный идентификатор внутри <script>...data_n...</script>
, который я пытаюсь извлечь, содержит:
var tabsRelated = ...
В пределах XPATH кто-нибудь знает способ найти script, который содержит эту переменную и нацелен на весь script? Сорта вроде:
//script[inner.text contains='var tabsRelated'
Синтаксис неверен
Использование
//script[contains(., $someDistinguishingValue)]
, где $someDistinguishingValue
следует заменить соответствующим значением (например, вышеупомянутое выражение XPath может динамически генерироваться как строка, а затем эта строка оценивается как выражение XPath с использованием доступного API XPath ( такой как метод DOM SelectNodes()
).