Я не нашел никакой документации или учебника для этого. Есть ли что-нибудь подобное?
doc.xpath('//table/tbody[@id="threadbits_forum_251"]/tr')
В приведенном выше коде будет добавлен любой table
, где есть дочерний элемент tbody
с атрибутом id
, равным "threadbits_forum_251". Но почему это начинается с double //
? Почему в конце есть /tr
? Подробнее см. "Ruby Nokogiri Parsing HTML table II.
Может кто-нибудь сказать мне, как извлечь href
, id
, alt
, src
и т.д., используя Nokogiri?
td[3]/div[1]/a/text()' <--- extracts text
Как я могу извлечь другие вещи?