Мне нравится библиотека соскабливания Beautiful Soup на Python. Это просто работает. Есть ли близкий эквивалент в Ruby?
Какой ближайший эквивалент Beautiful Soup для Ruby?
Ответ 1
Эта страница Ruby Toolbox содержит диаграмму относительной популярности различных парсеров.
Ответ 2
Nokogiri - еще один парсер HTML/XML. Это быстрее, чем hpricot в соответствии с этими критериями. Nokogiri использует libxml2 и является заменой hpricot. Он также имеет поддержку селектора css3, которая довольно приятна.
Изменить: Там новый тест, сравнивающий nokogiri, libxml-ruby, hpricot и rexml здесь.
Ruby Toolbox имеет категорию для парсеров HTML здесь.
Ответ 3
Там scRUBYt!, Rubyful-soup (больше не поддерживается), WWW:: Механизировать, scrAPI и еще несколько.
Или вы можете просто использовать Hpricot или Nokogiri для разбора.
Ответ 4
Hpricot? Я не знаю, что другие используют...