Может ли PhantomJS использовать альтернативу BeautifulSoup?
Я пытаюсь искать в Etsy и посещать все ссылки в срок. В Python я знаю, как это сделать (с BeautifulSoup), но сегодня я хочу посмотреть, могу ли я сделать то же самое с PhantomJS. Я не очень далеко.
Этот script должен искать "hello kitty" на Etsy и возвращать все продукты
<a class="listing-thumb" href=...></a>
и распечатать их в консоли. В идеале я бы посетил их позже и получил нужную мне информацию. Сейчас он просто замерзает. Любые идеи?
var page = require('webpage').create();
var url = 'http://www.etsy.com/search?q=hello%20kitty';
page.open(url, function(status){
// list all the a.href links in the hello kitty etsy page
var link = page.evaluate(function() {
return document.querySelectorAll('a.listing-thumb');
});
for(var i = 0; i < link.length; i++){ console.log(link[i].href); }
phantom.exit();
});
Я играл с использованием CasperJS, который может быть лучше разработан для этого.