Я пытаюсь разобрать HTML-дамп любой страницы. Я использовал HTML Parser, а также попытался JSoup для синтаксического анализа.
Я нашел полезные функции в Jsoup, но я получаю ошибку 403 при вызове Document doc = Jsoup.connect(url).get();
Я попробовал HTTPClient, чтобы получить html-дамп, и он был успешным для одного и того же URL-адреса.
Почему JSoup дает 403 для того же URL-адреса, который предоставляет контент из почтового клиента http? Я делаю что-то неправильно? Любые мысли?