Подтвердить что ты не робот

Как wget может сохранять только типы файлов, связанных со страницами, связанными с целевой страницей?

Как wget может сохранять только определенные типы файлов, связанные со страницами, связанными с целевой страницей, независимо от домена, в котором находятся определенные файлы?

Попытка ускорить задачу, которую я должен делать часто.

Я пропитывал документы wget и googling, но ничего не работает. Я продолжаю получать только целевую страницу или подстраницы без файлов (даже используя -H), поэтому я, очевидно, плохо делаю это.

Итак, по существу, example.com/index1/содержит ссылки на example.com/subpage1/и example.com/subpage2/, в то время как подстраницы содержат ссылки на example2.com/file.ext и example2.com/file2. ext и т.д. Однако example.com/index1.html может ссылаться на example.com/index2/, у которого есть ссылки на другие подстраницы, которые я не хочу.

Может ли даже сделать это, а если нет, то что вы предлагаете использовать? Спасибо.

4b9b3361

Ответ 1

Следующая команда работала для меня.

wget -r --accept "*.ext" --level 2 "example.com/index1/"

Нужно делать рекурсивно, поэтому -r следует добавить.

Ответ 2

Что-то вроде этого должно работать:

wget --accept "*.ext" --level 2 "example.com/index1/"