wget (или curl) все содержимое ветки форума?

URL-адрес ветки форума, к которой я пытаюсь получить доступ, находится в форме

http://domain.com/showthread.php?threadid=3333333&userid=0&perpage=40&pagenumber=1

я пробовал

wget --user-agent = Mozilla / 5.0 -k -m -E -p -np -R http: //domain/showthread.php? noseen = 0 & threadid = 3333333 & pagenumber = 1

и мне не повезло.

2 ответа

Почему бы не просто в цикле:

for pageno in {1..1000000}; do
    wget ... http://domain/showthread.php?noseen=0&threadid=3333333&pagenumber=$pageno || break
done

или, возможно, цикл while лучше, если написать немного дольше:

i=1
while true; do
    wget ... http://domain/showthread.php?noseen=0&threadid=3333333&pagenumber=$pageno
    if test $? -ne 0; then
        break
    fi
    i=$((i+1))
done

Возможно, стоит проверить, поддерживает ли форум RSS-каналы разделов / тем. Это спасло бы вас от беспокойства.

Другие вопросы по тегам