Как сделать резервную копию блога, запущенного на posterous.com

Я хотел бы сделать резервную копию содержимого моего блога, который работает на posterous.com. Я хотел бы сохранить все тексты и изображения на локальный диск. Возможность просматривать его в автономном режиме является плюсом.

Что я уже пробовал:

Wget

wget -mk http://myblogurl

Он загружает первую страницу со списком сообщений, затем останавливается с "20 redirections exceededсообщение

WinHttpTrack

Он загружает первую страницу с перенаправлением на домашнюю страницу http://posterous.com/ вместо реального содержимого страницы.

Изменить: URL сайта, который я пытаюсь сделать резервную копию, это http://blog.safabyte.net/

3 ответа

Posterous.com поддерживает API, который может вам помочь. В частности, их http://posterous.com/api/reading API может быть полезным. Вы можете использовать его для получения файла XML, содержащего все ваши сообщения и их содержание.

Например, http://posterous.com/api/readposts?hostname=jasonpearce возвращает все 12 сообщений, которые я сделал для Posterous.

Это сработало для меня:

wget -r -l inf -k -E -p -nc http://blog.safabyte.net/

Кажется, с использованием -m включается -N (отметка времени) и posterous не отправляет последние измененные заголовки, которые расстраивают wget, поэтому вместо этого я просто использовал -r -l inf непосредственно.

Используемые параметры:

-r рекурсивный
-l inf бесконечная глубина
-k HTML-файлы с суффиксом.html
-E обновить сохраненные файлы со ссылками на локальные файлы
-p ресурсы страницы загрузки
-nc не перезагружать URL более одного раза

Эта команда по-прежнему не загружает ресурсы из других доменов, что означает, что она не извлекает изображения, поскольку они размещены в другом CDN.

Удалось скачать как минимум весь html контент. Следующий код, кажется, загружает все страницы из блога (используя Wget 1.11.3 в Windows XP):

wget -mk http://blog.safabyte.net/*

Сообщения изображений еще не загружены. Похоже, что это, вероятно, потому что они хранятся в разных доменах.

HTML-контент находится на blog.safabyte.com/*, а изображения - на http://posterous.com/getfile/files.posterous.com/cheated-by-safabyte/* и files.posterous.com.

Другие вопросы по тегам