Как сделать резервную копию блога, запущенного на posterous.com
Я хотел бы сделать резервную копию содержимого моего блога, который работает на posterous.com. Я хотел бы сохранить все тексты и изображения на локальный диск. Возможность просматривать его в автономном режиме является плюсом.
Что я уже пробовал:
wget -mk http://myblogurl
Он загружает первую страницу со списком сообщений, затем останавливается с "20 redirections exceeded
сообщение
Он загружает первую страницу с перенаправлением на домашнюю страницу http://posterous.com/ вместо реального содержимого страницы.
Изменить: URL сайта, который я пытаюсь сделать резервную копию, это http://blog.safabyte.net/
3 ответа
Posterous.com поддерживает API, который может вам помочь. В частности, их http://posterous.com/api/reading API может быть полезным. Вы можете использовать его для получения файла XML, содержащего все ваши сообщения и их содержание.
Например, http://posterous.com/api/readposts?hostname=jasonpearce возвращает все 12 сообщений, которые я сделал для Posterous.
Это сработало для меня:
wget -r -l inf -k -E -p -nc http://blog.safabyte.net/
Кажется, с использованием -m
включается -N
(отметка времени) и posterous не отправляет последние измененные заголовки, которые расстраивают wget, поэтому вместо этого я просто использовал -r -l inf
непосредственно.
Используемые параметры:
-r
рекурсивный-l inf
бесконечная глубина-k
HTML-файлы с суффиксом.html-E
обновить сохраненные файлы со ссылками на локальные файлы-p
ресурсы страницы загрузки-nc
не перезагружать URL более одного раза
Эта команда по-прежнему не загружает ресурсы из других доменов, что означает, что она не извлекает изображения, поскольку они размещены в другом CDN.
Удалось скачать как минимум весь html контент. Следующий код, кажется, загружает все страницы из блога (используя Wget 1.11.3 в Windows XP):
wget -mk http://blog.safabyte.net/*
Сообщения изображений еще не загружены. Похоже, что это, вероятно, потому что они хранятся в разных доменах.
HTML-контент находится на blog.safabyte.com/*, а изображения - на http://posterous.com/getfile/files.posterous.com/cheated-by-safabyte/* и files.posterous.com.