Как восстановить данные с сайта после закрытия?
Предыстория: у Twitch был караоке-сервис Twitch Sings, который закрылся в декабре прошлого года. Его разработала Harmonix, та же студия, которая создала Guitar Hero и Rock Band, поэтому информацию о нем стоит сохранить. Я пытаюсь найти окончательный список песен, но единственная страница с полной информацией — это деактивированная страница: https://songlist.sings.twitch.tv/
Архивная версия: https://web.archive.org/web/20201202061659/https://songlist.sings.twitch.tv/
Проблема: при просмотре страницы через archive.org создается впечатление, что для заполнения страницы необходимо использовать данные из базы данных. Однако архивная версия отображается неправильно. Он получит доступ к базе данных и отобразит песни исполнителей, начинающиеся с цифр или A, но вместо отображения B следующим он возвращается назад и снова и снова отображает A. Я пробовал открыть его в Chrome, Firefox и Edge с теми же результатами.
Есть ли способ полностью обойти заархивированную страницу, обратившись напрямую к базе данных? Или можно отредактировать код, открыв исходный код страницы, чтобы он правильно отображался в браузере? Есть ли другой метод, который позволит мне получить информацию? У меня действительно нет большого опыта кодирования.
4 ответа
Вы почти наверняка правы, говоря, что база данных работает на серверной стороне. Поскольку сайт был закрыт, без сомнения, база данных и серверный код, который его запускал, полностью исчезли. Страница, которую вы видите, скорее всего, является HTML-выводом серверного кода и базы данных по умолчанию. Archive.org может копировать только HTML-вывод веб-сайта. У него нет возможности увидеть, что создает этот результат. По сути, у него есть «фотография» первой страницы и все. В реальности вы больше ничего не сможете восстановить, кроме того, что видите.
Как восстановить данные с сайта после закрытия?
ВЫ, вероятно, не можете.
Как вы узнали, Wayback Machine имеет ограничения на то, что она может кэшировать из Интернета.
Если вы не кэшировали его самостоятельно, пока сайт работал, вам придется найти другого человека, который заархивировал то, что вы ищете.
Есть ли способ полностью обойти заархивированную страницу, обратившись напрямую к базе данных?
Если база данных все еще существует, вам придется связаться с владельцем, чтобы получить доступ. Маловероятно, что он находится в свободном доступе через Интернет.
Обычно компании архивируют данные о продуктах, срок действия которых прекращен, и восстанавливают их только в том случае, если есть юридическое требование или если новый проект может каким-то образом извлечь выгоду из старых данных. Я сомневаюсь, что Twitch заботится о ваших личных интересах, но вы можете попытаться связаться с ними.
Если у кого-то есть копия базы данных, то, скорее всего, он получил ее незаконно.
Если вам повезет, ваш сайт все еще может храниться в кеше Google.
- Входить
site:example.com
в поиск Google. Вы получаете список всех HTML-документов, проиндексированных Google. - Нажмите на маленький треугольник, направленный вниз, рядом с URL-адресом.
- Нажмите «В кеше»
Вы получите то, что Google еще получил от HTML-документа, и сможете его загрузить.
Если применимы все следующие условия, вы можете использовать законный метод для получения данных, как указано в ответе MonkeyZeus :
- Вы проживаете в юрисдикции, к которой применяется GDPR (например, в Великобритании или государстве-члене ЕС).
- Компания находится в юрисдикции, к которой применяется GDPR, или она находится за пределами юрисдикции, но заключила с вами договор на предоставление доступа к ее веб-сайту (например, вы создали учетную запись и согласились с условиями).
- У компании все еще есть копия данных.
- Данные являются вашими личными данными.
В этом случае вы можете подать запрос на доступ к субъекту в соответствии со статьями 15 и 12 GDPR. В этом случае компания обычно будет обязана предоставить вам данные бесплатно без неоправданной задержки (и в течение максимум 1 месяца или 3 месяцев в случае сложного запроса, при условии, что они уведомили вас о дополнительном времени в течение 1 месяца). Если они этого не сделали, вы имеете право подать жалобу в орган по защите данных вашей страны и/или добиться судебного запрета.