Предыстория: На Twitch был караоке-сервис Twitch Sings, который закрылся в декабре прошлого года. Он был разработан Harmonix, той же студией, которая создала Guitar Hero и Rock Band, поэтому информацию о нем стоит сохранить. Я пытаюсь найти окончательный список песен, но единственная страница с полной информацией — эта страница, которая была деактивирована:https://songlist.sings.twitch.tv/
Архивная версия:https://web.archive.org/web/20201202061659/https://songlist.sings.twitch.tv/
Проблема: при просмотре страницы через archive.org создается впечатление, что она должна извлекать данные из базы данных для заполнения страницы. Однако архивная версия отображается неправильно. Она обращается к базе данных и отображает песни исполнителей, начинающиеся с цифр или A, но вместо того, чтобы отобразить B, она возвращается назад и снова и снова отображает A. Я пробовал открывать ее в Chrome, Firefox и Edge с тем же результатом.
Есть ли способ полностью обойти архивированную страницу, обратившись к базе данных напрямую? Или можно отредактировать код, открыв исходный код страницы, чтобы он правильно отображался в браузере? Есть ли какой-то другой метод, который позволит мне получить информацию? У меня действительно нет большого опыта в кодировании.
решение1
Вы почти наверняка правы, что база данных работала в бэкэнде. Поскольку сайт был закрыт, без сомнения, база данных и серверный код, которые его запускали, полностью исчезли. Страница, которую вы видите, скорее всего, является стандартным HTML-выводом серверного кода и базы данных. Archive.org может только копировать HTML-вывод веб-сайта. Он не может видеть, что создает этот вывод. По сути, у него есть «фотография» главной страницы, и это все. В действительности, вы больше ничего не сможете восстановить, кроме того, что видите.
решение2
Как можетявосстановить данные с сайта после закрытия?
ТЫвероятно, не может.
Как вы уже поняли, Wayback Machine имеет ограничения на то, что он может кэшировать из Интернета.
Если вы не кэшировали информацию самостоятельно, пока сайт работал, вам придется найти другого человека, который заархивировал то, что вы ищете.
Есть ли способ полностью обойти архивную страницу, обратившись к базе данных напрямую?
Если база данных все еще существует, вам придется связаться с владельцем, чтобы получить к ней доступ. Маловероятно, что она находится в свободном доступе через Интернет.
Обычно компании архивируют данные устаревших продуктов и восстанавливают данные только в том случае, если это требуется по закону или если новый проект может извлечь выгоду из старых данных. Сомневаюсь, что Twitch заботится о ваших личных интересах, но вы можете попробовать связаться с ними.
Если у кого-то есть копия базы данных, то, скорее всего, он получил ее незаконным путем.
решение3
Если вам повезет, то ваш сайт все еще может быть в кэше Google.
- Введите
site:example.com
поиск Google. Вы получите список всех HTML-документов, проиндексированных Google. - Нажмите на маленький треугольник, направленный вниз, рядом с URL-адресом.
- Нажмите «В кэше».
Вы получите то, что Google все еще имеет в своем распоряжении из HTML-документа, и сможете скачать его.
решение4
Есливсеиз следующих условий применимы, то вы можете использовать законный метод получения данных, как указано вОтвет MonkeyZeus:
- Вы проживаете в юрисдикции, на которую распространяется действие GDPR (например, в Великобритании или государстве-члене ЕС).
- Компания находится в юрисдикции, к которой применяется GDPR.илиони находятся за пределами юрисдикции, но заключили с вами договор на предоставление доступа к своему веб-сайту (например, вы создали учетную запись и согласились с положениями и условиями).
- У компании все еще есть копия данных.
- Данные являются вашими персональными данными.
Если это так, вы можете сделать запрос на доступ к теме в статьях15и12GDPR. Затем компания обычно обязана предоставить вам данные бесплатно и без неоправданной задержки (и в течение максимум 1 месяца или 3 месяцев в случае сложного запроса, при условии, что они уведомили вас о дополнительном времени в течение 1 месяца). Если они этого не сделали, вы имеете право подать жалобу в орган по защите данных вашей страны и/или добиться судебного запрета в суде.