web-dev-qa-db-ja.com

Googleキャッシュなどを使用して古いWebコンテンツを検索します

少し問題があります。クライアントがJoomla 1.0サイトを実行しており、一部のコンテンツ(テキスト)が失われました。 MySQLデータベースのバックアップが構成されていません。コンテンツは約失われました。 2012年12月16日頃。Webアーカイブを使用して古いサイトを検索しようとしましたが、葉巻は使用しませんでした。サイトはインデックス化されていません。

代わりにGoogleキャッシュ経由で取得しようとしました。キャッシュされたページ自体にはコンテンツはありませんでしたが、Webサイトのプレビュースクリーンショットには古いコンテンツがありました。スクリーンショットを読むことができるすべてを書きました。ただし、スクリーンショットの下に取得できないコンテンツがありました。

古いページを見つけるためにGoogle検索に入力したものは次のとおりです。

site:gerami.se previous ass

Ass =不思議な人への割り当て;)

スクリーンショットが撮られたとき、スクリーンショットの下にあった残りのテキストを取得したいです。

追伸:このスレッドが解決策を得るかどうかにかかわらず、物語の教訓は同じです。バックアップはあなたの友人です!

3
nctrnl

これは.seサイトであるため、スウェーデン国立図書館( Kungliga biblioteket )がページをアーカイブしている可能性があります(決して確実ではありませんが)。彼らは長年にわたってかなり堅牢なWebアーカイブプログラムを提供してきましたが、それがキャプチャされたかどうかにかかわらず、サイトがどのくらいの期間存続しているかに大きく依存します。コメントの年の範囲(2004年から2012年)を考えると、少なくとも一部のコンテンツがアーカイブされている可能性はかなり高いと思います。

インターネットアーカイブとは異なり、彼らのWebアーカイブは一般公開されていません。あなたは彼らに連絡し、彼らがあなたのコンテンツを持っているかどうか、そして彼らがあなたの方法でそれを抽出して送ることが可能であるかどうか尋ねる必要があります。

2
Kris

bing を使用してみてください:googleのようなページのキャッシュバージョンを生成します。

Googleのスクリーンショットがコンテンツを表示し、キャッシュされたページが表示されない理由は、スクリーンショットがキャッシュされたページよりも前に生成されたためです(キャッシュされたページは最新です)。

1
user6901