1つのWebサイトからリンクしたい4つのWebサイトがあります。しかしここでのキッカーは、単にサイトにリンクするだけでなく、自分のサイトにそれらのサイトからの更新を表示する方法を探していたことです。 RSSシンジケーションを通じてこれが可能であることは知っていますが、RSSなしでも可能ですか?
つまり、私が知る限り、4つのWebサイトにはRSSフィードがありません。しかし、それらのWebサイトからの更新を1か所に集約することを望んでいました。
更新:
顧客がアクセスし、更新プログラムを手動で確認する必要がある4つのWebサイトがあります。私の顧客が私のウェブサイトからリンクをクリックして各サイトを手動でチェックするのではなく、これらの4つのサイトのコンテンツのスニペットを表示するウィジェットまたは何かを構築する方法があることを望んでいました。
私のウェブサイトは、他のサイトの最新コンテンツを表示する必要があります。 GoogleリーダーがRSSフィードでできることのようなもの。ただし、これら4つのWebサイトはRSSをサポートしていません。
3つの方法が考えられます-1) Google SpreadsheetsのImportHtml関数 は、任意のWebサイトからコンテンツを選択的にスクレイピングするのに役立ちます。その後、 このスプレッドシートデータをウィジェットとして埋め込む
2) YQL を使用します。少しプログラミングが必要ですが、うんざりする作業が簡素化されます
3)チェック ソフトウェアを必要とせずに、またはXMLコードを1行も記述せずにWebサイトのRSSフィードを作成することに関するこの記事 。この方法を使用すると、フィードを作成するためにサイトの所有者である必要はありません。
上記のように、RSSやAPIを使用しない場合、これらのWebサイトを取得して解析する必要があります。おそらく、cronジョブを使用して、事前に定義された基準でクローラーを実行する必要があります。これらのサイトが更新されると、それ以上の頻度はなくなります。
また、他のサイトの所有者がWebサイトを廃棄することに反対していないことを確認する必要があります。それ以外の場合は、事前に許可を求めることをお勧めします。
PHPベースのソリューションの始まりについては、 この回答 を参照してください。
rSSをサポートしていない場合、おそらくこれらのページからHTMLを解析し、関連するコンテンツを取得できるスクリプトを作成するのが最善です。
それらのWebサイトにメールを送信して、RSSフィードの公開を依頼することもできます。