IMDBは、ユーザーがダウンロードして使用できるプレーンテキストファイルを提供します。このファイルは、ここで見つけることができます。 IMDBプレーンテキストファイル これはすばらしいですが、どのファイルでも各映画に使用されるIDが表示されません。
IMDBが使用条件でスクレーパー、データギャザラーなどを使用しないことを具体的に示している場合、タイトルIDをどのように取得しますか http://www.imdb.com/title/tt1133985 / プレーンテキストファイルに含まれていない映画の場合。
このIDを含むAPIが他にも構築されていることに気づいたので、どうやってそれを実現できたのだろうかと思っています。
次の場所にあるIMDB APIを使用できます。
このような映画名を検索できます-
http://www.omdbapi.com/?t=hangover%202
{
"Title":"The Hangover Part II",
"Year":"2011",
"Rated":"R",
"Released":"26 May 2011",
"Genre":"Comedy",
"Director":"Todd Phillips",
"Writer":"Craig Mazin, Scot Armstrong",
"Actors":"Bradley Cooper, Zach Galifianakis, Ed Helms, Justin Bartha",
"Plot":"Right after the bachelor party in Las Vegas, Phil, Stu, Alan, and Doug jet to Thailand for Stu's wedding. Stu's plan for a subdued pre-wedding brunch, however, goes seriously awry.",
"Poster":"http://ia.media-imdb.com/images/M/MV5BMTM2MTM4MzY2OV5BMl5BanBnXkFtZTcwNjQ3NzI4NA@@._V1_SX320.jpg","
Runtime":"1 hr 42 mins",
"Rating":"7.1",
"Votes":"13547",
"ID":"tt1411697",
"Response":"True"
}
このJSON応答から「ID」(tt1411697)を取得できます。
前述のように、IMDBにはWebサービスがありません。 imdbapiはスクリーンスクレイピングによって機能します。ダウンロード可能なフラットファイルは、IMDBのAmazon以前の時代の遺産であり、そこにある情報は不完全です。 (利用可能なファイルだけでは独自のIMDBを構築できませんでした)
ただし、 Rotten Tomatoes には、特に映画のimdb idを返すNice Webインターフェイスがあります-alternate_ids セクション。したがって、 Rotten Tomatoes API を使用して、imdbを直接画面スクレイピングすることなくimdb IDを取得できます。
Rotten TomatoesのデータベースはIMDBほど広範ではありませんが、最新(1995年以降)の米国リリースではかなりうまく機能しています。
TMDbを試すことができます。ここでドキュメントを確認できます- http://docs.themoviedb.apiary.io/ 。 append_to_responseを使用して、IMDB IDを他の詳細とともに取得できます。私が知っている代替ソリューションがあります。ソリューションはPHPにあります。ここにリンクがあります- http://blogs.niteshapte.com/2013-07-01-how-to-fetch-movie-identifier-id-from-imdb-using-php.htm 。要件に応じて調整する必要がある場合があります。