ユーザーの最近のInstagramメディアをサイドバーに入れようとしています。 Instagram APIを使ってメディアを取得しようとしています。
http://instagram.com/developer/endpoints/users/
ドキュメンテーションはGET https://api.instagram.com/v1/users/<user-id>/media/recent/
に言います、しかしそれはOAuthアクセストークンを渡すように言います。アクセストークンは、ユーザーに代わって動作するための承認を表します。サイドバーでこれを確認するために、ユーザーがInstagramにログインしたくない。 Instagramのアカウントを持っている必要すらありません。
たとえば、Instagramにログインして写真を見なくても、 http://instagram.com/thebrainscoop にアクセスできます。私はAPIを通してそれをやりたいのです。
Instagram APIでは、ユーザー認証されていないリクエストはclient_id
の代わりにaccess_token
を渡します。しかし、それを試すと、次のようになります。
{
"meta":{
"error_type":"OAuthParameterException",
"code":400,
"error_message":"\"access_token\" URL parameter missing. This OAuth request requires an \"access_token\" URL parameter."
}
}
それで、これは不可能ですか?最初にOAuthを通じてInstagramアカウントにログインするようにユーザーに要求せずにユーザーの最新の(一般の)メディアを取得する方法はありませんか?
これは遅いですが、私がInstagramのドキュメントでそれを見たことがないようにそれが誰かを助けるならば価値があります。
https://api.instagram.com/v1/users/<user-id>/media/recent/
に対してGETを実行するために(現時点で)、実際にはOAuthアクセストークンは必要ありません。
https://api.instagram.com/v1/users/[USER ID]/media/recent/?client_id=[CLIENT ID]
を実行できます
[CLIENT ID]は、管理クライアントを介してアプリに登録された有効なクライアントIDです(ユーザーには関係ありません)。 GETユーザーの検索要求を実行することで、usernameから[USER ID]を取得できます。https://api.instagram.com/v1/users/search?q=[USERNAME]&client_id=[CLIENT ID]
var name = "smena8m";
$.get("https://images"+~~(Math.random()*33)+"-focus-opensocial.googleusercontent.com/gadgets/proxy?container=none&url=https://www.instagram.com/" + name + "/", function(html) {
if (html) {
var regex = /_sharedData = ({.*);<\/script>/m,
json = JSON.parse(regex.exec(html)[1]),
edges = json.entry_data.ProfilePage[0].graphql.user.Edge_owner_to_timeline_media.edges;
$.each(edges, function(n, Edge) {
var node = Edge.node;
$('body').append(
$('<a/>', {
href: 'https://instagr.am/p/'+node.shortcode,
target: '_blank'
}).css({
backgroundImage: 'url(' + node.thumbnail_src + ')'
}));
});
}
});
html, body {
font-size: 0;
line-height: 0;
}
a {
display: inline-block;
width: 25%;
height: 0;
padding-bottom: 25%;
background: #eee 50% 50% no-repeat;
background-size: cover;
}
<script src="https://ajax.googleapis.com/ajax/libs/jquery/2.1.1/jquery.min.js"></script>
ランディングページのアドレス の横にある?__a=1
を使用して、任意のInstagramユーザーの写真フィードをJSON形式でダウンロードできます 。ユーザーIDを取得したりアプリを登録したり、トークン、oAuthを登録する必要はありません。
min_id
およびmax_id
変数は、ページ区切りに使用できます。これは の例です
YQL
はここではスニップされたiframe内では動作しない可能性があるので、いつでも手動で確認できます YQLコンソール
2018年4月更新:最新のInstagramの更新後は、CORS
Access-Control-Allow-Headers
の制限により、署名付きリクエストのカスタムヘッダーをjavascriptで設定できないため、クライアント側(javascript)でこれを行うことはできません。 php
、またはrhx_gis
、csrf_token
、およびrequestパラメータに基づいた適切な署名を使用して、他のサーバー側の方法でこれを実行することも可能です。あなたはそれについてもっと読むことができます ここで 。
2019年1月更新:YQLが引退しました。GoogleImage ProxyでInstagramページのCORS
プロキシとして最新の更新を確認してください。それから否定的な瞬間 - この方法では利用できないページ付け。
PHP
の解決策:
$html = file_get_contents('https://instagram.com/Apple/');
preg_match('/_sharedData = ({.*);<\/script>/', $html, $matches);
$profile_data = json_decode($matches[1])->entry_data->ProfilePage[0]->graphql->user;
11.11.2017
Instagramはこのデータを提供する方法を変更したので、最近では上記の方法はどれもうまくいきません。ユーザーのメディアを入手するための新しい方法は次のとおりです。
GET https://instagram.com/graphql/query/?query_id=17888483320059182&variables={"id":"1951415043","first":20,"after":null}
ここで、query_id
- 固定値:17888483320059182(将来変更される可能性があることに注意してください).id
- ユーザーのID。それはユーザーのリストと来るかもしれません。ユーザーの一覧を取得するには、次のリクエストを使用できます。GET https://www.instagram.com/web/search/topsearch/?context=blended&query=YOUR_QUERY
first
- 取得するアイテム数。after
- そのIDからアイテムを取得したい場合は最後のアイテムのID。
私は認証なしで次のAPIを使用してユーザーの最新のメディアを入手することができました(説明、いいね、コメント数を含む)。
https://www.instagram.com/Apple/?__a=1
例えば。
https://www.instagram.com/{username}/?__a=1
先週の時点で、Instagramは/media/
のURLを無効にしていました。回避策を実装しましたが、今のところうまく機能します。
このスレッドでみんなの問題を解決するために、私はこれを書いた: https://github.com/whizzzkid/instagram-reverse-proxy
以下のエンドポイントを使用して、Instagramの公開データをすべて提供します。
ユーザーメディアを入手する:
https://igapi.ga/<username>/media
e.g.: https://igapi.ga/whizzzkid/media
制限数のあるユーザーメディアを取得します。
https://igapi.ga/<username>/media?count=N // 1 < N < 20
e.g.: https://igapi.ga/whizzzkid/media?count=5
JSONPを使う:
https://igapi.ga/<username>/media?callback=foo
e.g.: https://igapi.ga/whizzzkid/media?callback=bar
プロキシAPIはまた、次のページと前のページのURLをレスポンスに追加するので、最後にそれを計算する必要はありません。
あなたがそれを好むことを願っています!
これを発見してくれた@ 350Dに感謝します:)
Instagram APIは、ユーザーの最近のメディアエンドポイントにアクセスするためにOAuthによるユーザー認証を要求します。ユーザーのためにすべてのメディアを入手するための他の方法は今のところありません。
単一のアカウントで使用するためのアクセストークンを生成する方法を探しているなら、これを試すことができます - > https://coderwall.com/p/cfgneq 。
特定のアカウントの最新のメディアをすべて入手するには、Instagram APIを使用する方法が必要でした。
これがRailsソリューションです。これは一種の裏口で、実際には正面玄関です。
# create a headless browser
b = Watir::Browser.new :phantomjs
uri = 'https://www.instagram.com/explore/tags/' + query
uri = 'https://www.instagram.com/' + query if type == 'user'
b.goto uri
# all data are stored on this page-level object.
o = b.execute_script( 'return window._sharedData;')
b.close
返されるオブジェクトは、それがユーザー検索かタグ検索かによって異なります。私はこのようなデータを得ます:
if type == 'user'
data = o[ 'entry_data' ][ 'ProfilePage' ][ 0 ][ 'user' ][ 'media' ][ 'nodes' ]
page_info = o[ 'entry_data' ][ 'ProfilePage' ][ 0 ][ 'user' ][ 'media' ][ 'page_info' ]
max_id = page_info[ 'end_cursor' ]
has_next_page = page_info[ 'has_next_page' ]
else
data = o[ 'entry_data' ][ 'TagPage' ][ 0 ][ 'tag' ][ 'media' ][ 'nodes' ]
page_info = o[ 'entry_data' ][ 'TagPage' ][ 0 ][ 'tag' ][ 'media' ][ 'page_info' ]
max_id = page_info[ 'end_cursor' ]
has_next_page = page_info[ 'has_next_page' ]
end
次のようにしてURLを作成すると、結果のページがもう1つ得られます。
uri = 'https://www.instagram.com/explore/tags/' + query_string.to_s\
+ '?&max_id=' + max_id.to_s
uri = 'https://www.instagram.com/' + query_string.to_s + '?&max_id='\
+ max_id.to_s if type === 'user'
Instagramの絶え間なく変化する(そして恐ろしく設計された)APIスキーマのおかげで、上記の大部分は2018年4月の時点でもう動作しません。
https://www.instagram.com/username/?__a=1
メソッドを使用して直接APIにクエリを送信している場合に、個々の投稿データにアクセスするための最新のパスです。
返されたJSON
データが$data
であると仮定すると、以下のパス例を使用して各結果をループ処理できます。
foreach ($data->graphql->user->Edge_owner_to_timeline_media->edges as $item) {
$content_id = $item->node->id;
$date_posted = $item-node->taken_at_timestamp;
$comments = $item->node->Edge_media_to_comment->count;
$likes = $item->node->Edge_liked_by->count;
$image = $item->node->display_url;
$content = $item->node->Edge_media_to_caption->edges[0]->node->text;
// etc etc ....
}
この最近の変更の主なものはgraphql
とEdge_owner_to_timeline_media
でした。
DEC 2018 そうでないうちに、彼らがこの「API」アクセスを「非ビジネス」のお客様に止めようとしているように見えます。
それが誰かに役立つことを願っています;)
私には理解しづらいので、@ 350Dの回答に追加したいだけです。
私のコードの論理は次のとおりです。
初めてAPIを呼び出すときは、https://www.instagram.com/_vull_ /media/
だけを呼び出します。応答を受信したら、more_available
のブール値を確認します。もしそうなら、私は配列から最後の写真を取得し、そのIDを取得してからInstagram APIを再度呼び出しますが、今回はhttps://www.instagram.com/_vull_/media/?max_id=1400286183132701451_1642962433
です。
ここで知っておくべき重要なこと、このIDは配列の最後の絵のIDです。そのため、配列内の画像の最後のIDを指定してmaxIdを要求すると、次の20枚の画像が表示されます。
これが物事を明確にすることを願っています。
さて、/?__a=1
は今は動作しなくなったので、curlを使ってこの答えで書かれたようにinstagramページを解析するのが良いでしょう: ログインせずにInstagram APIアクセストークンを生成する
もう1つのトリック、ハッシュタグで写真を検索する:
GET https://www.instagram.com/graphql/query/?query_hash=3e7706b09c6184d5eafd8b032dbcf487&variables={"tag_name":"nature","first":25,"after":""}
どこで:
query_hash
- 永久的な値(私はそのハッシュを17888483320059182と信じています、将来変更される可能性があります)
tag_name
- タイトルはそれ自身のために話す
first
- 取得するアイテムの量(理由はわかりませんが、この値は期待どおりに機能しません。実際に返される写真の数は、値の4.5倍(25の場合は約110、値の場合は約460)をわずかに上回ります。値100))
after
- そのIDからアイテムを取得したい場合は最後のアイテムのID。 JSONレスポンスからのend_cursor
の値はここで使用することができます。
このAPIを使用して、Instagramユーザーの公開情報を取得できます。
https://api.lityapp.com/instagrams/thebrainscoop?limit=2
limitパラメータを設定しないと、投稿数はデフォルトで12に制限されます
このAPIはSpringBootでHtmlUnitを使って作成されています。
public JSONObject getPublicInstagramByUserName(String userName, Integer limit) {
String html;
WebClient webClient = new WebClient();
try {
webClient.getOptions().setCssEnabled(false);
webClient.getOptions().setJavaScriptEnabled(false);
webClient.getOptions().setThrowExceptionOnScriptError(false);
webClient.getCookieManager().setCookiesEnabled(true);
Page page = webClient.getPage("https://www.instagram.com/" + userName);
WebResponse response = page.getWebResponse();
html = response.getContentAsString();
} catch (Exception ex) {
ex.printStackTrace();
throw new RuntimeException("Ocorreu um erro no Instagram");
}
String prefix = "static/bundles/es6/ProfilePageContainer.js";
String sufix = "\"";
String script = html.substring(html.indexOf(prefix));
script = script.substring(0, script.indexOf(sufix));
try {
Page page = webClient.getPage("https://www.instagram.com/" + script);
WebResponse response = page.getWebResponse();
script = response.getContentAsString();
} catch (Exception ex) {
ex.printStackTrace();
throw new RuntimeException("Ocorreu um erro no Instagram");
}
prefix = "l.pagination},queryId:\"";
String queryHash = script.substring(script.indexOf(prefix) + prefix.length());
queryHash = queryHash.substring(0, queryHash.indexOf(sufix));
prefix = "<script type=\"text/javascript\">window._sharedData = ";
sufix = ";</script>";
html = html.substring(html.indexOf(prefix) + prefix.length());
html = html.substring(0, html.indexOf(sufix));
JSONObject json = new JSONObject(html);
JSONObject entryData = json.getJSONObject("entry_data");
JSONObject profilePage = (JSONObject) entryData.getJSONArray("ProfilePage").get(0);
JSONObject graphql = profilePage.getJSONObject("graphql");
JSONObject user = graphql.getJSONObject("user");
JSONObject response = new JSONObject();
response.put("id", user.getString("id"));
response.put("username", user.getString("username"));
response.put("fullName", user.getString("full_name"));
response.put("followedBy", user.getJSONObject("Edge_followed_by").getLong("count"));
response.put("following", user.getJSONObject("Edge_follow").getLong("count"));
response.put("isBusinessAccount", user.getBoolean("is_business_account"));
response.put("photoUrl", user.getString("profile_pic_url"));
response.put("photoUrlHD", user.getString("profile_pic_url_hd"));
JSONObject edgeOwnerToTimelineMedia = user.getJSONObject("Edge_owner_to_timeline_media");
JSONArray posts = new JSONArray();
try {
loadPublicInstagramPosts(webClient, queryHash, user.getString("id"), posts, edgeOwnerToTimelineMedia, limit == null ? 12 : limit);
} catch (Exception ex) {
ex.printStackTrace();
throw new RuntimeException("Você fez muitas chamadas, tente mais tarde");
}
response.put("posts", posts);
return response;
}
private void loadPublicInstagramPosts(WebClient webClient, String queryHash, String userId, JSONArray posts, JSONObject edgeOwnerToTimelineMedia, Integer limit) throws IOException {
JSONArray edges = edgeOwnerToTimelineMedia.getJSONArray("edges");
for (Object elem : edges) {
if (limit != null && posts.length() == limit) {
return;
}
JSONObject node = ((JSONObject) elem).getJSONObject("node");
if (node.getBoolean("is_video")) {
continue;
}
JSONObject post = new JSONObject();
post.put("id", node.getString("id"));
post.put("shortcode", node.getString("shortcode"));
JSONArray captionEdges = node.getJSONObject("Edge_media_to_caption").getJSONArray("edges");
if (captionEdges.length() > 0) {
JSONObject captionNode = ((JSONObject) captionEdges.get(0)).getJSONObject("node");
post.put("caption", captionNode.getString("text"));
} else {
post.put("caption", (Object) null);
}
post.put("photoUrl", node.getString("display_url"));
JSONObject dimensions = node.getJSONObject("dimensions");
post.put("photoWidth", dimensions.getLong("width"));
post.put("photoHeight", dimensions.getLong("height"));
JSONArray thumbnailResources = node.getJSONArray("thumbnail_resources");
JSONArray thumbnails = new JSONArray();
for (Object elem2 : thumbnailResources) {
JSONObject obj = (JSONObject) elem2;
JSONObject thumbnail = new JSONObject();
thumbnail.put("photoUrl", obj.getString("src"));
thumbnail.put("photoWidth", obj.getLong("config_width"));
thumbnail.put("photoHeight", obj.getLong("config_height"));
thumbnails.put(thumbnail);
}
post.put("thumbnails", thumbnails);
posts.put(post);
}
JSONObject pageInfo = edgeOwnerToTimelineMedia.getJSONObject("page_info");
if (!pageInfo.getBoolean("has_next_page")) {
return;
}
String endCursor = pageInfo.getString("end_cursor");
String variables = "{\"id\":\"" + userId + "\",\"first\":12,\"after\":\"" + endCursor + "\"}";
String url = "https://www.instagram.com/graphql/query/?query_hash=" + queryHash + "&variables=" + URLEncoder.encode(variables, "UTF-8");
Page page = webClient.getPage(url);
WebResponse response = page.getWebResponse();
String content = response.getContentAsString();
JSONObject json = new JSONObject(content);
loadPublicInstagramPosts(webClient, queryHash, userId, posts, json.getJSONObject("data").getJSONObject("user").getJSONObject("Edge_owner_to_timeline_media"), limit);
}
これは回答の一例です。
{
"id": "290482318",
"username": "thebrainscoop",
"fullName": "Official Fan Page",
"followedBy": 1023,
"following": 6,
"isBusinessAccount": false,
"photoUrl": "https://scontent-gru2-1.cdninstagram.com/vp/447ffd0262082f373acf3d467435f130/5C709C77/t51.2885-19/11351770_612904665516559_678168252_a.jpg",
"photoUrlHD": "https://scontent-gru2-1.cdninstagram.com/vp/447ffd0262082f373acf3d467435f130/5C709C77/t51.2885-19/11351770_612904665516559_678168252_a.jpg",
"posts": [
{
"id": "1430331382090378714",
"shortcode": "BPZjtBUly3a",
"caption": "If I have any active followers anymore; hello! I'm Brianna, and I created this account when I was just 12 years old to show my love for The Brain Scoop. I'm now nearly finished high school, and just rediscovered it. I just wanted to see if anyone is still active on here, and also correct some of my past mistakes - being a child at the time, I didn't realise I had to credit artists for their work, so I'm going to try to correct that post haste. Also; the font in my bio is horrendous. Why'd I think that was a good idea? Anyway, this is a beautiful artwork of the long-tailed pangolin by @chelsealinaeve . Check her out!",
"photoUrl": "https://scontent-gru2-1.cdninstagram.com/vp/ab823331376ca46136457f4654bf2880/5CAD48E4/t51.2885-15/e35/16110915_400942200241213_3503127351280009216_n.jpg",
"photoWidth": 640,
"photoHeight": 457,
"thumbnails": [
{
"photoUrl": "https://scontent-gru2-1.cdninstagram.com/vp/43b195566d0ef2ad5f4663ff76d62d23/5C76D756/t51.2885-15/e35/c91.0.457.457/s150x150/16110915_400942200241213_3503127351280009216_n.jpg",
"photoWidth": 150,
"photoHeight": 150
},
{
"photoUrl": "https://scontent-gru2-1.cdninstagram.com/vp/ae39043a7ac050c56d741d8b4355c185/5C93971C/t51.2885-15/e35/c91.0.457.457/s240x240/16110915_400942200241213_3503127351280009216_n.jpg",
"photoWidth": 240,
"photoHeight": 240
},
{
"photoUrl": "https://scontent-gru2-1.cdninstagram.com/vp/ae7a22d09e3ef98d0a6bbf31d621a3b7/5CACBBA6/t51.2885-15/e35/c91.0.457.457/s320x320/16110915_400942200241213_3503127351280009216_n.jpg",
"photoWidth": 320,
"photoHeight": 320
},
{
"photoUrl": "https://scontent-gru2-1.cdninstagram.com/vp/1439dc72b70e7c0c0a3afcc30970bb13/5C8E2923/t51.2885-15/e35/c91.0.457.457/16110915_400942200241213_3503127351280009216_n.jpg",
"photoWidth": 480,
"photoHeight": 480
},
{
"photoUrl": "https://scontent-gru2-1.cdninstagram.com/vp/1439dc72b70e7c0c0a3afcc30970bb13/5C8E2923/t51.2885-15/e35/c91.0.457.457/16110915_400942200241213_3503127351280009216_n.jpg",
"photoWidth": 640,
"photoHeight": 640
}
]
},
{
"id": "442527661838057235",
"shortcode": "YkLJBXJD8T",
"caption": null,
"photoUrl": "https://scontent-gru2-1.cdninstagram.com/vp/dc94b38da679826b9ac94ccd2bcc4928/5C7CDF93/t51.2885-15/e15/11327349_860747310663863_2105199307_n.jpg",
"photoWidth": 612,
"photoHeight": 612,
"thumbnails": [
{
"photoUrl": "https://scontent-gru2-1.cdninstagram.com/vp/c1153c6513c44a6463d897e14b2d8f06/5CB13ADD/t51.2885-15/e15/s150x150/11327349_860747310663863_2105199307_n.jpg",
"photoWidth": 150,
"photoHeight": 150
},
{
"photoUrl": "https://scontent-gru2-1.cdninstagram.com/vp/47e60ec8bca5a1382cd9ac562439d48c/5CAE6A82/t51.2885-15/e15/s240x240/11327349_860747310663863_2105199307_n.jpg",
"photoWidth": 240,
"photoHeight": 240
},
{
"photoUrl": "https://scontent-gru2-1.cdninstagram.com/vp/da0ee5b666ab40e4adc1119e2edca014/5CADCB59/t51.2885-15/e15/s320x320/11327349_860747310663863_2105199307_n.jpg",
"photoWidth": 320,
"photoHeight": 320
},
{
"photoUrl": "https://scontent-gru2-1.cdninstagram.com/vp/02ee23571322ea8d0992e81e72f80ef2/5C741048/t51.2885-15/e15/s480x480/11327349_860747310663863_2105199307_n.jpg",
"photoWidth": 480,
"photoHeight": 480
},
{
"photoUrl": "https://scontent-gru2-1.cdninstagram.com/vp/dc94b38da679826b9ac94ccd2bcc4928/5C7CDF93/t51.2885-15/e15/11327349_860747310663863_2105199307_n.jpg",
"photoWidth": 640,
"photoHeight": 640
}
]
}
]
}
この機能は本当に必要でしたが、Wordpressに必要でした。私はフィットし、完全に機能しました
<script>
jQuery(function($){
var name = "caririceara.comcariri";
$.get("https://images"+~~(Math.random()*33)+"-focus-opensocial.googleusercontent.com/gadgets/proxy?container=none&url=https://www.instagram.com/" + name + "/", function(html) {
if (html) {
var regex = /_sharedData = ({.*);<\/script>/m,
json = JSON.parse(regex.exec(html)[1]),
edges = json.entry_data.ProfilePage[0].graphql.user.Edge_owner_to_timeline_media.edges;
$.each(edges, function(n, Edge) {
if (n <= 7){
var node = Edge.node;
$('.img_ins').append('<a href="https://instagr.am/p/'+node.shortcode+'" target="_blank"><img src="'+node.thumbnail_src+'" width="150"></a>');
}
});
}
});
});
</script>
更新
このメソッドはもう動作しません
Javascript:
$(document).ready(function(){
var username = "leomessi";
var max_num_items = 5;
var jqxhr = $.ajax( "https://www.instagram.com/"+username+"/?__a=1" ).done(function() {
//alert( "success" );
}).fail(function() {
//alert( "error" );
}).always(function(data) {
//alert( "complete" )
items = data.graphql.user.Edge_owner_to_timeline_media.edges;
$.each(items, function(n, item) {
if( (n+1) <= max_num_items )
{
var data_li = "<li><a target='_blank' href='https://www.instagram.com/p/"+item.node.shortcode+"'><img src='" + item.node.thumbnail_src + "'/></a></li>";
$("ul.instagram").append(data_li);
}
});
});
});
HTML:
<ul class="instagram">
</ul>
CSS:
ul.instagram {
list-style: none;
}
ul.instagram li {
float: left;
}
ul.instagram li img {
height: 100px;
}
以下のnodejsコードは、Instagramのページから人気のある画像を削り取ります。関数 'ScrapeInstagramPage'はポストエージング効果を処理します。
var request = require('parse5');
var request = require('request');
var rp = require('request-promise');
var $ = require('cheerio'); // Basically jQuery for node.js
const jsdom = require("jsdom");
const { JSDOM } = jsdom;
function ScrapeInstagramPage (args) {
dout("ScrapeInstagramPage for username -> " + args.username);
var query_url = 'https://www.instagram.com/' + args.username + '/';
var cookieString = '';
var options = {
url: query_url,
method: 'GET',
headers: {
'x-requested-with' : 'XMLHttpRequest',
'accept-language' : 'en-US,en;q=0.8,pt;q=0.6,hi;q=0.4',
'User-Agent' : 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36',
'referer' : 'https://www.instagram.com/dress_blouse_designer/',
'Cookie' : cookieString,
'Accept' : '*/*',
'Connection' : 'keep-alive',
'authority' : 'www.instagram.com'
}
};
function dout (msg) {
if (args.debug) {
console.log(msg);
}
}
function autoParse(body, response, resolveWithFullResponse) {
// FIXME: The content type string could contain additional values like the charset.
// Consider using the `content-type` library for a robust comparison.
if (response.headers['content-type'] === 'application/json') {
return JSON.parse(body);
} else if (response.headers['content-type'] === 'text/html') {
return $.load(body);
} else {
return body;
}
}
options.transform = autoParse;
rp(options)
.then(function (autoParsedBody) {
if (args.debug) {
console.log("Responce of 'Get first user page': ");
console.log(autoParsedBody);
console.log("Creating JSDOM from above Responce...");
}
const dom = new JSDOM(autoParsedBody.html(), { runScripts: "dangerously" });
if (args.debug) console.log(dom.window._sharedData); // full data doc form instagram for a page
var user = dom.window._sharedData.entry_data.ProfilePage[0].user;
if (args.debug) {
console.log(user); // page user
console.log(user.id); // user ID
console.log(user.full_name); // user full_name
console.log(user.username); // user username
console.log(user.followed_by.count); // user followed_by
console.log(user.profile_pic_url_hd); // user profile pic
console.log(autoParsedBody.html());
}
if (user.is_private) {
dout ("User account is PRIVATE");
} else {
dout ("User account is public");
GetPostsFromUser(user.id, 5000, undefined);
}
})
.catch(function (err) {
console.log( "ERROR: " + err );
});
var pop_posts = [];
function GetPostsFromUser (user_id, first, end_cursor) {
var end_cursor_str = "";
if (end_cursor != undefined) {
end_cursor_str = '&after=' + end_cursor;
}
options.url = 'https://www.instagram.com/graphql/query/?query_id=17880160963012870&id='
+ user_id + '&first=' + first + end_cursor_str;
rp(options)
.then(function (autoParsedBody) {
if (autoParsedBody.status === "ok") {
if (args.debug) console.log(autoParsedBody.data);
var posts = autoParsedBody.data.user.Edge_owner_to_timeline_media;
// POSTS processing
if (posts.edges.length > 0) {
//console.log(posts.edges);
pop_posts = pop_posts.concat
(posts.edges.map(function(e) {
var d = new Date();
var now_seconds = d.getTime() / 1000;
var seconds_since_post = now_seconds - e.node.taken_at_timestamp;
//console.log("seconds_since_post: " + seconds_since_post);
var ageing = 10; // valuses (1-10]; big value means no ageing
var days_since_post = Math.floor(seconds_since_post/(24*60*60));
var df = (Math.log(ageing+days_since_post) / (Math.log(ageing)));
var likes_per_day = (e.node.Edge_liked_by.count / df);
// console.log("likes: " + e.node.Edge_liked_by.count);
//console.log("df: " + df);
//console.log("likes_per_day: " + likes_per_day);
//return (likes_per_day > 10 * 1000);
var obj = {};
obj.url = e.node.display_url;
obj.likes_per_day = likes_per_day;
obj.days_since_post = days_since_post;
obj.total_likes = e.node.Edge_liked_by.count;
return obj;
}
));
pop_posts.sort(function (b,a) {
if (a.likes_per_day < b.likes_per_day)
return -1;
if (a.likes_per_day > b.likes_per_day)
return 1;
return 0;
});
//console.log(pop_posts);
pop_posts.forEach(function (obj) {
console.log(obj.url);
});
}
if (posts.page_info.has_next_page) {
GetPostsFromUser(user_id, first, posts.page_info.end_cursor);
}
} else {
console.log( "ERROR: Posts AJAX call not returned good..." );
}
})
.catch(function (err) {
console.log( "ERROR: " + err );
});
}
}
ScrapeInstagramPage ({username : "dress_blouse_designer", debug : false});
お試しください ここ
例:与えられたURLに ' https://www.instagram.com/dress_blouse_designer/ 'という関数を呼び出す
ScrapeInstagramPage ({username : "dress_blouse_designer", debug : false});
これは単純なajax呼び出しと画像パスの反復を使用して機能します。
var name = "nasa";
$.get("https://www.instagram.com/" + name + "/?__a=1", function (data, status) {
console.log('IG_NODES', data.user.media.nodes);
$.each(data.user.media.nodes, function (n, item) {
console.log('ITEMS', item.display_src);
$('body').append(
"<div class='col-md-4'><img class='img-fluid d-block' src='" + item.display_src + "'></div>"
);
});
})