Google AnalyticsのコアレポートAPIを使用して、ダッシュボードに表示されているデータとまったく同じデータを取得しようとしています。ただし、同じ期間とメトリックでもデータがこれほど異なる理由を理解していないようです。
私のWeb UIから、これはダッシュボードの私のテーブル構造です。
**Display the following columns:**
Dimension: Month of Year
Metric: Pageviews
**Filter this data:**
Only show **Page** containing "/blog/"
そして、これは2013年9月26日から12/26/2013までの期間に私のWeb UIに見られるものです:
Month of Year Pageviews
201312 151,502
201311 136,856
201310 183,555
201309 22,689
スクリプトでは、まったく同じメトリックを使用します(WebメトリックとAPIメトリックの命名規則の違いを除く)。
dimensions = ga:yearMonth
start-date = 2013-09-26
start-index = 1
metrics = [u'ga:pageviews']
filters = ga:pagepath=@/blog/
end-date = 2013-12-26
そして、これは私が見るものです:
Rows:
201312 148626
201311 160769
201310 154770
201309 16099
レポート情報:
Contains Sampled Data = False
Kind = analytics#gaData
ID = https://www.googleapis.com/analytics/v3/data/ga?ids=ga:xxxxxx&dimensions=ga:yearMonth&metrics=ga:pageviews&sort=-ga:yearMonth&filters=ga:pagepath%3D@/blog/&start-date=2013-09-26&end-date=2013-12-26
Self Link = https://www.googleapis.com/analytics/v3/data/ga?ids=ga:xxxxxx&dimensions=ga:yearMonth&metrics=ga:pageviews&sort=-ga:yearMonth&filters=ga:pagepath%3D@/blog/&start-date=2013-09-26&end-date=2013-12-26
Pagination Infos:
Items per page = 1000
Total Results = 4
ご覧のとおり、データ形式は正しいですが、内部のデータは間違っています。さらに悪いことに、データの傾向が異なります。
実際、これはかなり良いです。あなたの数字はかなり近いです。最後に、私のシステムの統計から、Google Analyticsの約4倍のヒットが得られます。
今...なぜ矛盾?多くの要因がありますが、これらはこの時点で私が考えることができるものです:
Pythonで生成されたレポートとgoogleが提供するWebツールを比較して、私は(私が考えていた)同じ質問をしました。違いは、Webツールがサンプリングを使用しているためだとわかりました。
「このレポートは96,693セッション(セッションの92.19%)に基づいています」
あなたは実際にはウェブツールでより高い1つのデータポイントを持っています...それを説明できません:)