web-dev-qa-db-ja.com

Analytics eコマースデータの不一致

私たちのほとんどはGAとGoogle広告または他のプラットフォームとの間に精通している/遭遇していると思いますが、これにはかなり困惑しています。

新しいクライアントの報告は、いつも私には少し変わっているように見えました。最近まで、私はその理由に指を当てることができませんでしたが、報告されている数字が不正確であるといつも感じていました。今日、同僚と私は、同一のレポート(この場合、データがソースおよびページURLの単純なロジックフィルターを介して実行されるカスタムダッシュボード)が大きく異なる結果を生成することを発見しました。実際、10分間で少なくとも3つの異なる結果に気付きました!

日付範囲、ビュー、セグメントが同一であることを確認しましたが、ある時点でページを更新するだけでレポートが変更されました。これを発生させることはできませんでしたが、新しいデータ(前月)と古いデータ(9か月前)で気付きました。これにより、直前に発生するコンバージョンの問題はないことがわかります。

何がこれを引き起こしているのだろうか?新しい役割での最初のタスクの1つは、レポートを手動プルからGDSに移行することですが、これらの結果が大きく変化する可能性がある場合、データの有効性に不安があります。

1
Daniel Parscale

あなたの「大きく異なる」がどれだけワイルドかによって、これはデータサンプリングのように聞こえます。

標準レポートはサンプリングされませんが、セグメント(またはほとんどのセカンダリディメンション)を追加すると、50万セッションのランダムサンプルからデータが推定されます(無料プランの場合、360の場合は100メガ)。これは、eコマースデータに大きな影響を与える可能性があります。頻度の低いアクションは、サンプルになる特定のセッションのコレクションによって比例的に影響を受けます。

サンプリングが有効な場合、レポートタイトルの横のバッジは緑色ではなく黄色になり、マウスオーバーすると、ドロップダウンパネルに「このレポートはセッションのX%に基づいています」と表示されます。 (このためにはレポートにアクセスする必要があります。ダッシュボードにはバッジがありません。)

サンプリングは、レポートが表示されるときに行われます。サンプリングは、ユーザーと同僚の間、さらにはページの読み込みの間のデータの不一致を説明します。

私は最近 サンプリングとそれを緩和する方法 を説明する別の回答を書きました。

1
Reve