大量の統計データがあり、ユーザー(技術者以外の消費者)に短い要約を提示したい。ここで、averageを表示し、 算術平均 と median の間で決定する必要があります。数学的な観点からは、外れ値が平均をゆがめる可能性があるため、中央値はより良いでしょう。
しかし、ユーザーが単語と概念medianを理解しているかどうかはわかりません。おそらく、多くのユーザーはこの2つの違いを知らず、averageを聞いたときの平均を考えています。
それで、私は平均(おそらくより理解しやすい)または中央値(おそらく解釈にとってより良い)を使うべきですか?または多分私は中央値を使用できますが、callそれaverage?しかし、それは人々を混乱させるか、欺くか、そうでないか?
表示するほうが良いのが中央値の場合は、中央値を表示して中央値と呼びます。
彼らがそれが何であるかを知らなければ、おそらく彼らはとにかく違いに感謝しないでしょう。彼らがそれが何であるかを知っているなら、彼らはあなたがあなたが中央値を意味していて意味ではないことを明確にすることをあなたに感謝するでしょう。
彼らが中央値が平均のタイプであることを知らない場合、彼らはおそらくそれでもとにかく数で本当に多くをするのに十分なほどふさわしくなく、彼らは一般的にせいぜい一般的な傾向を探しているだけです。ユーザーが両方の可能性を心配している場合
次に、「中央値」という用語の最初の出現を、それを定義するツールチップ/ポップアップのあるリンクにし、「中央値は数値の平均...」などで始まることを確認します。
大きなことは、それを平均と呼んで中央値を与えたくないということです。これは正しいですが、質問のコメントだけでも、「平均」という用語は「算術」を意味することがわかります平均"。中央値は平均ですが、ほとんどの人は「平均」を意味することに慣れているため、誤った仮定をする可能性があります。
技術的には、「平均」という言葉は「船への損傷」を意味します。 †
平均には、外れ値などのさまざまな問題があり、中央値ははるかに堅牢です。
ほとんどの人は平均と考えるとき平均と考えますが、中央値ではないと思います
中心性や分布の真ん中など、別の用語を考えます。
統計の知識がある人は、平均と中央値が異なる場合に分布が歪んでいることを知っているので、両方を確認したいと思うかもしれません。
†ロンドンのロイドは、沈没船に賭けることになるロンドンのコーヒーショップで始まり、その後、賭けをプールし(平均を共有)、保険を作成し始めました。
中央値を提供するという本能は、人々が歪んだデータセットについて考える方法と一般的に一致するので、おそらく正しいものだと思います( たとえば、2004年に、米国の平均収入は中央値よりも40%近く高かった =)。
ユーザーを教育する立場にありますか?その場合は、最も正確な「中央値」を使用し、サイドバー、ツールチップ、または簡単な言葉でWordを定義するリンク情報を提供します。
それ以外の場合は、扱うデータの種類に応じて、別の用語を検討することができます。グラフィックで使われるラベルとして「ミッドポイント」が好きです。それは、特に状況によっては明確になることがあります。また、何かを「ミドルスコア」(または同様のもの)としてラベル付けすることもできます。
ユーザーに完全な文章で話している場合は、さらによく理解されている50%の概念を使用できます。つまり、「米国の人口の50%は、49,777ドル以下の年収を稼いでいます。」
これがよりカジュアルな統計の場合は、「一般的に」または「一般的に」という語句の使用を検討してください。つまり、「ユーザーは通常、アンケートに回答するまでに48秒ほどかかります。」
ユーザーが選択するときに簡単な説明を含めることができますか?このようなもの:
これはユーザーでテストする必要があると思います!
十分な面積がある場合は「平均(中央値)」という用語を使用しますが、ユーザーに質問しやすい場合は、それを最初に実行します。
必要なデータを表示する数学を使用し、適切な用語を使用するだけでなく、おそらく長い名前を説明または使用します。
平均は、私にとって算術平均です。私はこれは地域的だと思うので、Average(a + b + c/3)または平均を地域ごとに調整するか、ロングネーム算術平均を使用する場合。
Medianを使用していて、ユーザーが心配な場合は、よりわかりやすい別の名前を付けてください。道路の中央にも中央分離帯があるため、中央分離帯は常に簡単な概念でした。
中央値に使用できるその他の用語
中央値を理解している人としての唯一の問題は、偶数の数値では中央値を計算する必要があることです。
1、5、9、中央値は5です。
1 5 9 15その場合、中央値は(5 + 9)/ 2または7です。グランドスキームでは、それは小さな違いですが、中点と呼ばれ、データシリーズに7がないことに気付いた場合、気になる。
しかし、技術者でない人はおそらくこれらの詳細を完全に読み飛ばすでしょう。そのため、大多数が中間数のようなものを理解するなら中央値よりも優れているが、中央値を使用するようにマークアップします*(おそらくアスタリスクと注記を付けて)が簡単に理解できるように、*はおおよその数、または計算された中央値を表します。
わかりやすい「平均」という言葉が使えます。中央値という用語はそれほど簡単ではありません。使用する場合は、説明を添付する必要があります。説明は、単純/初心者/非数学ユーザーに理解される場合と理解されない場合があります。
(あなたが考えているように)人を欺く代わりに、より技術的な用語よりも単純な用語が使用されれば素晴らしいでしょう。ユーザーは、よりユーザーフレンドリーで理解しやすいシステムの使用に明らかに関心があります。
あなたの聴衆は誰ですか?それは、それが一般市民向けか、たとえば学者向けかによって異なります。
なぜ平均値を表示して、実際に平均値にできないのですか?
ほとんどの人は平均値や中央値を知らないだろうと思います。どちらかを表示する必要がある場合は、ツールヒントまたは用語の意味のある種の説明が必要になると思います。しかし、繰り返しますが、それはあなたの聴衆に依存します。
一般的な聴衆に対して専門用語(専門用語)を使用しないでください。プライマリラベルとして平均を使用します。使用している平均のタイプに関する詳細情報を入手したい場合、一般的な解決策は括弧、またはアスタリスクと脚注です。
例えば平均(中央値)。
例えば平均*
ユーザーに質問してください! :)
一部の「技術者以外の消費者」に、「中央値」という用語を理解しているかどうかを尋ね、何人の人がそれを取得するか、取得しないかを把握します。
理解できない人が十分にいる場合は、この用語を初めて使用するときに簡単な説明を含めてください。
PeterLのアドバイスに同意しません。読者が用語の理解に基づいて探しているものを知っていると想定しないでください。