web-dev-qa-db-ja.com

リッカート尺度のすべての質問に同じラベルが必要ですか?

リッカート尺度を使用するUX調査を準備しています。

個人的には、次のようなすべての質問/項目に同じラベル設定を使用したいと思います。

1. Strongly disagree
2. Disagree
3. Neither agree nor disagree
4. Agree
5. Strongly agree

現在、これは共同作業であるため、私の同僚の何人かは、異なるラベル(タスクの頻度など)を使用し、時には異なる順序で使用する質問を追加しています。

私の直感は、すべての選択肢のラベルが調査全体でまったく同じになるように質問を編集する必要があるということです。

または私はあまり気にしませんか?

3
majimekun

同じ順序であることは重要です。調査全体で同じスケールと順序にする必要があります。それ以外の場合は、ユーザーが答えていることをユーザーが理解しているかどうか確信が持てません。

4点のリッカートスケールで偶数の回答オプションを使用して、ユーザーが質問に対して積極的な立場を取るように強制することを検討します。途中の「どちらでもない」のオプションは、「わからない」または「意見がない」という回答として使用できます。 4ポイントスケールでは、これらのオプションの1つを追加して、ユーザーが何を言っているかをより明確にすることができます。これにより、調査結果がより有効になります。

5ポイントまたは4ポイントはあなたの決定ですが、どちらを使用するかを決定します。

3
Benny Skogberg

情報に関しては、回答される質問に適切に関連付けられる値のスケールを持つことが理想的です。たとえば、「どれくらいの頻度で運動しますか?」 「毎日、週に2回、月に2回、まれに」という選択肢を読者に与えることは、読者にとって理にかなっています。どこでも同じオプションを使用するために質問を書き直すことは避けてください。

使いやすさに関しては、情報の一貫した順序を維持することが重要です。ユーザーは、質問に答えるとすぐにこれに慣れます。質問の言い方と与えられたオプションのリストに応じて、ユーザーは最初の質問が常に「最大」(非常に同意する/毎日/非常に難しい)であり、最後の質問が常に「最小」(非常に同意しない/まれ/非常に簡単)-実際の情報を読む前に。逆の場合もありますが、質問全体で一貫している必要があります。

人々は通常、選択肢を読む前に、質問自体から答えを決定し、次に、自分が考えていたものと最も一致するものをリストから選択します。

2
pushpoth

いいえ、同じ回答スケールを使用する必要はありません。

調査では、さまざまな変数を測定しています。各変数は、いくつかのメトリックによって測定されます。 使いやすさはメトリック学習性使いやすさなどで測定できます。異なるメトリックは異なるユニットを持つことができます。これは、時間を秒で測定し、距離をメートルで測定する物理学の場合とそれほど変わりません。

自己報告型変数を使用しているため、一部のメトリックに関する情報を取得する方法については、少し余裕があります。 「使い方がわからなくなった」という質問に「たくさん」から「まったくない」まで、または「使い方が難しかった」と答えて、 「まったくそう思わない」から「非常にそう思う」までのスケール。 2つのスケールを同等にできる限り*、最終的な情報に違いはありません。メートルまたはヤードで距離を測定するかの選択に似ており、そこから同じ情報が得られます。

同じメトリックを同じ方法で測定する必要があります。つまり、1年間隔で2つの調査を行う場合、最初の調査に1つの尺度を選択し、2番目の調査にもう1つの尺度を選択すると、調査間の結果の比較可能性が大幅に低下します。しかし、変数間では、そのような問題はありません。タスクの頻度(時間単位ごとの繰り返しで測定されます)と次のような固有の比較可能性はありません。学習可能性(単位のない序数測定で測定されます)、または単位のない序数測定で測定された異なるメトリック間。したがって、さまざまなスケールでさまざまなメトリックを測定しても問題はありません。比較可能性の点で何も失うことはありません。評価の観点から、同じスケールを使用する理由はまったくありません。

次に、ユーザーの質問があります。異なるスケールを使用している場合、それらを混同しますか?これが起こるとは思わない。私自身の研究でそれが起こるのを見たことがありません。世界には他の例もたくさんあります。私のお気に入りのスーパーマーケットでは、キウイフルーツを1個ずつ、オレンジを1 kgずつ、卵を6個入りパッケージで、チーズを任意のサイズのパックで販売しています。これで混乱する顧客はいません。私たちはいつも異なるものに異なるユニットを使用することに慣れています。アンケートでも同様です。さまざまなものを測定しているので、異なるスケールで測定しても、混乱することはありません。

[*]スケールを同等にすることについて:同意する-同意しないスケールは、より直接的なスケールよりも表現力が弱い場合があります。あなたの製品のいくつかの属性の現在のレベルに対するユーザーの意見を測定している場合、それは悪いことです。たとえば、「ニュースレターの長さについてどう思いますか」と質問すると、「ニュースレターがちょうど良いと感じています」と表現するよりも、「長すぎる」から「短すぎる」までの範囲で表現できます。そして、同意-不同意の尺度があります。

2
Rumi P.

(はい、私は見本市に遅れましたが、おそらく将来誰かがこれが役立つと思うでしょう)

リッカート尺度を使用する場合は、固視反応が得られないように両端を反転させます。

しかし、より良いアプローチは、あなたがそれを行う方法ではなく、あなたがしようとしているwhatの観点から考えることです。バウハウスの口述を覚えておいてください:フォームは機能に従う。 「何を」をしっかりつかむと、「どうやって」が明らかになるかもしれません。

LikertとOsgood( "Semantic Differential")の両方のスケールは、fuzzy評価を利用しようとします。非バイナリ評価。そして、どちらも回答者に連続体を提示します。

連続体に明らかに連続ポイントがある場合、リッカート尺度が機能します。ただし、ポイントが実際に隣接しており、ギャップもオーバーラップもないことを確認してください。 Pushpothの運動の例は、選択肢がnot連続している例です。不規則に運動している場合、その人は何をマークする必要がありますか?または週3回?現実を反映しない答えを選ばなければならないのはかなりイライラします!そしてもちろん、データから引き出そうとするいかなる結論も無意味です。

中間ステップを連続させることができない場合は、代わりにOsgood(SD)スケールを検討してください。中間点にはラベルが付いていません。

0
MMacD