平均値を使っていい時と、いけない時（アンケート結果と等間隔性）

前回に引き続き、平均値を出発点に、
アンケート項目を構成する際の注意点について議論したい。

前回：平均値を使っていい時と、いけない時（変数・尺度の種類と使用できる分析手法）

得点付け評価

例えば、ある評価対象について、
どれくらい好きか、あるいは、どれくらい嫌いかを評価させたい時に、
いくつかの言葉から適切なものを選択したり、数直線上の目盛りを選択したりする方法がある。
例えば、SD法はその代表的な評価手法である。

SD法は、意味の対立する形容詞を数直線の両端に置き、
評価対象が当てはまる位置を選択することで、
評価対象の持つ「意味の差（Semantic Differential）」を明らかにすることを
目的に、オスグッドにより提案された評価手法である。
（原著(Osgood, 1957)はPDFで一般公開されています。）

オリジナルのSD法では、両端の単語の間の数直線には、
等間隔で目盛りが付されているだけの、シンプルなものである。
これだけであれば、採点者はこの評価項目を少なくとも間隔尺度とみなすことができるだろう。
（もしかしたら比例尺度とみなすかもしれない。）
となると、この「オリジナルの」SD法で得られた結果に対しては、
平均を算出することに統計的意味があることになる。

さて、世の中の得点付け評価の中には、
両端の他に、各目盛りに形容詞などの単語を添えているものもある。
こうなってくると、一概に間隔尺度と言えなくなってくる。
例えば、好きか嫌いかを評価するときに、5つの目盛りを付して
「すごく嫌い」「嫌い」「どうでもいい」「好き」「すごく好き」
と単語を添えたとしよう。

この時、
「どうでもいい」と「好き」の間隔と、
「好き」と「すごく好き」の間隔は、
果たして同じなのだろうか。

これについては、実はいくつか研究があり、規格も存在している。

研究については、SD法が発明された当初から行われている。
例えば織田は、一対比較法に用いる形容詞表現について実験的研究を行い、
評価尺度を作成する際のガイドラインを提案している。
（原著(織田, 1970)はPDFで一般公開されています。）

一方で、関連規格として、
ISO11056:1999があり、日本ではこれを反映させたJIS Z9080:2004がJISになっています。
JISでは、形容詞の例として、

9: 最も快い
8: かなり快い
7: 少し快い
6: わずかに快い
5: 快いとも快くないともいえない
4: わずかに不愉快である
3: 少し不愉快である
2: かなり不愉快である
1: 最も不愉快である

が挙げられている。

また、注釈として、

これらの尺度は，等間隔であるという前提のときだけ間隔尺度である。等間隔でない場合には，順序尺度とみなすべきであるし，また，そう扱わなければならない（7.6.4 参照）。
（中略）
7.6.4　結果の表現パネルを構成している各評価者からの結果（得点）が得られたら，頻度分布及び中央値の計算によってこれらの結果を統計解析することができる。

とあり、JISにも明確に「等間隔性が担保できないなら、解析は頻度分布や中央値を使って」とあり、暗に平均を使ってはいけないと読み取ることもできる。

間隔尺度と主張するために

前回の記事において、
データ収集者は、解析の幅を広げる目的で、順序尺度よりも間隔尺度を採用したい
ということを書いた。
この方法として、例えば井上は、
各目盛りに形容詞とは別に数字を記す
ことを提案している。
また、使用する副詞についても、段階別に提案しており、
形容詞を定める際には、この文献に一度は目を通しておくべきであろう。
（原著(井上, 2002)はこのWebサイトで一般公開されています。）