
4. EXCELによる判別分析例題
ある会社を訪問してきた他社の社員(A業界社員とB業界社員)について、その印象について、10点評価をつけたのが下の表である。A業界社員とB業界社員間で印象に違いがあるかどうか調べる。
|
NO |
X1 礼儀 |
X2 積極性 |
X3 強調性 |
X4 業界区分 |
|
1 2 3 4 5 6 7 8 |
3 8 6 8 7 4 6 7 |
8 2 7 6 3 7 3 5 |
4 6 6 4 5 3 6 8 |
A B A A B A B B |
※各点は、10(良)〜0(悪) の10点評価値。業界区分はA業界とB業界の2社
上の表をもとにして、判別分析を実施してA業界とB業界の社員間で印象が違うかどうか調 べる。A業界を「1」・B 業界を「2」と質的区分データに置き換える。文字データから質的数値データに置き換えたデータを使用して判別分析を実行する。
|
NO |
X1 礼儀 |
X2 積極性 |
X3 強調性 |
X4 業界区分 |
|
1 2 3 4 5 6 7 8 |
3 8 6 8 7 4 6 7 |
8 2 7 6 3 7 3 5 |
4 6 6 4 5 3 6 8 |
1 2 1 1 2 1 2 2 |
判別分析を実施するには、まず分析するデータを入力して。1ケースあたりの変数はX1〜X4であり、NO1〜NO8 までの8ケース分のデータがある。分析用データ入力後、判別分析を実施する。
4.1 判別分析の実施
ボックスM検定を実施し、線形判別式で区分するか、マハラノビスの距離を用いて判別するかを決定する。
ボックスM検定は、群分けした時の2群の母分散共分散が等しいかどうかの検定である。ボックスM検定の結果2群の母分散共分散が等しければ、2群は線形判別式で区分することができる。2群の母分散共分散が等しくなければマハラノビスの距離による判別分析を実施する。
4.1.1 群1(A業界)・群2(B業界)それぞれの分散・共分散を求める
不偏分散は、Σ (Xi−
)2 不偏共分散は、Σ (Xi−
)(Xj−)
プール後の分散共分散は次式より求める。

4.1.2 検定統計量をχ2 として、この検定統計量を求める。
群1(A業界社員)の分散共分散行列をS1、標本数をn1、群2(B業界社員)の分散共分散行列をS2、標本数をn2、またプールした分散共分散行列をS、変量数をpとすると

行列式の値は、=MDETERM(範囲)で求める。ただし正方行列に限る
以上関数を使用して求めた値を整理すると

loge(数値)の値は、関数を使用して=LN(値)で求める。
loge9429.875 = 9.151638

4.1.3 検定を実施
帰無仮説:H0 :2群の母分散共分散は等しい
対立仮説:H1 :2群の母分散共分散は等しくない

χ2 < χ26 (0.05) であり、棄却域に入らない。よって仮説H0:(2群の母分散共分散は等しい)を棄却できない。2群の母分散共分散行列は等しくないとはいえない。よって2群を、線計判別式で分ける。
4.2 線形判別式を求める。
4.2.1 分散共分散行列を求める。

4.2.2 群1と群2の各変量の平均値の差をとる
以上から
2.79166・a1 − a2 + 0.45833・a3
=−1.75
−a1 + 1.125・a2
+ 0.625・a3 = 3.75
0.45833・a1 + 0.625・a2 + 1.58333・a3
= −2
(ただしa1・a2・a3 は変量X1・X2・X3 の各係数)
上の計算をEXCELの計算機能を使用して求める。
プール後の分散共分散行列Sと、平均の差の行列を入力する。

分散共分散行列の逆行列を求める。
先頭の値を=MINVERSE(行列範囲)で求める。

先頭の値が求まったら、そこから逆行列を求める範囲をドラッグし、次に数式バーをクリックした後、CTRLキー+SHIFTキー+ENTERキーを押して、配列式を完成する。


求まったSの逆行列(S-1)と平均の差の行列の積を求める。
先頭の値を=MMULT(行列1範囲,行列2範囲)で求める。

行列積を求める範囲をドラッグした後、数式バーをクリックし、CTRLキー+SHIFTキー+ENTERキーを押して配列式を完成する。
これより
a1=4.605 a2=11.36 a3 =−7.08
よって線形判別式は、Y=4.605・X1+11.36・X2−7.08・X3−49.25
4.3 判別分析における2群の母平均の差の検定を実施