ホームに戻る

EXCELによる数量化2類例題

 判別分析の例題は、説明変量が量的データであり、目的変量が質的データであった。この表を元にして、説明変量において、6点以上を該当あり、5点以下を該当無しとして新しい表を作成する。この新しく作成された表はすべて質的データであるから、数量化2類の分析を実施する。

 判別分析で使用した表

NO

1

礼儀

2

積極性

3

強調性

4

業界区分

1. 数量化2類分析用に質的データの表にする。

6点以上を該当有り:「1」 5点以下を該当無し:「0」 A業界:「1」 B業界:「2」とする。

NO

1

礼儀

2

積極性

3

強調性

Y

業界区分

 

有り

無し

有り

無し

有り

無し

 

 新しく作成した表を見ると、説明変量X2と目的変量Y11で対応状態となっている。このままでは変量X2さえあれば、他の変量はいらないということになるので、X2の変量を削除する。説明変量X1X3と目的変量Yの表

 

礼儀:

X1

協調性:

X3

業界区分

 

有り

無し

有り

無し

 

標本

X11

X12

X31

X32

Y

1

0

1

0

1

1

2

1

0

1

0

2

3

1

0

1

0

1

4

1

0

0

1

1

5

1

0

0

1

2

6

0

1

0

1

1

7

1

0

1

0

2

8

1

0

1

0

2

 

上の表のデータを元にして数量化2類の分析を実施する。

X11X31の成分を取り除き、業界区分をキーとして昇順にソートし、2群に分ける。

さらに各群の小計と2群の合計を求めると以下の様な表になる。

 

 

 

 

 

 

 

 

 

 

 

 

 


2. 上の表を元に線形判別式を求める。

 

 

 

 

 

 

 

 

 

 


とすると

  

 

  (0.25−η2 )(0.125−η2)0.25×0.125=0

  η2= 00.375

分散比(η2)は0で最小となり、0.375で最大となる。

 

以上から  a12  0.894     a32 = 0.447

線形判別式は、Y 0.894X12 + 0.447X32

この式を基準化すると、Y 0.2235X110.6705X120.2235X310.2235X32

この判別式を使用して予測値(Y')を求める。さらに求めた予測値の標準偏差を求め、各予測値を割って標準化(平均:0 標準偏差:1)する。さらに標準化された予測値の各群の平均値を求める。

 

 

礼儀

 

協調性

 

業界区分

 

 

 

 

有り

無し

有り

無し

 

予測値

標準化

 

標本

X11

X12

X31

X32

Y

Y'

Y'

各群平均

1

0

1

0

1

1

0.894

1.52753

 

3

1

0

1

0

1

-0.447

-0.7638

 

4