ANA国内線【PR】
06-06-26
# by ryu9dai | 2006-06-26 13:44
Cluster Analysis
簡単な応用

要素Aと要素Bの距離(近親度)の定義と計測

主成分得点
座標(第1主成分、第2主成分)

座標間のユークリッド距離を求め、親近度の指標を定義する。

ユークリッド距離の応用:クラスター分析

data test;
input lab$ x y;
cards;
A41
B24
C57
D52
E34
F65
G26
H72
;

proc cluster method=single data=test;
var x y;
id lab;
proc tree hor space=2 pos=70;
id lab;
run;


//////////////////////////////////////
data cldat1;
input subj$ x;
cards;
A 2
B 3
C 8
D 10
E 11
F 15
G 18
;








proc cluster method=single data=cldat1;
var x;
id subj;
proc tree hor space=2 pos=70;
id subj;
run;

proc tree graphics;
id subj;
run;

proc tree graphics horizontal;
id subj;
run;
# by ryu9dai | 2006-06-11 21:46
2006-06-11
1985Pro.Central.Pitcher

data baseball;
input name $ x1 x2 x3 x4 team $;
label x1="勝数"
x2="投球回数"
x3="試合数"
x4="奪三振数"
;
cards;
小松 17 210.3 33 172 中
川端 11 162.3 45 109 広
斎藤 12 155.0 41 124 洋
遠藤 14 214.3 28 154 洋
郭 11 230.3 34 157 中
北別府 16 199.0 35 85 広
西本 10 169.6 33 66 巨
大野 10 161.6 32 86 広
鈴木 8 151.3 28 66 中
梶間 11 189.6 38 88 ヤ
ゲイル 13 190.6 33 126 神
関根 6 160.3 38 66 洋
川口 9 143.6 31 116 広
尾花 11 205.0 40 107 ヤ
池田 9 151.6 32 82 神
高野 7 141.3 29 110 ヤ
欠端 9 152.6 28 77 洋
江川 11 167.0 30 117 巨


proc princomp data=baseball out=pit;
var x1-x4;
run;

proc print data=pit;
run;

proc gplot data=baseball;
plot x1*x2;
plot x1*x3;
plot x1*x4;
plot x2*x3;
run;

data tplot;
merge baseball pit;
text=put(name,6.);

proc print data=tplot;
run;

data tplot;
set tplot;
y=prin1;
x=prin2;
ysys="2";
xsys="2";
text=put(name,6.);

proc gplot data=pit;
symbol1 v=none;
plot prin1*prin2=1/annotate=tplot href=0 vref=0;
plot prin1*prin3/;
plot prin2*prin3;
run;
# by ryu9dai | 2006-06-11 21:39
< 前のページ 次のページ >



ryukyu9dai

by ryu9dai
カテゴリ
以前の記事
お気に入りブログ
最新のコメント
メモ帳
最新のトラックバック
ライフログ
検索
おすすめキーワード(PR)
ファン
XML | ATOM

skin by excite