統計ER

統計ソフトRの使い方を中心に、統計解析方法の解説をするブログ。ありそうでなかなか見つからないサンプルサイズ計算などニッチな方法について紹介しています。

統計ソフトRで行列の数字を見やすくする方法とは?

Toukei Consul Banner

KH Coder Consul Banner

統計ソフトRのsymnum()という関数は、 数字をシンボルに変換して、 表示してくれる。

マトリックスになっている結果の場合、 数字をシンボルに変換すると、 視覚的に見やすくなり威力を発揮する。

相関係数行列で試してみる

longleyという相関の高い変数を多く含む、 マクロ経済のデータを使って、 相関係数マトリックスの結果をシンボルで見やすくしてみる。

CI <- cor(longley)

結果はこのように表示される。

> CI
             GNP.deflator       GNP Unemployed Armed.Forces Population      Year  Employed
GNP.deflator    1.0000000 0.9915892  0.6206334    0.4647442  0.9791634 0.9911492 0.9708985
GNP             0.9915892 1.0000000  0.6042609    0.4464368  0.9910901 0.9952735 0.9835516
Unemployed      0.6206334 0.6042609  1.0000000   -0.1774206  0.6865515 0.6682566 0.5024981
Armed.Forces    0.4647442 0.4464368 -0.1774206    1.0000000  0.3644163 0.4172451 0.4573074
Population      0.9791634 0.9910901  0.6865515    0.3644163  1.0000000 0.9939528 0.9603906
Year            0.9911492 0.9952735  0.6682566    0.4172451  0.9939528 1.0000000 0.9713295
Employed        0.9708985 0.9835516  0.5024981    0.4573074  0.9603906 0.9713295 1.0000000

相関係数行列をシンボルでコードしなおすとどうなる?

シンボルでコードし直して見てみる。

symnum(CI)

とてもシンプルでわかりやすくなる。

0.95から1の間はB
0.6から0.8の間は ,
0.3から0.6の間は .

というシンボルで表現されている。

列方向の変数名を自動で省略してくれているのも、 見やすくなっている理由。

ざっくり傾向を確認するには、 こちらのほうが見やすい。

> symnum(CI)
             GNP. GNP U A P Y E
GNP.deflator 1                 
GNP          B    1            
Unemployed   ,    ,   1        
Armed.Forces .    .     1      
Population   B    B   , . 1    
Year         B    B   , . B 1  
Employed     B    B   . . B B 1
attr(,"legend")
[1] 0 ‘ ’ 0.3 ‘.’ 0.6,0.8+0.9*0.95 ‘B’ 1

まとめ

統計ソフトRのsymnum()という関数を使うと、行列内の数値の大小がわかりやすい、シンボルで表示させた行列に変換できる。

よければお試しあれ。