散布図ではなくて散布図行列を描いてみます(2)

グラフ

こんにちは。前回に引き続き散布図行列を描いてみます。

前回はPythonでしたが、今回はRです。

ライブラリをいろいろインストールしてよくわからなくなってしまっていますが、もしかしたら、ライブラリのインストールが必要な場合があるかもしれません。

とりあえず散布図行列を描いてみる

とりあえず散布図行列を描いてみます。

プログラムです。

pairs(iris)

このプログラム(?)で描いた散布図行列です。

ちょっと見にくいかな・・・

psych ライブラリを使ってみる

次に psych というライブラリを使って描いてみます。

library(psych)
psych::pairs.panels(iris)

これにより、散布図行列だけでなく、ヒストグラムも描け、さらに相関係数も求まります。

相関行列のヒートマップを描いてみる

前回、相関行列のヒートマップをPythonで描いたので、今回はRで描いてみます。

library(GGally)
ggcorr(iris[,-5],label = TRUE,label_round = 2)

このプログラムで次のようなヒートマップを描くことができます。

品種ごとに散布図行列を描いてみる

前回と同じ展開ですが、やはりirisのデータには3つの品種が混ざっているので、品種ごとに区別して散布図行列を描いてみることにします。

library(GGally)
ggpairs(iris,aes_string(colour="Species"))

これにより、次のような散布図行列を描くことができます。

散布図行列だけでなく、それぞれの値の箱ひげ図やカーネル密度分布のグラフを描いてくれたり、相関行列(しかも品種ごとにも!)を求めてくれたりと多機能です。

PythonやRなら散布図行列が簡単にたったの数行のプログラムで描けるんです!

Excelで散布図行列を描くのは、メチャメチャ面倒なんです。

RやPythonをちょっとだけでも使えるようにしましょうよ!

しかし、まったく別の話ですが、見分け方の説明を読んだのですが、あやめと花しょうぶとかきつばたの区別がつきません。実物を見てみないとダメかな・・・来年、見に行くことにしようと思います。

今回はこれでおしまいにします。

それではまた。

Posted by 春日井 優