バイオリンプロットをプログラムで描いてみる
data:image/s3,"s3://crabby-images/9d977/9d977a9501f8b122a98a254816f8f6a0b5aff0fa" alt=""
こんにちは。この記事がちょうど月末の投稿になるので、「グラフを描いてみる」シリーズをあと1回続けることにします。
今回はバイオリンプロットです。少し前に箱ひげ図を描いてみました。
箱ひげ図は、最大値・最小値・四分位数がわかるような、とても工夫されたグラフだと思います。
しかし、データの分布が見えにくくなってしまっているように思います。
そこで、バイオリンプロットというグラフを描いてみることにします。
どのようなグラフかは、見た方が早いので実際に描いてみます。
目次
Python + seaborn + matplotlib で描くバイオリンプロット
はじめに、seabornを使って描いていきます。
import seaborn
import matplotlib.pyplot
iris = seaborn.load_dataset( 'iris' )
seaborn.violinplot( x=iris['species'], y=iris['sepal_length'] )
matplotlib.pyplot.show()
このプログラムで、次のようなグラフが描けます。
data:image/s3,"s3://crabby-images/3bffb/3bffbedf543b23379dbaae399ab257d61de53663" alt=""
Python + seaborn + matplotlib でバイオリンプロットを工夫してみる
上のバイオリンプロットでは、四分位数がわからなくなっているので、表示してみます。
そのプログラムです。violinplotのパラメータに inner="quartile" を付けました。
import seaborn
import matplotlib.pyplot
iris = seaborn.load_dataset( 'iris' )
seaborn.violinplot( x=iris['species'], y=iris['sepal_length'], inner="quartile" )
matplotlib.pyplot.show()
次のようなグラフになります。
data:image/s3,"s3://crabby-images/138b5/138b5cddb672e155529df8521391c40a6f6543e9" alt=""
さらに、元のデータの分布をドットで表示するスウォームプロットを追加してみます。
(バイオリンプロットの色はグレーにしました。)
import seaborn
import matplotlib.pyplot
iris = seaborn.load_dataset( 'iris' )
seaborn.violinplot( x=iris['species'], y=iris['sepal_length'], inner="quartile", color="0.85" )
seaborn.swarmplot( x=iris['species'], y=iris['sepal_length'] )
matplotlib.pyplot.show()
出来上がったグラフです。
data:image/s3,"s3://crabby-images/7a9b9/7a9b9ae185585be9fdfffd9abfe8eeb592ff7e7e" alt=""
R で描くバイオリンプロット
次にRで描いてみます。ggplot2 を使います。
library( ggplot2 )
data( iris )
v <- ggplot( iris, aes( x= Species, y=Sepal.Length, color=Species )) +
geom_violin()
plot(v)
次のようなグラフが描けます。
data:image/s3,"s3://crabby-images/b0189/b018947799335eb10a5d0a64f33ccd3845b95cc5" alt=""
箱ひげ図を重ねてみます。
library( ggplot2 )
data( iris )
v <- ggplot( iris, aes( x=Species, y=Sepal.Length, color=Species )) +
geom_violin() +
geom_boxplot( width=0.2 )
plot(v)
data:image/s3,"s3://crabby-images/96427/96427f0bb325e3715377b38893ee1649a73d36e3" alt=""
さらにビースウォームを重ねてみます。
library( ggplot2 )
data( iris )
v <- ggplot( iris, aes( x= Species, y=Sepal.Length, color=Species, trim=FALSE )) +
geom_violin() +
geom_boxplot(width=0.2) +
geom_point( position=position_jitter( width=0.05, height=0 ), color="black", stackdir="center" )
plot(v)
data:image/s3,"s3://crabby-images/d5e7f/d5e7f6aca12ad64e62c684fa530b83102053160e" alt=""
今回はこれでおしまいにします。それでは、また。
ディスカッション
コメント一覧
まだ、コメントがありません