R でテキストマイニングをやってみた(10)まとめ
こんにちは。この1か月、Rを使ってテキストマイニングをしてみました。 それらを、まとめ、振り返るとともに、感想を書いてみることにします。 単語(形態素)の出現頻度に着目してみた は ...
Rでテキストマイニングをやってみた(9)いろいろクラスタリング
こんにちは。前回のクラスタリングをやってみて、用いる距離を変えてみたり、クラスタリングの方法を変えてみたらどうなるのか、とても気になってしまいました。 そんなこんなで、手当たり次第 ...
Rでテキストマイニングを試してみる(8)クラスタリング
こんにちは。まだまだテキストマイニングをやってみることにします。 今回はクラスタリングです。(アイキャッチ画像がぶどうなのは、「クラスター」が房という意味なので、ぶどうの房の画像を ...
Rでテキストマイニングを試してみる(7)共起ネットワーク
こんにちは。まだまだテキストマイニングを続けることにします。そして、まだまだ梶井基次郎作「檸檬」を題材にします。 共起ネットワークを描いてみる 前回は、共起語を調べてみました。 そ ...
Rでテキストマイニングを試してみる(6)共起語
こんにちは。 まだまだテキストマイニングをやってみることにします。 共起語・コロケーションについて 突然ですが、「目薬を〇〇」、「辞書を□□」 この伏字になっているところに、どのよ ...
Rでテキストマイニングを試してみる(5)TF-IDF
こんにちは。引き続き、梶井基次郎作品を使ってテキストマイニングをしていきます。 今回はTF-IDFを求めてみます。 以前、TF-IDFについてこのような投稿をしていました。 高校で ...
Rでテキストマイニングを試してみる(4)N-gramの比較
こんにちは。前回に続き、N-gramを取り上げます。 RMeCabには、N-gramをする関数がいろいろあるので、今回は試してみます。 Ngram関数を使ってみる このNgram関 ...
Rでテキストマイニングを試してみる(3)N-gram
こんにちは。今回はRでN-gramを試してみます。 N-gramについては、以前Pythonを使って書いた記事があるのでリンクを貼っておきます。 N-gram(1)|情報科 いっぽ ...
Rでテキストマイニングを試してみる(2)ストップワードとワードクラウド
こんにちは。前回に続いて R でテキストマイニングを試してみることにします。 前回までの問題点 前回はとりあえず、Rで形態素解析をし、形態素ごとの頻度を数えてみました。 Rでテキス ...
Rでテキストマイニングを試してみる(1)単語の出現頻度
こんにちは。なかなかまとまったことができないので、何回かに分けて少しずつまとまったことをやっていきたいと思います。 しばらくの間、Rを使ったテキストマイニングを試してみることにしま ...
バイオリンプロットをプログラムで描いてみる
こんにちは。この記事がちょうど月末の投稿になるので、「グラフを描いてみる」シリーズをあと1回続けることにします。 今回はバイオリンプロットです。少し前に箱ひげ図を描いてみました。 ...
翔んで埼玉な県知事選挙が終わったので、もう一度コロプレス図を描いてみたよ
こんにちは。前回に続き、コロプレス図を描くことにします。 今回は、Rで描いてみます。 Rで検索したときに行き着くサイトは 結構な確率で三重大学の奥村先生のページのような気がします。 ...
コロプレス図で埼玉の投票率を描いてみたけど、翔んで埼玉な県知事選挙の投票率はどうなることやら
こんにちは。これまで小学校から学ぶグラフをプログラムで描いていましたが、今回は違うネタで書くことにします。 今回は「コロプレス図」。聞きなれない名前かもしれませんが、要するに地図を ...
散布図ではなくて散布図行列を描いてみます(2)
こんにちは。前回に引き続き散布図行列を描いてみます。 前回はPythonでしたが、今回はRです。 ライブラリをいろいろインストールしてよくわからなくなってしまっていますが、もしかし ...
散布図ではなくて散布図行列を描いてみます(1)
こんにちは。今回は散布図を描くことにします。 たまたま調べた2項目間の関係を見るのでは不十分です。(と力説され、今は完全にそう思っています。) ということで、散布図ではなく、散布図 ...
高校でのデータの活用を確認しておきましょう
こんにちは。これまで、新学習指導要領における小学校算数・中学校数学での「データの活用」分野の学習内容を確認してきました。 これまでと同じように、高校での内容を学習指導要領をもとに確 ...
箱ひげ図をプログラムで描いてみる
こんにちは。中学校で学習することになった箱ひげ図をプログラムで描いてみます。 Python + matplotlib で描く箱ひげ図 これまでと同じあやめのデータで箱ひげ図を描いて ...
箱ひげ図は中学校の内容になるんです
こんにちは。前回までは,小学校算数に載っている「データの活用」領域の内容について取り上げました。 今回から,中学校数学での「データの活用」領域を取り上げることにしていきます。 学習 ...
度数分布表とヒストグラムを作ってみる
こんにちは。今回は度数分布表とヒストグラムを作ってみます。 以下の説明は概略がわかる程度に書いていますので、不正確な部分があれば訂正しますので教えていただけると助かります。 度数分 ...
ドットプロットを描こうと思ったら、さらに大変だった(2)
こんにちは。今回は引き続きドットプロットの話です。 ドットプロットって 単に「ドットプロット」で検索すると、このようになります。 ドットプロット なんだか、グラフにドットが混ざって ...