Thumbnail of post image 200

テキストマイニング

こんにちは。前回のクラスタリングをやってみて、用いる距離を変えてみたり、クラスタリングの方法を変えてみたらどうなるのか、とても気になってしまいました。 そんなこんなで、手当たり次第 ...

Thumbnail of post image 077

テキストマイニング

こんにちは。まだまだテキストマイニングをやってみることにします。 今回はクラスタリングです。(アイキャッチ画像がぶどうなのは、「クラスター」が房という意味なので、ぶどうの房の画像を ...

Thumbnail of post image 184

テキストマイニング

こんにちは。まだまだテキストマイニングを続けることにします。そして、まだまだ梶井基次郎作「檸檬」を題材にします。 共起ネットワークを描いてみる 前回は、共起語を調べてみました。 そ ...

Thumbnail of post image 117

テキストマイニング

こんにちは。 まだまだテキストマイニングをやってみることにします。 共起語・コロケーションについて 突然ですが、「目薬を〇〇」、「辞書を□□」 この伏字になっているところに、どのよ ...

Thumbnail of post image 030

テキストマイニング

こんにちは。引き続き、梶井基次郎作品を使ってテキストマイニングをしていきます。 今回はTF-IDFを求めてみます。 以前、TF-IDFについてこのような投稿をしていました。 高校で ...

Thumbnail of post image 188

テキストマイニング

こんにちは。前回に続き、N-gramを取り上げます。 RMeCabには、N-gramをする関数がいろいろあるので、今回は試してみます。 Ngram関数を使ってみる このNgram関 ...

Thumbnail of post image 182

テキストマイニング

こんにちは。今回はRでN-gramを試してみます。 N-gramについては、以前Pythonを使って書いた記事があるのでリンクを貼っておきます。 N-gram(1)|情報科 いっぽ ...

Thumbnail of post image 007

テキストマイニング

こんにちは。前回に続いて R でテキストマイニングを試してみることにします。 前回までの問題点 前回はとりあえず、Rで形態素解析をし、形態素ごとの頻度を数えてみました。 Rでテキス ...

Thumbnail of post image 171

テキストマイニング

こんにちは。なかなかまとまったことができないので、何回かに分けて少しずつまとまったことをやっていきたいと思います。 しばらくの間、Rを使ったテキストマイニングを試してみることにしま ...

Thumbnail of post image 170

グラフ

こんにちは。この記事がちょうど月末の投稿になるので、「グラフを描いてみる」シリーズをあと1回続けることにします。 今回はバイオリンプロットです。少し前に箱ひげ図を描いてみました。 ...

Thumbnail of post image 033

グラフ

こんにちは。前回に引き続き散布図行列を描いてみます。 前回はPythonでしたが、今回はRです。 ライブラリをいろいろインストールしてよくわからなくなってしまっていますが、もしかし ...

Thumbnail of post image 194

グラフ

こんにちは。今回は度数分布表とヒストグラムを作ってみます。 以下の説明は概略がわかる程度に書いていますので、不正確な部分があれば訂正しますので教えていただけると助かります。 度数分 ...

Thumbnail of post image 069

グラフ

こんにちは。今回は引き続きドットプロットの話です。 ドットプロットって 単に「ドットプロット」で検索すると、このようになります。 ドットプロット なんだか、グラフにドットが混ざって ...

Thumbnail of post image 098

データの活用

こんにちは。PythonでCSVファイルやExcelのファイルの読み書きを前回・前々回に取り上げました。 Rでもデータを扱っていたので、今度はRでCSVやExcelのファイルを読み ...