
R でテキストマイニングをやってみた(10)まとめ
こんにちは。この1か月、Rを使ってテキストマイニングをしてみました。 それらを、まとめ、振り返るとともに、感想を書いてみることにします。 単語(形態素)の出現頻度に着目してみた は ...

Rでテキストマイニングをやってみた(9)いろいろクラスタリング
こんにちは。前回のクラスタリングをやってみて、用いる距離を変えてみたり、クラスタリングの方法を変えてみたらどうなるのか、とても気になってしまいました。 そんなこんなで、手当たり次第 ...

Rでテキストマイニングを試してみる(8)クラスタリング
こんにちは。まだまだテキストマイニングをやってみることにします。 今回はクラスタリングです。(アイキャッチ画像がぶどうなのは、「クラスター」が房という意味なので、ぶどうの房の画像を ...

Rでテキストマイニングを試してみる(7)共起ネットワーク
こんにちは。まだまだテキストマイニングを続けることにします。そして、まだまだ梶井基次郎作「檸檬」を題材にします。 共起ネットワークを描いてみる 前回は、共起語を調べてみました。 そ ...

Rでテキストマイニングを試してみる(6)共起語
こんにちは。 まだまだテキストマイニングをやってみることにします。 共起語・コロケーションについて 突然ですが、「目薬を〇〇」、「辞書を□□」 この伏字になっているところに、どのよ ...

Rでテキストマイニングを試してみる(5)TF-IDF
こんにちは。引き続き、梶井基次郎作品を使ってテキストマイニングをしていきます。 今回はTF-IDFを求めてみます。 以前、TF-IDFについてこのような投稿をしていました。 高校で ...

Rでテキストマイニングを試してみる(4)N-gramの比較
こんにちは。前回に続き、N-gramを取り上げます。 RMeCabには、N-gramをする関数がいろいろあるので、今回は試してみます。 Ngram関数を使ってみる このNgram関 ...

Rでテキストマイニングを試してみる(3)N-gram
こんにちは。今回はRでN-gramを試してみます。 N-gramについては、以前Pythonを使って書いた記事があるのでリンクを貼っておきます。 N-gram(1)|情報科 いっぽ ...

Rでテキストマイニングを試してみる(2)ストップワードとワードクラウド
こんにちは。前回に続いて R でテキストマイニングを試してみることにします。 前回までの問題点 前回はとりあえず、Rで形態素解析をし、形態素ごとの頻度を数えてみました。 Rでテキス ...

Rでテキストマイニングを試してみる(1)単語の出現頻度
こんにちは。なかなかまとまったことができないので、何回かに分けて少しずつまとまったことをやっていきたいと思います。 しばらくの間、Rを使ったテキストマイニングを試してみることにしま ...

TF-IDFを求めてWordCloudをつくるプログラム(5)
こんにちは。これまで4回にわたり、TF-IDFを求めてWord Cloudをつくるプログラムを説明してきました。今回が最終回になります。 計算結果を出力する部分 149~173行目 ...

TF-IDFを求めてWordCloudをつくるプログラム(4)
こんにちは。前回に続きプログラムの説明です。まだ半分残っているので、今回も枕の話はなしです。 Word Cloudを作る部分 92~120行目では、Word Cloudを作っていま ...

TF-IDFを求めてWordCloudをつくるプログラム(3)
こんにちは。今回は前回の続きで、TF-IDFを求めてWordCloudをつくるプログラムについて、詳細を書いていきたいと思います。プログラムが長いので、枕の話はなしで早速本題に入り ...

TF-IDFを求めてWordCloudをつくるプログラム(2)
こんにちは。今回は前回紹介したプログラムについて、もう少し詳細を書いていきたいと思います。プログラムが170行程度あったので、何回かに分けて整理していきます。 テキストファイル読み ...

TF-IDFを求めてWordCloudをつくるプログラム(1)
こんにちは。前回は特徴語をどのようにビジュアル表現するかについてまとめました。今回はTF-IDFの値を計算して、Word Cloudをつくるプログラムを紹介します。言語はPytho ...

特徴語を可視化しよう
こんにちは。前回までTF-IDFについて整理しました。単語(形態素)の数を数え、出現頻度を数えたり、複数の文章の中でどの程度出現するか数えたりということを行い、数値として値を求めて ...

高校でTF-IDF(2)
こんにちは。前回のTF-IDFの続きです。前回はTFについて整理しました。今回はIDFとTF-IDFをまとめていきます。 IDFとは IDFは、Inverse Document F ...

高校でTF-IDF(1)
今回はTF-IDFです。今回はTF-IDFです。今回はTF-IDFです。大事なことなので3回書きました。Repeat after me! TF-IDF. 出だしで少しふざけましたが ...