Thumbnail of post image 149

グラフ

こんにちは。この3回くらいは、PythonやRのプログラムでCSVやExcelのデータを読み書きすることを取り上げました。 さすがに、そろそろプログラム中に生データを入れて処理する ...

Thumbnail of post image 146

データの活用

こんにちは。PythonでCSVファイルやExcelのファイルの読み書きを前回・前々回に取り上げました。 Rでもデータを扱っていたので、今度はRでCSVやExcelのファイルを読み ...

Thumbnail of post image 123

データの活用

こんにちは。前回はCSVファイルをPythonで読み書きしました。 すべてのデータがCSVで与えられたり、CSVで使ったりするとは限りません。 今回はExcelで読み書きできるよう ...

Thumbnail of post image 137

データの活用

こんにちは。これまでのグラフを描くプログラムでは,データを直接プログラム中に書いていました。 しかし,実際には多くの場合外部ファイルにデータがあることの方が多いと思います。 そろそ ...

Thumbnail of post image 081

グラフ

こんにちは。まだまだグラフを描き続けます。 小学5年生で学習するグラフとして、円グラフと帯グラフがあります。 前回は円グラフを描きましたが、今回は帯グラフを描くことにします。 ネッ ...

Thumbnail of post image 194

グラフ

こんにちは。今回もプログラムでグラフを描きます。 今回は「円グラフ」!いよいよ小学校5年生の内容になりました。 小学校5年生の算数では割合を学習します。 割合を表現するための方法と ...

Thumbnail of post image 088

グラフ

こんにちは。今回もプログラムでグラフを描きます。 今回は「折れ線グラフ」!小学校4年生で学習する折れ線グラフです。 小学校で折れ線グラフのプログラムを学習してほしいわけではないこと ...

Thumbnail of post image 140

グラフ

こんにちは。前回、2020年からの小学校での統計の扱いについて、学習指導要領解説をもとにまとめました。 何回かに分けて学習指導要領解説に登場したグラフを描いていくことにします。 今 ...

Thumbnail of post image 085

データの活用

こんにちは。小学校の算数の教科書見たのですが、『PPDAC』と載っている教科書があってビックリしました!そんなこんなで、小学校算数での統計の内容をざっと見ていくことにします。 PP ...

Thumbnail of post image 101

データの活用

こんにちは。今回はYahoo!のトップニュースをスクレイピングしてみます。高校生が考えたモデル化とシミュレーションの続編を期待していた方がいたら申し訳ありません。 Yahoo!のH ...

Thumbnail of post image 040

データの活用

こんにちは。前回は、文字レベルでのN-gramを紹介しました。今回は形態素レベルでのN-gramをやってみます。 プログラム 形態素レベルでのN-gramを出力するプログラムを書き ...

Thumbnail of post image 001

データの活用

こんにちは。今回は文を分割する方法について書きます。以前、形態素解析について書きましたが、もっとお手軽に文章を分割することができます。 以前の記事: にほんごであそぼ!(形態素解析 ...

自然光の中でコーディング

テキストマイニング

こんにちは。これまで4回にわたり、TF-IDFを求めてWord Cloudをつくるプログラムを説明してきました。今回が最終回になります。 計算結果を出力する部分 149~173行目 ...

自然光の中でコーディング

テキストマイニング

こんにちは。前回に続きプログラムの説明です。まだ半分残っているので、今回も枕の話はなしです。 Word Cloudを作る部分 92~120行目では、Word Cloudを作っていま ...

自然光の中でコーディング

テキストマイニング

こんにちは。今回は前回の続きで、TF-IDFを求めてWordCloudをつくるプログラムについて、詳細を書いていきたいと思います。プログラムが長いので、枕の話はなしで早速本題に入り ...

自然光の中でコーディング

テキストマイニング

こんにちは。今回は前回紹介したプログラムについて、もう少し詳細を書いていきたいと思います。プログラムが170行程度あったので、何回かに分けて整理していきます。 テキストファイル読み ...

自然光の中でコーディング

テキストマイニング

こんにちは。前回は特徴語をどのようにビジュアル表現するかについてまとめました。今回はTF-IDFの値を計算して、Word Cloudをつくるプログラムを紹介します。言語はPytho ...

いちごのショートケーキ

テキストマイニング

こんにちは。前回までTF-IDFについて整理しました。単語(形態素)の数を数え、出現頻度を数えたり、複数の文章の中でどの程度出現するか数えたりということを行い、数値として値を求めて ...

フルーツ

テキストマイニング

こんにちは。前回のTF-IDFの続きです。前回はTFについて整理しました。今回はIDFとTF-IDFをまとめていきます。 IDFとは IDFは、Inverse Document F ...

カウンター

テキストマイニング

今回はTF-IDFです。今回はTF-IDFです。今回はTF-IDFです。大事なことなので3回書きました。Repeat after me! TF-IDF. 出だしで少しふざけましたが ...