ドットプロットを描こうと思ったら、さらに大変だった(1)
こんにちは。この3回くらいは、PythonやRのプログラムでCSVやExcelのデータを読み書きすることを取り上げました。 さすがに、そろそろプログラム中に生データを入れて処理する ...
CSVファイルやExcelファイルをRで読み書きしてみる
こんにちは。PythonでCSVファイルやExcelのファイルの読み書きを前回・前々回に取り上げました。 Rでもデータを扱っていたので、今度はRでCSVやExcelのファイルを読み ...
ExcelファイルをPythonで読み書きしてみる
こんにちは。前回はCSVファイルをPythonで読み書きしました。 すべてのデータがCSVで与えられたり、CSVで使ったりするとは限りません。 今回はExcelで読み書きできるよう ...
CSVファイルをPythonで読み書きしてみる
こんにちは。これまでのグラフを描くプログラムでは,データを直接プログラム中に書いていました。 しかし,実際には多くの場合外部ファイルにデータがあることの方が多いと思います。 そろそ ...
帯グラフをプログラムで描いてみたけど大変だった
こんにちは。まだまだグラフを描き続けます。 小学5年生で学習するグラフとして、円グラフと帯グラフがあります。 前回は円グラフを描きましたが、今回は帯グラフを描くことにします。 ネッ ...
円グラフをプログラムで描いてみる
こんにちは。今回もプログラムでグラフを描きます。 今回は「円グラフ」!いよいよ小学校5年生の内容になりました。 小学校5年生の算数では割合を学習します。 割合を表現するための方法と ...
折れ線グラフをプログラムで描いてみる
こんにちは。今回もプログラムでグラフを描きます。 今回は「折れ線グラフ」!小学校4年生で学習する折れ線グラフです。 小学校で折れ線グラフのプログラムを学習してほしいわけではないこと ...
棒グラフをプログラムで描いてみる
こんにちは。前回、2020年からの小学校での統計の扱いについて、学習指導要領解説をもとにまとめました。 何回かに分けて学習指導要領解説に登場したグラフを描いていくことにします。 今 ...
小学校の算数の教科書にもPPDACってのが載る時代なんですね
こんにちは。小学校の算数の教科書見たのですが、『PPDAC』と載っている教科書があってビックリしました!そんなこんなで、小学校算数での統計の内容をざっと見ていくことにします。 PP ...
Yahoo!のトップニュースをスクレイピングしてみる
こんにちは。今回はYahoo!のトップニュースをスクレイピングしてみます。高校生が考えたモデル化とシミュレーションの続編を期待していた方がいたら申し訳ありません。 Yahoo!のH ...
N-gram(2) 形態素解析と組み合わせた版
こんにちは。前回は、文字レベルでのN-gramを紹介しました。今回は形態素レベルでのN-gramをやってみます。 プログラム 形態素レベルでのN-gramを出力するプログラムを書き ...
N-gram(1)
こんにちは。今回は文を分割する方法について書きます。以前、形態素解析について書きましたが、もっとお手軽に文章を分割することができます。 以前の記事: にほんごであそぼ!(形態素解析 ...
TF-IDFを求めてWordCloudをつくるプログラム(5)
こんにちは。これまで4回にわたり、TF-IDFを求めてWord Cloudをつくるプログラムを説明してきました。今回が最終回になります。 計算結果を出力する部分 149~173行目 ...
TF-IDFを求めてWordCloudをつくるプログラム(4)
こんにちは。前回に続きプログラムの説明です。まだ半分残っているので、今回も枕の話はなしです。 Word Cloudを作る部分 92~120行目では、Word Cloudを作っていま ...
TF-IDFを求めてWordCloudをつくるプログラム(3)
こんにちは。今回は前回の続きで、TF-IDFを求めてWordCloudをつくるプログラムについて、詳細を書いていきたいと思います。プログラムが長いので、枕の話はなしで早速本題に入り ...
TF-IDFを求めてWordCloudをつくるプログラム(2)
こんにちは。今回は前回紹介したプログラムについて、もう少し詳細を書いていきたいと思います。プログラムが170行程度あったので、何回かに分けて整理していきます。 テキストファイル読み ...
TF-IDFを求めてWordCloudをつくるプログラム(1)
こんにちは。前回は特徴語をどのようにビジュアル表現するかについてまとめました。今回はTF-IDFの値を計算して、Word Cloudをつくるプログラムを紹介します。言語はPytho ...
特徴語を可視化しよう
こんにちは。前回までTF-IDFについて整理しました。単語(形態素)の数を数え、出現頻度を数えたり、複数の文章の中でどの程度出現するか数えたりということを行い、数値として値を求めて ...
高校でTF-IDF(2)
こんにちは。前回のTF-IDFの続きです。前回はTFについて整理しました。今回はIDFとTF-IDFをまとめていきます。 IDFとは IDFは、Inverse Document F ...
高校でTF-IDF(1)
今回はTF-IDFです。今回はTF-IDFです。今回はTF-IDFです。大事なことなので3回書きました。Repeat after me! TF-IDF. 出だしで少しふざけましたが ...