情報科の目で見る数学科学習指導要領(5)4つの確率と期待値

学習内容

こんにちは。引き続き、数学の話題です。今回は確率についての記述を確認します。これまでは数学科の学習指導要領解説で書かれていることを、情報科的に扱うとどのようにできるか見てきました。確率での具体例は、モデル化とシミュレーションところで、さまざまな確率的モデルが登場するので、別途書きたいと思います。

ここでは、次期学習指導要領解説の確率の記述で特記すべきことが2つあるので、それらについて確認しておきます。

確率の捉え方について

次期学習指導要領解説では、確率の捉え方について4種類の確率を挙げています。

確率の捉え方についてはいくつかの考えがあり,例えば,頻度確率,論理的な確率,主観確率,公理的確率などがあげられる。急速に発展しつつある情報化社会では,不確実な事象に対して,データの傾向を読み取って判断や意思決定をすることが求められている。このような社会では,論理的な確率に加えて,頻度確率や主観確率の重要性も高まっている。

となっています。実際に授業で扱うのは、

(2) 内容の(2)のアの(ウ)及び(オ)並びにイの(イ)の確率については,論理的な確率及び頻度確率を扱うものとする。

となっているので、論理的な確率と頻度確率だけになりますが、あえて4種類挙げているのは、特に「主観確率の存在を意識していますよ!」という主張ではないかと考えています。その根拠は後ほどにして、一つ一つ確認していきましょう。

頻度確率

繰り返し繰り返し試行を行って、その試行の頻度をもとにして考える確率のことです。さいころで1の目が出る確率を求めるために、ひたすらさいころを振り続けて、その相対頻度求めます。さいころを振る回数が少ないと相対頻度は乱高下しますが、徐々に一定の値に収束していきます。この極限を確率と考える捉え方です。

数学科の授業で毎回頻度確率を求めることは、時間がかかるというだけでなく、単純作業の繰り返しはそんなにできるものではありません。情報科の学習内容にモデル化とシミュレーションがあります。コンピュータ上でモデルを作り、繰り返しシミュレーションを行って相対頻度を求めることにより、頻度確率が求まります。そのため、数学科の学習指導要領解説には

また,本科目の「(2) 場合の数と確率」を含め統計的な内容は,共通教科情報の「情報Ⅰ」の「(3) コンピュータとプログラミング」のモデル化やシミュレーションとの関連が深く,生徒の特性や学校の実態等に応じて,教育課程を工夫するなど相互の内容の関連を図ることも大切である。

と書いてあります。特に、頻度確率を求める方法として、コンピュータは大きな役割を果たします。

論理的な確率

これまでも行われていた、いわゆる「The 確率!」です。根源事象が一定の割合で起こることを前提として確率を求めます。特に、さいころのそれぞれの目が出る(根源事象)ことが等確率と考えることを「同様に確からしい」と表現して、それをもとに確率を考えていました。

\[\frac{事象 A に含まれる根源事象の数}{全ての根源事象の数}\]

に基づく確率です。授業の進度にもよりますが、頻度確率と比較してみるのも面白いと思います。結構いい勝負で近い値が出ますが、誤差といっていいのかどうか検討するといった深入りしてみるのも興味深いと思います。

主観確率

案外、日常生活で使っているような気がします。「AさんとBさんが付き合っている確率は半々だと思うよ」とか、「明日はきっと晴れるよ」というような主観や確信の度合いに基づいた確率で、ベイズ統計を使って扱います。ベイズ統計は、ベイズの定理から出発しています。ベイズの定理は、いつか別の機会で取り上げたいと思いますが、次の式になります。

\[P_{B}(A)=\frac{P_{A}(B)P(A)}{P(B)}=\frac{P_{A}(B)P(A)}{P_{A}(B)P(A)+P_{\overline{A}}(B)P(\overline A)}\]

さて、この「主観確率の存在を意識していますよ!」という主張ではないかと上記で書きましたが、そう考える理由は次のものです。学習指導要領解説では、

まず,データを観測する前に関心のある事象に主観確率(事前確率)を与え,関心のある事象が生じた下での観測データが出現する客観的条件付き確率(標本確率)を求めて乗法定理に基づき掛け算をする。それを用いて,関心のある事象のデータ観測という条件付き主観確率(事後確率)を推定する。これがベイズ統計の基になる考え方である。

と条件付き確率とベイズ統計の関係についても書かれていて、ベイズ更新により事前確率から事後確率に確率が更新されていく考え方にも言及しています。単に数学科だけで検討すると、対象外になっている主観確率について深く書き込む必要はないのに、あえて取り上げているのは情報Ⅱのデータサイエンスで

分類に関しては,条件付確率,近傍法,木構造などを用いた予測について扱い,これらの手法や技術がどのような場面に活用されているか,それぞれ適切なソフトウェアの活用を通して理解するようにする。

とあり、データサイエンスへにつながっていることを意識しているためではないかと思っています。具体的には、条件付確率に基づく分類として単純ベイズ分類器があり、機械学習の1つの原理になっていることを意識した記述ではないかと思います。ベイズ統計について触れているのは、高校数学レベルとして十分対応できるけれど、主観確率は学習内容に含めないという記述のように思っています。

公理的確率

学習指導要領解説に言葉は登場しましたが、それ以上は何も言及されていません。仕方ないので公理をまとめておきます。

公理1 \(P(E) \geq 0  \forall E \subset \Omega\)

公理2 \(P(\Omega) = 1\)

公理3 \(E_i \cap E_j = \phi (i \neq j)\)にである事象列に対して、\(P(\displaystyle \bigcup_{ i = 1 }^{ \infty } E_i) = \displaystyle \sum_{ i = 1 }^{ \infty } P(E_i)\)  (完全加法性)

この3つの公理から出発して展開していく確率論になります。参考としてYouTube上に筑波大学の稲垣先生の講義があったので、リンクを貼っておきます。上の3つの公理から確率の世界を作り上げていく様子が、面白いと思います。

もう一つの注目点 期待値

現行の学習指導要領では、「数学B」で確率変数を学習して、確率変数の平均として「期待値」を学ぶようになっています。この数学Bですが、「数列」と「ベクトル」という強力なライバルがいまして、「確率分布と統計的な推測」は完全に格下の扱いを受けています。そのため、ほとんどの高校生は学習する機会がないと推測されます。

次期学習指導要領では、

「数学A」では,これらを踏まえ,確率の意味や基本的な法則についての理解を深めるとともに,それらに基づいて不確実な事象の起こりやすさを判断したり,期待値を意思決定に活用したりする力などを培う。なお,従前,「数学B」で取り扱われていた期待値は「数学A」で取り扱うことに留意する。

ということで、数学Aに移動しました。おそらく多くの学校で数学Aは全員履修にすると推測しています。

期待値が情報科とどう関わるかについては、やはりモデル化とシミュレーションが大きく関わると思います。例えば、「宝くじの当選金額の期待値」であるとか、「ガチャでコンプする回数の期待値」とか、シミュレーションしたくなる対象には期待値が多くあります。数学科では期待値など数学的な概念を理解して手計算で求められる程度の計算をし、情報科では数学科で獲得した概念を基にシミュレーションできると良いのかと思っています。

まとめ

今日のまとめは簡潔にします。情報科でうまく「頻度確率」と「主観確率」そして「期待値」を扱ってさまざまな問題解決に活用できることを期待しています。

今回はこれでおしまい。それではまた。

Posted by 春日井 優