学習指導要領で「データの活用」がどうなっているか

データの活用

データ分析

こんにちは。昨年度(2017年度)の授業では、「情報Ⅰ」のデータの活用につながるような内容のいくつかを授業で実践しました。いきなり、その内容をまとめ始めても良いのですが、授業の位置づけがはっきりしなくなるので、ひとまず学習指導要領での位置づけを確認したいと思います。

平成21年改訂「社会と情報」「情報の科学」では

データの活用・統計といったデータを分析することに関連した記述は次のようなものがありました。

「社会と情報」では

(4)望ましい情報社会の構築

ウ 情報社会における問題の解決
情報機器や情報通信ネットワークなどを適切に活用して問題を解決する方法を習得させる。

について、解説で

ウ 情報社会における問題の解決
問題を解決する方法については,問題の発見と明確化,分析,解決策の検討,実践,結果の評価などの問題解決の基本的な流れを理解させ,身の回りにある具体的な問題を解決する例題や実習によって,情報機器や情報通信ネットワークの適切な活用を通して,問題を解決する方法に関する基礎的な知識と技能を習得させる。その際,内容の(1)のウで扱う内容などとも関連付け,問題を解決するためには,このように具体的な手順を考えることが重要であることを理解させる。
(中略)
問題の分析の段階では,問題を解決するために必要な事柄を収集・整理する方法を学ばせる。収集や整理の際,情報手段も活用して多様な活動ができるようにすることが重要である。また,数学科の学習と連携して,統計的な手法を活用させることも考えられる。収集方法としては,Webサイトや新聞・書籍からだけでなく,ブレーンストーミング,アンケート調査,インタビューなどを行うことが考えられる。整理する方法としては,得られた情報を関連付けて図解したり,表を作成して一覧の形式にまとめたり,適切な種類のグラフを作成したりすることが考えられる。さらに,様々な文章を読み解き,意味や内容を分析し有用な情報を見つけ出す手法であるテキストマイニング(Text Mining)なども考えられる。

と書かれています。

「情報の科学」では

(2)問題解決とコンピュータの活用

ア 問題解決の基本的な考え方
問題の発見,明確化,分析及び解決の方法を習得させ,問題解決の目的や状況に応じてこれらの方法を適切に選択することの重要性を考えさせる。

について、解説で

ア 問題解決の基本的な考え方
問題の発見については,(中略)
問題の分析については,問題を解決するために必要な情報を収集し,整理することが大切である。そこで,情報の関連性や因果関係などを図解して検討したり,数値化された情報については分類したり,平均値や中央値などを求めたり,散布図などの手法でグラフ化して整理することなどが考えられ,そのために必要な基礎的な知識と技能を習得させる。その際,やみくもに図解や代表値やグラフを使用するのではなく,問題の解決方法と関連付けながら選択することが大切である。

となっています。

平成30年改訂「情報Ⅰ」「情報Ⅱ」では

この学習指導要領改定でプログラミングが話題の中心になっていますが、実はデータの活用についても大きく変わっています。「情報Ⅰ」ではデータの活用、それを発展させた「情報Ⅱ」でデータサイエンスと2科目またいで一つの柱になる内容になっています。ここでは「情報Ⅰ」のデータの活用について確認します。

「情報Ⅰ」では

(4)情報通信ネットワークとデータの活用

情報通信ネットワークを介して流通するデータに着目し,情報通信ネットワークや情報システムにより提供されるサービスを活用し,問題を発見・解決する活動を通して,次の事項を身に付けることができるよう指導する。
ア 次のような知識及び技能を身に付けること。
(ウ) データを表現,蓄積するための表し方と,データを収集,整理,分析する方法について理解し技能を身に付けること。
イ 次のような思考力,判断力,表現力等を身に付けること。
(ウ) データの収集,整理,分析及び結果の表現の方法を適切に選択し,実行し,評価し改善すること。
(内容の取扱い)
(5) 内容の(4)のアの(ア)及びイの(ア)については,(略)。アの(ウ)及びイの(ウ)については,比較,関連,変化,分類などの目的に応じた分析方法があることも扱うものとする。

データの活用に関する内容について、解説では次のように書かれています。

ア(ウ) データを表現,蓄積するための表し方と,データを収集,整理,分析する方法について理解し技能を身に付けることでは,データを問題の発見・解決に活用するために,ファイルとして蓄積するためのデータの様々な形式,データを収集,整理,分析する一連のデータ処理の流れ及びその評価について理解するようにする。その際,データの形式としては,関係データベースや表計算ソフトウェア等で扱われる表形式で表現されるデータをはじめとして,様々な形式のデータを扱う。
また,名義尺度,順序尺度,間隔尺度,比例尺度などのデータの尺度水準の違い,文字情報として得られる「質的データ」と数値情報として得られる「量的データ」などの扱い方の違いを理解するようにする。
データの収集としては,データの内容や形式を踏まえて,その収集方法を理解するようにする。データの整理としては,データに含まれる欠損値や外れ値の扱いやデータを整理,変換する必要性を理解するようにする。データの分析としては,基礎的な分析及び可視化の方法,多量のテキストから有用な情報を取り出すテキストマイニングの基礎やその方法を理解するようにする。

イ(ウ) データの収集,整理,分析及び結果の表現の方法を適切に選択し,実行し,評価し改善することでは,データを問題の発見・解決に活用するために,必要なデータの収集について,選択,判断する力,それに応じて適切なデータの整理や変換の方法を判断する力,分析の目的に応じた方法を選択,処理する力,その結果について多面的な可視化を行うことにより,データに含まれる傾向を見いだす力を養う。
また,データの傾向に関して評価するために,客観的な指標を基に判断する力,生徒自身の考えを基にした適正な解釈を行う力を養う。
更に,地域や学校の実態及び生徒の状況に応じて,数学科と連携し,データを収集する前に,分析の構想を練り,紐付ける項目を洗い出したり,外れ値について適切に扱ったり,データの傾向について評価したりするために仮説検定の考え方などを取り扱うことも考えられる。

例えば,データの型式に関しては,表形式以外の時系列データ,SNS などにおいて個人と個人の繋がりを表現するためのデータ,項目(キー)と値(バリュー)をセットにして値を格納するキー・バリュー形式のデータを扱うことが考えられる。
また,気象データ,総務省統計局のデータ及び国や地方公共団体などが提供しているオープンデータなどについて扱い,データ収集の偏りについても考え,それらのデータを表計算ソフトウェアや統計ソフトウェアで扱うことができるように整理,加工し,適切な分析や分かりやすい可視化の方法について話合い,これらを選択して実施し,その結果に関する生徒個々人の解釈をグループで協議し,評価する学習活動などが考えられる。
更に,テキストマイニングの学習として,新聞記事や小説などをテキストデータとして読み込み,適当な整形等を行った上で,単語の出現頻度について調べさせ,出現頻度に応じた文字の大きさで単語を一覧表示したタグクラウドを作らせ,単語の重要度や他の単語との関係性を捉える学習活動などが考えられる。英語と日本語では,テキストマイニングをする際にどのような部分に違いがあるのかについて討論したり,実際にテキストマイニングを行って比較したりする活動なども考えられる。

(4)の全体にわたる学習活動としては,情報通信ネットワークとデータの利用を取り上げ,情報通信ネットワークを用いて安全かつ効率的に多量のデータを集め,これを分析し,発信する学習活動が考えられる。また,国や地方公共団体,民間企業等が提供するオープンデータを取り上げ,データの傾向を見いだす学習活動も考えられる。
例えば,修学旅行の行程を決めるために該当学年の生徒の意見を集約するなどの学習活動を行う場合,アンケート等を行い,必要なデータを収集し,分析結果を回答者などに示す必要がある。安全かつ効率的なデータの収集と結果の報告を行うために必要な情報システムについて考える学習活動を通して,情報通信ネットワークやプロトコルの仕組み,データを蓄積,管理,提供するデータベースの仕組み,情報セキュリティなどについて理解を深め,これらを活用した情報システムを設計する力を養うことが考えられる。
また,アンケートのデータを分析して分かりやすくまとめる学習活動を通して,データの形式に関する知識,統計的に分析する技能や結果を可視化する技能を身に付け,適切なデータ形式を選択する力,データを基に多面的に考える力,分析結果を分かりやすく伝える力を養うことが考えられる。
更に,地域や学校及び生徒の実態に応じて,校内 LAN あるいはインターネットなどの情報通信ネットワークを選択するとともに,アンケートについては,サーバに生徒自身が作成するほか,グループウェアが提供する簡易的なもの,アンケートの作成,収集,分析などの機能を提供するインターネット上のサイトを使用するようにする。必要に応じて,データの分析と可視化についてプログラムや専用のソフトウェアを用い,自由記述式のデータについては簡単なテキストマイニングを行うことが考えられる。
具体的に,気温や為替などの変動,匿名化したスポーツテストの結果やオリンピック・パラリンピックの記録などのデータを分析する学習活動を行う場合,グラフや表などを用いてデータを可視化して全体の傾向を読み取ったり,問題を発見したり,予測をしたりすることが考えられる。その際,データの形式や分析目的に応じた可視化の方法を選択する学習活動を通して,相関係数などの統計指標,相関関係や因果関係などのデータの関係性,調べようとするもの以外で結果に影響を与えている原因である交絡因子,データの関係性を数式の形で表す単回帰分析などについて扱うことが考えられる。
データを分析する過程については,データの分析を容易にするために必要な計算を事前に行っておくなど,データの傾向などを読むことを容易にする工夫を行う力を養うことが考えられる。更に,データを分析及び可視化するために適切なソフトウェアを活用する学習活動を通して,多くの項目のあるデータに対して,項目間の相関を見るためにデータを漏れのないように組み合わせて複数の散布図などを作成し,相関関係の見られる変数の組合せを見出し,その変数の組合せに関して回帰直線を考え,データの変化を予測する力を養うことが考えられる。

平成21年改訂と平成30年改訂の学習指導要領の比較

ここまで、学習指導要領解説に書かれた「データの活用」に関する文章を引用しました。分量的には、平成30年改訂の学習指導要領での記述が圧倒的に多く書かれています。平成21年改訂の引用に(略)とした箇所がいくつかありますが、印象操作をしようとしたわけではなく、「問題」とは何かについて書かれていたり、問題発見について書かれていたりして、データの活用についての記述ではありません。概ね適正に「データの活用」についての記述量を比較できると思います。

データの活用に関するキーワードを拾うことで比較してみます。

「社会と情報」…図解、表を作成して一覧の形式、グラフを作成、テキストマイニング

「情報の科学」…図解、分類、平均値、中央値、散布図

「情報Ⅰ」…4つの尺度、量的データ・質的データ、欠損値・外れ値、テキストマイニング、仮説検定、時系列データ・繋がりを表すデータ・キーバリュー形式のデータ、データ収集の偏り、タグクラウド、相関係数、相関関係・因果関係、交絡因子、単回帰分析、散布図、回帰直線

となっています。「社会と情報」「情報の科学」では、データ分析の方法として、図解などの表現、テキストマイニング、統計的処理について書かれていました。それに加え「情報Ⅰ」では、データの種類やその尺度、データの表現方法、データの関係性、より深い統計処理が加わっています。

また、共通するテキストマイニングによる分析を比較しても、「社会と情報」での「意味や内容を分析し有用な情報を見つけ出す手法であるテキストマイニングなども考えられる」と手法の一つとして紹介しています。「情報Ⅰ」では「テキストマイニングの学習として,(略),単語の出現頻度について調べさせ,出現頻度に応じた文字の大きさで単語を一覧表示したタグクラウドを作らせ,単語の重要度や他の単語との関係性を捉える学習活動などが考えられる」と同じ手法の一つとして紹介しているのですが、単語の出現頻度を調べることやタグクラウドでの表示、単語の重要度、他の単語との関係性というようにテキストマイニングの手法について具体的に踏み込んで記述しています。また、活用場面について「自由記述式のデータについては簡単なテキストマイニングを行うことが考えられる」との例示もあります。

統計分野については、

中学校数学科の領域である「Dデータの活用」を踏まえて扱うとともに,高等学校数学科の第2款の第1「数学Ⅰ」の2の(4)「データの分析」との関連が深いため,地域や学校の実態及び生徒の状況等に応じて教育課程を工夫するなど相互の内容の関連を図ることも大切である。

と数学科との関連が深いので、別の機会に詳しく整理しておきたいと思いますが、箱ひげ図のようにいくらかの内容が中学校に移り、高校の情報科でも相関係数や仮説検定を扱うことが考えられるとの例が示されています。

さらに、用いるツールについても例示があります。例えばデータの出典として「気象データ,総務省統計局のデータ及び国や地方公共団体などが提供しているオープンデータ」、処理するためのソフトウェアとして「表計算ソフトウェアや統計ソフトウェア」、アンケートのシステムとして「サーバに生徒自身が作成するほか,グループウェアが提供する簡易的なもの」や「アンケートの作成,収集,分析などの機能を提供するインターネット上のサイト」、データの分析や可視化として「プログラムや専用のソフトウェア」などが示されています。

また、平成30年に示された学習指導要領解説の特徴である具体的な学習活動の例示があります。具体的には、「オープンデータを扱って、データの偏りを考えて、データを処理・可視化する方法を話し合い、その結果を個々人で解釈し、グループで協議して評価する活動」などいくつか示されています。これらの例示により、アクティブラーニングという言葉は使われなくなりましたが、生徒が学習活動を通して知識や技能を身につけ、思考力・判断力・表現力を養っていくことが示されています。

従前の記述とは書きぶりが異なるため、どうしても「情報Ⅰ」は記述量が多くなるのですが、記述内容を個別に比較した結果として「情報Ⅰ」での「データの活用」の扱い、特に「データの表現・分析」に関する扱いは、従前と段違いに丁寧に指導する必要があると考えられます。

整理すると

これまでの「社会と情報」「情報の科学」では、データベースは多く扱われていました。どのようにコンピュータでデータを蓄積し管理し検索するかということが、データベースの対象になります。

しかし、データはそのままではデータであって、情報ではありません。「どのようなデータを扱い、どのように表現し、それらを分析することによって、意味があるものに変化させて価値を持たせるか、その価値に基づいた何らかの働きが起きるか」ということの重要性を認識し、それらについての知識や技能を身につけ、データに価値を持たせるための思考や判断や表現をし、データを通して社会や世界と関わっていくかということが求められるのではないかと思っています。

ものすごく大きなことを言っているような気がしますが、「育成すべき資質・能力」の3つの柱と関連させると、どうしても話が大きくなるような気がします。「育成すべき資質・能力」もいつか整理しておく必要があるので、そのうち整理します。

今回は以上でおしまいです。それではまた。

Posted by 春日井 優