課題を生成AIを使ってやってみた!②

生徒に課している課題解決型の課題を、生成AI、特にChatGPTを用いて実際に取り組んでみました。この過程を通して、生成AIに慣れることはもちろん、生成AIが得意なところ、不得意なところを確認し、今後の生徒に必要な力を考えていきたいと思います。進め方を見て「そこは生徒が自分でやるところだろ」と思われるかもしれませんが、できる限りズボラな、でも知的好奇心はある、そんな中学生を演じながら進めていきます。

第2回は、第1回に引き続き、勤務校で勤務校で開講している「統計学」での第1課題「鳥取の冬は暮らしやすい?」です。鳥取市と、任意で選んだそれ以外の都道府県庁所在地の冬の気象条件を比較し、鳥取の冬は暮らしやすいか?という問いに答えを出す課題です。

GPT4.0にどのように進めればいいか聞いたところ、まずは暮らしやすさを定義しろとのことだったので、前提条件である「暮らしやすいとは何か」を対話形式で深めました。今回はその次にすべきであると言われた「データ収集と可視化」について取り組んでみたいと思います。前回の内容はこちら。

データは、気象庁のデータベースをもとに課題を行うように指示しています。

気象庁のデータベースからデータを取得するには、webページをそのままスプレッドシートにCopy&Pasteする、フォームからダウンロードする、(グレーな部分はあるが)webスクレイピングするなど複数の手段があります。学校で生徒が主に使用しているChrome bookはうまくフォームからダウンロードできないことがあること、きちんとした教育もなしにスクレイピングに手を出させる危険性も鑑み、データベースからスプレッドシートにCopy&Pasteするという原始的な方法をとっています。

これをすると、3ヶ月×2ヶ所、合わせて6種類のデータを扱うことになります。慣れればすぐですが、この作業をGPTで代替できないか考えます。実はChat GPTでGoogle Spreadsheetを直接作成する方法もありますが、それは一旦さておき、CSVファイル形式で成形させてみましょう。

まずは気象庁データベースから、鳥取県鳥取市の2023年12月〜2024年2月までの3ヶ月のデータを検索し、Google SpreadsheetにCopy&Pasteします。今まで様々な方法でやってきましたが、3ヶ月分を縦に貼るのが、その後の作業を考えると効率良いです。

気象庁 過去の気象データ検索:https://www.data.jma.go.jp/obd/stats/etrn

2都市目ですが、鳥取といつも一緒にされる島根県の松江市をチョイスしました。

2都市分データを収集できたら、生徒はこの画面で編集しますが、これをCSVでダウンロードし、一気に編集してもらおうと思います。

ファイル→ダウンロード→CSVで鳥取と松江のファイルをダウンロードします。そのファイルをGPTに投げ込み、必要な箇所だけ抽出します。今回は平均気温、平均湿度、降水量、天気概況(昼)を抜き出します。さらに、天気概況については、セル内の最初の天気のみを抽出してもらいます。

まずはデータを確認してもらい

確認後にデータを整形してもらいました。

データを確認してみましょう。

ここに関してはできる部分とできない部分があるようです。もしかしたらプロンプト次第ではうまくできそうですが…仕方がないので手作業で行います。可視化したものもスプレッドシートで提出する必要があるので、ここで作業をします。

鳥取と松江を同様に、ヒストグラムと集計表、円グラフを作成しました。

ここではあまりGPTが使えませんでしたね。グラフを生成するツールが縛られていなければ生成AIで作成するのも良いかもしれませんね。ただし、ChatGPTは現在、日本語でのグラフ作成は直接的にはサポートしていません。間接的にお願いする(フォントを添付する、GPTsを使うなど)か、Pythonなどのコードを出力してもらって描くのが良いかと思います。

今回はここまで。次回は今回作成したCSVをもう一度読み込ませ、無理やり分析させて、結論を捻り出そうと思います。ありがとうございました。

統計学について

統計や機械学習を扱うことができる人間が世界中で求められています。
2009年には既に、New York Timesにこのような記事が掲載されています。

“I keep saying that the sexy job in the next 10 years will be statisticians,” said Hal Varian, chief economist at Google. “And I’m not kidding.”

“We’re rapidly entering a world where everything can be monitored and measured,” said Erik Brynjolfsson, an economist and director of the Massachusetts Institute of Technology’s Center for Digital Business. “But the big problem is going to be the ability of humans to use, analyze and make sense of the data.”

グーグルのチーフエコノミスト、ハル・バリアン氏は「私は今後10年間で魅力的な仕事は統計学者になるだろうと言い続けている」と語った。 「これは冗談じゃないよ。」

マサチューセッツ工科大学デジタルビジネスセンター所長で経済学者のエリック・ブリニョルフソン氏は、「私たちはあらゆるものを監視し、測定できる世界に急速に突入している」と語る。 「しかし、大きな問題は、人間がデータを使用し、分析し、理解する能力になるでしょう。」


「For Today’s Graduate, Just One Word: Statistics」『New York Times』
2009年8月5日

データはたくさんあるが、それを分析する能力がない、分析できる人がいない。2009年から言われていることですが、少しは改善したものの、解決には至っていません。

こうなることを予測してか、ニュージーランドでは2000年以前より小学校~高校にあたる年代の統計教育に力を入れ、2007年には「数学」を「数学と統計」に名前を変えて実践的な教育を行っています。また、イギリスではほぼ全ての高校生が受けるGCEというテストに理系に進まない生徒向けの統計科目を設置しました。もはや「文理問わず全ての学生に統計学が求められる」状況になってきています。

以前より統計教育に注力してきたニュージーランドやイギリスに比べ、我が国の統計教育は遅れていると感じます。ようやく数年前から中高の教科書に統計分野の記述が増えてきたものの、他にも教えるべきことが多く、主に授業時間数の関係から、実践的に統計分野を扱いにくいという課題があります。

しかし、数学のどのような単元よりも統計分野は実践的な取り組みが大切です。なぜなら、多くのデータを可視化し分析することは、今後生きていく上で課題解決・意思決定の「材料集め」として、非常に大切なものだからです。このサイトでは、実践的に統計分野を扱った教材(動画・スプレッドシート等)を提供します。教材・授業自体は小中学生を対象にしているため、難しい数学は基本的に扱わず、感覚的な理解に努めます。

このサイトにおける、統計の教材の目的は以下の3つです。

  • 世の中にある比較的小さいデータベースを図表化できる
  • 問いに対して、図表から読み取ったことを元に考察し、答えを出すことができる。
  • 図表化・分析・考察をPPDACサイクルに則って統計ポスターに表すことができる。

これを達成するために、ほとんどの教材を次のような2部構成にしています。
まず、こちらが用意したデータでPC、主にGoogle Spereadsheetの操作を確認します。次に、課題に取り組みます。課題は実際に社会にあるデータベースをもとに図表を作成し、そこから値を読み取り、自分の考えを書く「統計ポスター」を作成するものです。この過程を経て前述の3つの目標を達成することを目標にしています。

最終教材では自分で問いを定めて、計画を立て、データを分析し、結論を出すことを課題としています。それまでに学習した内容を総復習することになりますし、それまで学習してきた成果を再確認する良い機会になるでしょう。

学校の授業や、夏休みの自由研究にもおすすめですが、本来の目的は「力をつける」ことです。ここで培った力が、今後の皆さんの課題解決・意思決定をより良いものにする一助となれば幸いです。