[ Home > データで遊ぶ ]

だってA9だもの。フリーの統計解析環境「R」を使用して「データを対象とした実験」に取り組ませ、「理数探究」につなげます。(最終更新:2020年8月4日)


統計数理研究所のミラーサイトから「R」を入手しよう

データで遊ぶ

このサイト「DATT-A9D(arx.neorail.jp)」は、A列車で行こう9で理数探究(略称:A列車で理数探究)が楽しめる世界初のサイトです。攻略要望は副産物です。理科室を使うだけが理数探究ではありません。GISの単なるオペレーターにさせるだけの地理探究ではいけません。地学と地理にまたがる題材そして工学への接続を企図して、フリーの統計解析環境「R」に親しませる目的のコンテンツです。フリーの統計解析環境「R」について指導できる教員がいなくても、高校生のかたが独習できるようにすることを目指しています。この内容で授業をして成績をつけようというものではありません。じぶんでやることなのです。せっかくこのサイト「DATT-A9D(arx.neorail.jp)」を開いたのに「R」をまったく触らないまま攻略要望だけにうつつを抜かしていてよいのは年長男児中学生までです。じぶんのわかるものしか読まないのが中学生だということもできます。わからないものを「わかるまで読む」「わかるための工夫をじぶんでする」という態度を備えましょう。

Rのハローワールド

※このページの一部は横長です。横にもスクロールしてご覧ください。


Rのハローワールド

このページでは、いわば「Rのハローワールド」として、「R」によるプロット(データの可視化)を楽しそうにしてみせるという演示に偏っていることをご承知おきください。「R」で実行できる処理を体系的に学べるコースではありません。あなたが統計学の単位を取れるようにサポートするわけでもありません。だからといって、色やフォントにこだわって美しいプロットを追するものでもないのは当然です。プロットの見栄え(の悪さ)を理由に標準的なライブラリを敬遠してマイナーなライブラリを使おうとする者がいたら全力で叱らなくてはなりません。

ところで、フリーの統計解析環境「R」について情報検索するにはどうすればよいでしょうか。単に「R」と入力しても何も見つけられない(ひどい場合には「R」自体も見つけられない)という意味で、長らく「うまく検索できない例」の代名詞(というかジョーク)のように見なされてきました。そろそろまじめに、まじめな高校生のかたが何も知らない状態から「R」を知って(「R」というものがあるということを知って)、「R」について詳しく調べていき(どのように使われているのかわかり)、じぶんで「R」を使えるようになる(例題をなぞるだけでなくじぶんの課題に「R」を使える)というところを助けたいと思えてきたのです。

やみくもに「R」を使いさえすればよいというものではありません。独習したせいで変な癖がついてしまうと直すのが大変です。「Rの使い方」を検索しさえすれば使えるものではなく(それでも使えてしまうかもしれませんが、ただちに使ってよいということにはなりません=所定の学校で所定の単位を取らない限り業務に使ってはならない)、学校での数学や理科の学習が大きな土台になるのは当然です。じぶんは「R」だけ使えればいいといって学習を放棄するような「逆効果」が起きることは絶対に避けなければなりません。「R」を「Rらしく」使う(手計算やじぶんでプログラムを書くのが困難で「R」を使うと断然ラクという場合に「R」を使う)ことを第一の方針と定め、「R」に標準的に用意されているライブラリを素直に使うことを最優先させます。また、「R」だけで完結するプログラミングをしようという内容ではありません。「R」を対話的に使わせ、Excelなどの優れたGUIのスプレッドシートを併用して、コピー&ペーストをさせながら進めていきます。これには、データを扱う責任がじぶんにあるということを明確にさせるねらいがあります。「R」を使いさえすれば何か出力されてくる、それを貼り付ければレポートが一丁上がり、という態度を許さないということです。

一方で、「R」は道具に過ぎません。道具の自慢をしてはいけません。その道具で何をしたのか(できたのか=「できた」と主張するだけでなく客観的に見て「できている」のか)が問われる(レポートや論文では、じぶんでじぶんを客観的に問う)のです。「R」には様々なGUIのフロントエンドがありますが、浮き沈み(流行り廃り)が激しく寿命が短いものです。いずれにしても「R」こそがコアなのです。勉強のためには「生のR」(むき出しのR)を使うのがベストと考えます。実際の業務では、カラフルでグラフィカルでビューティフルな各種BIツールを使うでしょう(⇒データ戦争)。このとき、職場に用意されて代々申し送られてきた(質問があっても誰も答えられない「不文律の」)マニュアルの通りに操作するだけの人になるのか、そのBIツールがどんなデータで何をしているのかを、あたかもじぶんで「R」を使って処理しているかのようなイメージで生々しく認識できる人になるのかということなのです。実際にじぶんでなんでも実装する(生のプログラムを書く、生のデータ収集に取り組む)ということや、本当に「R」(そのもの)を業務で使うということは、きっとないでしょう

「A列車で行こう9」には
データがいっぱい

生のデータ収集に取り組むことはたいへんで、これだけで専門的な業務です。理数探究のための時間の大部分が単純な労働に費やされてしまっては元も子もありません。このサイト「DATT-A9D(arx.neorail.jp)」では、PCゲーム「A列車で行こう9」に題材を求め、さまざまなデータどん欲に使っていこうと思います。もっとほかのものでも、同じことができるでしょう。ここでPCゲーム「A列車で行こう9」を使ったのはたまたまです。

具体的・内部的なものから抽象的・外部的なものまで、さまざまなデータがあります。「さまざまなデータがある」とは、ゲームの中で列車や建物や植物や人口などの値の種類があるということではなく、このように「具体的・内部的なものから抽象的・外部的なものまで」があることを指しています。もちろん、抽象的・内部的なものもあれば、具体的・外部的なものもあるでしょう。文章や箇条書きでは、そのことが可視化できません。可視化の方法を考えてみましょう。3つ目の軸も探してみましょう。

まずは遊べ!ゲームとして)

ニューゲームで試す」の各ページで挙げたようなことを頭の片隅に置きながら、しかし思う存分、まずは遊びましょう!

ゲームとして遊ぶときには面倒に思えるでしょうが、このあと取り組む理数探究がラクになると思って、遊びながらもちょっとだけ面倒なことをしてください。ちょっとでいいですから!

  1. じぶんは何を考えてどう判断したのかをノートに記録しましょう
  2. ゲームの勝ち負けを決めさえすればよいという程度を超えて、より詳細な採点方法を考えてみよう

条件が違うと、判断やスコアはどのように変わるでしょうか。うまくいったことだけでなく、うまくいかなかったことや、うまくいっていたけれどこれをすればうまくいかなくなるというようなことを網羅的に書き出してみよう

※「実験計画法という名のおまじないを暗記という状態」あるいは「数学のパズルみたいなものという理解」に陥らず切実さ(実感)を持たせようというねらい

「データを対象とした実験」

*プロフェッショナルなツールで実現されていて新規性はないが、統計解析環境「R」や自作のプログラムで追体験しよう

ゲームのプログラムから離れて
実験環境を用意しよう

「R」を対話的に使おう
「R」と同じ計算をするプログラムを書いてみよう

地形の特徴・地形の複雑度


References


Descriptions and More

  • このページのもとになった記事(※ただし口語で長文です)がフォーラムで読めますので、詳しいことが知りたいときは参照してください。

  • All Rights Reserved. ©2018-2020, tht. このサイトについて