[ DATT-A9D > データで遊ぶ ]
PCゲーム「A列車で行こう9」で遊びながら学ぶ、Rのハローワールド。(最終更新:2024年9月12日、8月31日は野菜の日です)
データで遊ぶ
このページを読むと何ができるのかまったくわからんというかたは先にこちら
独習「A列車で理数探究」への展望
このサイト「DATT-A9D(arx.neorail.jp)」は、A列車で行こう9で理数探究(略称:A列車で理数探究)が楽しめる世界初のサイトです。理科室を使うだけが理数探究ではありません。GISの単なるオペレーターにさせるだけの地理探究ではいけません。地学と地理にまたがる題材そして工学への接続を企図して、フリーの統計解析環境「R」に親しませる目的のコンテンツです。フリーの統計解析環境「R」について指導できる教員がいなくても、理数探究といわれても理科に興味はなく数学は可もなく不可もなく高校生のかたが独習できるようにすることを目指しています。この内容で先生が授業をして成績をつけようというものではありません。じぶんでやりましょう。
データなくして研究にあらず。データを見つけよう。さすればそれがテーマだ。ファミレスに外付けハードディスクを置き忘れないでください。
ステップバイステップ
1 | ダウンロード | いますぐ「R」を入手せよ |
2 | インストール | 「R」をインストールして操作方法を知り
とにかくプロットしてみる(計算しない) |
3 | ライブラリ | わかりやすいアルゴリズム(ライブラリ)を
ストレートに使ってみる(考えない) |
4 | コーディング | 自分で考えた処理を実行してみる(あまり凝らない) |
5 | エクステンション | 複数の方法を組み合わせたり
数や規模を大きくしてみる |
6 | プロプライエタリ | 「R」も使うけれど
「Excel」を使わなくなるわけではない |
いますぐ「R」を入手せよ
- 統計数理研究所のミラーサイトからダウンロード
どこの何ともわからないあやしいものではなく、大学共同利用機関法人「情報・システム研究機構」傘下の国立の研究機関「統計数理研究所」のサーバーからダウンロードするのだというリアリティを持って。
「オープンソース」の説明が必要な人には、そこから丁寧に説明を。
- (参考)「初音ミクのベクトル」とは
「R」が高速な計算や使いやすさを誇る領域である「行列・ベクトル」の楽しさを知り、ほかのプログラミング言語との使い分けについて理解します。
「コサイン距離」が情報検索や情報推薦に使われていることを紹介し、「ベクトル」を3次元までの物理的なイメージにとらわれず理解するよう促します。
「R」をインストールして操作方法を知り
とにかくプロットしてみる(計算しない)
- 片栗粉R ~ラピエ・ドリーネ・ポドゾル!~
地学の先生が夜なべして片栗粉で作った模型のような3Dプロット。
ゲームの中では(ゲームソフトの機能だけでは)見ることのできない「マップ全景」を、いとも簡単に描きます。
往年のファミコン雑誌に載っていた(テレビ画面を撮影してつなぎ合わせた)マリオのステージやドラクエの地図が懐かしいですね。
- (参考)シウマイ多変量解析
Excelで描くのは面倒な「散布図行列」をコマンド1つで描きながら「多変量」の空間的イメージを養います。
かの有名なフライドポテトの長さを測る例題の向こうを張ってみました。
わかりやすいアルゴリズム(ライブラリ)を
ストレートに使ってみる(考えない)
- 府中のメソッド ~ノエルがいっぱい~
マップの「平地」を均等に分割します。
お試しとして「最近隣法」「ウォード法」「最小全域木」を使ってみます。
「R」を使わないと簡単にはできない計算やプロットができさえすればよい、その前後の工程は手作業でもよい、というスタンスで気楽に臨みましょう。
- 新川崎メソッド ~ロコがいっぱい~
細かく町名をつけるために、「平地」を36分割します。
数が多くなると色分けでのプロットには無理が出てきますので、色分けに頼らないプロットの方法を見つけます。
「R」の上でちょっとしたデータの加工やプロットの見栄えの変更をするコマンドを調べながら進めましょう。
- 三景七景 ~プレミアム~
「平地」を主成分分析し、さまざまな数や形の領域に分割します。
クラスターの数をどう決めればよいのかという「永遠の課題」と戯れます。
- (参考)ニューゲームを自動分類するには
人工知能(パターン認識)への導入として、CART法を使って「回帰木」を作成します。「ポンチ絵」はこちら。
ニューラルネットワーク(NN)だけが「AI」ではありません。SF映画や言葉のイメージだけで抱いてしまった「AI」への幻想を打ち砕きましょう。
自分で考えた処理を実行してみる(あまり凝らない)
- ベクトル円海山 ~砂まじりの一滴~
「平地」の微地形を復元します。
- ベクトル海百山百 ~網棚がいっぱい~
「山」と「水面」をクラスタリングし、最近傍のクラスターの重心を探し、矢印でプロットします。
「作図しよう」に掲載の例題を使った「検証編」はこちら。
クラスターの数や矢印の描画方法をいろいろ変えてみてください。
- (未稿)三都物語 ~全自動CBDのスズメ~
水面と20mまでの高台をクラスタリングして「都心(CBD)」の立地を決めるアルゴリズムを考えます。
三都物語®は西日本旅客鉄道株式会社の登録商標です。自作のプログラムに三都物語という名前は付けられないので意欲が削がれ、ペンディングになっています。
- 新千歳メソッド ~いっぱいスキー~
隣町との接続が容易でゲームのスタート地点とするのに適するエリアの候補を提案する方法を検討しました。
マップの「周囲の平地」をクラスタリングし、マップ全体の「平地の重心」と「周囲の平地の重心」との比較により、候補地を絞り込みます。
- (未稿)固有ベクトル中心性
グラフ(ネットワーク)の隣接行列から「固有ベクトル中心性」を求めて何か遊ぼうと思いました。
複数の方法を組み合わせたり
数や規模を大きくしてみる(おかわり)
- 新浦安オンザアイス ~いつかどこかで~
マップの「海」と「山」の重心を求め、ボロノイ図を描きます。
- 新札幌バウム ~空返大王~
- 新御茶ノ水ジャム ~到達回転再発進立坑~
復元した微地形の主成分得点でk-means。等高線も描きます。
- 新逢坂山田前 ~乾杯は抹茶で~
平地と高台を15・45・90の領域に分割します。
「R」も使うけれど
「Excel」を使わなくなるわけではない(おかえり)
- 単回帰分析 ~スターチップスわかしお味~
Excelでグラフを描くだけの簡単なお仕事です。
- (参考)いわゆるMDSとPCAの違い
「t-SNEのBarnes-Hutアルゴリズム」を紹介します。
いろいろな名前の分析手法があっても、単なる流行り廃りで数理的な違いがほとんどないものもあるということを理解します。
- (参考)「右固有ベクトル」の読み方
Googleでおなじみの「PageRank」を「HITS」に戻って理解しなおします。
- (参考)商用製品に頼らずに「PLS回帰」を理解して使いこなすには
企業研究者ではない教員・学生や一般の人が「PLS回帰」を学ぼうとするとたいへんな目に遭うようすを遠目に眺めます。
社内にデータ解析のマニュアルが完備されていれば、解析に従事する個々人の数理的な理解の程度は不問になるということについて考えさせます。
- (未稿)君台観左右帳記
朝倉書店「多変量解析実例ハンドブック」で古典籍(古文書・国文学)の研究事例を見ていきます。
研究における「現物」(試料・史料)をいかにして「データ」にして「データ解析」の俎上に載せるのかを考えさせます。
- (未稿)ハイパースペクトルカメラ
人間の目では見えない波長まで撮影できるカメラを紹介し、同じものを違う方法で観察することや、そうして得た多次元のデータを再び総合して考察していくプロセスを追体験します。
ARXざぶんと一枚ツイン(2661) All Rights Reserved. ©2018-2024, tht.