高等学校情報科「情報Ⅱ」教員研修用教材の内容あるいは関連する内容をPythonで実装します。ただし、すべてを網羅するものではありません。このページは随時更新していきます(したがって、準備中の項目もあります)。
〔参考〕
- 統計学習の指導のために > 補助教材 > 総合学習のための補助教材 > 「高等学校における「情報II」のためのデータサイエンス・データ解析入門」
第3章 情報とデータサイエンス 前半
(1)学習11 演習▶4 pandas によるデータフレームのメリットを感じてみよう
(a) 演習▶4の準備:CSVファイルの生成
(2)学習11 演習5 グラフ型データベースのイメージ体験
(省略)
(3)学習11 演習6 図表6 に示した JSON 形式のデータ「study.json」を Python で読み込んでみましょう。
(4)学習12 演習1 世界中で発生した地震について調べるために,USGS から Web API を用いて地震のデータを取得してみましょう。
(5)学習12 演習2 文部科学省から発表された内容を確認するために,新着情報のページから,項目名を抽出してみましょう。
(6)学習12 演習3 都道府県別の人口の状況を調べるため,e-Stat で「都道府県の指標 基礎データ 人口・世帯 2020」とキーワード検索して表示されたデータを,表計算ソフトで読み込める形式でダウンロードしました。このデータの中の 2015 年の部分をプログラミング言語で扱えるように表計算ソフトで修正しましょう
(7)学習12 演習4 人口減少社会といわれていますが,pandas を用いて都道府県ごとに人口 10 万人に対する人口の増減について調べてみましょう。ここで,人口の増減は(出生数+転入者数)ー(死亡数+転出者数)により求めるものとします
(8)学習12 演習5 演習 4 の変数 df を用いて,データ形式の変換に慣れましょう。変数 df はワイドフォーマットになっています。これをロングフォーマットに変換してみましょう。また,変換されたロングフォーマットのデータフレームをワイドフォーマットに変換してみましょう。
(9)学習12 演習6 そらまめ君(環境省大気汚染物質広域監視システム)からデータをダウンロードし大気汚染の状況を調べようとしています。このデータに含まれる欠損値がどの程度あるかを調べて,欠損値の処理をしましょう。
(10)学習13 演習2 「科学の道具箱」https://rika-net.com/contents/cp0530/contents/ から,体力測定のデータをダウンロードし,目的変数と説明変数を自身で決めて予測モデルを作成してみましょう。また,作成した予測モデルからどのようなことが分かるのか,説明してみましょう。
(11)学習14 演習1 体力測定データの主成分分析結果の数値を読み取り,採用する主成分数の決定とその主成分の解釈をしてみましょう。また,「科学の道具箱」から体力測定のデータをダウンロードし,主成分分析を実行してみましょう。
第3章 情報とデータサイエンス 後半
(12)学習15 演習1 kaggle から,titanic データをダウンロードし 図表3 ,タイタニック号に乗っていた乗客の年齢,性別,客室に関して,その生存の有無を表す決定木を作成してみましょう。
(13)学習15 演習2 kaggle から,digit-recognizer のデータ(MNIST データ)をダウンロードし 図表8 ,train.csv の一部を訓練データとして,k近傍法を用いて学習させ,train.csv の一部をテストデータとして,その正答率を
調べましょう
(14)学習16 演習1 e-Stat で公開されている家計消費状況調査の「特定の財(商品)・サービスの 1 世帯当たり 1 か月間の支出を全国・地方・都市階級別にまとめたのデータ(表番号 3-1)」を用いて,地方ごとの支出額を基にクラスタリングをし,家計の傾向についての地方間の類似性やその傾向について考えてみましょう。
(15)学習16 演習2 カリフォルニア大学アーバイン校(UCI)が運営する機械学習用データ配布サイトで公開されている卸売業者の顧客データを用いて,顧客をクラスタリングし,どのような顧客が購入しているか分析してみましょう。
(16)学習16 演習3 各クラスタの特徴とこの卸売業者が売り上げを伸ばすための方策を考えましょう 図表9 図表10。また,クラスタ数を5として分析を行いましたが,クラスタ数を変えた場合はどのように変化するかを考えましょう。
(17)学習17 演習2 TensorFlow Playgroundで, を複数組み合わせ,同じものを重ねて,FEATURES や HIDDENLAYER を操作して組み合わせることにより,オレンジ色の点とブルーの点の集まりを明確に分
けることができるか,試してみましょう。
(18)学習17 演習3 ニューラルネットワークの計算を確認しましょう。
(19)学習17 演習4 MNIST(4 と 9 の手書き文字)の認識(2 値分類)をニューラルネットワークで学習してみましょう。ここでは,Neural Network Console(https://dl.sony.com/ja/ アカウント取得が必要)を使って演習します
(19)学習17 演習5 自分で10種類の文字を判別するニューラルネットワークを作成してみましょう。多層のニューラルネットワークでなければ精度の高い判別は難しいが,練習のために単純なニューラルネットワークを構築してみましょう。
(20)学習18 演習2 青空文庫の夏目漱石作「坊っちゃん」を題材に,Word2vec を用いて,分析しましょう。
(21)学習18 演習4 それぞれが用意した写真について,Tiny YOLO アルゴリズムを用いて,写真上にある物体を検出・識別するプログラムを作成してみましょう。
第4章 情報システムとプログラミング
(22)学習23 演習2 著者名で検索して,該当する書籍を一覧で表示するプログラムを作成しましょう
(23)学習25 演習2 著者名で検索して,該当する書籍を一覧で表示するプログラムを作成しましょう
第5章 情報と情報技術を活用した問題発見・解決の探究
Copyright (C) 2022 Easy Programming