| 年度 |
2026年度 |
開講部局 |
人間社会科学研究科博士課程前期人文社会科学専攻ソーシャルデータサイエンスプログラム |
| 講義コード |
WMK00400 |
科目区分 |
専門的教育科目 |
| 授業科目名 |
機械学習の基礎 |
授業科目名 (フリガナ) |
キカイガクシュウノキソ |
| 英文授業科目名 |
Basics of Machine Learning |
| 担当教員名 |
湧田 雄基,梶川 祐朗,原田 裕輔 |
担当教員名 (フリガナ) |
ワクダ ユウキ,カジカワ ヒロアキ,ハラダ ユウスケ |
| 開講キャンパス |
東千田 |
開設期 |
1年次生 前期 2ターム |
| 曜日・時限・講義室 |
(2T) 火13-14,水13-14:オンライン,東千田第3演習室 |
| 授業の方法 |
講義 |
授業の方法 【詳細情報】 |
オンライン(同時双方向型) |
| 講義中心、演習中心、ディスカッション、学生の発表、 |
| 単位 |
2.0 |
週時間 |
4 |
使用言語 |
J
:
日本語 |
| 学習の段階 |
5
:
大学院基礎的レベル
|
| 学問分野(分野) |
24
:
社会科学 |
| 学問分野(分科) |
07
:
教育学 |
| 対象学生 |
ソーシャルデータサイエンスプログラム博士前期課程 |
| 授業のキーワード |
機械学習,データサイエンス,人工知能(AI),社会科学,教育 |
| 教職専門科目 |
|
教科専門科目 |
|
プログラムの中での この授業科目の位置づけ (学部生対象科目のみ) | |
|---|
到達度評価 の評価項目 (学部生対象科目のみ) | |
| 授業の目標・概要等 |
授業概要: 本授業では、機械学習を「データから予測・分類・構造発見を行い、意思決定を支援する技術」と捉え、代表的手法の考え方と使いどころを学びます。回帰・分類・クラスタリング等を題材に、データ前処理、学習、検証(ホールドアウト/交差検証)、評価指標の選び方、過学習への対処を、Pythonによる演習を通じて身に付けます。演習では生成AIを援用したコーディングを積極的に活用し、AIと協働しながら実践的なデータ処理・分析を進めます。さらに、モデルの性能評価や解釈といった実務で重要な観点にも触れ、実データに対して適切な手法選択と説明ができる基礎力を養います。
達成目標: ・教師あり学習(判別・回帰)および教師なし学習の代表的手法を理解し、与えられたデータ・課題に対して適切な分析手法を選択・適用できる ・データの前処理からモデル構築・評価までの一連の機械学習活用の工程を、生成AIを援用しながらPythonを用いて実行できる ・構築したモデルの性能を適切な指標で評価し、分析結果を解釈し、一般の人にわかるように説明できる |
| 授業計画 |
第1回 機械学習への導入 ・機械学習(ML: Machine Learning)/AI概論 ・ML活用の工程(CRISP-DM) ・人の学習との対比による機械学習の応用事例の理解 ・ML/AI活用におけるELSI 【演習】機械学習に関する授業開始時アンケート 第2回 ML応用のためのPython基礎(1) ・ソフトウェア実行環境(Google Colab) ・Markdown記法 ・Open Dataの活用 ・生成AI援用コーディング入門(Gemini on Colab, プロンプト設計) 【演習】Google ColabでNotebookの作成・編集 第3回 ML応用のためのPython基礎(2) ・データ処理の基本(データ型, Pandas) ・実行の基本(制御構造, 関数) ・フローチャートによる処理設計(input/処理/outputを意識した設計) ・可視化の基本(Matplotlib, japanize-matplotlib) 【演習】エクセルファイルの読み込み、データの可視化 第4回 ML応用のためのPython基礎(3) ・データ加工の基本(groupby, join, fillna) ・AI援用コーディングの作法とTips(関数化・設定の冒頭配置・コードレビュー) 【演習】データの集計、統合、動作検査 第5回 データの前処理(1) ・データの品質 ・データクレンジングと変数選択 【演習】データクオリティ評価、クレンジング、レコード除去と変数選択 第6回 データの前処理(2) ・MLのためのデータ前処理(Train-test split) ・カテゴリ変数のエンコーディング(get_dummies) 【演習】ML入力用データの完成(目的変数と説明変数の整理/数量化の完了) 第7回 教師有り学習(1):判別 ・機械学習を使って自動判別を行う(判別一般論, 決定木) ・判別モデルの構築(決定木) ・分析手法の選択、切り替え ・モデルの性能評価入門(Precision, Recall, F値) 【演習】解約しそうな顧客を判別するモデルを構築する 第8回 教師有り学習(2):判別 ・判別モデルの性能評価(F値, 混同行列, P-R曲線, AUC) ・学習用データと評価用データの分離(Hold-out法) ・汎化性能と過学習 【演習】判別モデルがどの程度あたるか、その性能評価(混同行列/P-R曲線) 第9回 教師有り学習(3):判別 ・Feature Importance(FI)によるモデル解釈 ・SHAPによるモデル解釈 ・「仮説抽出ツール」としてのML活用 【演習】判別に貢献している変数が何か、モデルの解釈(FI/SHAP) 第10回 教師有り学習(4):判別 ・交差検証(k-fold CV) ・不均衡データへの対応(アンダー/オーバーサンプリング, SMOTE) 【演習】不均衡データへの対応、性能変化の確認 第11回 教師有り学習(1):回帰 ・機械学習を使って推定を行う(回帰一般論) ・回帰に向けた前処理(パネルデータの作成) ・回帰モデルの構築(パネルデータ分析, 重回帰) 【演習】パネルデータ分析(地価の変動分析と予測) 第12回 教師有り学習(2):回帰 ・回帰モデルの性能評価(R2, RMSE, MAE) ・手法選択と性能比較(LightGBM) ・時系列データに対する回帰の適用 【演習】時系列分析、回帰の性能評価(経済指標の変動分析と予測) 第13回 教師無し学習:PCA・クラスター分析 ・対象データの成分を調べる(主成分分析: PCA) ・対象データをグループに分類する(クラスター分析, k-means/階層型クラスター) ・主成分クラスター分析 ・因子分析(概念と位置づけ) 【演習】データ分析による顧客セグメンテーション(PCAクラスター分析) 第14回 まとめと考察(1):ML全体像と予測と因果 ・ML全体像の整理と手法選定の方針 ・MLの得意分野/MLの限界・失敗事例 ・社会・経済分野のDS ・因果関係と相関関係 ・自然実験、DID(差分の差分法) ・MLを用いた因果分析のアプローチ(紹介) 【演習】機械学習に関する授業終了時アンケート 第15回 まとめと考察(2):自身の研究への活用設計 ・授業全体の振り返り ・自身の研究へのML活用についての考察 【演習】終了課題:身近/興味関心のある課題に対して、ML適用シナリオを設計する
レポートを提出すること。 |
| 教科書・参考書等 |
特定の教科書は用いません。授業時に、テキストとなる資料を配付します。 |
授業で使用する メディア・機器等 |
映像資料, Microsoft Teams, Zoom, moodle |
| 【詳細情報】 |
Ovice |
授業で取り入れる 学習手法 |
ディスカッション, PBL(Problem-based Learning)/ TBL(Team-based Learning), 授業後レポート |
予習・復習への アドバイス |
予習: ・次の回の授業項目を事前に確認し、これらの内容について自分なりの考えや疑問を整理した上で授業に臨むこと。 ・前回の授業で提示された課題の残りや、次回までの宿題がある場合には、次回までに進めておくこと。 復習: ・前回までの授業内容で、授業時間内に完了しなかったものについて、手を動かし、進める。 ・進め方がわからなかったことは、不明確のまま放置せず、記録し、次回授業に臨むこと。 ・授業後レポートを通じて、当日の内容への理解を自分の言葉で整理すること。 |
履修上の注意 受講条件等 |
|
| 成績評価の基準等 |
授業の参加姿勢,課題レポート 成績評価は、授業への参加姿勢、課題レポートを考慮して評価します。 ・授業への参加姿勢/授業や演習への積極的な参加:40% ・課題レポート:60% |
| 実務経験 |
有り
|
実務経験の概要と それに基づく授業内容 |
機械学習の実用化や、民間企業との共同研究等の実務経験を活用し、実務で有用な機械学習手法を扱う。 |
| メッセージ |
機械学習は、オープンソースのソフトウェアライブラリや、開発環境、生成AIの援用も可能になり、かなり身近なものになりました。 当授業では、可能な限り、実用的なプログラミングに厳選して、人文・社会科学での機械学習の応用を見据えた、基礎技術を扱います。 自身の研究や卒後の仕事など、色々な場面で、自分の専門知識や接している問題に対して、機械学習を応用し、データサイエンスを行える素地を身に付けてください。 |
| その他 |
|
すべての授業科目において,授業改善アンケートを実施していますので,回答に協力してください。 回答に対しては教員からコメントを入力しており,今後の改善につなげていきます。 |