年度 |
2025年度 |
開講部局 |
先進理工系科学研究科博士課程前期先進理工系科学専攻情報科学プログラム |
講義コード |
WSN22001 |
科目区分 |
専門的教育科目 |
授業科目名 |
Data Management |
授業科目名 (フリガナ) |
データ マネジメント |
英文授業科目名 |
Data Management |
担当教員名 |
森本 康彦 |
担当教員名 (フリガナ) |
モリモト ヤスヒコ |
開講キャンパス |
東広島 |
開設期 |
1年次生 後期 3ターム |
曜日・時限・講義室 |
(3T) 水5-8:工106 |
授業の方法 |
講義 |
授業の方法 【詳細情報】 |
対面 |
講義、演習、作業を併用 |
単位 |
2.0 |
週時間 |
4 |
使用言語 |
B
:
日本語・英語 |
学習の段階 |
6
:
大学院専門的レベル
|
学問分野(分野) |
25
:
理工学 |
学問分野(分科) |
02
:
情報科学 |
対象学生 |
博士課程前期(修士課程)および博士課程後期(博士課程) |
授業のキーワード |
|
教職専門科目 |
|
教科専門科目 |
|
プログラムの中での この授業科目の位置づけ (学部生対象科目のみ) | |
---|
到達度評価 の評価項目 (学部生対象科目のみ) | |
授業の目標・概要等 |
この授業では,説明可能なAI,いわゆるXAIについて学ぶ.ビッグデータから機械学習して作成されたAIは,すでに人間の能力以上の情報認識能力・情報判別能力をもつようになっている.その一方で,性能の高いニューラルネットワークにもとづく多くのモデルは,その認識や判定理由がブラックボックスとなっており,それを利用しようとする人間にとって,モデルの出力の妥当性を判断するすべはない.そこでXAI技術の必要性が高まってきたが,モデルから説明を発掘するこの技術は,データマイニング技術とも相通じるところがある.この授業ではモデルから有用な知識を発掘するという視点で,XAI技術と関連するデータマイニング技術を解説してゆく. 大規模なデータから有用な知識を発掘するデータマイニング技術が90年代後半より急速に発展し,我々の日常生活の行動のあらゆる場面の意思決定に関わるようになっている.これまでのこの授業では,主要なデータマイニング技術を解説していたが,その主な内容は,すでにコモディティ化してきており,希少専門知識というより必需知識といえるものになってきている.そのような変化に対応し,主要なデータマイニング技術の解説は,情報科学部の専門科目「データマイニング」にて扱うようにした.これら主要データマイニング技術を腰を据えて学びたいという人は,学部授業を受講されたい. このような理由から,この授業は学部の「データマイニング」を受講してからの受講が望ましいが,この講義で必要不可欠な主要データマイニングについては,本講義内でも概説する予定なので,学部の「データマイニング」の受講をしていなくても,本講義の受講は可能である.
この授業は,解説・探求・演習を組み合わせたPBLスタイル(問題解決型)で行う予定で,各学習単元の具体的な問題に対して,各自が実データやクラウド・インターネットサイトを利用して,探求課題または演習課題のレポートを作成します. |
授業計画 |
1-2: ガイダンス・演習準備 本講義の概要を説明するとともに,解説・探求・演習を組み合わせたPBLスタイル(問題解決型)の授業の受講方法についてガイダンスを行う. また,演習時に使用予定のPythonやPython環境などの事前準備を行う. 3-4: 機械学習と人工知能の基本事項とXAI概要 本講義を学ぶ上で知っておかなければならない「機械学習と人工知能」の基本的事項を学ぶ. (教師あり学習,決定木,ニューラルネットワークなど) それらをふまえ,XAI技術が必要になった背景およびその技術概要を学ぶ. 演習では,特徴量の重要性,特徴量と予測値の関連性を分析する. 5-6: アンサンブル学習モデル・局所説明 アンサンブル学習による高性能な予測モデルについて学び,そのモデルの判定に対する判定理由の説明をLIMEと呼ばれる局所説明ツールを使用して抽出する演習を行う. 7-8: SHAP 協力ゲーム理論にもとづくShapley値(予測への貢献度)とその算出アルゴリズムを学ぶ. また,SHAPを利用した局所説明に関する演習を行う. 9-10: 大域説明 個々のインスタンスに対する説明ではなくモデルそのものの動作原理・判断原理を説明するいわゆる大域説明技術について学び,大域説明ツールをもちいた演習を行う. 11-12: 画像分類に対するXAI 表形式以外のデータについてもAIおよびXAIは利用されている. この回では画像分類に関するAI技術と,それに対するXAI技術について学び,それらについての演習を行う. 13-14: テキスト分類に対するXAI ひきつづき表形式以外のデータについて学ぶ. この回ではテキスト分類に関するAI技術と,それに対するXAI技術について学び,それらについて の演習を行う. 15: 生成系AIとそのプロファイリング 近年,情報処理技術のなかでもOCEAN Big Fiveと呼ばれる性格的特徴分析が利用されるようになっている.また画像と言語を融合したモデルも急速に発展している.そうした新たなアプローチから生成系を含むAIの動作原理の説明が可能か今後を展望する.
試験はせずレポート課題で評価します. |
教科書・参考書等 |
各単元で論文・参考書を紹介するとともにオリジナルのプリントも配布します. |
授業で使用する メディア・機器等 |
配付資料, moodle |
【詳細情報】 |
|
授業で取り入れる 学習手法 |
PBL(Problem-based Learning)/ TBL(Team-based Learning) |
予習・復習への アドバイス |
基本的に予習は不要ですが,各単元の解説に対する復習・探求・演習に関するアドバイスは以下の通りです. 3-4: 機械学習と人工知能の基本事項とXAI概要 とくに決定木とニューラルネットワークは,のちの講義・演習でも必要になるので,その原理をよく復習しておいてください. -- 5-6: アンサンブル学習モデル・局所説明 アンサンブル学習で利用される弱学習器としては多くの場合,決定木が利用されています.決定木は簡単なモデルですがアンサンブルモデルで利用することで,深層学習モデルに匹敵する性能をもつことを演習をとうして実感できるとよいと思います.また,XAIの代表的なツールであるLIMEを演習で利用する予定です.これを使いこなせるようになれば,社会に出てXAIを実務において応用できるようになります. -- 7-8: SHAP SHAPはLIMEとともにXAIの代表的なツールです.LIME同様にこれを使いこなせるようになれば,社会に出てXAIを実務において応用できるようになります.自分で使いこなせるようにしっかり演習してください. -- 9-10: 大域説明 具体的にはXAI技術として知られるPermutation Feature Importance,Partial Dependenceのコンセプト解説と,実際の分析をするので,必要に応じて,このキーワードで文献や解説および計算例を検索して参考にしてください. -- 11-14: 演習ではLIME,Grad-CAM,Integrated Gradients, BERTなどを利用します. 画像やテキストの分野では本演習で利用するもの以外にも,年々,あらたなより高性能なものがでてきているダイナミックな分野です.本演習を足掛かりに,新しいモデルでのXAI分析にとり組んでみてください. |
履修上の注意 受講条件等 |
|
成績評価の基準等 |
レポート課題80% 各課題への参加度20% |
実務経験 |
|
実務経験の概要と それに基づく授業内容 |
|
メッセージ |
|
その他 |
|
すべての授業科目において,授業改善アンケートを実施していますので,回答に協力してください。 回答に対しては教員からコメントを入力しており,今後の改善につなげていきます。 |