広島大学シラバス

シラバスTOPへ
English
年度 2025年度 開講部局 情報科学部
講義コード KA240101 科目区分 専門教育科目
授業科目名 テキストマイニング
授業科目名
(フリガナ)
テキストマイニング
英文授業科目名 Text Mining
担当教員名 戴 憶菱
担当教員名
(フリガナ)
ダイ オクリョウ
開講キャンパス 東広島 開設期 3年次生   後期   4ターム
曜日・時限・講義室 (4T) 月1-4:経B257
授業の方法 講義 授業の方法
【詳細情報】
対面
講義中心、演習中心、ディスカッション、学生の発表 
単位 2.0 週時間 4 使用言語 J : 日本語
学習の段階 3 : 中級レベル
学問分野(分野) 25 : 理工学
学問分野(分科) 02 : 情報科学
対象学生
授業のキーワード  
教職専門科目   教科専門科目  
プログラムの中での
この授業科目の位置づけ
(学部生対象科目のみ)
 
到達度評価
の評価項目
(学部生対象科目のみ)
計算機科学プログラム
(知識・理解)
・D1. 計算機科学の基礎となる理論体系を理解し,科学的論理性に基づいた情報処理技術を駆使して,高次元データを収集・処理するための知識と能力.

データ科学プログラム
(能力・技能)
・A. 情報基盤の開発技術,情報処理技術,データを分析して新しい付加価値を生む技術.
・B. 新たな課題を自ら発見し,データに基づいた定量的かつ論理的な思考と,多角的視野と高度な情報処理・分析により,課題を解決する能力.

知能科学プログラム
(能力・技能)
・B. 新たな課題を自ら発見し,データに基づいた定量的かつ論理的な思考と,多角的視野と高度な情報処理・分析により,課題を解決する能力.
・D2. 人工知能やIoTなどの応用や発展に寄与できる情報処理能力やデータ分析能力. 
授業の目標・概要等 テキストマイニングとは,大量のテキストから知識を抽出する分野のことで,自然言語処理技術の進化と共に発展している.本授業では,基礎知識から応用例までを学び,Pythonを活用した解析スキルを習得することを目指す.第一部では身近な例を通じて基礎を学び,技術的な解説を受ける.第二部では,文書表現,分類,トピックモデル,検索,要約,感情分析などの理論と実践を習得する.第三部では,大規模言語モデルなどがテキストマイニングにもたらす影響を議論する.第四部では,学んだ技術を用いてデータから知見を抽出し,発表する課題に挑戦する. 
授業計画 第1回 テキストマイニングの導入:人間vs機械(ディスカッション)
第2回 テキストマイニングの概要と歴史,Python環境の構築
第3回 テキスト表現と前処理
第4回 テキストの基本統計と可視化 
第5回 テキストの共起分析
第6回 テキストの分類
第7回 テキストのトピックモデル
第8回 テキストの検索
第9回 テキストの要約
第10回 第1回ディスカッションの振り返り,課題内容の発表
第11回 テキストの感情分析
第12回 ニューラルネットワーク,機械翻訳
第13回 言語モデル,Transformer,大規模言語モデル
第14回 課題発表(前半)
第15回 課題発表(後半)

基本的に毎週,演習・レポートを課す.
授業の進捗により内容を変更する場合がある. 
教科書・参考書等 教科書は指定せず,適宜資料を配布する.

参考書:
・金 明哲 著,テキストアナリティクスの基礎と実践,岩波書店,2021
・Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008.
・Charu C. Aggarwal, Machine Learning for Text, Springer, 2019.

 
授業で使用する
メディア・機器等
【詳細情報】  
授業で取り入れる
学習手法
予習・復習への
アドバイス
Pythonや他のプログラミング言語の経験があるとよいでしょう. 
履修上の注意
受講条件等
 
成績評価の基準等 ディスカッション,演習,レポート,課題発表によって総合的に評価する. 
実務経験  
実務経験の概要と
それに基づく授業内容
 
メッセージ  
その他   
すべての授業科目において,授業改善アンケートを実施していますので,回答に協力してください。
回答に対しては教員からコメントを入力しており,今後の改善につなげていきます。 
シラバスTOPへ