年度 |
2025年度 |
開講部局 |
人間社会科学研究科博士課程前期人文社会科学専攻ソーシャルデータサイエンスプログラム |
講義コード |
WMK00700 |
科目区分 |
専門的教育科目 |
授業科目名 |
テキスト解析 |
授業科目名 (フリガナ) |
テキストカイセキ |
英文授業科目名 |
Text Analysis |
担当教員名 |
鈴木 喜久,梶川 祐朗,原田 裕輔 |
担当教員名 (フリガナ) |
スズキ ヨシヒサ,カジカワ ヒロアキ,ハラダ ユウスケ |
開講キャンパス |
東千田 |
開設期 |
1年次生 後期 セメスター(後期) |
曜日・時限・講義室 |
(後) 水13-14 |
授業の方法 |
|
授業の方法 【詳細情報】 |
対面, オンライン(オンデマンド型) |
講義中心、演習中心、ディスカッション、学生の発表 |
単位 |
2.0 |
週時間 |
2 |
使用言語 |
J
:
日本語 |
学習の段階 |
5
:
大学院基礎的レベル
|
学問分野(分野) |
24
:
社会科学 |
学問分野(分科) |
05
:
社会学 |
対象学生 |
ソーシャルデータサイエンスプログラム博士前期課程 |
授業のキーワード |
テキスト解析,機械学習,データサイエンス,人工知能(AI),社会科学 |
教職専門科目 |
|
教科専門科目 |
|
プログラムの中での この授業科目の位置づけ (学部生対象科目のみ) | テキスト形式の解析方法について基礎となるプログラミングおよび分析ソフトウェアを用いて、基礎から学ぶ。 |
---|
到達度評価 の評価項目 (学部生対象科目のみ) | |
授業の目標・概要等 |
本授業では、テキストデータから有益な情報を抽出するためのテキスト解析手法を体系的に学びます。Pythonによるプログラミング演習を中心に、形態素解析・単語頻度分析・機械学習を用いた文章分類やクラスタリング・トピックモデルなどを扱います。また、GUIベースのテキスト解析ツール(例:KH Coder、Voyant Tools)なども併用し、コードを書くことが苦手な受講者でも取り組みやすいアプローチを提供します。授業後半では、ニューラルネットワーク(Word2Vec、BERT等)といった先端的な手法や、大規模言語モデルの概要にも触れます。 |
授業計画 |
第1回:オリエンテーションと開発環境の準備 第2回:Pythonの基礎とテキストデータの扱い 第3回:テキスト解析の基礎 (1) – 形態素解析とトークナイゼーション 第4回:テキスト解析の基礎 (2) – コーパスとデータ構造 第5回:統計基礎 (1) – 記述統計と可視化 第6回:統計基礎 (2) – 統計的仮説検定 第7回:機械学習 (1) – テキスト分類とナイーブベイズ 第8回:機械学習 (2) – 情報検索とウェブテキストの収集 第9回:多変量解析 (1) – クラスタリング・次元削減 第10回:多変量解析 (2) – トピックモデル (LDA) と応用 第11回:ニューラルネットワーク (1) – 単語埋め込みとベクトル表現 第12回:ニューラルネットワーク (2) – BERT 等のトランスフォーマーモデル 第13回:応用演習 (1) – テキスト解析ソフトウェアを使った総合分析 第14回:応用演習 (2) – プロジェクトワーク 第15回:総括と先端事例・社会的課題の検討
レポートを提出すること。 |
教科書・参考書等 |
授業内で紹介する。 |
授業で使用する メディア・機器等 |
テキスト, 映像資料, Microsoft Teams, moodle |
【詳細情報】 |
|
授業で取り入れる 学習手法 |
ディスカッション, 授業後レポート |
予習・復習への アドバイス |
第1回: 授業の流れを理解してください。確実に環境を整えてください。 第2回: Python の理解を深めてください。 第3-4: 扱うテキストデータの構造について理解してください。 第5-6回: 基本的な統計について理解を深めてください。 第7-12回: データの解析手法や可視化について理解を深めてください。 第13-14回: 実際のデータに基づいた前処理からテキストデータの分析について理解を深めてください。 第14-15回: 総括と先端の事例について理解を深めてください。 |
履修上の注意 受講条件等 |
|
成績評価の基準等 |
授業の参加姿勢,課題レポート |
実務経験 |
|
実務経験の概要と それに基づく授業内容 |
|
メッセージ |
|
その他 |
|
すべての授業科目において,授業改善アンケートを実施していますので,回答に協力してください。 回答に対しては教員からコメントを入力しており,今後の改善につなげていきます。 |