WMK00700 テキスト解析

広島大学シラバス

English

年度 2025年度開講部局人間社会科学研究科博士課程前期人文社会科学専攻ソーシャルデータサイエンスプログラム

講義コード WMK00700 科目区分専門的教育科目

授業科目名テキスト解析

授業科目名
（フリガナ）テキストカイセキ

英文授業科目名 Text Analysis

担当教員名原田　裕輔,梶川　祐朗,鈴木　喜久

担当教員名
(フリガナ) ハラダ　ユウスケ,カジカワ　ヒロアキ,スズキ　ヨシヒサ

開講キャンパス東千田開設期 1年次生後期セメスター（後期）

曜日・時限・講義室 (後) 水13-14：東千田第2演習室

授業の方法授業の方法
【詳細情報】対面, オンライン（オンデマンド型）

講義中心、演習中心、ディスカッション、学生の発表

単位 2.0 週時間 2 使用言語 J : 日本語

学習の段階 5 : 大学院基礎的レベル

学問分野（分野） 24 : 社会科学

学問分野（分科） 05 : 社会学

対象学生ソーシャルデータサイエンスプログラム博士前期課程

授業のキーワードテキスト解析，機械学習，データサイエンス，人工知能（AI），社会科学

教職専門科目　教科専門科目　

プログラムの中での
この授業科目の位置づけ
（学部生対象科目のみ）テキスト形式の解析方法について基礎となるプログラミングおよび分析ソフトウェアを用いて、基礎から学ぶ。
到達度評価
の評価項目
（学部生対象科目のみ）

授業の目標・概要等本授業では、テキストデータから有益な情報を抽出するためのテキスト解析手法を体系的に学びます。Pythonによるプログラミング演習を中心に、形態素解析・単語頻度分析・機械学習を用いた文章分類やクラスタリング・トピックモデルなどを扱います。また、GUIベースのテキスト解析ツール（例：KH Coder、Voyant Tools）なども併用し、コードを書くことが苦手な受講者でも取り組みやすいアプローチを提供します。授業後半では、ニューラルネットワーク（Word2Vec、BERT等）といった先端的な手法や、大規模言語モデルの概要にも触れます。

授業計画第1回：オリエンテーションと開発環境の準備
第2回：Pythonの基礎とテキストデータの扱い
第3回：テキスト解析の基礎 (1) – 形態素解析とトークナイゼーション
第4回：テキスト解析の基礎 (2) – コーパスとデータ構造
第5回：統計基礎 (1) – 記述統計と可視化
第6回：統計基礎 (2) – 統計的仮説検定
第7回：機械学習 (1) – テキスト分類とナイーブベイズ
第8回：機械学習 (2) – 情報検索とウェブテキストの収集
第9回：多変量解析 (1) – クラスタリング・次元削減
第10回：多変量解析 (2) – トピックモデル (LDA) と応用
第11回：ニューラルネットワーク (1) – 単語埋め込みとベクトル表現
第12回：ニューラルネットワーク (2) – BERT 等のトランスフォーマーモデル
第13回：応用演習 (1) – テキスト解析ソフトウェアを使った総合分析
第14回：応用演習 (2) – プロジェクトワーク
第15回：総括と先端事例・社会的課題の検討

レポートを提出すること。

教科書・参考書等授業内で紹介する。

授業で使用する
メディア・機器等テキスト, 映像資料, Microsoft Teams, moodle

【詳細情報】

授業で取り入れる
学習手法ディスカッション, 授業後レポート

予習・復習への
アドバイス第1回: 授業の流れを理解してください。確実に環境を整えてください。
第2回: Python の理解を深めてください。
第3-4: 扱うテキストデータの構造について理解してください。
第5-6回: 基本的な統計について理解を深めてください。
第7-12回: データの解析手法や可視化について理解を深めてください。
第13-14回: 実際のデータに基づいた前処理からテキストデータの分析について理解を深めてください。
第14-15回: 総括と先端の事例について理解を深めてください。

履修上の注意
受講条件等

成績評価の基準等授業の参加姿勢，課題レポート

実務経験

実務経験の概要と
それに基づく授業内容

メッセージ

その他

すべての授業科目において，授業改善アンケートを実施していますので，回答に協力してください。
回答に対しては教員からコメントを入力しており，今後の改善につなげていきます。

年度	2025年度	開講部局	人間社会科学研究科博士課程前期人文社会科学専攻ソーシャルデータサイエンスプログラム
講義コード	WMK00700	科目区分	専門的教育科目
授業科目名	テキスト解析
授業科目名（フリガナ）	テキストカイセキ
英文授業科目名	Text Analysis
担当教員名	原田　裕輔,梶川　祐朗,鈴木　喜久
担当教員名 (フリガナ)	ハラダ　ユウスケ,カジカワ　ヒロアキ,スズキ　ヨシヒサ
開講キャンパス	東千田	開設期	1年次生後期セメスター（後期）
曜日・時限・講義室	(後) 水13-14：東千田第2演習室
授業の方法		授業の方法【詳細情報】	対面, オンライン（オンデマンド型）
講義中心、演習中心、ディスカッション、学生の発表
単位	2.0	週時間	2	使用言語	J : 日本語
学習の段階	5 : 大学院基礎的レベル
学問分野（分野）	24 : 社会科学
学問分野（分科）	05 : 社会学
対象学生	ソーシャルデータサイエンスプログラム博士前期課程
授業のキーワード	テキスト解析，機械学習，データサイエンス，人工知能（AI），社会科学
教職専門科目		教科専門科目
プログラムの中でのこの授業科目の位置づけ（学部生対象科目のみ）	テキスト形式の解析方法について基礎となるプログラミングおよび分析ソフトウェアを用いて、基礎から学ぶ。
到達度評価の評価項目（学部生対象科目のみ）
授業の目標・概要等	本授業では、テキストデータから有益な情報を抽出するためのテキスト解析手法を体系的に学びます。Pythonによるプログラミング演習を中心に、形態素解析・単語頻度分析・機械学習を用いた文章分類やクラスタリング・トピックモデルなどを扱います。また、GUIベースのテキスト解析ツール（例：KH Coder、Voyant Tools）なども併用し、コードを書くことが苦手な受講者でも取り組みやすいアプローチを提供します。授業後半では、ニューラルネットワーク（Word2Vec、BERT等）といった先端的な手法や、大規模言語モデルの概要にも触れます。
授業計画	第1回：オリエンテーションと開発環境の準備第2回：Pythonの基礎とテキストデータの扱い第3回：テキスト解析の基礎 (1) – 形態素解析とトークナイゼーション第4回：テキスト解析の基礎 (2) – コーパスとデータ構造第5回：統計基礎 (1) – 記述統計と可視化第6回：統計基礎 (2) – 統計的仮説検定第7回：機械学習 (1) – テキスト分類とナイーブベイズ第8回：機械学習 (2) – 情報検索とウェブテキストの収集第9回：多変量解析 (1) – クラスタリング・次元削減第10回：多変量解析 (2) – トピックモデル (LDA) と応用第11回：ニューラルネットワーク (1) – 単語埋め込みとベクトル表現第12回：ニューラルネットワーク (2) – BERT 等のトランスフォーマーモデル第13回：応用演習 (1) – テキスト解析ソフトウェアを使った総合分析第14回：応用演習 (2) – プロジェクトワーク第15回：総括と先端事例・社会的課題の検討レポートを提出すること。
教科書・参考書等	授業内で紹介する。
授業で使用するメディア・機器等	テキスト, 映像資料, Microsoft Teams, moodle
【詳細情報】
授業で取り入れる学習手法	ディスカッション, 授業後レポート
予習・復習へのアドバイス	第1回: 授業の流れを理解してください。確実に環境を整えてください。第2回: Python の理解を深めてください。第3-4: 扱うテキストデータの構造について理解してください。第5-6回: 基本的な統計について理解を深めてください。第7-12回: データの解析手法や可視化について理解を深めてください。第13-14回: 実際のデータに基づいた前処理からテキストデータの分析について理解を深めてください。第14-15回: 総括と先端の事例について理解を深めてください。
履修上の注意受講条件等
成績評価の基準等	授業の参加姿勢，課題レポート
実務経験
実務経験の概要とそれに基づく授業内容
メッセージ
その他
すべての授業科目において，授業改善アンケートを実施していますので，回答に協力してください。回答に対しては教員からコメントを入力しており，今後の改善につなげていきます。

シラバスTOPへ