[[成蹊2009]] *日本語学講義B(後期) [#v96d1a69] --月曜5限 --資料は[[IT's Class>http://www.cc.seikei.ac.jp/itsclassstudent/itsclass.htm]]の教材のページを見てください。 --http://www.cc.seikei.ac.jp/ **お知らせ //-次回(11/2)の授業時にUSBメモリ(1GB以上)を持ってきてください。 -Web Collaborationで形態素解析用のソフトウェアを配布しています。自分のUSBメモリにコピーして使ってください。(空き容量が約400MB必要です) -出席について:情報教育用施設の出席管理システムで毎回確認しています。 ***11/16 第7回 形態素解析結果の集計(Excel) -今回から実習的な内容が多くなります。 -茶まめ(UniDic+MeCab)で解析した結果をExcelで集計します。 -自分で形態素解析が行えるようにするとともにExcelのピボットテーブルが使いこなせるようになってください。 +茶まめの使い方 --複数のファイルを解析する --ファイルに出力する ---タブ区切りテキスト +Excelとピボットテーブル --語種別の集計 --品詞別の集計 ---品詞大分類で集計(関数の利用) ***11/09 第6回 形態素解析 -形態素解析とは -UniDicの概要 -茶まめで形態素解析を行う --パワーポイント参照([[IT's Class入り口>http://www.cc.seikei.ac.jp/itsclassstudent/itsclass.htm]]) -配付資料:小木曽(2007)「日本語研究と自動形態素解析」 ***11/02 第5回 文字コード -文字の符号化と文字集合 --パワーポイント参照([[IT's Class入り口>http://www.cc.seikei.ac.jp/itsclassstudent/itsclass.htm]]) -形態素解析用ソフトウェア(配布と動作確認) ***10/26 第4回 コーパスのデータ形式 -構造化文書とXML --パワーポイント参照([[IT's Class入り口>http://www.cc.seikei.ac.jp/itsclassstudent/itsclass.htm]]) ***10/19 第3回 均衡コーパス -コーパスの設計とサンプリング --パワーポイント参照([[IT's Class入り口>http://www.cc.seikei.ac.jp/itsclassstudent/itsclass.htm]]) ***10/12(体育の日・開講日) 休講 ***10/5 第2回 利用可能な言語資源とコーパス -前回補足 --形態素解析のデモンストレーション(兼 環境チェック) (以下パワーポイント参照) -紙の資料からコーパスまで --コーパスとは ---広義のコーパス/狭義のコーパス ---コーパス,テキストデータの紹介 ***9/28 第1回 ガイダンス -[[自己紹介]] --独立行政法人国立国語研究所 http://www.kokken.go.jp/ → 大学共同利用機関法人人間文化研究機構 国立国語研究所 http://www.ninjal.ac.jp/ --[[日本語コーパスKOTONOHA>http://www2.kokken.go.jp/kotonoha/]] --[[KOTONOHA検索デモサイト>http://www.kotonoha.gr.jp/demo/]] --[[形態素解析辞書UniDic>http://download.unidic.org/]] -[[シラバス>http://home.ogiso.net/wiki/pukiwiki.php?plugin=attach&pcmd=open&file=2009%A5%B7%A5%E9%A5%D0%A5%B9%A1%A6%C6%FC%CB%DC%B8%EC%B3%D8%B9%D6%B5%C1B.pdf&refer=%C0%AE%EC%FE2009%2F%C6%FC%CB%DC%B8%EC%B3%D8%B9%D6%B5%C1B]]確認 --この授業の目的 --授業の進め方 --評価方法 -デモ