[[成蹊2010]]

*コーパス日本語学入門
--月曜5限
--資料は[[IT's Class>http://www.cc.seikei.ac.jp/itsclassstudent/itsclass.htm]]の教材のページを見てください。
--http://www.cc.seikei.ac.jp/
--''[[コーパス検索ツール:中納言>http://morph.kotonoha.gr.jp/login.aspx]]''

***期末について
--授業最終週(7月26日)は授業を行いません。また期末試験も行いません。
--レポートは教務部提出の「期末レポート」ではなく、メールでの提出になります。

***レポートテーマの検討について
-レポートのテーマに取り上げる言葉,表現を早めに検討してください。

**2010/05/24 コーパスの品詞情報と形態素解析(2)

-[[UniDic>http://download.unidic.org]]の品詞体系
--IT's Class >日本語学講義E>教材>その他の教材>UniDicマニュアル
-「茶まめ」の使い方

**2010/05/17 コーパスの品詞情報と形態素解析

-(スライド参照)IT's Class >日本語学講義E>教材>スライド>5月17日コーパスと形態素解析

-コーパスと形態素解析
--配付資料:「日本語研究と自動形態素解析」
-形態素解析の仕組み

-[[UniDic>http://download.unidic.org]]の品詞体系
--IT's Class >日本語学講義E>教材>その他の教材>5月17日 UniDicマニュアル
-「茶まめ」の使い方

**2010/05/10 コーパスと文字コード

-(スライド参照)IT's Class >日本語学講義E>教材>スライド>5月10日コーパスと文字コード

-文字化けのいろいろ
-文字集合と文字符号化方式
-包摂規準


**2010/04/26 均衡コーパスとサンプリング
風邪のため早めに終わります。。

-(スライド参照)IT's Class >日本語学講義E>教材>スライド>4月26日均衡コーパスとサンプリング

-「バランスがとれている」とは?
-コーパスの母集団とサンプリング
-著作権処理

**2010/04/19 コーパスとはどんなものか
-(スライド参照)IT's Class >日本語学講義E>教材>スライド>4月19日コーパスとは

:狭義のコーパス|言語研究を目的として収集され、言語研究のための情報が付けられたコンピュータ上で利用可能な大規模な言語データ。
:広義のコーパス|コンピュータ上で利用可能な大規模な言語データ。必ずしも言語研究向きではないが、言語研究にも利用可能。
-この授業で扱うのは狭義のコーパス。中でも「現代日本語書き言葉均衡コーパス(BCCWJ)」。

-コーパス以前のデータとBCCWJ

-[[コーパス検索ツール:中納言>http://morph.kotonoha.gr.jp/login.aspx]]を使ってみる

**2010/04/12 イントロダクション
-[[自己紹介]]
--大学共同利用機関法人人間文化研究機構 国立国語研究所 http://www.ninjal.ac.jp/
-コーパスとは
---[[日本語コーパスKOTONOHA>http://www.ninjal.ac.jp/kotonoha/]]
---[[KOTONOHA検索デモサイト>http://www.kotonoha.gr.jp/demo/]]
---[[形態素解析辞書UniDic>http://download.unidic.org/]]

-[[シラバス>http://home.ogiso.net/wiki/pukiwiki.php?plugin=attach&pcmd=open&file=2010%C6%FC%CB%DC%B8%EC%B3%D8%B9%D6%B5%C1E.pdf&refer=%C0%AE%EC%FE2010%2F%C6%FC%CB%DC%B8%EC%B3%D8%B9%D6%B5%C1E]]確認
--この授業の目的
--授業の進め方
--評価方法

-デモ
--''[[コーパス検索ツール:中納言>http://morph.kotonoha.gr.jp/login.aspx]]''
--形態素解析


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS