[[成蹊2010]] *コーパス日本語学入門 --月曜5限 --資料は[[IT's Class>http://www.cc.seikei.ac.jp/itsclassstudent/itsclass.htm]]の教材のページを見てください。 --http://www.cc.seikei.ac.jp/ --''[[コーパス検索ツール:中納言>http://morph.kotonoha.gr.jp/login.aspx]]'' ***期末について --授業最終週(7月26日)は授業を行いません。また期末試験も行いません。 --レポートは教務部提出の「期末レポート」ではなく、メールでの提出になります。 --学会出張のため&color(red){''7月12日は休講''};とします。 //***レポートテーマの検討について //-レポートのテーマに取り上げる言葉,表現を早めに検討してください。 **レポートについて -締め切り:7月30日(金)(予定) -分量:A4用紙3枚以上(図表、用例等含む)。 **2010/07/05 レポート準備(3) -各自コーパスを用いて自分のレポートのテーマを調査してください。 -質問を随時受け付けます。積極的に相談してください。 -相対頻度の算出 --項目別頻度データ([[IT's Class>http://www.cc.seikei.ac.jp/itsclassstudent/itsclass.htm]]) -図書館の利用 **2010/06/28 Wordの使い方 / レポート準備(2) ***Wordを使ってレポートを書く -サンプル文書が[[IT's Class>http://www.cc.seikei.ac.jp/itsclassstudent/itsclass.htm]]においてあります。 -図表の取り扱い --「形式を選択して貼り付け」 --図表番号、キャプション -文書の構造化 --章・節番号 --「スタイル」「見出しマップ」の活用 -節番号、図表番号と相互参照 -目次、図表目次 ***レポート準備(2) -各自コーパスを用いて自分のレポートのテーマを調査してください。 -質問を随時受け付けます。積極的に相談してください。 **2010/06/21 レポート準備(1) -各自コーパスを用いて自分のレポートのテーマを調査してください。 -質問を随時受け付けます。積極的に相談してください。 **2010/06/14 コーパス検索結果の集計(2) ***(復習) -中納言による用例検索 -検索結果のダウンロード --検索結果をExcelにインポートする -Excelによる集計 --並べ替え --オートフィルタ ---オートフィルタのオプション --ピボットテーブル ***調査テーマの例 -表記 --あっせん、せっけん・・・常用漢字表外字を含む漢語の表記の揺れ(漢字・交ぜ書き・かな書き) -類義語 --きれい・美しい・・・ジャンル別用例数(→文体差)、連体修飾する名詞の違い(→意味の違い) -語法 --煙草を吸う・煙草をのむ・・・用例数の割合と「煙草をのむ」の出現条件 **2010/06/07 コーパス検索結果の集計 -検索結果のダウンロード --検索結果をExcelにインポートする -Excelの使い方 --並べ替え --オートフィルタ ---オートフィルタのオプション --ピボットテーブル **2010/05/31 コーパスの検索方法 -[[コーパス検索ツール:中納言>http://morph.kotonoha.gr.jp/login.aspx]] --全文検索と短単位検索の違い --短単位の指定方法 --短単位連続の検索 --同一文中における共起の検索 -検索結果のダウンロード --検索結果をExcelにインポートする -レポートテーマ確認(第1回) **2010/05/24 コーパスの品詞情報と形態素解析(2) -[[UniDic>http://download.unidic.org]]の品詞体系 --IT's Class >日本語学講義E>教材>その他の教材>UniDicマニュアル --品詞:名詞-固有名詞-姓 (大分類>中分類>小分類) --活用型:下一段-ア行 (大分類>行分類(>小分類)) --可能性に基づく品詞体系 ---名詞-普通名詞-サ変可能 --形状詞 (=形容動詞語幹) --助動詞「う」が付いた形を意志推量形として扱う -「茶まめ」の使い方 --解析結果をピボットテーブルで集計 CENTER:&ref(chamame.PNG,,50%); **2010/05/17 コーパスの品詞情報と形態素解析 -(スライド参照)IT's Class >日本語学講義E>教材>スライド>5月17日コーパスと形態素解析 -コーパスと形態素解析 --配付資料:「日本語研究と自動形態素解析」 -形態素解析の仕組み **2010/05/10 コーパスと文字コード -(スライド参照)IT's Class >日本語学講義E>教材>スライド>5月10日コーパスと文字コード -文字化けのいろいろ -文字集合と文字符号化方式 -包摂規準 **2010/04/26 均衡コーパスとサンプリング 風邪のため早めに終わります。。 -(スライド参照)IT's Class >日本語学講義E>教材>スライド>4月26日均衡コーパスとサンプリング -「バランスがとれている」とは? -コーパスの母集団とサンプリング -著作権処理 **2010/04/19 コーパスとはどんなものか -(スライド参照)IT's Class >日本語学講義E>教材>スライド>4月19日コーパスとは :狭義のコーパス|言語研究を目的として収集され、言語研究のための情報が付けられたコンピュータ上で利用可能な大規模な言語データ。 :広義のコーパス|コンピュータ上で利用可能な大規模な言語データ。必ずしも言語研究向きではないが、言語研究にも利用可能。 -この授業で扱うのは狭義のコーパス。中でも「現代日本語書き言葉均衡コーパス(BCCWJ)」。 -コーパス以前のデータとBCCWJ -[[コーパス検索ツール:中納言>http://morph.kotonoha.gr.jp/login.aspx]]を使ってみる **2010/04/12 イントロダクション -[[自己紹介]] --大学共同利用機関法人人間文化研究機構 国立国語研究所 http://www.ninjal.ac.jp/ -コーパスとは ---[[日本語コーパスKOTONOHA>http://www.ninjal.ac.jp/kotonoha/]] ---[[KOTONOHA検索デモサイト>http://www.kotonoha.gr.jp/demo/]] ---[[形態素解析辞書UniDic>http://download.unidic.org/]] -[[シラバス>http://home.ogiso.net/wiki/pukiwiki.php?plugin=attach&pcmd=open&file=2010%C6%FC%CB%DC%B8%EC%B3%D8%B9%D6%B5%C1E.pdf&refer=%C0%AE%EC%FE2010%2F%C6%FC%CB%DC%B8%EC%B3%D8%B9%D6%B5%C1E]]確認 --この授業の目的 --授業の進め方 --評価方法 -デモ --''[[コーパス検索ツール:中納言>http://morph.kotonoha.gr.jp/login.aspx]]'' --形態素解析