- 追加された行はこの色です。
- 削除された行はこの色です。
[[成蹊2010]]
*コーパス日本語学入門
--月曜5限
--資料は[[IT's Class>http://www.cc.seikei.ac.jp/itsclassstudent/itsclass.htm]]の教材のページを見てください。
--http://www.cc.seikei.ac.jp/
--''[[コーパス検索ツール:中納言>http://morph.kotonoha.gr.jp/login.aspx]]''
***期末について
--授業最終週(7月26日)は授業を行いません。また期末試験も行いません。
--レポートは教務部提出の「期末レポート」ではなく、メールでの提出になります。
***レポートテーマの検討について
-レポートのテーマに取り上げる言葉,表現を早めに検討してください。
//--学会出張のため&color(red){''7月12日は休講''};とします。
//***レポートテーマの検討について
//-レポートのテーマに取り上げる言葉,表現を早めに検討してください。
**レポートについて
-締め切り:''7月30日(金)''
-分量:A4用紙3枚以上(図表、用例等含む)。
**2010/07/19 レポート最終仕上げ(最終回)
-最終回です。レポートの仕上げにかかってください。
**2010/07/12 休講
-海外出張のため休講
**2010/07/05 レポート準備(3)
-各自コーパスを用いて自分のレポートのテーマを調査してください。
-質問を随時受け付けます。積極的に相談してください。
-相対頻度の算出
--項目別頻度データ([[IT's Class>http://www.cc.seikei.ac.jp/itsclassstudent/itsclass.htm]])
-図書館の利用
**2010/06/28 Wordの使い方 / レポート準備(2)
***Wordを使ってレポートを書く
-サンプル文書が[[IT's Class>http://www.cc.seikei.ac.jp/itsclassstudent/itsclass.htm]]においてあります。
-図表の取り扱い
--「形式を選択して貼り付け」
--図表番号、キャプション
-文書の構造化
--章・節番号
--「スタイル」「見出しマップ」の活用
-節番号、図表番号と相互参照
-目次、図表目次
***レポート準備(2)
-各自コーパスを用いて自分のレポートのテーマを調査してください。
-質問を随時受け付けます。積極的に相談してください。
**2010/06/21 レポート準備(1)
-各自コーパスを用いて自分のレポートのテーマを調査してください。
-質問を随時受け付けます。積極的に相談してください。
**2010/06/14 コーパス検索結果の集計(2)
-(復習)
***(復習)
-中納言による用例検索
-検索結果のダウンロード
--検索結果をExcelにインポートする
-Excelによる集計
--並べ替え
--オートフィルタ
---オートフィルタのオプション
--ピボットテーブル
-調査テーマの例
--表記
---あっせん、せっけん・・・常用漢字表外字を含む漢語の表記(漢字・交ぜ書き・かな書き)
--類義語
---きれい・美しい・・・ジャンル別用例数、連体修飾する名詞の違い
--語法
---煙草を吸う・煙草をのむ・・・用例数の割合と「煙草をのむ」の出現条件
***調査テーマの例
-表記
--あっせん、せっけん・・・常用漢字表外字を含む漢語の表記の揺れ(漢字・交ぜ書き・かな書き)
-類義語
--きれい・美しい・・・ジャンル別用例数(→文体差)、連体修飾する名詞の違い(→意味の違い)
-語法
--煙草を吸う・煙草をのむ・・・用例数の割合と「煙草をのむ」の出現条件
**2010/06/07 コーパス検索結果の集計
-検索結果のダウンロード
--検索結果をExcelにインポートする
-Excelの使い方
--並べ替え
--オートフィルタ
---オートフィルタのオプション
--ピボットテーブル
**2010/05/31 コーパスの検索方法
-[[コーパス検索ツール:中納言>http://morph.kotonoha.gr.jp/login.aspx]]
--全文検索と短単位検索の違い
--短単位の指定方法
--短単位連続の検索
--同一文中における共起の検索
-検索結果のダウンロード
--検索結果をExcelにインポートする
-レポートテーマ確認(第1回)
**2010/05/24 コーパスの品詞情報と形態素解析(2)
-[[UniDic>http://download.unidic.org]]の品詞体系
--IT's Class >日本語学講義E>教材>その他の教材>UniDicマニュアル
--品詞:名詞-固有名詞-姓 (大分類>中分類>小分類)
--活用型:下一段-ア行 (大分類>行分類(>小分類))
--可能性に基づく品詞体系
---名詞-普通名詞-サ変可能
--形状詞 (=形容動詞語幹)
--助動詞「う」が付いた形を意志推量形として扱う
-「茶まめ」の使い方
--解析結果をピボットテーブルで集計
CENTER:&ref(chamame.PNG,,50%);
**2010/05/17 コーパスの品詞情報と形態素解析
-(スライド参照)IT's Class >日本語学講義E>教材>スライド>5月17日コーパスと形態素解析
-コーパスと形態素解析
--配付資料:「日本語研究と自動形態素解析」
-形態素解析の仕組み
**2010/05/10 コーパスと文字コード
-(スライド参照)IT's Class >日本語学講義E>教材>スライド>5月10日コーパスと文字コード
-文字化けのいろいろ
-文字集合と文字符号化方式
-包摂規準
**2010/04/26 均衡コーパスとサンプリング
風邪のため早めに終わります。。
-(スライド参照)IT's Class >日本語学講義E>教材>スライド>4月26日均衡コーパスとサンプリング
-「バランスがとれている」とは?
-コーパスの母集団とサンプリング
-著作権処理
**2010/04/19 コーパスとはどんなものか
-(スライド参照)IT's Class >日本語学講義E>教材>スライド>4月19日コーパスとは
:狭義のコーパス|言語研究を目的として収集され、言語研究のための情報が付けられたコンピュータ上で利用可能な大規模な言語データ。
:広義のコーパス|コンピュータ上で利用可能な大規模な言語データ。必ずしも言語研究向きではないが、言語研究にも利用可能。
-この授業で扱うのは狭義のコーパス。中でも「現代日本語書き言葉均衡コーパス(BCCWJ)」。
-コーパス以前のデータとBCCWJ
-[[コーパス検索ツール:中納言>http://morph.kotonoha.gr.jp/login.aspx]]を使ってみる
**2010/04/12 イントロダクション
-[[自己紹介]]
--大学共同利用機関法人人間文化研究機構 国立国語研究所 http://www.ninjal.ac.jp/
-コーパスとは
---[[日本語コーパスKOTONOHA>http://www.ninjal.ac.jp/kotonoha/]]
---[[KOTONOHA検索デモサイト>http://www.kotonoha.gr.jp/demo/]]
---[[形態素解析辞書UniDic>http://download.unidic.org/]]
-[[シラバス>http://home.ogiso.net/wiki/pukiwiki.php?plugin=attach&pcmd=open&file=2010%C6%FC%CB%DC%B8%EC%B3%D8%B9%D6%B5%C1E.pdf&refer=%C0%AE%EC%FE2010%2F%C6%FC%CB%DC%B8%EC%B3%D8%B9%D6%B5%C1E]]確認
--この授業の目的
--授業の進め方
--評価方法
-デモ
--''[[コーパス検索ツール:中納言>http://morph.kotonoha.gr.jp/login.aspx]]''
--形態素解析