[[成蹊2010]]

*コーパス日本語学入門
--月曜5限
--資料は[[IT's Class>http://www.cc.seikei.ac.jp/itsclassstudent/itsclass.htm]]の教材のページを見てください。
--http://www.cc.seikei.ac.jp/
--''[[コーパス検索ツール:中納言>http://morph.kotonoha.gr.jp/login.aspx]]''

***期末について
--授業最終週(7月26日)は授業を行いません。また期末試験も行いません。
--レポートは教務部提出の「期末レポート」ではなく、メールでの提出になります。

//--学会出張のため&color(red){''7月12日は休講''};とします。
//***レポートテーマの検討について
//-レポートのテーマに取り上げる言葉,表現を早めに検討してください。

**レポートについて
-締め切り:''7月30日(金)''
-分量:A4用紙3枚以上(図表、用例等含む)。

**2010/07/19 レポート最終仕上げ(最終回)
-最終回です。レポートの仕上げにかかってください。

**2010/07/12 休講
-海外出張のため休講

**2010/07/05 レポート準備(3)

-各自コーパスを用いて自分のレポートのテーマを調査してください。
-質問を随時受け付けます。積極的に相談してください。

-相対頻度の算出
--項目別頻度データ([[IT's Class>http://www.cc.seikei.ac.jp/itsclassstudent/itsclass.htm]])

-図書館の利用

**2010/06/28 Wordの使い方 / レポート準備(2)

***Wordを使ってレポートを書く
-サンプル文書が[[IT's Class>http://www.cc.seikei.ac.jp/itsclassstudent/itsclass.htm]]においてあります。
-図表の取り扱い
--「形式を選択して貼り付け」
--図表番号、キャプション
-文書の構造化
--章・節番号
--「スタイル」「見出しマップ」の活用
-節番号、図表番号と相互参照
-目次、図表目次

***レポート準備(2)
-各自コーパスを用いて自分のレポートのテーマを調査してください。
-質問を随時受け付けます。積極的に相談してください。


**2010/06/21 レポート準備(1)
-各自コーパスを用いて自分のレポートのテーマを調査してください。
-質問を随時受け付けます。積極的に相談してください。

**2010/06/14 コーパス検索結果の集計(2)

***(復習)
-中納言による用例検索
-検索結果のダウンロード
--検索結果をExcelにインポートする
-Excelによる集計
--並べ替え
--オートフィルタ
---オートフィルタのオプション
--ピボットテーブル

***調査テーマの例
-表記
--あっせん、せっけん・・・常用漢字表外字を含む漢語の表記の揺れ(漢字・交ぜ書き・かな書き)
-類義語
--きれい・美しい・・・ジャンル別用例数(→文体差)、連体修飾する名詞の違い(→意味の違い)
-語法
--煙草を吸う・煙草をのむ・・・用例数の割合と「煙草をのむ」の出現条件

**2010/06/07 コーパス検索結果の集計

-検索結果のダウンロード
--検索結果をExcelにインポートする

-Excelの使い方
--並べ替え
--オートフィルタ
---オートフィルタのオプション
--ピボットテーブル

**2010/05/31 コーパスの検索方法
-[[コーパス検索ツール:中納言>http://morph.kotonoha.gr.jp/login.aspx]]
--全文検索と短単位検索の違い
--短単位の指定方法
--短単位連続の検索
--同一文中における共起の検索

-検索結果のダウンロード
--検索結果をExcelにインポートする

-レポートテーマ確認(第1回)

**2010/05/24 コーパスの品詞情報と形態素解析(2)

-[[UniDic>http://download.unidic.org]]の品詞体系
--IT's Class >日本語学講義E>教材>その他の教材>UniDicマニュアル
--品詞:名詞-固有名詞-姓 (大分類>中分類>小分類)
--活用型:下一段-ア行 (大分類>行分類(>小分類))
--可能性に基づく品詞体系
---名詞-普通名詞-サ変可能
--形状詞 (=形容動詞語幹)
--助動詞「う」が付いた形を意志推量形として扱う

-「茶まめ」の使い方
--解析結果をピボットテーブルで集計

CENTER:&ref(chamame.PNG,,50%);

**2010/05/17 コーパスの品詞情報と形態素解析

-(スライド参照)IT's Class >日本語学講義E>教材>スライド>5月17日コーパスと形態素解析

-コーパスと形態素解析
--配付資料:「日本語研究と自動形態素解析」
-形態素解析の仕組み


**2010/05/10 コーパスと文字コード

-(スライド参照)IT's Class >日本語学講義E>教材>スライド>5月10日コーパスと文字コード

-文字化けのいろいろ
-文字集合と文字符号化方式
-包摂規準


**2010/04/26 均衡コーパスとサンプリング
風邪のため早めに終わります。。

-(スライド参照)IT's Class >日本語学講義E>教材>スライド>4月26日均衡コーパスとサンプリング

-「バランスがとれている」とは?
-コーパスの母集団とサンプリング
-著作権処理

**2010/04/19 コーパスとはどんなものか
-(スライド参照)IT's Class >日本語学講義E>教材>スライド>4月19日コーパスとは

:狭義のコーパス|言語研究を目的として収集され、言語研究のための情報が付けられたコンピュータ上で利用可能な大規模な言語データ。
:広義のコーパス|コンピュータ上で利用可能な大規模な言語データ。必ずしも言語研究向きではないが、言語研究にも利用可能。
-この授業で扱うのは狭義のコーパス。中でも「現代日本語書き言葉均衡コーパス(BCCWJ)」。

-コーパス以前のデータとBCCWJ

-[[コーパス検索ツール:中納言>http://morph.kotonoha.gr.jp/login.aspx]]を使ってみる

**2010/04/12 イントロダクション
-[[自己紹介]]
--大学共同利用機関法人人間文化研究機構 国立国語研究所 http://www.ninjal.ac.jp/
-コーパスとは
---[[日本語コーパスKOTONOHA>http://www.ninjal.ac.jp/kotonoha/]]
---[[KOTONOHA検索デモサイト>http://www.kotonoha.gr.jp/demo/]]
---[[形態素解析辞書UniDic>http://download.unidic.org/]]

-[[シラバス>http://home.ogiso.net/wiki/pukiwiki.php?plugin=attach&pcmd=open&file=2010%C6%FC%CB%DC%B8%EC%B3%D8%B9%D6%B5%C1E.pdf&refer=%C0%AE%EC%FE2010%2F%C6%FC%CB%DC%B8%EC%B3%D8%B9%D6%B5%C1E]]確認
--この授業の目的
--授業の進め方
--評価方法

-デモ
--''[[コーパス検索ツール:中納言>http://morph.kotonoha.gr.jp/login.aspx]]''
--形態素解析

トップ   編集 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS