**日本語教育学研究
***コーパス日本語学入門

-授業に関するメールはこちらへ。&br;小木曽 智信: ogiso@ogiso.net ←@を半角に置き換えてください
-[[シラバス>http://home.ogiso.net/wiki/pukiwiki.php?plugin=attach&pcmd=open&file=501M0900%20-%20%C6%FC%CB%DC%B8%EC%B6%B5%B0%E9%B3%D8%B8%A6%B5%E6%20-%20%A5%B3%A1%BC%A5%D1%A5%B9%C6%FC%CB%DC%B8%EC%B3%D8%C6%FE%CC%E7.pdf&refer=%C5%EC%B5%FE%B3%B0%C2%E72012]]
-中納言: https://chunagon.ninjal.ac.jp

//***教室変更のお知らせ
//-4月20日からは''323教室(マルチメディア室)''で行います。

***期末レポートについて
-締切:7月31日(火)
-提出先:メールで直接送付(必ず返信を確認すること)
-分量:A4用紙で3~10枚


**2012/07/13(最終)

-BCCWJ契約書返却


***Excel集計のコツ
-複数の検索結果表をまとめる
-ランダムに指定数のレコードを取得する

***形態素解析とその仕組み
-[[授業資料/形態素解析]]
//-http://dl.dropbox.com/u/134600/UniDic-Mecab_portable.zip
-UniDic-Mecab_portable.zip

***Wordの使い方
-文書の構造化とスタイルの使用
-注・図表番号・相互参照


**2012/07/06
***発表3:中納言とBCCWJの活用
-張(志)
-段
-白


**2012/06/22
***発表2:中納言とBCCWJの活用
-畢
-張(舒)
-呂


**2012/06/22

***発表1:中納言とBCCWJの活用
-三代川
-竹ノ谷

***NINJAL LWP for BCCWJ
-http://ninjal-lwp-bccwj.ninjal.ac.jp/

***相対頻度
***調整頻度
-100万語あたりの頻度

**2012/06/15

***補足
-連体修飾(である可能性が高いもの)の検索と集計
-Zipf則

***検索・集計の事例
-「寂しい」「寂し」を同一視するには
--文字列関数による置き換え
-長単位と短単位の仕様の違い

***Excelの文字列関数とif関数
--left,right,mid,len,search,substitute

**2012/06/08

***検索課題
-配付資料参照

***検索・集計の事例
-「乗り込む」のとるニ格名詞句を検索する
--前方n語以内の名詞+「に」(長単位検索)で近似

**2012/06/01

***検索条件式を使う(復習)

 キー: 語彙素 = "奇麗" IN core="true" WITH OPTIONS unit="1" AND tglWords="20" AND tglKugiri="|" AND tglFixVariable="2"

***「中納言」検索結果のダウンロード
+ダウンロード
+アーカイブの展開(解凍)
+インポート

***中納言の検索結果をExcelで利用する
-前回資料(4.)参照

***Excelの基本的な使い方
-フィルタ
--テキストフィルタ
-並べ替え
--ユーザー設定の並べ替え
-ピボットテーブル
-ピボットグラフ


**2012/05/25
 (休講)


**2012/05/18

-前回資料参照

**コーパスの形態論情報

-[[UniDic>http://download.unidic.org]]の品詞体系
//--IT's Class >日本語学講義E>教材>その他の教材>UniDicマニュアル
--品詞:名詞-固有名詞-姓 (大分類>中分類>小分類)
--活用型:下一段-ア行 (大分類>行分類(>小分類))
--可能性に基づく品詞体系
---名詞-普通名詞-サ変可能

***学校文法との違い
--形状詞 (=形容動詞語幹)
--助動詞「う」が付いた形を意志推量形として扱う

***長単位の品詞
--可能性に基づく品詞付与ではなく、出現例に則した品詞付与
--短単位との違い
--複合辞


**2012/05/11

***「中納言」の利用
-書類訂正
-アカウント作成とログイン

***中納言によるコーパスの検索方法
-とりあえず検索してみる

--配布資料:中納言の使い方

**2011/04/27

***「中納言」利用申込み用紙回収
-申込用紙と契約書を回収します。

***コーパスの設計とサンプリング

--「バランスがとれている」とは?
--現代日本語の書き言葉の縮図としてのコーパスを作る
--コーパスの母集団の設定とサンプリング
--BCCWJのサブコーパス
--可変長と固定長
-著作権をめぐる問題

-参考リンク
--[[ブラウンコーパス マニュアル>http://khnt.aksis.uib.no/icame/manuals/brown/]] http://khnt.aksis.uib.no/icame/manuals/brown/
--[[BNCリファレンスガイド>http://www.natcorp.ox.ac.uk/docs/URG/]] http://www.natcorp.ox.ac.uk/docs/URG/

--[[現代日本語書き言葉均衡コーパスの基本方針>http://www.ninjal.ac.jp/kotonoha/ex_2.html]]
--[[現代日本語書き言葉均衡コーパスのためのサンプル抽出>http://www.ninjal.ac.jp/kotonoha/ex_3.html]]


**2012/04/20 

***授業の進め方
-発表について

***コーパスとは
-スライド参照
--コーパスとはどんなものか
--日本語コーパス以外(以前)の電子資料

:狭義のコーパス|言語研究を目的として収集され、言語研究のための情報が付けられたコンピュータ上で利用可能な大規模な言語データ。
:広義のコーパス|コンピュータ上で利用可能な大規模な言語データ。必ずしも言語研究向きではないが、言語研究にも利用可能。


***「中納言」利用申込み
-申込用紙を配布します。次の回に記入・押印して必ず持ってきてください。

***「少納言」を使ってみる
-[[BCCWJ少納言>http://shonagon.ninjal.ac.jp]]

***参考リンク
-[[コーパス日本語学のための情報館>http://www30.atwiki.jp/corpus-ling/pages/17.html]]

**2012/04/13 イントロダクション
-[[自己紹介]]
-[[国立国語研究所(NINJAL)>http://www.ninjal.ac.jp/]]
-国語研コーパス([[KOTONOHA>http://www.ninjal.ac.jp/kotonoha/]])
--現代日本語書き言葉均衡コーパス(BCCWJ)
---[[特定領域 日本語コーパス>http://www.tokuteicorpus.jp/]]
---[[少納言>http://shonagon.ninjal.ac.jp]]
---[[中納言>http://chunagon.ninjal.ac.jp]]

--日本語話し言葉コーパス(CSJ)
--太陽コーパス(明治・大正期の総合雑誌)
--通時コーパス(設計中)


-受講者アンケート
--専門・関心領域
--PCスキル

-授業の進め方について
--受講者のレベルにあわせて基礎的なことから始め、自分の研究に実際に活かせるようになることを目指します。

トップ   編集 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS