日本語学講義(I) 日本語コーパス研究入門

おしらせ

第11回 2010/07/01 Wordで論文を書く/集計結果の検定

Wordで論文を書く

集計結果の検定(クロス集計表の独立性の検定)

第10回 2010/06/24 形態素解析済みコーパスの利用

第9回 2010/06/17 形態素解析

レポートテーマについて

第8回 2010/06/10 「ひまわり」で検索できるミニコーパスを作る

「ひまわり」用のデータを作るには

既存のデータを「ひまわり」用に変換する

第7回 2010/06/03 「ひまわり」とExcelの利用(2)

前文脈キー後文脈タイトル著者著者ID生没年原著者原著者ID仮名遣いコーパス名

表計算ソフト Excel入門

Excelを使った集計

テキストエディタと組み合わせて使う

第6回 2010/05/27 「ひまわり」とExcelの利用(1)

全文検索ソフト「ひまわり」

「ひまわり」で使用できる正規表現

前文脈キー後文脈タイトル著者著者ID生没年原著者原著者ID仮名遣いコーパス名

第5回 2010/05/20  タグ付き正規表現

検索語の中での後方参照

最長一致の原則(greedy matching)

正規表現に関する本

#amazon(4873111706) #amazon(4873113598)

第4回 2010/05/13  正規表現

正規表現のいろいろ

正規表現の応用

タグ付き正規表現

5/6:休講

4/29:祝日

第3回 2010/04/22  テキストエディタの利用

復習

grepと置換でKWIC(CSVファイル)を作る

ショートカットキー

おすすめテキストエディタ

正規表現とは

第2回 2010/04/15  テキストデータとテキストエディタ

最初に、テキストエディタを使ってテキストデータを扱うことからはじめます。

(補足)「コーパス」について

この授業ではBCCWJ(モニター公開版)のほかに、青空文庫・国会会議録などの広義のコーパス、自作のミニコーパスなども取り扱います。

テキストデータ

全ての基本。テキストデータ≒テキストファイル≒電子化テキスト

#amazon(4894762994)

テキストファイルと拡張子

テキストエディタ

テキストエディタの基礎

2010/04/08 イントロダクション

授業で利用する主なソフトウェア

秀丸エディタテキストエディタ検索・整形
Excel表計算ソフト集計・分析・グラフ作成
Accessデータベースソフト集計・分析
Wordワープロレポート作成
ひまわり全文検索ソフト検索・分析
MeCab形態素解析器形態素解析
UniDic形態素解析辞書

このほかにWeb上で利用できるサービスも取り上げます。


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS