日本語学講義(I) 日本語コーパス研究入門

BCCWJ中納言の申し込み

今後のテーマ

「ひまわり」で検索できるミニコーパスを作る

BCCWJの設計と書誌情報

Wordで論文を書く(スタイルと見出し機能)

2011/12/09 Excelによるデータの処理

復習

応用・意味に関わる分析

相対頻度の計算

中納言の検索結果をピボットテーブルで集計する

BCCWJの形態論情報とUniDicによる形態素解析

2011/12/02 中納言

BCCWJ中納言の使い方

2011/11/25 「ひまわり」とExcelの利用(2)

前文脈キー後文脈タイトル著者著者ID生没年原著者原著者ID仮名遣いコーパス名

表計算ソフト Excel入門

Excelを使った集計

テキストエディタと組み合わせて使う

2011/11/18 「ひまわり」とExcelの利用(1)

全文検索ソフト「ひまわり」

「ひまわり」で使用できる正規表現

前文脈キー後文脈タイトル著者著者ID生没年原著者原著者ID仮名遣いコーパス名

2011/11/4(一橋祭) 復習&質問

2011/10/28  タグ付き正規表現

タグ付き正規表現

検索語の中での後方参照

最長一致の原則(greedy matching)

正規表現に関する本

#amazon(4873111706) #amazon(4873113598)

2011/10/21  正規表現

正規表現のいろいろ

正規表現の応用

タグ付き正規表現

検索語の中での後方参照

最長一致の原則(greedy matching)

2011/10/14  テキストエディタの利用

復習

ショートカットキー

grepと置換でKWIC(CSVファイル)を作る

おすすめテキストエディタ

正規表現とは

2011/10/07  テキストデータとテキストエディタ

まずは、テキストエディタを使ってテキストデータを扱うことからはじめます。

(補足)「コーパス」について

この授業ではBCCWJのほかに、青空文庫・国会会議録などの広義のコーパス、自作のミニコーパスなども取り扱います。

テキストデータ

全ての基本。テキストデータ≒テキストファイル≒電子化テキスト

#amazon(4894762994)

テキストファイルと拡張子

テキストエディタ

テキストエディタの基礎

2011/09/30 イントロダクション

授業で利用する主なソフトウェア

名前種類利用目的
秀丸エディタテキストエディタ検索・整形
Excel表計算ソフト集計・分析・グラフ作成
Access(時間があれば)データベースソフト集計・分析
Wordワープロレポート作成
ひまわり全文検索システム検索・集計
MeCab形態素解析器形態素解析
UniDic形態素解析辞書
BCCWJ:小納言Webサービス(文字列検索)コーパス検索
BCCWJ:前中納言Webサービス(単語情報付き検索)
BCCWJ:中納言Webサービス(単語情報付き検索)

トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS