select * from corpus as corpus_1 inner join corpus as corpus_2 on corpus_1.ID+1 = corpus_2.ID where ・・・・・・
| 前文脈 | キー | 後文脈 | タイトル | 著者 | 著者ID | 生没年 | 原著者 | 原著者ID | 仮名遣い | コーパス名 |
(続きは次回)
この授業ではBCCWJ(モニター公開版)・太陽コーパスのほか、青空文庫・国会会議録などの広義のコーパスも取り扱う。
| 秀丸エディタ | テキストエディタ | 検索・整形 |
| ひまわり | 全文検索ソフト | 検索・分析 |
| MeCab | 形態素解析器 | 形態素解析 |
| UniDic | 形態素解析辞書 | |
| Excel | 表計算ソフト | 集計・分析・グラフ作成 |
| Access | データベースソフト | 集計・分析 |
| Word | ワープロ | レポート作成 |
このほかにWeb上で利用できるサービスも取り上げます。
最初に、テキストエディタを使ってテキストデータを扱うことからはじめます。
全ての基本。テキストデータ≒テキストファイル≒電子化テキスト