成蹊2020

2020/12/11

(復習)調整頻度の計算

『日本語歴史コーパス』CHJの紹介

Excelの文字列関数とIF関数

【参考】 授業資料/EXCELの文字列関数

2020/12/04

レポートテーマの確認

2020/11/27

ランダムサンプリング調査

BCCWJ利用の落とし穴

調整頻度の計算

レポートテーマについて

*1

2020/11/20【欅祭のため休み】

2020/11/13

中納言によるさまざまな検索(つづき)

複数の検索結果の結合(復習)

レポートテーマについて

2020/11/06

検索結果のピボットテーブルによる集計(復習)

複数の検索結果の結合

ショートカットキーを活用すると便利

  1. 表をコピー
    • Ctrl+Home, ↓(列名はコピーしないようにする),Shift+Ctrl+End, Ctrl+C
  2. コピーした表を既存の表の下に貼り付け
    • Ctrl+↓, ↓, Ctrl+V, Ctrl+Home

集計用の列を自分で用意する

中納言によるさまざまな検索

提出課題

2020/10/30

『中納言』の使い方

「中納言」検索結果のダウンロードとExcelでの利用

  1. ダウンロード
  2. アーカイブの展開(解凍):複数の検索条件式で検索・ダウンロードしたときのみ
  3. Excelでインポート:ファイルをダブルクリックすれば開かれる

Excelの基礎

【重要】ピボットテーブルの使い方

2020/10/23【四大戦のため休み】

2020/10/16

『中納言』の使い方

検索条件式の利用

キー: (品詞 LIKE "形容詞%" AND 活用形 LIKE "連体形%")
 AND 後方共起: 語彙素="言葉" ON 1 WORDS FROM キー
 WITH OPTIONS tglKugiri="|" AND tglBunKugiri="#" AND limitToSelfSentence="1"
AND tglFixVariable="2" AND tglWords="20" AND unit="1" AND encoding="UTF-16LE" AND endOfLine="CRLF"

2020/10/09

コーパスの形態論情報:短単位と長単位

品詞体系と見出し語の階層

コーパスへの形態論情報の付与

(参考)Web茶まめ

『中納言』の使い方

(来週以降も使います)

2020/10/02 

日本語コーパス(BCCWJ)の紹介

狭義のコーパス
言語研究を目的として収集され、言語研究のための情報が付けられたコンピュータ上で利用可能な大規模な言語データ。
広義のコーパス
コンピュータ上で利用可能な大規模な言語データ。必ずしも言語研究向きではないが、言語研究にも利用可能。

「中納言」オンライン利用申込みについて

日本語コーパス(BCCWJ)の設計

参考リンク

2020/09/25 休講

2020/09/18

イントロダクション


*1 実際に検索してみてできそうなものと難しそうなものが含まれています

トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS