上智2017

国語学演習Ⅲa

2017/6/30

(復習)検索・集計・調整頻度

Excelの文字列関数とIF関数

【補足】Excelの文字列関数で前後文脈を整える

検索の例

補足

2017/06/23

ランダムサンプリング調査(Excelでの集計・補足)

BCCWJ利用の落とし穴

調整頻度の計算

レポートテーマについて

〈参考〉 国語に関する世論調査の結果について(文化庁)

表記

類義語・対義語

語形、語法

新語・意味変化

2017/06/16

複数の検索結果の結合

ショートカットキーを活用すると便利

  1. 表をコピー
    • Ctrl+Home, ↓(列名はコピーしないようにする),Shift+Ctrl+End, Ctrl+C
  2. コピーした表を既存の表の下に貼り付け
    • Ctrl+End, Home, ↓, Ctrl+V, Ctrl+Home

集計用の列を自分で用意する

CHJ明治・大正編

(配布資料)「中納言」検索課題

2017/06/09

「中納言」検索結果のダウンロードとExcelでの利用

  1. ダウンロード
  2. Excelでインポート

Excelの基礎

【重要】ピボットテーブルの使い方

2017/06/02

形態論情報を使った検索 つづき

検索条件式の利用

キー: (品詞 LIKE "形容詞%" AND 活用形 LIKE "連体形%")
 AND 後方共起: 語彙素="言葉" ON 1 WORDS FROM キー
 WITH OPTIONS tglKugiri="|" AND tglBunKugiri="#" AND limitToSelfSentence="1"
AND tglFixVariable="2" AND tglWords="20" AND unit="1" AND encoding="UTF-16LE" AND endOfLine="CRLF"

2017/05/26

「中納言」の利用:形態論情報を使った検索

2017/5/19(休講)

2017/05/12

日本語コーパスの形態論情報

品詞体系と見出し語の階層

UniDicによる形態素解析

形態論情報を使った検索(詳しくは次回)

2017/04/28

BCCWJの紹介 コーパスの設計とサンプリング

参考リンク

2017/04/21

「現代日本語書き言葉均衡コーパス(BCCWJ)」と「日本語歴史コーパス(CHJ)」と

※当面、BCCWJを中心に解説し、その後CHJ明治大正編に

「中納言」オンライン利用申込み

日本語コーパスの紹介(1)コーパスとはどんなものか

狭義のコーパス
言語研究を目的として収集され、言語研究のための情報が付けられたコンピュータ上で利用可能な大規模な言語データ。
広義のコーパス
コンピュータ上で利用可能な大規模な言語データ。必ずしも言語研究向きではないが、言語研究にも利用可能。

2017/04/14

イントロダクション


*1 「#」が複数ある場合の処理があるので難しい。「~」は前文脈に決して出現しない文字を指定

トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS