成蹊2025

日本語学講義D

11/28 第8回  Excelによる検索結果の集計(2)

Excelの基礎

【重要】ピボットテーブルの使い方

複数の検索結果の結合

一度にピボットテーブルで集計できるように一つの表にまとめる

ショートカットキーを活用すると便利

  1. 表をコピー
    • Ctrl+Home*4(表の左上へ移動), ↓(列名は選択しないようにするため1行下へ),Shift+Ctrl+End, Ctrl+C(コピー)
  2. コピーした表を既存の表の下に貼り付け
    • Ctrl+↓(表の一番下の行に移動), ↓(1行下へ), Ctrl+V(貼り付け)

または、「検索条件式ごとに出力ファイルを分割する」を外して検索条件式で一度にダウンロード(ZIPファイルの中のcsvファイルを利用)

たくさんまとめて調べたい場合には特に便利

キー: 語彙素="ワイン";
キー: 語彙素="葡萄" AND 後方共起: 語彙素="酒" ON 1 WORDS FROM キー;
キー: 語彙素="ブランデー";
キー: 語彙素="ウイスキー";
キー: 語彙素="日本" AND 後方共起: 語彙素="酒" ON 1 WORDS FROM キー;

集計用の列を自分で用意する

出現サンプル数の調査(重複の削除)

用例数ではなく、用例が一つでも出現したサンプルの数を調べたい場合

ランダムサンプリング調査

11/21 (休み・欅祭)

11/14 第7回  「中納言」の使い方(3)/検索結果の集計

「中納言」の使い方 つづき(4から)

11/07 第6回  「中納言」の使い方(2)

「中納言」の使い方 つづき(3.3の復習から)

10/31 第5回  コーパスの形態論情報(2)/「中納言」の使い方(1)

コーパスへの形態論情報の付与

形態素解析を試してみる

形態素解析の仕組み

「中納言」の使い方

10/24 第4回 コーパスの形態論情報

コーパスの形態論情報

品詞体系

10/17 (休み・四大戦)

10/10 第3回 『日本語歴史コーパス』『昭和・平成書き言葉コーパス』

(前回補足)参考リンク

「日本語歴史コーパス」(CHJ)の構成

近世以前
残されている資料が少なく、できるだけ(可能なら全部)コーパスに入れたい
近世(後期)以降
偏りはあるものの選べるだけの資料があるが、それでもなるべく全文でいれたい(作品など資料単位で調査したい)

近代語コーパスの場合

「昭和・平成書き言葉コーパス」(SHC)の設計・構成

利用する側から見たコーパスの設計

コーパスの形態論情報について(予告)

10/03 第2回 コーパスとは / 『現代日本語書き言葉均衡コーパス』『日本語日常会話コーパス』

「中納言」授業アカウント配布

コーパスを使ってみる

細かい話は抜きで「中納言」でコーパスを使ってみよう

コーパスとは

狭義のコーパス
言語研究を目的として収集され、言語研究のための情報が付けられたコンピュータ上で利用可能な大規模な言語データ。
  • 現代日本語書き言葉均衡コーパス(BCCWJ) / 日本語歴史コーパス(CHJ)
広義のコーパス
コンピュータ上で利用可能な大規模な言語データ。必ずしも言語研究向きではないが、言語研究に利用可能。

コーパスへの要請

「現代日本語書き言葉均衡コーパス」(BCCWJ)の構成とサンプリング

「日本語日常会話コーパス」(CEJC)の設計・構成

09/26 第1回 イントロダクション

授業内容等の確認

授業内容デモ

「中納言」アカウントについて

授業で利用する主なソフトウェア・Webアプリケーション(予定)

ソフトウェアの種類・名前利用目的
コーパス検索アプリケーション「中納言」コーパスの検索
表計算ソフトExcelピボットテーブルによる分析・グラフ作成
ワープロWord「スタイル」を利用したレポート作成
Web茶まめ形態素解析

09/19 第0回 休講

初回から申し訳ありませんが、国際会議(EAJRS, TEI)出張のため休講です。
9月16日分のリンク先を見て、この授業で使うコーパスについて予習をしておいてください。


*1 Macの場合はCommand
*2 EndキーはノートPCではしばしばFn+→
*3 EndがFn+→の場合は、Shift+Ctrl+Fn+→を同時押し
*4 HomeキーはノートPCではしばしばFn+←

トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS