コーパスを用いた近代日本語の調査法

教室変更のお知らせ

 

2010/05/21 XMLファイルから情報を抜き出す(XSLT)

太陽コーパスの記事種別分量

  1. プリズムで記事ごとの字数を出力(単一ファイルに出力)
  2. ピボットテーブルで集計
    • 年別
    • 文体別
    • ジャンル別
      • NDC大分類別 =mid(NDC,4,1)

XSLT

2010/05/14 「ひまわり」と正規表現

高度な正規表現

参考:太陽コーパス以外のひまわり用データ

2010/05/07 「ひまわり」の使い方と正規表現

ひまわりの検索オプション

ひまわりで利用できる正規表現

例題

前文脈キー後文脈雑誌名題名著者位置欄名ジャンル文体話者種別
 

2010/04/30 休講

 

2010/04/23 「太陽コーパス」のプログラムとデータ形式

収録されているプログラム

とりあえずの使い方(「ひまわり」)

  1. ひまわりを起動
  2. 検索
  3. 検索結果をExcelにコピー
  4. ゴミを削除後ピボットテーブルで集計

データの形式

2010/04/16 イントロダクション

自己紹介

デモンストレーション

授業について


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS