成蹊2017

日本語・日本文学のためのコンピュータ

2017/12/01 ひまわり補足 / CHJ中納言

ひまわりによる検索・補足

調整頻度の計算

※「それきり」「それぎり」のように割合を作家ごとに比較する場合には調整頻度は必要ない

『日本語歴史コーパス』と「中納言」

日本語歴史コーパス(CHJ)

「中納言」の利用:形態論情報を使った検索

2017/11/24 Excelによる集計(2)

分類用の列を作って集計する

サンプリング調査

正規表現小テスト

2017/11/10 Excelによる検索結果の集計

ひまわり検索結果をExcelで扱う

生年代による集計(通時的変化)

  1. Himawariで「すべて選択」後、「すべて選択」「コピー(列名含む)」をする
  2. Excelで生年月日の列が貼り付けられることになる列(NとO)を丸ごと選択し、書式を「文字列」とする
  3. Excelに貼り付ける

ひまわりで利用可能なデータについて

2017/11/03 全文検索システム「ひまわり」

「ひまわり」と「青空文庫パッケージ」のインストールまとめ(前回の補足)

  1. ひまわり本体のダウンロード
    1. ひまわり のダウンロードページからプログラム本体をダウンロード
    2. ダウンロードしたファイルのセキュリティブロックを解除
    3. 解凍後、フォルダごとUSBメモリにコピー
  2. 青空文庫パッケージのダウンロード
    1. ひまわり用「青空文庫」パッケージのダウンロードページから「青空文庫パッケージ」をUSBメモリに直接ダウンロードして保存(サイズが大きいのでPCにダウンロードできない)
  3. USBメモリにコピーしたフォルダ内のhimawari.exeを起動
    1. メニューのファイル>インストールをえらび、青空文庫パッケージのzipファイルを指定
    2. しばらく待つと完了(数分から10分程度はかかる)
  4. 要らなくなったファイルの削除
    1. PC上の「ひまわり」フォルダやzipファイル、USBの青空文庫パッケージzipファイルは不要なので削除する

「ひまわり」とその使い方

himawari_aozora.png

ひまわり検索結果をExcelで扱う

Excelの基本操作

正規表現小テスト(来週)

2017/10/27 タグ付き正規表現 / 「ひまわり」の導入

タグ付き正規表現

検索文字列の中での後方参照

最長一致の原則(greedy matching)

正規表現に関する参考資料

#amazon(4873114500) #amazon(4873113598)

全文検索システム「ひまわり」について

「ひまわり」の導入

2017/10/14 正規表現

テキストエディタ・正規表現(文字クラス)の復習

正規表現のいろいろ

正規表現の応用

2017/10/06 テキストエディタの利用


ショートカットキー

grepと置換でKWIC(CSVファイル)を作る(簡易版)

正規表現を使ってみる

正規表現とは

2017/09/29 テキストデータとテキストエディタ

テキストデータ

テキストエディタ

2017/09/22 イントロダクション

授業で利用する主なソフトウェア

ソフトウェアの種類・名前利用目的
テキストエディタ サクラエディタ正規表現を使ったテキストの検索・整形
全文検索ソフトひまわりデータの検索
表計算ソフトExcelピボットテーブルによる分析・グラフ作成
ワープロWord「スタイル」を利用したレポート作成

トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS