成蹊2020


2020/07/03 「中納言」を使ったコーパスの利用

「中納言」の利用:形態論情報を使った検索

形態論情報を使った検索

品詞体系と見出し語の階層

「中納言」検索結果のダウンロードとExcelでの利用

  1. ダウンロード
  2. Excelでインポート

2020/06/26 レポートについて

ひまわり+Excelの復習

「ひまわり」の利用について補足

「中納言」の紹介

レポートテーマ予備調査結果発表(ライトニングトーク)について

2020/06/19 さまざまな集計方法/レポートについて

課題(復習)

Himawari+青空文庫(文学作品)パッケージを使って、「心持」と「気持」を検索し、検索結果にExcel上で作家の生年代(10年刻み)を付与したうえで、ピボットテーブルで集計して、生年代別に「心持」「気持」の用例数を示す表と使用割合を示すグラフを作成しなさい。

分類用の列を作って集計する

サンプリング調査

作品数の調査(用例数ではなく)

レポートテーマについて(予告)

2020/06/12 検索結果のExcelによる集計(2)

Excelの基本操作(再)

ひまわり検索結果をExcelで扱う

生年代による集計(通時的変化)

  1. Himawariで「すべて選択」後、「すべて選択」「コピー(列名含む)」をする
  2. Excelで生年月日の列が貼り付けられることになる列(NとO)を丸ごと選択し、書式を「文字列」とする
  3. Excelに貼り付ける

2020/06/05 検索結果のExcelによる集計

正規表現小テスト

「ひまわり」とその使い方

ひまわり検索結果をExcelで扱う

Excelの基本操作

2020/05/29  全文検索システム「ひまわり」

正規表現の復習(タグ付き正規表現)

全文検索システム「ひまわり」

全文検索システム「ひまわり」について

himawari_aozora.png

「青空文庫パッケージ」のインストール

  1. 青空文庫パッケージのダウンロード
    1. ひまわり用「青空文庫」パッケージのダウンロードページから「青空文庫パッケージ」をUSBメモリに直接ダウンロードして保存(サイズが大きいのでPCにダウンロードできない)
  2. USBメモリにコピーしたフォルダ内のhimawari.exeを起動
    1. Himawari画面上にダウンロードしたzipファイルをドラッグ&ドロップ*1
    2. しばらく待つと完了(数分から10分程度はかかる)
  3. 要らなくなったUSBメモリ上の青空文庫パッケージzipファイルは不要なので削除する

2020/05/22  正規表現2(タグ付き正規表現)

正規表現の応用

タグ付き正規表現

最長一致の原則(greedy matching)

検索文字列の中での後方参照

正規表現に関する参考資料

2020/05/15 正規表現

テキストエディタ・正規表現(文字クラス)の復習

正規表現のいろいろ

2020/05/08 テキストエディタの利用

復習(前回のデータを使って)

ショートカットキー

テキストデータ(青空文庫)の配布

grepと置換でKWIC(CSVファイル)を作る(簡易版)

正規表現を使ってみる

正規表現とは

2020/05/01 テキストエディタ

テキストエディタ

サクラエディタのダウンロードとインストール

Macの場合(miのダウンロードとインストール)

テキストエディタを使ってみる

2020/04/24 テキストデータと文字コード

【重要】授業の進め方について

文字コード

テキストデータ

テキストエディタ

2020/04/17

※オンライン授業になるため、受講者のPC環境によっては一部の内容を変更して進めます。特にソフトウェアについては参考程度に見てください。

Zoom準備

イントロダクション

授業で利用する主なソフトウェア

ソフトウェアの種類・名前利用目的
テキストエディタ サクラエディタ正規表現を使ったテキストの検索・整形
全文検索ソフトひまわりデータの検索
表計算ソフトExcelピボットテーブルによる分析・グラフ作成
ワープロWord「スタイル」を利用したレポート作成

アンケート


*1 または、メニューのファイル>インストールをえらび、青空文庫パッケージのzipファイルを指定

トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2020-07-03 (金) 08:15:58