成蹊2019

2019/10/26(土)の金曜日不足分授業日は休講

2019/10/25 正規表現

2019/10/18 (四大戦で休み)

2019/10/11 テキストエディタの利用

  • 今回からUSBメモリを利用します。

  • テキストデータ(青空文庫)の配布
    • ダウンロードしてUSBメモリに展開(解凍)してください
  • 検索・置換、grep
    • 検索で初出行を調べる
    • 置換で用例数を数える
    • grepで用例リストを作る
    • タグジャンプで文脈を確認する
    • サブフォルダのgrep

ショートカットキー

grepと置換でKWIC(CSVファイル)を作る(簡易版)

  • CSVファイルとは:テキストファイルで表を表現する 用語:CSVファイル
  • KWIC:KeyWord In Context

正規表現を使ってみる

  • 文字クラス
    • 例:読[まみむめもん]
      • 半角ブラケットの中に文字を並べる→並べた文字いずれか1文字

正規表現とは

  • 正規表現 >用語
    • 文字を表すための特殊な文字(メタ文字)を使って文字列のパターンを表現する
    • エディタでは置換・検索・grepで利用できる (エディタ以外にもさまざまなアプリケ−ションやコンピュータ言語で利用されている)
    • 特殊な文字(メタ文字)はすべて半角

2019/10/04 テキストデータとテキストエディタ

  • USBメモリの準備
    • 次回の授業からUSBメモリを使います。2GB(なるべく4GB)以上の空きのあるUSBメモリを用意してください。

テキストデータ

テキストエディタ

  • zipファイルの展開(解凍)
    • 解凍しないままでも開けるが必ず解凍すること
  • テキストエディタの設定
    • 行の折り返し
    • 行番号表示
      • スタイル行番号(ワープロ的行番号)と論理行番号(エディタ的行番号)
  • 練習用サンプルデータ(漱石+芥川)
  • 検索・置換、grep
    • 検索で初出行を調べる
    • 置換で用例数を数える
    • grepで用例リストを作る
    • タグジャンプで文脈を確認する
    • サブフォルダのgrep

2019/09/27

イントロダクション

  • デモ
    • テキストエディタとgrep
    • 全文検索システムひまわり
    • Excel(ピボットテーブル)
    • 形態素解析:Web茶まめ
  • シラバス確認
    • シラバス(PDF)
    • この授業の目的
    • 授業の進め方
    • 評価方法

授業で利用する主なソフトウェア

ソフトウェアの種類・名前利用目的
テキストエディタ サクラエディタ正規表現を使ったテキストの検索・整形
全文検索ソフトひまわりデータの検索
表計算ソフトExcelピボットテーブルによる分析・グラフ作成
ワープロWord「スタイル」を利用したレポート作成
  • アンケート

2019/09/20

  • 初回ですが,海外出張のため休講です。

トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS