[[成蹊2007]]

-[[シラバス>成蹊2007/前期/シラバス]]
-授業に関するメールはこちらへ。小木曽 智信:seikei@ogiso.net
-[[授業資料]] のページにこの授業に関連する資料がおいてあります。
-授業フォルダ file://U:\ogiso
-授業資料/用語集リンク (わからないコンピュータ用語を調べてください)

----
//&color(red){''5/25は学会のため休講とします。''};


//ひまわりの前にxml

**第7回 6/15 [#u9a4fbf1]

***総復習・質問 [#o89ff29a]
-これまでにやってきたテキストエディタ・正規表現の使い方について復習します。

***小テスト [#j1f58942]
-正規表現に関する簡単な力試し。


**第6回 6/8 [#de3fa830]

***タグ付き正規表現を使った置換 [#c0c09730]

-[[K2エディタの使い方2005.pdf>授業資料#bf35bd53]]参照
-走[らりるれろ] でGrepした結果を置換するにはどうしたらいいか
--次のように置換するととんでもないことに
---検索文字列:走[らりるれろ] 
---置換文字列:★走[らりるれろ] 
-カッコ(半角丸カッコ)と$1($2,$3…)を使う

-例
--「ー」で終わるカタカナ語の「ー」を削除する
--動詞「表わす」の表記を「表す」に統一する
-授業資料/タグつき正規表現


***タグ付き正規表現の応用 [#j53c023d]
-[[Grep結果から置換を使ってKWIC型CSVファイルを作る>授業資料/grepと置換でKWICを作る]]

 ^([^,]*,[^,]*,)(.*)(,走[らりるれろつっ],)([^,]*)(,走[らりるれろつっ],.*)$
 ↓
 $1$2$3$4\n$1$4$5


***補足 [#jcedb1ba]
-タグ付き正規表現:カッコの罠

***古典文学作品のデータ [#b8f2260c]
授業フォルダ内参照


**第5回 6/1  [#q41ea132]
-復習(テキストエディタ)

***正規表現 [#yc024174]
-[[授業資料/正規表現]]
--繰り返し
--グループ化

-正規表現に関する参考資料
--K2Editorでの正規表現の解説 http://www4.ocn.ne.jp/~kaerume/k2e/regex_top.html
--正規表現に関する本 [[amazonで検索>http://www.amazon.co.jp/exec/obidos/search-handle-form/249-2978637-6517941]]
#amazon(4873111307)
#amazon(4873111706)
#amazon(4873110319)
#clear

-正規表現・補足
--特殊文字のエスケープ 記号そのものを表す場合には\でエスケープする(例:1\+2)
--最長一致の原則 greedy

-課題
--送りがなの揺れ(行う/行なう)
--"私は"で始まり"した。"で終わる行
--会話("「"で始まる)
--"全然~ない"


**5/18, 5/25 [[麻疹にともなう全学休講>http://www.seikei.ac.jp/gakuen/oshirase_zengaku_070517.html]] [#s9e4a295]

//&color(red){''5/18,5/25は[[麻疹にともなう全学休講>http://www.seikei.ac.jp/gakuen/oshirase_zengaku_070517.html]]のため授業は行いません。''};

**第4回 5/11  [#q41ea132]
-[[授業資料/覚えておきたいショートカットキー]]配布
-復習

***テキストファイルと拡張子 [#c15ea011]
-[[拡張子(wikipedia)>http://ja.wikipedia.org/wiki/%E6%8B%A1%E5%BC%B5%E5%AD%90]]
-拡張子辞典:http://jisyo.com/viewer/list/list.html

-TXT,CSV,HTM・・・

//htmlのごく簡単な入門

***grepと置換でCSVファイルを作る(簡易版) [#u3ab2d6f]
-CSVファイルとは:テキストファイルで表を表現する
[[用語:CSVファイル>http://www.microsoft.com/japan/Terminology/query.asp?id=3334&q=CSV&kbid=&key=&ui=L&dev=]]
-KWIC:KeyWord In Context

-参考:[[grepと置換でKWICを作る>授業資料/grepと置換でKWICを作る]]

***正規表現入門 [#o846fab3]

-''メタ文字 ― ワイルドカードと正規表現''
-''ワイルドカード'' [[>用語>http://e-words.jp/w/E383AFE382A4E383ABE38389E382ABE383BCE38389.html]]  cf.トランプのJoker
--主にファイル名の指定で使う
--文字を表すための文字(メタ文字) ?と* ((ワイルドカードの「?」「*」は、後で説明する正規表現の「?」「*」とは意味が違うので注意。ワイルドカードの「?」は正規表現で「.」、「*」は「.*」。))

|?|任意の1文字|
|*|任意の長さの文字列|

-''正規表現'' [[>用語>http://e-words.jp/w/E6ADA3E8A68FE8A1A8E78FBE.html]]
--文字を表すための特殊な文字(メタ文字)
--置換・検索・grepで利用できる
--すべて半角
--特殊文字そのものを表す場合には\でエスケープする(例:1\+2)

-[[授業資料/正規表現]]

//GW

**第3回 4/27 テキストエディタの基礎 [#hfb99cfa]

-授業フォルダ file://U:\ogiso
-授業用テキストファイル

-[[授業資料/K2Editorの使い方>授業資料#bf35bd53]] (印刷)
-検索・置換、grep
--検索で初出行を調べる
--置換で用例数を数える
-[[授業資料/覚えておきたいショートカットキー]]


**第2回 4/20 テキストデータとテキストエディタ [#g53e1e46]

-授業ページへのショートカット

***授業で利用する主なソフトウェア [#i06478d2]
|''K2Editor''|テキストエディタ|検索・整形|
|''ひまわり''|全文検索ソフト|検索・分析|
|''Excel''|表計算ソフト|分析・グラフ作成|
|''Access''|データベースソフト|調査・分析|


***テキストデータ [#wee47413]

-電子化データの種類と授業で扱う対象
--Web上で公開
--パッケージ(書籍・CD-ROM)

||画像|テキスト|
|生データ|×|◎|
|Webサービス/専用ソフト|×|△|

テキストデータ≒テキストファイル≒電子化テキスト

-テキストデータとはどんなものか
--[[授業資料/テキストデータとは]]
--[[授業資料/テキストデータ紹介]]


***テキストエディタ [#q7ae852c]
-テキストエディタとはどんなものか
--[[授業資料/テキストエディタ]]

-テキストエディタのダウンロードとインストール
--[[K2Editor>http://k2top.jpn.org/]] http://k2top.jpn.org/
-圧縮ファイルの展開(解凍)
--圧縮・展開ソフト(アーカイバ [[用語>http://e-words.jp/w/E382A2E383BCE382ABE382A4E38390.html]])
--zip,lzh形式
--+Lhaca
-テキストエディタの設定
--行の折り返し
--行番号表示
---スタイル行番号(ワープロ的行番号)と論理行番号(エディタ的行番号)

**第1回 4/13 イントロダクション [#t3a60d7a]
-自己紹介
-この授業の目的
-授業の進め方
-評価方法


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS