*成蹊大学 日本語日本文学のためのコンピュータ [#o6f89cad]
*成蹊大学 日本語日本文学のためのコンピュータ (後期) [#x0df355b]

-授業に関するメールはこちらへ。小木曽 智信:seikei@ogiso.net
-[[授業に関する掲示板>成蹊大学/質問掲示板]] にこの授業用の掲示板を用意しました。質問があったら書き込んでください。
-[[授業資料]] のページにこの授業に関連する資料がおいてあります。
-授業フォルダ file://U:\ogiso
-授業資料/用語集リンク (わからないコンピュータ用語を調べてください)

**1/19 [#y48768ff]
-レポート作成2

**第9回 6/16 [#g2b9db9c]
***形態素解析(参考) [#ad0c3ca3]
***Accessの利用 [#u02b591a]

***データのCD-Rについて [#t2c508b9]
-青空文庫のテキストデータや、テキストエディタ(K2Editor)、青空文庫が検索できる「ひまわり」 などは、CD-Rにコピーして持ち帰ってもかまいません。方法を説明するので、必要な人は自分でディスクを用意してコピーしてください。
-基本的にWindows用ですが、テキストデータと「ひまわり」は他のOSでも利用可能です。

***テキストエディタ・正規表現 小テスト [#w31f02d2]
-Webページやノートなどを見てもかまいません。
**1/12 [#bc43e0db]
-レポート作成

***レポートテーマについて [#w44fa92e]
-提出日は授業最終日です。(間に合わない場合には、メールでの提出も認めますが、最終日に申し出てください)
-来週以降、自分のレポートテーマに必要な作業を授業の中で行っていきます。テーマを考えておいてください。
***太陽コーパス・近代女性雑誌コーパス [#a37af685]

***Excelによる分析 [#c01a6d3a]
-xlsとcsv
-分類データの入力
-ピボットテーブル・デモ

**第8回 6/9 [#adea6a79]
**12/22 [#x3eeb26f]

***正規表現・補足 [#jcedb1ba]
-タグ付き正規表現:カッコの罠
***Excelによる分析2 [#f9a178c6]

***全文検索ソフト「ひまわり」を使う [#tae381fe]

**12/15 [#jbcbca7c]

***全文検索ソフト「ひまわり」 [#tae381fe]
-「ひまわり」 [[国立国語研究所/言語データベースとソフトウェア/ひまわり>http://www.kokken.go.jp/lrc/index.php?%C1%B4%CA%B8%B8%A1%BA%F7%A5%B7%A5%B9%A5%C6%A5%E0%A1%D8%A4%D2%A4%DE%A4%EF%A4%EA%A1%D9]]
-「ひまわり」を授業フォルダに入れ、青空文庫を検索できるようにしてあります。~
file://U:\小木曽\himawari
-「ひまわり」を授業フォルダに入れ、青空文庫を検索できるようにしてあります。file://U:\小木曽\himawari

***「ひまわり」で使用できる正規表現 [#t52b1fee]
-検索語/キー:普通の文字と、列挙型の文字クラス([あいう]のようなもの。[あ-う]は不可)
-前文脈/後文脈:ほぼ全ての正規表現
-「ひまわり」で使用できる正規表現
--検索語/キー:普通の文字と、列挙型の文字クラス([あいう]のようなもの。[あ-う]は不可)
--前文脈/後文脈:ほぼ全ての正規表現

-「ひまわり」の検索結果を正規表現を使った置換で加工する

***表計算ソフト Excel入門 [#k88c28d1]
***Excelによる分析 [#c01a6d3a]
-並べ替え
-オートフィルタ
--オートフィルタの「オプション」

***小テスト予告 [#z8664c16]
-来週、テキストエディタの使い方と正規表現についての簡単な小テストを行います。
-分類データの入力

-ピボットテーブルとピボットグラフ
-関数を使う
--=left(xx,n)

**第7回 6/2 [#kceaab6f]
-区切り位置(メニュー>データ>区切り位置)

***タグ付き正規表現を使った置換 [#c0c09730]
[[K2エディタの使い方2005.pdf>授業資料#bf35bd53]]参照
-走[らりるれろ] でGrepした結果を置換するにはどうしたらいいか
--次のように置換するととんでもないことに
---検索文字列:走[らりるれろ] 
---置換文字列:★走[らりるれろ] 
-カッコ(半角丸カッコ)と$1($2,$3…)を使う
***データのCD-Rについて [#t2c508b9]

***タグ付き正規表現の応用 [#j53c023d]
-[[Grep結果から置換を使ってKWIC型CSVファイルを作る>授業資料/grepと置換でKWICを作る]]
**12/01 正規表現復習・レポートテーマの検討 [#we45dd4b]
-課題の答え合わせ
-レポートテーマの検討
-「ひまわり」の利用

 ^([^,]*,[^,]*,)(.*)(,走[らりるれろつっ],)([^,]*)(,走[らりるれろつっ],.*)$

 $1$2$3$4\n$1$4$5
**11/17 正規表現・タグつき正規表現 [#d70bc225]

***古典文学作品のデータ [#b8f2260c]
授業フォルダ内参照


**第6回 5/26 正規表現 [#sb2b07bc]

-[[授業資料/正規表現]]
--繰り返し
--グループ化

-正規表現に関する参考資料
--K2Editorでの正規表現の解説 http://www4.ocn.ne.jp/~kaerume/k2e/regex_top.html
--正規表現に関する本 [[amazonで検索>http://www.amazon.co.jp/exec/obidos/search-handle-form/249-2978637-6517941]]
#amazon(4873111307)
#amazon(4873111706)
#amazon(4873110319)
#clear
**休講 10/20 (四大戦) [#d629ef1c]

-正規表現・補足
--特殊文字のエスケープ 記号そのものを表す場合には\でエスケープする(例:1\+2)
--最長一致の原則 greedy
**第4回 10/13 テキストエディタ(2) [#d85e2401]

-課題
--送りがなの揺れ(行う/行なう)
--"私は"で始まり"した。"で終わる行
--会話("「"で始まる)
--"全然~ない"
***復習 [#xc9dae9a]
-置換・検索・grep
--夏目漱石『行人』における「兄」の初出行
--夏目漱石『行人』における「母」の用例数
--太宰治『走れメロス』における「メロス」の用例数

***grep(複数のファイルを検索) [#kfb37c1d]

-タグ付き正規表現
//--「ー」で終わるカタカナ語の「ー」を削除する
//--動詞「表わす」の表記を「表す」に統一する
--夏目漱石の「飲む」
--太宰治の「飛べ」

***テキストファイルと拡張子 [#c15ea011]
-TXTファイル
-CSVファイル

**第5回 5/19 テキストエディタ(3) 正規表現入門 [#aecfa986]
***grepと置換でCSVファイルを作る(簡易版) [#u3ab2d6f]
-CSVファイルとは:テキストファイルで表を表現する
[[用語:CSVファイル>http://www.microsoft.com/japan/Terminology/query.asp?id=3334&q=CSV&kbid=&key=&ui=L&dev=]]
-KWIC:KeyWord In Context

-参考:[[grepと置換でKWICを作る>授業資料/grepと置換でKWICを作る]]

***メタ文字 ― ワイルドカードと正規表現 [#d0de5e25]
-''ワイルドカード'' [[>用語>http://e-words.jp/w/E383AFE382A4E383ABE38389E382ABE383BCE38389.html]]  cf.トランプのJoker
--主にファイル名の指定で使う
--文字を表すための文字(メタ文字) ?と* ((ワイルドカードの「?」「*」は、後で説明する正規表現の「?」「*」とは意味が違うので注意。ワイルドカードの「?」は正規表現で「.」、「*」は「.*」。))

|?|任意の1文字|
|*|任意の長さの文字列|

-''正規表現'' [[>用語>http://e-words.jp/w/E6ADA3E8A68FE8A1A8E78FBE.html]]
--文字を表すための特殊な文字(メタ文字)
--置換・検索・grepで利用できる
--すべて半角
--特殊文字そのものを表す場合には\でエスケープする(例:1\+2)

-[[授業資料/正規表現]]

**第4回 5/12 テキストエディタ(2) [#kf080791]
***資料 [#j1437696]
次の資料を印刷して使ってください(室内のプリンタに出力)
-[[授業資料/K2Editorの使い方>授業資料#bf35bd53]]
***解凍用ソフト [#ve477f0c]
http://park8.wakwak.com/~app/Lhaca/

***復習 [#xc9dae9a]
-検索で初出行を調べる
--ex.夏目漱石『行人』における「兄」の初出行
-置換で用例数を数える
--ex.夏目漱石『行人』における「母」の用例数
--ex.太宰治『走れメロス』における「メロス」の用例数
**第3回 10/6 テキストエディタの基礎 [#k1aa72b4]
-テキストエディタの設定
--行の折り返し
--行番号表示
---スタイル行番号(ワープロ的行番号)と論理行番号(エディタ的行番号)

***grepと置換でCSVファイルを作る(簡易版) [#u3ab2d6f]
-CSVファイルとは:テキストファイルで表を表現する
[[用語:CSVファイル>http://www.microsoft.com/japan/Terminology/query.asp?id=3334&q=CSV&kbid=&key=&ui=L&dev=]]
-KWIC:KeyWord In Context

-参考:[[grepと置換でKWICを作る>授業資料/grepと置換でKWICを作る]]

**GW [#xf53d668]

**第3回 4/28 テキストエディタの基礎 [#hfb99cfa]

-授業フォルダ file://U:\ogiso
-授業用テキストファイル

-[[授業資料/K2Editorの使い方>授業資料#bf35bd53]]
-検索・置換、grep
-[[授業資料/覚えておきたいショートカットキー]]

**第2回 9/29 テキストデータとテキストエディタ [#g53e1e46]

***テキストファイルと拡張子 [#c15ea011]
-TXTファイル
-CSVファイル


**第2回 4/21 テキストデータとテキストエディタ [#g53e1e46]

-授業ページへのショートカット

***テキストデータ [#wee47413]

テキストデータ≒テキストファイル≒電子化テキスト

-テキストデータとはどんなものか
--[[授業資料/テキストデータとは]]
--[[授業資料/テキストデータ紹介]]

***テキストエディタ [#q7ae852c]
-テキストエディタとはどんなものか
--[[授業資料/テキストエディタ]]

-テキストエディタのダウンロードとインストール
--[[K2Editor>http://k2top.jpn.org/]] http://k2top.jpn.org/
-圧縮ファイルの展開(解凍)
--圧縮・展開ソフト(アーカイバ [[用語>http://e-words.jp/w/E382A2E383BCE382ABE382A4E38390.html]])
--zip,lzh形式
--+Lhaca
-テキストエディタの設定
--行の折り返し
--行番号表示
---スタイル行番号(ワープロ的行番号)と論理行番号(エディタ的行番号)

**第1回 4/14 イントロダクション [#t3a60d7a]

**第1回 9/22 イントロダクション [#t3a60d7a]
-自己紹介
-この授業の目的
-授業の進め方
-評価方法

***授業で利用する主なソフトウェア [#i06478d2]
***授業で使用する主なソフトウェア [#i06478d2]
|''K2Editor''|テキストエディタ|検索・整形|
|''ひまわり''|全文検索ソフト|検索・分析|
|''Excel''|表計算ソフト|分析・グラフ作成|

-用例検索・整理のデモ

//小森昌人 l052050

//欅祭委員会
// 16:40~17:15
// 9/29,10/27,11/17,12/1


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS