[[一橋2008]] -授業に関するメールはこちらへ。小木曽 智信: ogiso@ogiso.net -[[授業資料/用語集リンク]] (わからないコンピュータ用語を調べてください) -授業フォルダ \\Servercai-1\SharedDocs\cai_share\日本語コーパス //--[[シラバス>https://syllabus.hit-u.ac.jp/WebSyllabus/Syllabus/WFS02030S.aspx?target=_blank]] *日本語学講義(I) 日本語コーパス研究 [#nfef3a22] **第3回 2008/10/17 テキストエディタを使う [#wb9e8a55] -テキストエディタの基礎 --スタイル行番号(ワープロ的行番号)と論理行番号(エディタ的行番号) --ファイルの作成と保存 --検索と置換 -grepとその応用 --grep --タグジャンプ --grep結果の保存 -応用 --検索で初出行を調べる --置換で用例数を数える ***grepと置換でCSVファイルを作る [#u3ab2d6f] -grep結果の置換による整形 -CSVファイルとは:テキストファイルで表を表現する [[用語:CSVファイル>http://e-words.jp/w/CSV.html]] -CSVファイルをExcelで開く -KWIC:KeyWord In Context ***テキストファイルと拡張子 [#c15ea011] -[[拡張子(wikipedia)>http://ja.wikipedia.org/wiki/%E6%8B%A1%E5%BC%B5%E5%AD%90]] -拡張子辞典:http://jisyo.com/viewer/list/list.html -TXT,CSV,HTM・・・ ***ショートカットキー [#f0022be4] -[[授業資料/覚えておきたいショートカットキー]] // // // //***メタ文字 ― ワイルドカードと正規表現 [#s632d4fa] //-''ワイルドカード'' [[>用語>http://e-words.jp/w/E383AFE382A4E383ABE38389E382ABE383BCE38389.html]] cf.トランプのJoker //--主にファイル名の指定で使う //--文字を表すための文字(メタ文字) ?と* ((ワイルドカードの「?」「*」は、後で説明する正規表現の「?」「*」とは意味が違うので注意。ワイルドカードの「?」は正規表現で「.」、「*」は「.*」。)) // //|?|任意の1文字| //|*|任意の長さの文字列| // //-''正規表現'' [[>用語>http://e-words.jp/w/E6ADA3E8A68FE8A1A8E78FBE.html]] //--文字を表すための特殊な文字(メタ文字) //--置換・検索・grepで利用できる //--すべて半角 //--特殊文字そのものを表す場合には\でエスケープする(例:1\+2) // //-[[授業資料/正規表現]] //テキストエディタとは、から **第2回 2008/10/10 テキストデータとテキストエディタ [#g53e1e46] -共有フォルダの確認 //-出席 //--名前・学籍番号と、専門分野またはこの授業で取り組みたい課題を書き込んでください。 //- まだ未定ですが、年少者教育について興味があります。私はパソコンに弱いので、基礎から教えていただきたいです。 -- [[永渕泰子・LM082005]] &new{2008-10-10 (金) 10:55:06}; //- 日本語・中国語の対照研究。モダリティに関わる表現(終助詞など)。 -- [[LM082006 中村紗弥子]] &new{2008-10-10 (金) 10:55:36}; //- 専門分野は文章理解なので、この授業で何をやりたいのかはまだ決まっていません。でも、コーパスにも興味があるので、コーパス関係で何かやるかもしれません。 -- [[ポクロフスカ・オーリガ LA080002]] &new{2008-10-10 (金) 10:56:42}; //- 第二言語の語彙習得を専門にしています。特に連語(コロケーション)の習得について扱っていますので、この授業でも語の共起について取り組みたいと考えています。 -- [[阿保きみ枝 LD072001]] &new{2008-10-10 (金) 10:57:10}; //- 見送る、見逃すなど見ると組み合わせする複合動詞 -- [[LM072004 黄嘉韻]] &new{2008-10-10 (金) 10:57:16}; //- 研究テーマはまだ決まっていないのですが、外来語(カタカナ語)について興味を持っております。 -- [[黎嘉欣(レイカキン) [カミラ] LM082008]] &new{2008-10-10 (金) 10:57:40}; //- 初級日本語段階からのビデオ視聴授業 -- [[史文華 lm082002]] &new{2008-10-10 (金) 10:57:46}; //- 専門分野:平安時代の作品を中心に、言葉の検索、分析などのコーパスを学びたいです -- [[周静]] &new{2008-10-10 (金) 10:58:10}; //- 異文化コミュニケーション研究。企業における異文化摩擦の動向など。 -- [[lm081012姜景字]] &new{2008-10-10 (金) 10:58:27}; //- "明治大正期の音楽教育”国樂概念、唱歌歌詞(文語から口語へ)。 太陽コーパスを使って幾つかの語彙の意味内容変遷をみたいです。よろしくお願いします。 -- [[LM082001 佐川祥予]] &new{2008-10-10 (金) 10:59:07}; //- 研究テ―マはまだ決まっていないのですが、専門は日本語教育なんです -- [[沈衛傑]] &new{2008-10-10 (金) 10:59:33}; // //#comment // ***授業で利用する主なソフトウェア [#i06478d2] |''[[秀丸エディタ>http://hide.maruo.co.jp/software/hidemaru.html]]''|テキストエディタ|検索・整形| |''[[ひまわり>http://www.kokken.go.jp/lrc/index.php?%C1%B4%CA%B8%B8%A1%BA%F7%A5%B7%A5%B9%A5%C6%A5%E0%A1%D8%A4%D2%A4%DE%A4%EF%A4%EA%A1%D9]]''|全文検索ソフト|検索・分析| |''[[MeCab>http://mecab.sourceforge.net/]]''|形態素解析ソフト|形態素解析| |''[[UniDic>http://download.unidic.org]]''|形態素解析辞書|形態素解析| |''[[Excel>http://office.microsoft.com/ja-jp/excel/default.aspx]]''|表計算ソフト|集計・分析・グラフ作成| |''[[Access>http://office.microsoft.com/ja-jp/access/default.aspx]]''|データベースソフト|集計・分析| 最初に、テキストエディタを使ってテキストデータを扱うことからはじめます。 ***テキストデータ [#wee47413] テキストデータ≒テキストファイル≒電子化テキスト -テキストデータとはどんなものか --[[授業資料/テキストデータとは]] --[[授業資料/テキストデータ紹介]] ---参考 [[『国会会議録を使った日本語研究』>http://www.hituzi.co.jp/books/299.html]] --[[授業資料/文字コード関連リンク]] ***テキストエディタ [#q7ae852c] -テキストエディタとはどんなものか --[[授業資料/テキストエディタ]] **2008/10/03 イントロダクション [#wa4a4b4f] -[[自己紹介]] -国語研コーパスの紹介 -授業の進め方について --シラバス確認 //・・手を動かすこと、実用 -デモ --形態素解析+Excel -受講者アンケート --専門・関心領域 --PCスキル