[[一橋2008]]

ひまわりの検索結果に形態素解析をかけて、ゴミの除去に応用してみる。
かなり無理矢理な方法。

***1.検索結果(Excelで前文脈・キー・語彙素を取り出したもの)に対し [#le568da4]
+置換(前文脈前文の残りを削除)
***1.ひまわり検索結果をExcelにコピー [#f124b1ac]

***2.Excelの前文脈・キー・語彙素をテキストエディタにコピーして次の処理 [#le568da4]
-(1) 置換(前文脈にある前文の残りを削除)
 ^[^\t]*。
↓
 
+置換(後文脈後続文の残りを削除)
  

-(2) 置換(後文脈にある後続文の先頭部分を削除)
 。[^\t]*?$
↓
 。
***2.解析結果に対し [#jf4b2f35]
+置換(文頭以外の行の改行文字を削除)

-(3) 置換(キーの区切りを削除)
 \t

  

***3.この結果を茶まめに貼り付けて形態素解析 [#r92dbf77]

***4.形態素解析結果をテキストエディタに出力して次の処理 [#jf4b2f35]
-(1) 置換(文頭以外の行の改行文字を削除)
 \nchamame\tI
↓
 
***3.検索結果(Excel)の開いている列に貼り付け [#r32d79f0]
その列をオートフィルタで絞り込み
  
-(2) 置換(後で見やすいようにタブを,に置換)
 \t

 ,

***5.最初の検索結果(Excel)の空いている列に貼り付け [#r32d79f0]
-その列をオートフィルタ(~を含む)で絞り込み
--(ほしい語が入っているかどうか、,区切りの形態素解析結果を条件に指定する)


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS