一橋2008

ひまわりの検索結果に形態素解析をかけて、ゴミの除去に応用してみる。 かなり無理矢理な方法。

1.ひまわり検索結果をExcelにコピー

2.Excelの前文脈・キー・語彙素をエディタにコピーして次の処理

  1. 置換(前文脈にある前文の残りを削除)
    ^[^\t]*。
     
  1. 置換(後文脈にある後続文の先頭部分を削除)
    。[^\t]*?$
  1. 置換(キーの区切りを削除)
    \t
     

3.この結果を茶まめに貼り付けて形態素解析

4.形態素解析結果をテキストエディタに出力して次の処理

  1. 置換(文頭以外の行の改行文字を削除)
    \nchamame\tI
     

5.最初の検索結果(Excel)の空いている列に貼り付け

その列をオートフィルタ(~を含む)で絞り込み


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS