[[ソフトウェア/UniDic]] *ubuntuでUniDic [#qd254943] -ubuntu(8.04LTS)でUniDicを使えるようにする手順(ソースからインストール)(2008-12-04) -UniDic 1.3.9用 **0.準備 [#za34392f] $ sudo apt-get install build-essential **1.解析器のインストール [#ua462610] +MeCabのインストール $ tar -xzf mecab-0.97.tar.gz $ cd mecab-0.97 $ ./configure --with-charset=utf8 $ make $ make check $ sudo make install --必要ならmecab用IPADICもインストール $ tar -xzf mecab-ipadic-2.7.0-20070801.tar.gz $ cd mecab-ipadic-2.7.0-20070801/ $ make $ sudo make install ***ライブラリのパスの更新 [#i6347597] $ sudo gedit /etc/ld.so.conf 最終行に次を追加 /usr/local/lib +ChaSenのインストール -[[darts>http://chasen.org/~taku/software/darts/]]のインストール --http://chasen.org/~taku/software/darts/src/darts-0.32.tar.gz $ tar -xzf darts-0.32.tar.gz $ cd darts-0.32/ $ ./configure $ make $ sudo make install -ChaSen本体のインストール --http://sourceforge.jp/projects/chasen-legacy/downloads/32224/chasen-2.4.4.tar.gz $ tar -xzf chasen-2.4.4.tar.gz $ cd chasen-2.4.4/ $ ./configure $ make $ sudo make install --必要ならchasen用NAIST-jdic(IPADIC)もインストール(UniDicだけを使うなら要らない) ---http://sourceforge.jp/projects/ipadic/ ---http://sourceforge.jp/projects/naist-jdic/ IPADICをインストール ---http://sourceforge.jp/projects/ipadic/downloads/24435/ipadic-2.7.0.tar.gz $ tar -xzf ipadic-2.7.0.tar.gz $ cd ipadic-2.7.0/ $ ./configure $ make $ sudo make install またはNAIST-jdic ---http://sourceforge.jp/projects/naist-jdic/downloads/31880/naist-jdic-0.4.3.tar.gz $ tar -xzf naist-jdic-0.4.3.tar.gz $ cd naist-jdic-0.4.3/ $ ./configure $ make $ sudo make install **2. UniDicをインストール [#d75075ac] ーhttp://download.unidic.org/ へいって、ユーザ登録。 -ダウンロードページの「キャビネット」というところの「1.3.9パッケージ」をクリック、そこにあるunidic-1.3.9-pkg.tar.gzをクリックしてダウンロード。 $ tar -xzf unidic-1.3.9-pkg.tar.gz $ cd unidic-1.3.9-pkg/ $ ./configure $ make $ sudo make install **3.UniDicを使って解析 -MeCabの場合 $ mecab -d /usr/local/unidic/dic/unidic-mecab FILE -ChaSenの場合 --UniDic標準のXMLタグ形式で出力する場合 $ chasen -i w -r /usr/local/unidic/dic/unidic-chasen FILE --表形式テキストで出力する場合(UniDicパッケージ付属のchauniを利用) $ cd /usr/local/unidic/ $ ./chauni -t FILE -chauniのオプション usage: chauni [Options] file ... where Options are -c: Use chasen for morphological analysis [default=yes] -m: Use mecab for morphological analysis [default=no] -z: Use han2zen (unavailable with mecab) [default=no] -n: Use numtrans (unavailable with mecab) [default=no] -p: Use chaone (unavailable with mecab) [default=no] -t: Use xml2txt (unavailable with mecab) [default=no] -a: Use all of z, n, p, and t #counter