[[ソフトウェア/UniDic]] *ubuntuでUniDic [#qd254943] -[[ubuntu>http://www.ubuntulinux.jp/]](8.04LTS)でUniDicを使えるようにする手順(ソースからインストールする)(2008-12-04) -UniDic 1.3.9用 **0.準備 [#za34392f] -[[gccなど必要なもの>http://packages.ubuntu.com/ja/dapper/build-essential]]を入れておく。 $ sudo apt-get install build-essential **1.解析器のインストール [#ua462610] ***1.1 MeCabのインストール [#h5dcf213] -http://sourceforge.net/project/showfiles.php?group_id=177856&package_id=204917 $ tar -xzf mecab-0.97.tar.gz $ cd mecab-0.97 $ ./configure --with-charset=utf8 $ make $ make check $ sudo make install -必要ならmecab用IPADICもインストール(UniDicを使うだけなら要らない) --http://sourceforge.net/project/showfiles.php?group_id=177856&package_id=205275 $ tar -xzf mecab-ipadic-2.7.0-20070801.tar.gz $ cd mecab-ipadic-2.7.0-20070801/ $ ./configure $ make $ sudo make install ***1.2 ChaSenのインストール [#ld38e5d1] -[[darts>http://chasen.org/~taku/software/darts/]]のインストール --http://chasen.org/~taku/software/darts/src/darts-0.32.tar.gz $ tar -xzf darts-0.32.tar.gz $ cd darts-0.32/ $ ./configure $ make $ sudo make install +ChaSen本体のインストール --http://sourceforge.jp/projects/chasen-legacy/downloads/32224/chasen-2.4.4.tar.gz $ tar -xzf chasen-2.4.4.tar.gz $ cd chasen-2.4.4/ $ ./configure $ make $ sudo make install --必要ならchasen用NAIST-jdic(IPADIC)もインストール(UniDicだけを使うなら要らない) ---http://sourceforge.jp/projects/ipadic/ ---http://sourceforge.jp/projects/naist-jdic/ ---''IPADICをインストール''(任意) ---http://sourceforge.jp/projects/ipadic/downloads/24435/ipadic-2.7.0.tar.gz $ tar -xzf ipadic-2.7.0.tar.gz $ cd ipadic-2.7.0/ $ ./configure $ make $ sudo make install ---''またはNAIST-jdicをインストール''(任意) ---http://sourceforge.jp/projects/naist-jdic/downloads/31880/naist-jdic-0.4.3.tar.gz $ tar -xzf naist-jdic-0.4.3.tar.gz $ cd naist-jdic-0.4.3/ $ ./configure $ make $ sudo make install ***1.3 ライブラリのパスの更新 [#i6347597] $ sudo gedit /etc/ld.so.conf 最終行に次を追加 /usr/local/lib **2. UniDicをインストール [#d75075ac] +http://download.unidic.org/ へいって、ユーザ登録。 +ダウンロードページの「キャビネット」というところの「1.3.9パッケージ」をクリック、そこにあるunidic-1.3.9-pkg.tar.gzをクリックしてダウンロード。 $ tar -xzf unidic-1.3.9-pkg.tar.gz $ cd unidic-1.3.9-pkg/ $ ./configure $ make $ sudo make install **3.UniDicを使って解析 [#kdc659bf] -MeCabの場合 $ mecab -d /usr/local/unidic/dic/unidic-mecab FILE -ChaSenの場合 --UniDic標準のXMLタグ形式で出力する場合 $ chasen -i w -r /usr/local/unidic/dic/unidic-chasen FILE --表形式テキストで出力する場合(UniDicパッケージ付属のchauniを利用) $ cd /usr/local/unidic/ $ ./chauni -t FILE -chauniのオプション usage: chauni [Options] file ... where Options are -c: Use chasen for morphological analysis [default=yes] -m: Use mecab for morphological analysis [default=no] -z: Use han2zen (unavailable with mecab) [default=no] -n: Use numtrans (unavailable with mecab) [default=no] -p: Use chaone (unavailable with mecab) [default=no] -t: Use xml2txt (unavailable with mecab) [default=no] -a: Use all of z, n, p, and t #counter