[[ソフトウェア/UniDic]]

*ubuntuでUniDic [#qd254943]

-ubuntu(8.04LTS)でUniDicを使えるようにする手順(ソースからインストール)(2008-12-04)
-[[ubuntu>http://www.ubuntulinux.jp/]](8.04LTS)でUniDicを使えるようにする手順(ソースからインストールする)(2008-12-04)
-UniDic 1.3.9用

**0.準備 [#za34392f]

-[[gccなど必要なもの>http://packages.ubuntu.com/ja/dapper/build-essential]]を入れておく。
 $ sudo apt-get install build-essential

**1.解析器のインストール [#ua462610]
+MeCabのインストール
ChaSenかMeCabどちらかだけでもok。
***1.1 MeCabのインストール [#h5dcf213]
-http://sourceforge.net/project/showfiles.php?group_id=177856&package_id=204917
 $ tar -xzf mecab-0.97.tar.gz
 $ cd mecab-0.97
 $ ./configure --with-charset=utf8
 $ make
 $ make check
 $ sudo make install

--必要ならmecab用IPADICもインストール
-必要ならmecab用IPADICもインストール(UniDicを使うだけなら要らない)
--http://sourceforge.net/project/showfiles.php?group_id=177856&package_id=205275
 $ tar -xzf mecab-ipadic-2.7.0-20070801.tar.gz
 $ cd mecab-ipadic-2.7.0-20070801/
 $ ./configure
 $ make
 $ sudo make install

***ライブラリのパスの更新 [#i6347597]
 $ sudo gedit /etc/ld.so.conf
最終行に次を追加
/usr/local/lib 

+ChaSenのインストール
***1.2 ChaSenのインストール [#ld38e5d1]
-[[darts>http://chasen.org/~taku/software/darts/]]のインストール
--http://chasen.org/~taku/software/darts/src/darts-0.32.tar.gz
 $ tar -xzf darts-0.32.tar.gz
 $ cd darts-0.32/
 $ ./configure
 $ make
 $ sudo make install

-ChaSen本体のインストール
+ChaSen本体のインストール
--http://sourceforge.jp/projects/chasen-legacy/downloads/32224/chasen-2.4.4.tar.gz
 $ tar -xzf chasen-2.4.4.tar.gz
 $ cd chasen-2.4.4/
 $ ./configure
 $ make
 $ sudo make install

--必要ならchasen用NAIST-jdic(IPADIC)もインストール(UniDicだけを使うなら要らない)
---http://sourceforge.jp/projects/ipadic/
---http://sourceforge.jp/projects/naist-jdic/

IPADICをインストール
---''IPADICをインストール''(任意)
---http://sourceforge.jp/projects/ipadic/downloads/24435/ipadic-2.7.0.tar.gz
 $ tar -xzf ipadic-2.7.0.tar.gz
 $ cd ipadic-2.7.0/
 $ ./configure
 $ make
 $ sudo make install

またはNAIST-jdic
---''またはNAIST-jdicをインストール''(任意)
---http://sourceforge.jp/projects/naist-jdic/downloads/31880/naist-jdic-0.4.3.tar.gz
 $ tar -xzf naist-jdic-0.4.3.tar.gz
 $ cd naist-jdic-0.4.3/
 $ ./configure
 $ make
 $ sudo make install

***1.3 ライブラリのパスの更新 [#i6347597]
 $ sudo gedit /etc/ld.so.conf
最終行に次を追加
/usr/local/lib 

**2. UniDicをインストール [#d75075ac]
ーhttp://download.unidic.org/ へいって、ユーザ登録。
-ダウンロードページの「キャビネット」というところの「1.3.9パッケージ」をクリック、そこにあるunidic-1.3.9-pkg.tar.gzをクリックしてダウンロード。
+http://download.unidic.org/ へいって、ユーザ登録。
+ダウンロードページの「キャビネット」というところの「1.3.9パッケージ」をクリック、そこにあるunidic-1.3.9-pkg.tar.gzをクリックしてダウンロード。
 $ tar -xzf unidic-1.3.9-pkg.tar.gz
 $ cd unidic-1.3.9-pkg/
 $ ./configure
 $ make
 $ sudo make install

 **3.UniDicを使って解析
**3.UniDicを使って解析 [#kdc659bf]
-MeCabの場合
 $ mecab -d /usr/local/unidic/dic/unidic-mecab FILE

-ChaSenの場合
--UniDic標準のXMLタグ形式で出力する場合
 $ chasen -i w -r /usr/local/unidic/dic/unidic-chasen FILE
--表形式テキストで出力する場合(UniDicパッケージ付属のchauniを利用)
 $ cd /usr/local/unidic/
 $ ./chauni -t FILE

-chauniのオプション
 usage: chauni [Options] file ...
  where Options are
    -c:		Use chasen for morphological analysis [default=yes]
    -m:		Use mecab for morphological analysis [default=no]
    -z:		Use han2zen (unavailable with mecab) [default=no]
    -n:		Use numtrans (unavailable with mecab) [default=no]
    -p:		Use chaone (unavailable with mecab) [default=no]
    -t:		Use xml2txt (unavailable with mecab) [default=no]
    -a:		Use all of z, n, p, and t


#counter


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS