目次
環境とバージョン
- OS:Debian Wheezy amd64
- namazu2:namazu22.0.21-6amd64
- namazu2-common:namazu2-common2.0.21-6all
- namazu2-index-tools:namazu2-index-tools2.0.21-6all
- mecab:mecab0.99.3-3amd64
- mecab-naist-jdic:mecab-naist-jdic0.6.3.b-20111013-3all
- libmecab-perl:libmecab-perl0.99.3-1amd64
Namazuとは
全文検索システムとは,検索対象になるファイルをあらかじめ
インデックスしておくことにより,すぐにさまざまな条件で
全文検索が行なえるシステムのことです.
namazu2パッケージの説明より.
フルテキスト版検索エンジン – バイナリおよび CGI スクリプト
Namazu はフルテキスト検索エンジンであり、cgi 経由で利用できます。
シンプルかつ使いやすい設定が特徴であり、C と Perl を使って書かれています。
Namazu はテキストユーティリティ nkf および kakasi 又は chasen を利用します。
インストール
Namazuのインストール
- コマンド apt-get install namazu2 namazu2-index-tools
Mecabのインストール
Mecabという形態素解析システムを使いたいので,これもインストールします.
- コマンド ap-get install mecab
mecab-naist-jdicのインストール
同時にmecab-jumandicというパッケージが入るのですが,日本語を扱う場合
mecab-ipadicより性能的に劣るようです.
mecab-ipadicをもとにBSDライセンスでリリースされた
mecab-naist-jdicをインストールします.
- コマンド apt-get install mecab-naist-jdic
libmecab-perlのインストール
Perl 用 mecab バインディング
インデックスの作成
インデックスを作成します.ここではディレクトリ’/usr/share/doc’以下の
ドキュメントに対してインデックスを作ってみます.
コマンド
mknmz -b -O /home/hoge/nmzindex/usrsharedoc /usr/share/doc
オプション
- -b:形態素解析にMecabを使用するオプションです.
- -O:インデックスの出力先のディレクトリを指定します.
ディレクトリはコマンド実行前に作成しておく必要があります.