全文検索システムNamazuのインストールと設定


目次

  1. 環境とバージョン
  2. Namazuとは
  3. インストール
    1. Namazuのインストール
    2. Mecabのインストール
    3. mecab-naist-jdicのインストール
    4. libmecab-perlのインストール
  4. インデックスの作成
    1. コマンド
    2. オプション

環境とバージョン

  • OS:Debian Wheezy amd64
  • namazu2:namazu22.0.21-6amd64
  • namazu2-common:namazu2-common2.0.21-6all
  • namazu2-index-tools:namazu2-index-tools2.0.21-6all
  • mecab:mecab0.99.3-3amd64
  • mecab-naist-jdic:mecab-naist-jdic0.6.3.b-20111013-3all
  • libmecab-perl:libmecab-perl0.99.3-1amd64

Namazuとは

全文検索システムとは,検索対象になるファイルをあらかじめ
インデックスしておくことにより,すぐにさまざまな条件で
全文検索が行なえるシステムのことです.

namazu2パッケージの説明より.

フルテキスト版検索エンジン – バイナリおよび CGI スクリプト
Namazu はフルテキスト検索エンジンであり、cgi 経由で利用できます。
シンプルかつ使いやすい設定が特徴であり、C と Perl を使って書かれています。
Namazu はテキストユーティリティ nkf および kakasi 又は chasen を利用します。

インストール

Namazuのインストール

  1. コマンド apt-get install namazu2 namazu2-index-tools

Mecabのインストール

Mecabという形態素解析システムを使いたいので,これもインストールします.

  1. コマンド ap-get install mecab

mecab-naist-jdicのインストール

同時にmecab-jumandicというパッケージが入るのですが,日本語を扱う場合
mecab-ipadicより性能的に劣るようです.
mecab-ipadicをもとにBSDライセンスでリリースされた
mecab-naist-jdicをインストールします.

  1. コマンド apt-get install mecab-naist-jdic

libmecab-perlのインストール

Perl 用 mecab バインディング

インデックスの作成

インデックスを作成します.ここではディレクトリ’/usr/share/doc’以下の
ドキュメントに対してインデックスを作ってみます.

コマンド

mknmz -b -O /home/hoge/nmzindex/usrsharedoc /usr/share/doc

オプション

  • -b:形態素解析にMecabを使用するオプションです.
  • -O:インデックスの出力先のディレクトリを指定します.

ディレクトリはコマンド実行前に作成しておく必要があります.


コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です