Navigation : Top / mknmz

mknmz

mknmz

機能

namazuのデ−タ−ベ−ス作成

書式

mknmz [オプション] <対象Directory>... 

使用例

mknmz -O /home/mori/namazu/proceedings /home/mori/doc_sci/proceedings/

オプション

対象ファイル:

  • -a, --all すべてのファイルを対象とする
  • -t, --media-type=MTYPE 対象ファイルの文書形式を指定する
  • -h, --mailnews --media-type='message/rfc822' と同じ
  • --mhonarc --media-type='text/html; x-type=mhonarc' と同じ
  • -F, --target-list=FILE インデックス対象のファイルのリストを読み込む
  • --allow=PATTERN 対象とするファイル名の正規表現を指定する
  • --deny=PATTERN 拒絶するファイル名の正規表現を指定する
  • --exclude=PATTERN 除外するパス名の正規表現を指定する
  • -e, --robots 次の記述を含む HTMLファイルを除外する
  • -M, --meta HTMLの metaタグをフィールド指定検索に用いる
  • -r, --replace=CODE URIを置換するためのコードを指定する
  • --html-split HTMLファイルを 単位で分割処理する
  • --mtime=NUM 変更日制限 find(1) の -mtime と同じ規則 例: -50 で 50 日以内、+50 で 50 日より古いものだけ

形態素解析:

  • -c, --use-chasen 日本語の単語のわかち書きに ChaSen? を用いる
  • -k, --use-kakasi 日本語の単語のわかち書きに KAKASI を用いる
  • -m, --use-chasen-noun 名詞のみを抽出する
  • -L, --indexing-lang=LANG インデックス時に言語に特化した処理を行なう

文字列処理:

  • -E, --no-edge-symbol 単語の両端の記号は削除する
  • -G, --no-okurigana 送り仮名を削除する
  • -H, --no-hiragana 平仮名のみの単語は登録しない
  • -K, --no-symbol 記号をすべて削除する

要約:

  • -U, --no-encode-uri URIのencodeを行わない
  • -x, --no-heading-summary HTML のヘディングによる要約作成を行わない

インデックス作成:

  • --update=INDEX 更新するインデックスを指定する
  • -Y, --no-delete 削除された文書の検出を行わない
  • -Z, --no-update 文書の更新・削除を反映しない

その他:

  • -s, --checkpoint チェックポイント機構を作動させる
  • -C, --show-config 現在の設定を表示する
  • -f, --config=FILE 設定ファイルを指定する
  • -I, --include=FILE カスタマイズ用ファイルを読み込む
  • -O, --output-dir=DIR インデックスの出力先を指定する
  • -T, --template-dir=DIR NMZ.{head,foot,body}.* のディレクトリを指定する
  • -q, --quiet インデックス処理の最中にメッセージを表示しない
  • -v, --version ヴァージョンを表示する
  • -V, --verbose 口やかましいモード
  • --debug デバッグモード
  • --help このヘルプを表示する