初めに戻る |
参照 |
四つの版 |
準備・make |
動作確認( 索引作成 mknmz) |
動作確認(検索 namazu) |
用語 |
その他 |
設置資源 |
[installer]
Namazu/target
対象となる譜(target file)について
関係する用語
namazu.conf, conf.pl, -I, -a, -F, -t, $TARGET_FILE, $DENY_FILE,
.htacess, /robots.txt
mknmz を起動して検索索引を作る場合に、何を対象にして処理する
かについてまとめてみた。
$TARGET_FILE
-
無指定時には、
(/usr/local/namazu/lib/)
conf.pl
に書いてある次の表現
が有効である。
$TARGET_FILE = '.*\.html?|.*\.txt|.*_default';
つまり
*.html
|
*.htmlに一文字付けたもの
|
*.text
|
*._default
|
(だけ)が対象となる。
-
-a を指定すると、上の設定は
$TARGET_FILE = '.*';
で上書きされる。「$TARGE_FILE を書き替えている」ことが重要。
-
-I filename と指定した filename の中に
$TARGET_FILE=
で新たに設定し直すことが出来る。
但し、この設定があると上記 -a の指定は無視されてしまう。つまり -a
を指定しても意味がない。
- -F filename
filename の中に書いてある名前のものを対象とする
- -t regexp
regexp に書いた正規表現に一致するものを対象とする。
$DENY_FILE
-
無指定時には、
前出
conf.pl
には次のような文字があって
$DENY_FILE = '.*\.gif|.*\.(jpg|jpeg)|.*\.tar\.gz|core|.*\.bak|.*~|\..*|\x23.*|NMZ\..*';
ここに書いてあるものは(上記 $TARGE_FILE の指定に関係なく)
何より無視される。
-
-I filename と指定した filename の中に
$conf::DENY_FILE を初めから設定し直すことも出来るし、
また
$conf::$DENY_FILE .=
の形を使って追加することも出来る。
上記の他に .htaccess, robots.txt による除外も設定出来る。
/robots.txt, .htaccess
Last Update
19:53:39 03/12/08
Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; ClaudeBot/1.0; +claudebot@anthropic.com)
(since 1999/06/10)