ここに書いてある変数は
/usr/local/share/namazu/pl/conf.pl
に設定されていて、mknmz の動作を制御する。
またそれらの意味は、その中に英語で書いてある。
自分の環境や条件に合せて変更する場合、
~/.mknmzrc
(など) に設定し直すことで、内容を上書き出来る。
ただし、その時には
package conf;
と最初に書き、Perl の言葉で設定する。 また mknmz の起動時に 操作行で選択を指定 することによって上書きすることも出来る。
変数名に (*) の付いているものの初期値は、./configure 時に決定される
(その事情は pl/conf.pl.in を見れば分る)
変数名 | 初期値(例) | 説明 | |
---|---|---|---|
$NKF (*) | "module_nkf" | NKF 起動法 | |
$KAKASI (*) | "/usr/local/bin/kakasi -ieuc -oeuc -w" | kakasi 起動法 | |
$CHASEN (*) | "module_chasen1 -j -F '\%m '" | chasen 起動法 | |
$CHASEN_NOUN (*) | "module_chasen1 -j -F '\%m %H\\n'" | ||
$WAKATI (*) | $KAKASI | わかち書きに kakase を 使うか chasen を使うか | -c, -k |
$LANGUAGE | "ja" | 処理言語 (日本語・英語) # language of messages | |
$ADMIN (*) | # admin's email address (config 時に設定される) | ||
$DIRECTORY_INDEX | "index.html" | URL が / で 終っている時の意味。(実際には、表示の時に取除く) | |
$ALLOW_FILE | '.*\.html?|.*\.txt|.*_default| .*\.pdf|.*\.doc' | 対象譜 (正規表現)(注 1) | -a, --allow=PATTERN |
$DENY_FILE | '.*\.gif|.*\.(jpg|jpeg)|.*\.tar\.gz| core|.*\.bak|.*~|\..*|\x23.*|NMZ\..*' | 除外譜 (正規表現)(注2) | --deny=PATTERN |
$EXCLUDE_PATH | undef | 除外 path (正規表現) | --exclude=PATTERN |
$HTML_SUFFIX | 'html?|[ps]html|html\.[a-z]{2}|asp|cgi' | この接尾語を持もの だけ処理する | |
$CGI_DIR | '/(cgi-bin|htbin)/' | ||
$MHONARC_HEADER | '<\!-- MHonArc v\d\.\d\.\d -->' | ||
$MHONARC_MESSAGE_FILE | 'msg\d{5}\.html(?:\.gz)?' | ||
$REMAIN_HEADER | "From|Date|Message-ID" | RFC 822 Header などのうち表示に残すもの | |
$SEARCH_FIELD | "message-id|subject|from|date| uri|newsgroups|to|summary|size" | 検索対象見出部分 | |
$META_TAGS | 'keywords|description' | <META の中で見るもの | |
$TEXT_TITLE | " (Text File) "; # text file | 文字形式表示 | |
$NO_TITLE | "No title in original"; # document has no title | <TITLE> がない時に表示する文字列 | |
$ON_MEMORY_MAX | 5000000 | この大きさまで、文書は一度に記憶域に覚えている。 (読んだ文書の大きさの合計が、 これを越えると索引を書き出して記憶域が増加しないようにする) (注3) | |
$TEXT_SIZE_MAX | 600000 | これ以上の大きさの譜は無視する | |
$WORD_LENG_MAX | 128 | これ以上の長さの単語は処理しない(bytes) | |
$NON_SEPARATION_ELEMENTS | 'A|TT|CODE|SAMP|KBD|VAR |B|STRONG|I|EM|CITE|FONT|U|'. | これらがあっても単語は切らない | |
$INVALID_LENG | 128 | これ以上の長さの文字は重み付けから外す。 <Hn> .. </Hn> を書体の大小指定だと思っている人がいるため | |
$SUMMARY_LENGTH | 200 | (NMZ.field.summary に保存する)要約の大きさ (bytes) | |
%FIELD_ALIASES | ('title' => 'subject', 'author' => 'from') | メール見出名の置換法 | |
%Weight | (長いので省略) | HTML 素子による重み付け点数 | |
robot 関係 | |||
$HTDOCUMENT_ROOT | "/usr/local/apache/share/htdocs" | この下の $ROBOTS_TXT を探す | |
$HTDOCUMENT_ROOT_URI_PREFIX | "http://www.foo.domain.jp/" | $ROBOTS_TXT の中を解釈する時に、この URI を前に付ける | |
$ROBOTS_TXT | "$HTDOCUMENT_ROOT/robots.txt" | ||
$ROBOTS_EXCLUDE_URIS | "" |
Last Update 19:53:40 03/12/08 Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; ClaudeBot/1.0; +claudebot@anthropic.com) Apache/2.4.62 (Unix) OpenSSL/3.0.12(since 2000/01/17)