こんにちはゲストさん。会員登録(無料)して質問・回答してみよう!

締切り済みの質問

namazuのインデックス作成で・・・

現在、htaccessにてphpファイルをhtml拡張子で使えるようにして利用しているディレクトリがあります。
そのhtmlは大量にありそれぞれ内容は違いますが、ヘッダ、フッタ部分は共通ファイルをインクルードしているので同じになっています。
インクルードファイルは、ヘッダ、フッタ共に静的なhtmlで、本体自体もインクルードの記述部分以外は静的なhtmlです。

<html>
<?php include('header.html'); ?>
<body>
~ ここが各htmlによって内容が違う ~
<?php include('footer.html'); ?>
</body>
</html>

という構造になっております。
このhtml群をnamazuを使ってディレクトリ内の全文検索を行えるようにしようかと考えているのですが、上述のようなhtmlの場合、インクルードされるheader.htmlやfooter.htmlに書かれている内容はインデックスされるのでしょうか?
インデックスさせる・させない
の選択がnamazuの設定によって出来るのであれば一番ありがたいのですが・・・。
宜しくお願い致します。

投稿日時 - 2007-05-24 23:38:48

QNo.3028019

困ってます

このQ&Aは役に立ちましたか?

1人が「このQ&Aが役に立った」と投票しています

回答(1)

ANo.1

mknmzはhtmlやphpを解釈しません。
ファイル単位でインデックス対象を選択してください。

--target-list=FILE インデックス対象のファイルのリストを読み込む
--allow=PATTERN 対象とするファイル名の正規表現を指定する
--deny=PATTERN 拒絶するファイル名の正規表現を指定する
--exclude=PATTERN 除外するパス名の正規表現を指定する

投稿日時 - 2007-05-25 01:28:02

補足

すみませんお礼欄に書いた確認の補足です。
各本体htmlには
<?php include('header.html'); ?>

<?php include('footer.html'); ?>
が書かれているのですが、この文字列自体もインデックスされてしまうのでしょうか?
例えば"<?"や"include"などをキーワードにして検索した場合、本体html全てが検索にひっかかってしまうとか・・・。
もしそうなってしまう場合、allow、denyでディレクトリやファイルのフィルタをするような要領で文字列のフィルタリングも可能なのでしょうか?

投稿日時 - 2007-05-25 09:13:16

お礼

回答ありがとうございます。

・header.html、hooter.htmlはそれぞれのファイルとしてインデクスされ、それ以外の本体htmlが何らかのキーワードで検索にひっかかったとしてもインクルードされる部分に含まれる文字列の表示はされない。
・インクルード部分にのみ含まれる文字列で検索をかけても本体html自体は検索にひっかからない。

ということでよろしいでしょうか?

投稿日時 - 2007-05-25 08:38:15

あなたにオススメの質問