Namazu で PDF取扱い その2

Namazu での PDF 取扱いに成功しました
PDFファイルを検索対象とする
を参考に行ってみました
NamazuでPDFを検索対象とするにはxpdfといったソフトウェアが必要らしいです
まず xdf をインストールします
wget ftp://ftp.foolabs.com/pub/xpdf/xpdf-3.02.tar.gz
tar xzvf xpdf-3.02.tar.gz
cd xpdf-3.02
./configure
make
make install
次に、xpdf-japanese をインストールします
wget ftp://ftp.foolabs.com/pub/xpdf/xpdf-japanese.tar.gz
mv xpdf-japanese.tar.gz /home/wiki/
cd /home/wiki/
tar zxvf xpdf-japanese.tar.gz
cd xpdf-japanese
mkdir -p /usr/local/share/xpdf/japanese
cp -R * /usr/local/share/xpdf/japanese/
cat add-to-xpdfrc >> /usr/local/etc/xpdfrc
これで、pdf が検索可能になりますが、
拡張子に .pdf がついていないと検索できませんでした
ためしに、.pdf がないファイルを検索してみましたが
検索できませんでした
どうやら、拡張子で検索しているようです
mknmz -C | grep pdf
で、成功しているかどうかがわかります
mknmzrcファイルに pdf を検索対象として加えるには
サイト内検索システム構築(Namazu)
をもとに行っているなら
$ALLOW_FILE = “.*\\.(?:$HTML_SUFFIX)”;
の部分を
$ALLOW_FILE = “.*\\.(?:$HTML_SUFFIX)”.
“|.*\\.pdf|.*\\.ps”;
とすれば、検索対象になります
もっとも、まだこの段階では、cgi 検索(ブラウザでの検索)
のときに問題が残っているので、解決したらまとめようと思います

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です