Namazu で PDF を取り扱えるように設定をしたのですが
欠点が発覚しました
まず、初期の設定から変えないと、
2MBを超えるファイルは無条件に索引データベースに含まれなくなります
また、600KBを超えるファイルは無条件に索引データベースに含まれなくなります
この問題を解決するには
索引データベース作成用設定ファイル”mknmzrc”の編集
の
$FILE_SIZE_MAX~処理対象のファイルサイズの上限
と
$TEXT_SIZE_MAX~処理対象のテキストサイズの上限
を変更する必要性があります
vi /usr/local/etc/namazu/mknmzrc
でファイルを開き、
# $FILE_SIZE_MAX = 2000000;
の部分を変更します
このままだと、取扱い可能なのは2MBしかありません
かなり大きなファイルを使いたいので
$FILE_SIZE_MAX = 20000000000;
としました
さらに、
# $TEXT_SIZE_MAX = 600000;
では 600KBしか使えないので
$TEXT_SIZE_MAX = 60000000000;
としました
これで、検索対象から除外されることはなくなりました
もう一つの問題のほうが面倒で、こちらについてはまだ検討中です
スキャナーで取り込んだ雑誌をPDFに変換し
これをローカルサーバに入れておけば、本を探す手間が省けると
おもったのですが、
残念ながらただたんに、スキャナーで取り込んだだけでは
Namazu で検索しても文字を認識して検索することができませんでした
なんらかの方法で、この問題を解決して見ようと思います