Namazu の導入に成功

いろいろと手間がかかりましたが、なんとかNamazu 単体の
インストールと設定はできました
FTP サーバ構築
まで完成した状態で
サイト内検索システム構築(Namazu)
を参考にすすめます
このサイトのように行うときの注意点は
あらかじめ
mkdir /var/www/html/wiki
というように、ディレクトリをつくっておくこと、
そして、
chown wiki. /var/www/html/wiki
というように、パーミッションも変更しておいて
それから実行することです
ちなみに、用意するコンテンツに関しては
ユーザーディレクトリ作成(/~ユーザー名/)
で作成した
index.html などのファイルをコピーしておくと楽です
例えば
cp -p /home/wiki/public_html/* /var/www/html/wiki
というようにすると。試験的に導入するためのコンテンツを用意しなくても
実験できます
今回、私が行った設定が異なるところは
(2)namazuコマンド設定
インデックスをもとに検索を行うnamazuコマンドを設定する
というところで
Replace /var/www/html/centos/ http://centossrv.com/ ← 追加(/var/www/html/centos/をhttp://centossrv.com/に置換する)
となっているところを
Replace /var/www/html/snow/ http://192.168.10.67/
としたところぐらいです
/var/www/html/snow
の部分は検索対象で
http://192.168.10.67
については。いつもどおりDNSサーバがないのでIPで行っています
あと、文字コードがUTF-8 を使っているぐらいです
ブラウザ、コマンドラインからの検索については
成功が確認できましたので、次にテキストではなく
PDFの取扱いを行ってみようと思います

飛行機で北海道へ(計画中)

最近はいろいろと煮詰まってきているので、
旅行の計画などを立てて気分転換しようと思っています
ただ、私はツアーのように団体行動ではおもしろくないし
自分の自由に行動したいので、ここはひとつ
格安とまではいかなくても、安めに旅行できないかな?
ということで計画中です
雑誌等を買ってしらべるのも考えたのですが
せっかくなので、インターネットなどを利用して安く、ある程度はおもしろく
旅行できないかな、と考えています
食べログ
で食べ物を探し、
じゃらん
で泊まるところを探してます
ほかにもなにかあれば書き込んでみます

再インストール時のトラブル

どうしても Namazu がうまくいかないので
一度再インストールしてやり直すことにしました
幸い、仮想環境で行っているので、そこまで不便は感じません
ただ、WebサーバーSSL確認
にてトラブルが発生しました
削除したサーバーと同じIPアドレスのためなのか。それとも同じ証明書に
なっているのかはわかりませんが、警告がでてしまいます
これを回避するために
sec_error_reused_issuer_and_serial
を検索してみました
結果、Firefoxのsec_error_reused_issuer_and_serial対策
を参考に対処することができました
「編集」→「設定」→「詳細」→「暗号化」→「証明書を表示」→「認証局証明書」→「SomeOrganization」→目的の証明書を削除することで、問題は解決しました
ただ、Namazu は未だに解決していませんが

fedora 13 の設定その 3

引き続き、fedora 13 の設定です
USBメモリでのデータをやりとりしていたのですが、
FTPで送ったほうが楽のような気がしますので
FileZilla をインストールしてみました
yum -y install filezilla
でインストールできます
そして、実験的にいろいろと行いたいので仮想環境
VMware Player 3.1 をインストールします
ダウンロードページである
ダウンロード VMware Player
からダウンロードして
管理者権限になってダウンロードしたファイルへ移動し
chmod 755 VMware-Player-3.1.0-261024.i386.bundle
で実行権限を与えて
./VMware-Player-3.1.0-261024.i386.bundle
でインストールできます
古いバージョンのVMware Player がインストールされている場合
削除するかどうか聞かれますので、
そこで選択すれば、古いバージョンはアンインストールされます

fedora 13 の設定その2

fedora 13 の設定を変えてみました
Fedora11(Leonidas) の設定メモ
を参考に、少しいじってみました
実行したのは
右クリックに「端末の中に開く」を追加ができるようになる
su -c “yum -y install nautilus-open-terminal”
そして
ホームディレクトリの日本語ディレクトリを英語にする
LC_ALL=C xdg-user-dirs-gtk-update
の2つを変更しました
また、パスワード管理ソフトである
keepassx を
http://download.opensuse.org/repositories/security:/passwordmanagement/Fedora_11/i386/
からダウンロードしてインストールしてみました
fedora11 のバージョンですが
インストール自体は問題なく終了です

Namazu で PDF取扱い

現在、Namazu の取扱いで苦戦してます
そんななか、Nmazu での本来の目的であるPDF閲覧について
発見しました
PDFファイルを検索対象とする
という内容です
どうやら、そのままではPDF などを取扱いできないようです
まだ実験はしていないので、結果ができましたら
また書き込もうと思います

英語の勉強について

最近は英語の学習について考えています
プログラムのソースコードをみたり、マニュアルを読んだり
そして海外のニュースを読むのには英語が必要にななります
そして、今後海外にいろいろと行いたい場合、英語は必須と思われます
そこで、英語の勉強に参考になりそうなものを探しています
英語学習に役立ちそうなTwitterアカウントまとめ
というところに、いろいろなものが載っていました
私としては、単語の意味がわかならいことが多いので
まずは
時事英語辞典
で勉強していこうと思います

Namazu の設定でまだ少し理解不能

昨日に引き続き。Namazu の導入を行っています
目指すべきは Namazu を使って PDF 閲覧ですが、まだまだ先は長いです
昨日の失敗であるNamazuの設定で失敗の反省点である
/var/www/html の下にディレクトリをつくり忘れ
そのうえ、中身のコンテンツをつくっていなかった
という点を踏まえて再度挑戦です
行った手順を記述しておこうと思います
サイト内検索システム構築(Namazu)
を参考にすすめます
namazuコマンド設定 の部分で文字コードをUTFー8
にした場合、どうなるかな?と
実験してみました
Lang ja_JP.eucJP

Lang ja_JP.utf8
にしてみましたが、見事文字化けしてしまい、無理でした
そのため、ここはそのまま
Lang ja_JP.eucJP
という設定にしてあります
ここからの変更点は、ユーザを示す centos を wiki に置き換えてあります
また、DNSはいつもどおりなしなので、IPアドレスである
192.168.10.67
を設定します
このため、 http://centossrv.com/ なら http://192.168.10.67
としてあります
あとはそのままなのですが、ここで理解不能な点が
発生しました
なぜか
namazu.cgi確認
のところで
http://192.168.10.67/cgi-bin/namazu.cgi?idxname=wiki
でアクセスし、検索結果をみると
/var/www/html/wiki
の内容ではなく
/var/www/html
の内容を調べてるようです
もう少し調べてみようと思います

HTML タグの無効化

HTMLタグを無効化するには
htmlspecialchars();
を使います
この関数は、HTMLタグに使用される <>をなどを特殊記号に変換し、
文字表示はできても
HTMLタグとして機能しないようにできます
使用用途としては、
この機能を使うことで
個人情報を盗む目的でのJavaScript などを含んだ入力dataが送信されてきても、たたの文字列になるので、クロスサイドスクリプティング対策になるようです
htmlspecialchars();
の構文は
$変数=htmlspecialchars(文字列,オプション);
となります
---------------–
[e:69][e:69]例[e:69][e:69]
$string =’‘;
$result=htmlspecialchars($string,ENT_QUOTES);
print $result;
---------------–
これにより、
HTMLタグがリンクにならずにそのまま表示されます
htmlspecialchars();により、
[e:69]& は &
[e:69]" は "
[e:69]’ は '
[e:69]< は <
[e:69]> は >
と変換されます
つまり、今回なら
<A href='http://yahoo.co.jp/'>YAHOO</A>
へ変換されます
" や ‘ の変換は、
オプションで決めれます
[e:69]ENT_COMPAT
" のみを変換
[e:69]ENT_QUOTES
" と ‘ を変換
[e:69]ENT_NOQUOTES
どちらも変換しない

Namazuの設定で失敗

サイト内検索システム構築(Namazu)
を参考に構築してみましたが、なぜか
インデックス作成の対象ファイルがみつからないので、
なぜかな?と調べてみたら
検索対象のWebコンテンツは/var/www/html/centosに格納されているものとする。
とかかれていました
まったく読んでいなかったので、
/var/www/html の下にディレクトリをつくり忘れ
そのうえ、中身のコンテンツをつくっていなかったので
これではさすがになにもでてきません
明日もう一度やりなおしてみようとおもいます