日記
Rast+php_rast試し中 (21:09)Edit

プチはまりその1。

  • icuを有効にしないとUTF-8が使えない
  • というのを忘れて、Rast、php_rastをコンパイルした。
  • 後からicuをインストールして、Rastをicu有効でコンパイルし直した。
  • php_rastもコンパイルし直さないと、php_rastからUTF-8が使えなかった

プチはまりその2。

  • 検索インデックスを保存するディレクトリを作成し、書き込み可能にしておく
  • そのディレクトリに対して、rast_db_createを実行。しかし失敗する(FALSEが返る)
  • 特にエラーメッセージやエラーログも出ないので、理由が分からず悩む
  • インデックスを作成するディレクトリを削除して実行したらOKだった。ディレクトリもrast_db_createが作成するってことだった

で、ひとまずインデックスに登録したり、削除したり、検索したりを一通り動かしてみた。

ちなみに、一度登録した文書が更新されたときに再登録するためには、前回登録した文書をdoc_idを使って削除しなければならず、そのためには何らかのユニークなキー(doc_id以外)を付与しておいて(Web系の検索ならばURLとか)、それを使って検索して既存文書を削除しなければならないんだね(登録時にdoc_idの方をドキュメントにひもづけておいてもいいけど)。最初ユニークキーを持たせずにインデックスを作成・登録していって、登録済みのドキュメントのインデックスを更新しようとして困った。更新される可能性があるドキュメントを登録するときにはインデックス作成時に注意。

次はある程度の分量のドキュメントを登録して、一般的な検索機能を試してみて、それでよさげだったら大量ドキュメントの登録・検索を試してみようかな。

Published At2005-07-28 00:00Updated At2005-07-28 00:00