日記
2ちゃんねる、掲示板検索サービス「2ちゃんねる検索」βテスト開始 from INTERNET Watch (13:50)Edit

どうやって実現しているのか考えてみるのは、なかなか楽しいかも。

まず最初にネックになるのは、2chは大量のサーバーがかなり適当に運用されているっぽいんで、それをきちんと統括管理すること、か。2chビューア系みたいにサーバー一覧のテキストファイルなんかを使ってローテクに管理しているのかなー。各サーバー側から検索サーバー側へメッセージを送る形にしたほうが、多少管理コストが下がる気がするけど。

で、どうやって検索処理を実現するか。datファイルまるごと、もしくはその差分ファイルを、検索サーバー側に定期的あるいは書き込みごとに送ったり(GETしたり)しているのかな? それだと、まあみみずん検索と同じように、検索サーバー側で定期的にインデックスを作り直して運用は出来るな。でもそのやり方はつまらない。

どうせならば、各サーバーごとにちょっと偉いインデクサを組み込んで、サーバーレベルで書き込みごとの有意な(検索インデックスとして使える)情報を抜き出しておき、それを定期的に検索サーバーと同期する、といった感じの方が好みだ。さらにいうならば、各サーバーに乗っている板ごとに、インデクサの性格付け(簡単には辞書)を変えられるようにしておいて、生成されるインデックスの効率&効果を高めておくといいかも。インデクサは動的にアップデート可能な感じだとさらにカッコいいな。

で、コアとなる検索エンジン部分はどうやったのかな? オリジナルを作ったのか、既成のものを使ったのか。2chでは、AAとかジャーゴンとかが大量に含まれることを考えると、かなり専用に作り込んだものを用意した方が良さそうだ。

と、技術的にはおもしろそうなんだけど、有料で提供ってあたりから考えると、主に企業が効率的に2ch情報を活用するために利用するためのもの、という位置づけになっちゃいそうで、その存在意義的にはおもしろみがないなー。まあ2ch情報を勝手に使って商売しているところとかに対抗するために用意したんだろうし、運用には金がかかりそうだからしょうがないんだろうけど。

Published At2003-09-22 00:00Updated At2003-09-22 00:00