日記
RSSジャンル検索 (18:51)Edit

新機能追加はやめようと心に誓ったばかりなのに、「はてなのキーワードとtechnoratiのタグ 08:26」を読んで反射的に作ってしまった。RSSアイテムのタイトルの先頭が「[」で始まっている場合、「[」と「]」で囲まれている部分をその記事のジャンル名称であるとして、記事をジャンルで検索する機能。たとえば、「iPodで検索」とか「tDiaryで検索」とか。まだ検索インデックスが作りかけなんで、ちょっと古い記事しか検索に引っかからないかも。ああこれでまた負荷が高まるなー。

検索インデックス生成が終わった

で、これいいなー。Planetほにゃらら系って、各サイトに上記ルールでタイトルにカテゴリ表記を入れてもらって、それをキーに分類表示するのが一番まっとうなんじゃないか。

RSS出力もそのうちつけます。けどその前に安定運用できるレベルまで全体の負荷を調整しないと……。

dc:subjectは

あの…dc:subjectは…

データ収集の段階で捨てちゃってるんで、DB上に残ってないんですよ……。

強引にdc:subjectをつっこんでみた

今後クロールするデータは(DBスキーマ変更なしで対応するため)、タイトルの頭に無理矢理「[dc:subject]」をくっつけて、dc:subjectも認識できるようにしてみた。けど、いわゆる人間が明示的に付与する「タグ」的なカテゴリーわけと、システムがデフォルトで付与するカテゴリーわけ(が多いような気がするblogツールが吐き出すdc:subject)とは、本当は意味合いが違う気もする。

最近流行のタグってのは、俺が昔WikiLikeで試していた、自分がキーワードだと思う本文中のキーワードをBracketNameとして囲むことによって、そのキーワードをそのテキストにおける重要語と認識し、カテゴリー検索等の目的で使用する、というアプローチに似ている気がする。入力者が入力時に人力指定する非固定のジャンル指定。

Published At2005-01-27 00:00Updated At2005-01-27 00:00