自前更新チェックを始めた関係で (15:45)
古いRSSをばしばし食いまくっているんで、ランキング上位にちょっと古いRSSの内容を反映したデータが出てきちゃっています。自前更新チェックの最初の1周が終わったら、ちゃんと新しい情報のみを使ったランキングに戻ると思いますので。
自前の更新チェックを追加 (15:37)
blogmapは基本的に、他のアンテナ・pingサイトから取得した更新時刻情報を使って、各blogサイトが更新されたかどうかを確認し、更新が確認できたサイトに対してのみ巡回を行っているわけだけど、それだと他のアンテナ・pingサイトから更新情報を取得できなくなってしまった場合に、クローリングできないことになってしまう。それはそれでいいかと思っていたんだけど、やっぱりそういう場合でも更新されているところには巡回した方がいいような気もしてきたんで、自力で更新チェックをしつつ巡回する機能を追加。48時間以上更新が確認できなかったサイトには、自動的に更新チェックを兼ねた巡回を行う。ただ、毎回48時間おきというわけではなく、巡回時に最終更新日をチェックして、最終更新から現在までの更新されていない期間に応じて、更新頻度を調整する。要は、長く更新されていないサイトには、滅多に更新チェックには行かなくなる。ただし、アンテナやpingを通して新しく更新を確認できた場合は、通常の巡回処理対象に戻る。というわけで、なにやらそういう処理が追加されたという報告兼メモでした。
追跡のバグフィックス (01:51)
trackback追跡のキャッシングで、階層の途中から追跡をやり直したときに、不完全なキャッシュを再利用してしまい、本来たどれるはずの枝をたどり損ねるバグを修正。
あと文言を、「trackbackの追跡」を「議論追跡」、「ここから追跡」を「再追跡」に変更しつつ、「再追跡」は枝の末端だけでなく、すべての枝から実行できるようにリンクを追加した。
trackback追跡のRSS (23:17)
結局すげーてきとーな実装にしてしまった。というのは、ツリーの階層構造をtitle要素の頭に階層の深さ分だけ「*」をつけて表現するという方法。
みたいな感じね。って、全然メタデータじゃねー! けど、ふつうのRSSリーダーでタイトル一覧を表示させた場合は、一見ツリー構造っぽく見えてくれるんじゃなかろうか。凝ったXML表現を使うよりも実用性はこっちの方が高いと見た。
blog記事からtrackback追跡へのリンク (19:11)
blogサイトのある記事から、その記事に関するtrackback追跡へリンクする方法としては、
- http://1470.net/bm/map?url=[記事のパーマリンク(をURLエンコードしたもの)]
なんて表記が使えます。ただし記事のパーマリンクに、アンカーリンク(index.html#p1)とかQUERY_STRING(?a=123&b=xyz)とかが含まれるような場合は、記事のパーマリンクは必ずURLエンコードしておく必要があります。たとえばうち(tDiary)の場合だと、
なんて感じ。ちなみに、trackback追跡の結果は最長2時間キャッシュされるので、一回アクセスするとその後2時間以上経たないとその内容は更新されません。
追跡階層を5階層までに (15:04)
「ここから追跡」をつけたんで、一度に5階層以上は再帰追跡しないようにした。ときどきものすごい深い階層まで追いかけて、HTMLレンダリングがゲロ重になっちゃう場合があるみたいだし。5階層より先を追いたい場合は、「ここから追跡」でたどってください。この方が使い勝手のバランスがいいでしょう。
というわけで、trackback追跡時の制限としては、
- 最大100記事(URL)まで
- 最大5階層まで
という二つがあることになります。
「ここから追跡」を追加 (14:32)
trackback追跡が中断された末端の枝に、その枝からの追跡結果を表示するための「ここから追跡」リンクを追加。ただし、その枝の記事URLがblogmapに登録済みURLじゃない場合は、ページ検索に遷移しちゃいます。大量trackbackで追跡が途中で終わっちゃった場合なんかに続きを追いかけるのに、このリンクを使ってください。
あと「trackbackの追跡機能」の、
こっちにも是非RSS出力をヽ(´Д`;)ノ
についてはどうしたもんでしょうねー。RSS化しちゃうとツリー構造という重要な情報が表現できないんだよなー。適当に拡張してツリー構造を表現したところで、対応するリーダーがないと意味がないだろうし。せめてtrackbackから取得できるRSSがdc:dateくらい持っていてくれれば、フラットなリストとして出力してもそれなりに意味があるデータになるんだけど。
ツリー構造情報を生かしつつ、RSSリーダー等でも使えるような、なんかほどよい表現方法を思いつけば、この機能でもRSSを配信するかも。
trackbackの追跡機能 (12:43)
「[blogmap] そういや」で触れた、trackbackの追跡機能を載せてみた。けど、さすがにこれはちょっと重いなー。ということで、汎用的なtrackback追跡機能としては載せず、blogmapでデータ収集しているサイトのみ追跡可能なようにしてみた。
呼び出すリンクは、「サイト情報」ページにのみ用意してある。
みたいな感じで、trackbackを追跡したいサイトの「サイト情報」ページを呼び出すと、最近10件の更新記事と他のサイトから言及された記事のリストが表示される。そして、それぞれの横に「trackbackを追跡する」というリンクがある。それをクリックするとその記事に対するtrackbackを再帰的に追跡する。
たとえば、うちで比較的多くtrackbackがたどれる記事は、
あたりかな。
ちなみに追跡していった先に、既出の記事が存在した場合はその枝はそれ以上先まで追跡せず、[この枝と一緒]というリンクが付加される。それをクリックすると、その記事を追跡した枝へページ内アンカーリンクで飛ぶ。
あと、あんまりtrackbackの追跡先が(再帰も含めて)多い場合は、最大100件まで追跡したところで追跡を打ち切る。その場合、「trackback数が多いため、追跡を中断しました。」と表示して、その枝から先の追跡を中断する。たとえば、
の下の方みたいな感じ。
ゲロ血便 (12:38)
下の子供がゲロゲロになった。ひどいときは10分に1回くらいのペースで吐く。しかも、まだ1歳2ヶ月なもんだから、洗面器に吐かせようとしても吐きながら暴れる。吐いていないときも、腹減った喉が渇いたと暴れる。そして、吐く。さらに血便&血尿というおまけまでついてきた。
という一晩を過ごし、夜が明けてから最寄りの病院に問い合わせてみたらはみんなもう冬休みに入っていたんで、雪の中救急病院まで車で行ってきた。診断の結果は、ウイルス系の風邪でしょうということで、胃と腸の薬をもらって帰宅。様子を見ながらちょっとずつ水分とおかゆをあげて行きましょう、とのこと。冬休み中に治るかなー。
そういや (17:13)
blogmapでもある程度ランキング上位に入ったblog記事に関してのみ、trackbackの追跡をやろうかと思ったりもしているんだけど、最近はちょっとは意味のある情報が得られるようになったのかなー。多分あれから1年半以上経った今でも、(blogmapが現在行っている)リンク解析で得られる情報以上に有意な情報は得られないだろうと思っているんだけど。でもまあ、サイトの質によってはちゃんと意味のあるtrackbackが集まっているところもあるんだろうけど。