(19:24)
height="140" width="102"
alt="" title="">
height="140" width="101"
alt="" title="">
height="140" width="100"
alt="" title="">
height="140" width="101"
alt="" title="">
西太后は民主主義の英雄だったというすごいストーリーを骨格に、清朝末期の中国を、
- 貧乏な糞拾い出身の少年宦官
- 不良少年出身の英才官僚
- 西太后を始めとした、滅びつつある清朝政府首脳陣
- 各国中国特派員たち
というさまざまな視点から描いた大作。西太后関連の話があまりにもトンデモすぎて、そこだけがいまいちむずがゆかったけど、後は相変わらずの浅田次郎節で面白かった。
特に最後ぐだぐだになりつつあったところで、主人公が見得を切るところがなんかやたらと格好良かった。なんかもう「チャー!」って感じ(意味不明)。
ところでこの辺の歴史的事実ってほとんど覚えてないから、どう見てもトンデモ度が高いこの小説の話が、俺の中で史実になってしまいそうな予感。
今日のREFERER SPAM (17:04)
ちょっとたちが悪いなー。いつもの絨毯爆撃系なんだけど、1日に3回もIPアドレスを変えてやってきているし、しかもIPアドレスも80.58.46.235 80.58.34.237 80.55.195.214と最初のオクテットしかあってない。プロバイダもひとつじゃないみたいだし。
しょうがないんで、80.で丸ごとアクセス拒否することにした。けど、どうやらこのSPAMスクリプトはHEADリクエストしか使わないみたいなんで、ひとまず、
<Limit HEAD> deny from 80. </Limit>
ってことで。なんかまずい人がいたら言ってください。
サイト情報を追加 (15:27)
「サイト情報」ページを追加しました。ちなみにうちの場合は、
なんて感じになります。現状では、
- 他サイトからリンクされている記事一覧
- そのサイトで今まで紹介したメディア一覧
を表示しています。自分のサイトの情報を見てみたい場合は、SEARCHから自サイトのURLで検索し、[サイト情報]をクリックしてみてください。
なんかこの機能をつけたら、ずいぶん本来の目的であったblogmap(blogサイト関係図)っぽい感じになったなー。ってあたりで、そろそろサーバーの負荷的に限界が見えてきたかも。まだつけたい機能はたくさんあるんだけどなー。
巡回ロジックについて (09:32)
blogmapの巡回方法は、
- 公開されているアンテナ(LIRS)やRSS配信サイトから定期的に、さまざまなサイトの更新時刻情報を取得する
- blogmap weblogUpdates.pingサーバー(http://1470.net/api/ping)にpingが送られたサイトはリアルタイムで更新時刻を変更する
- 更新されたサイトが、
- 未登録サイトの場合は、RSS AutoDiscoveryを試み、RSSが見つかった場合はそれを情報収集先URLとして登録する
- 既登録サイトの場合は、RSSのURLが登録されていれば次回巡回時にRSSを取得し、descriptionもしくはcontent:encodedに含まれるURL、ASIN情報を解析する
となっています。現在更新時刻情報を取得しているサイトは、
- http://bulkfeeds.net/app/new.rdf
- http://ping.bloggers.jp/index.rdf
- http://www.di-do.net/cgi-bin/lmnew.cgi?mode=lirs
- http://a.hatena.ne.jp/hatenadiary/source?mode=lirs
- http://www.blogpeople.net/changes.rdf
- http://blog.seesaa.jp/contents/xml/recent_blog.rdf
- http://najo.cc.sakura.ne.jp/~alimika/satomican/rss/all.rdf
- http://semicolon.jp/ussy/mican/natsumican.lirs
- http://kisouma.com/cgi-bin/decopon/deco.lirs
- http://www.h14m.org/hoshino/natsumican.lirs
- http://www14.cds.ne.jp/~not/antenna/nantenna.lirs
- http://club.h14m.org/gachapin/natsumican.lirs
- http://blog.livedoor.com/xml/recent_blog.rdf
- http://blog.dion.ne.jp/xml/recent_blog.rdf
- http://diary.jp.aol.com/applet/newlist?__mode=rss
- http://suk2.tok2.com/new_list_rss.php
- http://www.mypress.jp/rss.rdf
- http://autopage.teacup.com/applet/post/recent?rss
- http://www.tdiary.net/tdiary.lirs (現在orz中)
です(要は記事単位ではなく、サイト単位での更新時刻が取得できるところ。記事単位の更新情報からもデータを集めることは可能なんだけど、いろいろ問題がありそうなんでやめた)。あと、上記から更新時刻情報を取得できていないサイトのうち、私が個人的にチェックしているサイトは自前で適当に更新チェックをかけたりしていますけど、これは将来的に内蔵のアンテナ機能に置き換える予定です。
というわけですので、blogmapに確実に情報を収集される方法としては、
- RSSを配信し、できるだけ多くのURL、ASIN情報をRSSに含める
- RSS autodiscoveryに対応する
- 更新情報取得先アンテナ、pingサーバーにpingを送る(更新情報取得タイミングによっては、たまにデータ収集対象から漏れてしまう場合もある)。あるいはblogmapのpingサーバーにpingを送る(こっちの方が確実)
としておくといいかと思います。RSS autodiscoveryに対応していないけれども、RSSを配信しているという場合は、ツッコミかメールでRSSのURLを教えていただければ、手動で登録します。逆に現在情報収集先に登録されているが、データ収集をされたくない場合も、申し訳ありませんがメールかツッコミでサイトのURLを教えてください。巡回対象から外します。
ランキングRSSにcontent:encodedを追加 (08:41)
ランキングRSSのdescriptionの代わりにcontent:encodedを追加し、従来よりもちょっと詳しい内容を埋め込むようにしました。あと、ついでにtrackback:pingも一応入れておいたけど、これに対応しているリーダーってあるのかな?
