Home

日記
またゲロ (02:07)Edit

また下の子がゲロリンパですよ。せっかく正月休みで風邪も治っていたのに、1日保育園に行っただけであっさり復活ですか。しかも今日は夕飯をたんまり食べていたらしく、寝ながら上を向いて吐いたゲロが5センチくらい吹き上がりましたよ。なんかもう大人並みに立派なゲロでもらいゲロしそうになるし。なんかもう部屋中が酸っぱいにおいで満載ですよ。

Published At2005-01-07 00:00Updated At2005-01-07 00:00

日記
Anti Referer Spam プラグイン ver 0.9導入 (13:19)Edit

英文/URLオンリーSPAMは拒否する設定にしてみた。

Published At2005-01-07 00:00Updated At2005-01-07 00:00

日記
svnでhttpsが使えない (16:16)Edit

RedHat9のマシンでコンパイルしたSubversion 1.0.3(svn)が、httpsをUnrecognized URL schemeだとぬかして扱えないんで、1.0.9にあげてみたんだけどそれでも使えない。

よく見たら、同梱されているneonがnot SSL supportになっていたんで、neonディレクトリに下りて、./configure --with-sslしてからコンパイルし直したら、httpsサポートしてくれるようになった。

なんかググってもあんまり情報が見つからなかったんで、一応書いておこう。

Published At2005-01-07 00:00Updated At2005-01-07 00:00

日記
チャレンジ!周辺視野! (08:42)Edit

「」でもやっていた周辺視野の広さ測定。俺は最初にやった18秒台が最高で、2回目以降どんどん遅くなっていった。

素早く次の数字を探そうとして、一つの数字に目の焦点をあわせすぎると、逆に遅くなってしまうみたいだ。どんなに急いでいても、あくまでも周辺視野のレベルで数字を探さないと、次の一手はよくても、それ以降のスピードが遅くなる。

Published At2005-01-08 00:00Updated At2005-01-08 00:00

日記
キーワード検索修正 (08:53)Edit

この間Webサーバーを移転させたんだけど、検索インデックスのパス指定の修正漏れのせいで、URLに対するキーワード検索が動いてませんでした。修正したんで、今はちゃんと検索がかかるようになってます。例「スマトラ」。

Published At2005-01-08 00:00Updated At2005-01-08 00:00

日記
メディア検索に種類指定を追加 (12:50)Edit

メディア検索の際に、対象とする商品種類(本、CD、DVD……)を指定する機能を追加しました。内部的には、種類を指定した場合はKeywordSearch、指定しなかった場合は、BlendedSearchになります。BlendedSearchでうまく出てこない場合は、KeywordSearchを使ってみると見つかるかもしれません。

Published At2005-01-08 00:00Updated At2005-01-08 00:00

日記
newswatchテスト中です (13:00)Edit

まだ調整中ですけど、ひとまずURLを公開しておきます。

要はGoogle Newsみたいな感じに、新しめの(主にニュース)記事をジャンル別に分けて表示するサービスです。対象となる記事はニュース記事に限らず、blogmapで収集しているさまざまなページが含まれます。あと、汎用的な特徴語検出ロジック+適当に決めたキーワードリストで分類しているので、あまり正確な分類にはならないかもしれません。

あとキーワード検索機能ももっているんで、自分で気になるニュースキーワードで検索した結果のRSSを更新チェックしておいたりしてもいいかもしれません。たとえば「スマトラ 被害」とか。ちなみにデフォルトではand検索になります。or検索にしたい場合は、「スマトラ [or] 被害」のようになります。

バックエンドには、Estraierを使っているんで、より細かい検索クエリー指定方法については、検索用ユーザインタフェースあたりを読んでおくといいかもしれません。

ただ、最近ちょっとマシン負荷がぎりぎり状態になっているんで、安定運用できるかどうかは微妙な感じです。

Published At2005-01-08 00:00Updated At2005-01-08 00:00

日記
うわー (02:14)Edit

下の子供に続いて、上の子供もゲロって、さらにオクサンもゲロったよ。残るは俺だけですか。いや俺も何週間か前に一度同じ症状は通ってきているんだけどさ。子供たちもそうだし、現在家族全員で2周目突入って感じだ。

Published At2005-01-09 00:00Updated At2005-01-09 00:00

日記
議論追跡のバグ修正 (04:44)Edit

1ページに複数の記事(RDF)が含まれる構成のサイトに対してtrackback auto discoveryするときに、正しいtrackback ping URL(identityに記事URLを持つ)を見つけることができず、一番最初のRDFに含まれるtrackback ping URLを無条件で使うというバグがあったので、修正しました。

Published At2005-01-09 00:00Updated At2005-01-09 00:00

日記
ジャンル抽出キーワード調整中 (14:22)Edit

newswatchも、ずいぶんジャンルごとのニュースの抽出精度が良くなってきたのではないでしょうか? でもまだ全然関係ないニュースが混ざったりするけど。

ちなみにこのジャンル抽出は単なる検索キーワードの設定なんで、newswatchの検索機能を使って完全に再現可能です。なんで、標準のジャンル抽出が気に入らない人は、自分でオリジナルの検索キーワード設定でもして使ってください。検索パターンをRSSリーダーとかに登録しておくと、いい感じのニュースソースとして使えるんじゃないかと思います。

オリジナルキーワード設定の作り方としては、

  • そのジャンルに特徴的なキーワードを[or]でつないで羅列する。たとえば「KDDI [or] au [or] ドコモ」とかで携帯電話会社関連のニュースを拾ったり。
  • 複合語などのキーワードは、ChaSenで複数語に分割されてしまい、うまく一つのキーワードとして認識されなかったりするので注意する。ちなみに「大リーグ」とかは「大」と「リーグ」に分割されちゃったよ。
  • 関係ないジャンルでも使われそうな語の使用はできるだけ避ける。特に同音同表記異義語とか、ありがちな人名とか。あとヘッダ・フッタ・サイドバーなんかに含まれがちなキーワードも誤爆しやすい。
  • どうしても他のジャンルで使われる語を使いたい場合は、[not]を使って他のジャンルで利用されるパターンを弾く。たとえば、「ドコモ」を検索するとドコモに関するさまざまなニュースが検索されるが、「ドコモ[not]株価」とかしておくとそのうち株価情報関係なんかが弾かれる。

まあそんな感じで。

Published At2005-01-11 00:00Updated At2005-01-11 00:00