日記
書評リンクの話 3 (20:11)Edit

ISBNはキーとして使えるのか、という話について。以下ISBN絡みについてのまとまった資料へのリンク。

まれに同一のISBNが別の書籍に振られている場合があるらしいけれども、楽天みたいに「出版日が新しいものを優先」ってことで、古い方は対象外にしてしまって構わない気がする。どうしても扱いたいならば、存在しないはずのISBN(風コード)を生成して無理矢理それで代替させるとか。

目的が「完璧な書誌データDBを作成すること」ではなく、「書評リンク集の基盤として使えるレベルの書誌データDBが欲しい」ならば、ISBNをキーに作成した書誌データDBでも十分に実用に耐えるだろう。イレギュラーなデータに対しては、運用でカバー(イレギュラーな対応を用意)で問題なさそう。

ISBNが不明な段階での書誌データ(主に新作を想定)に関しては、別テーブルにいったんデータを蓄えて、ISBNが定まった時点でメインのテーブルにデータを移行。ただし、書名や著者名による検索に関しては、そのテーブルに対してもメインテーブルと同様に(透過的に)行えるようにする。なんて感じでどうだろう?

あと、データフォーマットの話。タブ区切りテキストとかCSVとかだと、1フィールドに複数の情報をもたせるのがやりにくいのがガンなんだよな。適当なフィールド内区切り文字を予約して、それを使って表現することは可能だけど、そういう拡張をごちゃごちゃ考えるくらいだったら、はじめからその辺りまで吸収できるフォーマット(XMLとか)を採用した方が幸せになれる気がする。

というのは、そのデータフォーマットを再利用性のあるものとして扱いたい場合の話で、そこまで考えないならば、タブ区切りテキストとかCSVでも十分だと思う。その場その場で必要な情報を盛り込んだデータフォーマットを使うのは問題ないけれども、バックエンドで管理するデータに関しては多少リッチな情報をもっておいた方がいいよね、という話。いつでもリッチな表現(=解釈にかかるコストが大きい)を使うのはバカらしいけど、後付けで必要になってずるずる仕様を拡張するのも大変だしね。

Published At2003-02-11 00:00Updated At2003-02-11 00:00