日記
ウィキペディア登録語の辞書 (2) (13:51)Edit

コメントでDBダンプ(http://ja.wikipedia.org/wiki/Wikipedia:%E3%83%87%E3%83%BC%E3%82%BF%E3%83%99%E3%83%BC%E3%82%B9%E3%83%80%E3%82%A6%E3%83%B3%E3%83%AD%E3%83%BC%E3%83%89)が提供されていることを教えてもらったんだけど、これを使えるようにするのはなかなか敷居が高いな。UTF-8なMySQLのダンプデータがbz2圧縮した状態で25Mバイトとなると、インポートする環境を用意するのもそれなりに大変だ。UTF-8対応のMySQLを用意するのが面倒だったんで、ひとまずEUC-JPに変換して、--force付きでインポートしてみたんだけど、なんか途中でエラーが出ている模様(外部ホストに接続できない、とか、「-」な値がどうした、とか)。インポートファイルがでかすぎて、エラーの内容を細かく確認する気になれないのー。レコード数が32000行くらいしかできなかったんだけど、これってやっぱ全部インポートできていないのかなー。

Published At2004-04-12 00:00Updated At2004-04-12 00:00