街区レベルの逆ジオコーディングのデータを作成する

id:yellow_73:20070419 で、街区レベル位置参照情報が更新されていたことを言いました。
これは個人的にはノドにひっかかっていたトゲが外れたことを意味します。
つまり、id:yellow_73:20070228 の処理が必要なくなったわけです。また、id:yellow_73:20061127#p3 で示した問題、つまり国土数値情報(行政区域)との関連付けが、ほとんど処理を施さずにクリアできるようになったことにもなります。
よかったよかった。
ただ、データが非常に大きい。
全国のデータは、地域コード、字・番地、緯度経度、都道府県名、市区町村名 を抜き出してタブ区切りにしたプレーンテキストにして、1ギガ。wcは面倒なので、もうやらない。
これから INSERT クエリを作成するのに、モルモット機で40分程度。
SQLに叩き込むのはまだやってません。正確には二度ほどやったのですが、一度目は全てのデータを一気に書き込もうとしたところ、途中でソケットかが壊れたといわれて停止。二度目は、分割してクエリを実行していく方針を立ててクエリを作成したところ、プライマリキーに設定していたIDフィールドが、分割ファイルごとに1からスタートするようになっていたため、二つ目以降のファイルは、プライマリキー重複ではねられました(このときは、モルモット機で1時間半でしたが、たぶんもっとかかる)。