街区レベル位置参照情報と郵便番号の字

id:yellow_73:20070216 の続き。
街区レベル位置参照情報の地名を国土数値情報(行政区画)および郵便番号データベースを用いて更新してしまおうというのが今回の目的。
これが成功すれば、無償で得られるデータから最新の逆ジオコーディング用データを生成できるかも知れません。
ここで注意すべきは、まず、街区レベルの鮮度は、国土数値情報や郵便番号DBの鮮度より落ちている点です。市区町村合併にともなうデータの更新が必要となっています。
市町村合併による影響は、次の2点です。

  1. 市区町村名が消えてしまう
  2. 一部で字が変わる

よって、街区レベルの情報更新では、上記2項目の更新が必要となります。

…で、やってみましたが、先に言っておくと、失敗しています。

具体的な手順は次の通りでした。

  • 街区レベルの市区町村名と国土数値情報の市区町村名とリンクさせるため、街区レベルの代表点から、どの行政区画に含まれるかを出して、街区レベルの市区町村名を更新。これ、フルにやると結構時間が食われたので、街区レベルの市区町村名と行政区画の市区町村名とが一致しないときのみ実行しました。
  • 街区レベルの代表点が海上の場合もあるので、そこは手動で市区町村名を変更。
  • 郵便番号DBから市区町村名と字を抜き出します。
  • 街区レベルの各レコードについて、市区町村名・字の組み合わせが郵便番号データの市区町村名・字の一覧の中に存在しないものをリストアップ。
  • リストアップされたものを手動で更新しようとして挫折。手動ではどうにもなりません。リストアップされたレコード数はそう多くないのですが、街区レベルの字から、候補となる郵便番号DBの字がなんとなく想像できる場合と、できない場合とがあり、後者につきあたると、かなり面倒臭いです。

この挫折したところをどう解消するかは未定。ひとつには、地図とにらめっこして字を確定させる。もうひとつは、あきらめて、字以下はもう知りませんみたいにしておく。
また、郵便番号DBと街区レベルでは、「ケ」と「ヶ」の違いがあります。たとえば「鈴ケ峯」と「鈴ヶ峰」の違い。これは別の地名とされてしまわないように注意が必要です。