千代田が、坃代田と表示されるのはなぜか。

 msnなどのサイトで、

こんな表示を見たことがあるだろうか。

日本におけるデフォルトの住所である千代田区が表示される場合に、坃代田区と表示されてしまう現象である。

ぱっと見、ただの入力間違いだと思いがちだが、入力間違いでこんな字にはなるまい。

ちょっと調べてみて、推測してみると。

(ただの憶測なので、全然違っていても何の責任も取りません。)

「千」のutf-8における文字コードは、 

E5 83 8D

なのだが、 「坃」は

E5 83 9D

なのである。つまり、入力は正しく「千」だったのだろうが(そもそも手入力のはずがない)エディタか何かのバグ、おそらくunicode→utf-8変換ライブラリのバグで 「坃」と文字化けしてしまったのだろう。

せいぜい先頭の文字が化けるだけで深刻なバグではない上に、どこかの内製ツールだけで起きている問題なのでしばらく残り続けると思われます。

コメント

このブログの人気の投稿

メモリの解放にEmpty.exeは必要ありません。

KOEI G1L形式のBGMファイルの変換

そういえばコーエーテクモだった