jeyseni's diary

「ジェイセニ」と呼んでください。批判ではなく提案をするのが生き甲斐です。

マイナンバーで文字化けが出るらしい--おそらく大型汎用コンピュータ時代の負の遺産

マイナ「文字化けトラブル」続出も…河野デジタル相は現場の混乱放置、総裁選演説で改革派気取り (msn.com)  。「髙」といういわゆる「はしご高」が「●」に化けるなど,どうやら旧字体を中心に文字化けが出るようである。

 これはコンピュータシステムの問題である。おそらく,かつての大型コンピュータを使ったシステムで運用しているのだろう。

 筆者も実は気づいていた。というのも,システムに個人登録をする際,パスワードとして「大文字アルファベット」と「数字」という組み合わせを要求したからである。つまり,大文字しか受け付けないのである。「今どき,古いな」と思ったのである。

 大型汎用コンピュータで日本語を扱えるようになった最初のシステムは,新聞の電子組版だった。扱える文字はJIS第1水準しかなかった。当然,旧字体は表現できなかったが,新聞の印刷をするためには文字のイメージさえ紙の上に配置すればよく,それは「外字」という独自のイメージを用意することで解決してきた。しかしそのイメージは印刷用だけで,データとして標準のものではなかったので,ほかの環境から見れば「文字化け」となる。

 同様に,銀行システムでも口座名義をカタカナで登録しているケースがまだ残っている。要するに漢字では表現しきれないので,簡単なカナを使い,さらにデータ容量が半分になる「半角カタカナ」が使用されたりしている。これももはや,パソコンやインターネットをベースとする一般的なデータシステムではまず使用していない。

 同じことが,マイナンバーの仕組みで起きているとすると,これは大問題である。

 コンピュータシステムでは,中央集中型と分散型があり,上記の印刷システムも銀行システムも中央集中型である。これまでも,大地震が来たら大規模コンピュータシステムが被害を受けるため,データセンターを複数個所に分散させる取り組みは進められてきている。しかし,おそらく国指導のシステムであるマイナンバーや年金,税金などのシステムは,基本は1ヵ所のデータセンターで運用していると思われる。

 本来なら,マイナンバーを手軽に活用するためのマイナンバーカードの仕組みが,スマホやPC,インターネットなどと親和性のいい分散型コンピュータシステムで構築すべきだったと思われるが,結局は政府御用達のコンピュータメーカーと,その下請けのソフトハウスがちまちまと自作した結果,融通の利かないシステムになってしまったと思われる。

 銀行システムが,複数銀行間で統一する際も,システムダウンなどさまざまな問題が起きた。おそらく,かつての汎用コンピュータの仕組みを引きづっているからだと思われる。せめてワークステーションでの標準であるUnixで分散型システムを構築すべきだと思われるが,おそらくこのレベルの実務エンジニアが日本では足りないのだと思われる。多くのコンピュータエンジニアが,古い汎用システムのメンテナンスに使われてしまっているからである。

  「身分証明書」が出せない日本--迷走するマイナンバーカードがついにカードでなくなる日 - jeyseni's diary (hatenablog.com) (2024/5/31)と書いた中で,2026年に新デザインになると発表されたマイナンバーカードである。2025年3月には,運転免許証とマイナンバーカードの合体も計画されている。運転免許証も,かつては和文タイプライターで漢字の名前を手動で打ち込んでいた。現在は更新時に即日発行される。更新講習もオンラインでできるようになっている。おそらく,Unixベースのコンピュータシステムで構築されているのではないかと思われる。マイナンバーカードのシステムとの親和性がなく,またトラブルになるのではないかと懸念される。

 漢字文化の日本が,漢字を表現するための2バイト系文字コードの利用でもたもたしているのはまことに恥ずかしい。JISコードの改定も何度も行われており,ますます混乱している。国際コードであるUnicodeに準拠し,旧字体でも中国の簡体字も,ハングルも何でも,カバーできるシステムの導入と切り替えが,日本のコンピュータシステム全般に求められているのではないだろうか。

 パソコンで仕事をしていても,Unicodeと頻繁に遭遇する機会が増えた。いつまでもシフトJISにこだわっていたら,表現が限定されるし,文字化け問題もまた頻発するようになっている。数字を中心に扱うだけなら,汎用コンピュータシステムでもごまかしが効くが,漢字,特に旧字体の利用が求められる国民登録の仕組みには,汎用コンピュータシステムからの脱却を早急に進めるべきだろう。

 そのためのIoT人材がまったく不足しているのが日本の現状なのだが,この際,こうした大規模システム改修においてはAIを利用したプログラミングを活用すべきだと提言したい。中身がブラックボックスになる懸念はあるが,少なくともバグのないシステムを短期間に構築できると期待されるからである。AIはこうした場面に使うべきであり,デザインや創作など,創造的分野で遊んだり,戦争や犯罪などでの使用は禁止すべきである。ChatGPT登場からまだ2年も経たないが,人間の欲望のままに誤った使われ方に暴走していると警告したい。