2018年 10月 15日 (月)

草なぎ剛の「なぎ」の漢字も文字化けしない! 漢字6万字「国際規格化」のインパクト

印刷
糖の吸収を抑える、腸の環境を整える富士フイルムのサプリ!

   パソコン(PC)で人名や地名を入力する際、特殊な漢字で該当する文字が見つからなかった経験はないだろうか。

   情報処理推進機構(IPA)は2010年9月から、行政で用いられる人名漢字など約6万字の漢字を整備する「文字情報基盤整備事業」を進め、その国際規格化が完了したと17年12月25日に発表した。IPAに取材し、詳しく聞いた。

  • IPAの発表資料より、文字情報基盤の概念図
    IPAの発表資料より、文字情報基盤の概念図

「渡辺さん」の「辺」にはいろいろな文字がある

   文字情報基盤とは何か。IPAの発表資料では「辺」という文字を例に取っている(画像参照)。「渡辺さん」「田辺さん」のように、人名に使われる「辺」の文字は実際には多種類だが、私たちが普段接する常用漢字2136文字の中には「辺」しか含まれていない。一方、「実用上の情報交換の必要性から、出現頻度等を元に文字を選定」した「JIS X 0213漢字」が常用漢字を含め1万50文字あり、新聞記事やウェブサイトに掲載する情報、一般向け公文書など広く使われる。この範囲だと「辺」のほかに「邉」「邊」が加わる。だがここまででも「範囲外」の文字がいくつもあるのは、記事中の画像で示されている通りだ。

   文字情報基盤とは、こうしたくくりとして最も範囲が広く、「戸籍のオンライン手続に使用することを目的として整理した文字」も含めて合計5万8861文字ある。ただし「JIS X 0213」から外れたおよそ4万8800字は、「個人のアイデンティティーに関わる文字」ではあるが用途は限定的だ。そのためコンピューター用に標準的に提供されている文字セットに含まれておらず、使い手が自力で作成、追加する「外字」となる。

   自治体では住民票や戸籍の人名の漢字を正確に表記させるため、外字をつくることがある。だが同じ文字を別の自治体が作字した場合、自治体ごとに異なる文字コードを登録していたため一貫性がなく、自治体を超えてコンピューター上の文書で外字を「共有」できなかった。コードが違うため、相手のところでは「文字化け」してしまうのだ。

   IPAは経済産業省などと2010年から、漢字5万8861文字について統一した文字コードに基づくフォントや、文字情報基盤の整備を進めてきた。ありとあらゆる漢字というわけではなく、戸籍、住民票に必要となる文字が対象だ。整備が完了した文字は「IPAmj明朝フォント」として、IPAのウェブサイトからダウンロードし使用できる。最新版は16年4月に公開されたものだ。

今すぐ無料会員に登録して、コメントを書き込もう!
ビジネスパーソン必修
保阪正康の考える「ありえた日本」とは? 特別講演を開催!

J-CASTニュースに「不可視の視点」を連載中の保阪正康さんを迎え、歴史にあえて「イフ(if)」を持ち込むことで、多様な角度から明治150年を読み解き、じっくり語る講演会です。 場所は東京・駒込にある東洋学の専門図書館「東洋文庫」にある「モリソン書庫」。圧倒的な書物に囲まれた空間で、アカデミックな夜のひとときを。

PR 2018/9/26

ad-kyouryoku-kaidan2.png
秋の夜長に「最恐怪談」はいかが?

この秋、「最恐怪談」が、さらにパワーアップして帰ってきました。赤羽の地に集まったのは、怪談界でも指折りの3人の語り部たち。今宵は、背筋も凍る、このお話からお聞かせしましょう......。

PR 2018/10/9

姉妹サイト
    loading...