日本語の漢字は、戸籍などに使われているものも含めると6万字あるのに対し、コンピューターは、実は1万字しか扱うことができません。
これに対し、このほど15年越しの作業の末、6万字すべてが統一の規格にまとめられて、コンピューターがすべての漢字を扱えるようになり、ビッグデータの活用をはじめさまざまな効果が期待されています。
コンピューターで文字を扱うには、1つ1つの文字に、「コード」と呼ばれる世界共通の番号を割りふる必要がありますが、
日本語の漢字で、コードが割りふられているのは1万字だけで、コードが無く、コンピューターが扱えない「外字」は、戸籍で使われているものをはじめおよそ5万字に上っています。
中には、メーカーなどが独自に対応した外字もありますが、コードが無いために、メーカーごとの互換性が無く、データを受け渡してもコンピューターが認識できずに「文字化け」してしまったり、
ある人の名前に本名の外字を充てたものと略字を充てたものの2つのデータがあった場合、コンピューター上では、別の人と認識されてしまったりするなどの問題が起きていました。
このためIPA=情報処理推進機構は平成14年から、経済産業省とともに外字を含めたおよそ6万字の漢字1つ1つに、コードを割りつける作業を進めた結果、
このほど15年越しでようやく完了し、国際規格として登録されました。
この結果「日本語の壁」の1つが取り払われ、外字が使われた名前を正確に表示できたり、
地名を含むビッグデータを正確に分析できたりするなどの効果が期待されています。
IPAの田代秀一参与は「日本人にとって、名前は大事なアイデンティティーで、戸籍では尊重されているがコンピューターが追いついていなかった。文字を正確に扱えるようにすることは、今後ますます重要になる」と話しています。
https://www3.nhk.or.jp/news/html/20171224/k10011270111000.html?utm_int=news_contents_news-main_001
引用元:政府「コンピューターで漢字を6万文字使えるようにした、これで日本語の壁が取り払われる」
どこの超漢字だよ
マイナンバー制のためでしょう?
文系ってほんと馬鹿だな
超漢字は18万文字だろ
なんで劣化コピー作ってドヤ顔してるんだ
>>6
2バイトコードの上限が65536文字だから
1万文字からの次の段階として6万を目指してきてたんじゃね
>>63
2バイトコードてw
>>63
Unicodeは3バイト4バイト行けるで
これは凄い
世界に誇れる
15年かかる作業とは思えない
ワタナベさん「俺らのバリエーションなめんなよ」
頭悪過ぎてコメントのしようがない
>>12
しなくていいよ
どうせつまらないレスしかできないんだから
15年かかるとは大事業だな
人名漢字の細かい縦棒が
まっすぐか斜めかなんて
超どうでもいい無意味な話にこだわり続ける糞老害のために
どれだけの労力をムダにし続けるんだよ
6万字もいらんだろ
そもそも1万字もかけんわ
どこかのメーカーが作って使ってた外字のコード整理するだけで良かったんじゃ
超漢字のTRONコードとか
減らせよw
1日11文字のペース
ゆっくりしすぎてないか
>>28
担当者一人なんやろな
フォントにした場合違いが判別できるかどうかだよね
つかこの2ちゃんの文字って何ドットなの
DBに記録できるようになってもフォントがなければ表示できない
アホくさ
フォントはその度にネットで引いて来たらいいから別に大きな問題にはならない
カタカナでいいよ
アホかと
手書きで出され書類の名前が6万字の中のどれに該当するのか調べるだけでも大変そうだわ
ほんと5千字くらいにまとめろや
それでも多い気がするけど
邊のバリエーションも書き間違いだろ
しょうもない話
ワタミの社長も変な字使ってた気がする
全部渡辺にしてしまえば解決するんだけどなあ
うちの苗字も草かんむりが十十だったのをオヤジが今の実家に本籍移すときに普通の字に変えた
そのおかげでコンピューターの時代になっても全く困らない
頑張ったなあ拍手
日本に現存する漢字が何万文字あって
一般人が一生のうちに目にする漢字は何%くらいあるの
さいとう先輩はどのさいとうだろう
トロンOSから再開発したら
Unicodeの拡張領域のどっかに割り振ったってことなのか
日本人1億3000万人のうちたった一人しか使ってない漢字とかあるんだろ
>>58
辰吉丈一郎の「丈'」とか
本家の中国には漢字何個あるんだろう
昔の人がたくさん作った漢字が今に伝えられてるんだから
現代人が漢字を作ってもいいよね
15年もかかったことが恥ずかしい
>>83
こんなん全部データー化するのか
アホやわ
今更使えますよと言われてもねえ
いいね!しよう
本日注目の話題!
コメント一覧
※ 1.
私は名無しさん
2017年12月25日 12:20 ID:ffKjNz.Z0 ※このコメントに返信する※
(e/d)
友達の名字がJIS第4水準だからたすかるわぁ(白目
※ 2.
私は名無しさん
2017年12月25日 12:27 ID:ItHLRRQX0 ※このコメントに返信する※
(e/d)
これ、実用化すると、変な異字体の人は漢字検索でひっかからくなって、行方不明者になるという罠、それを防ぐために標準字での検索欄が別にいるという無駄w
※ 3.
あ
2017年12月25日 12:34 ID:sOCn2auC0 ※このコメントに返信する※
(e/d)
本場中国はどうしてるんだ?
中国から技術買えば時間も経費も安く出来たんじゃないの?
※ 4.
名無し
2017年12月25日 12:41 ID:mxSBA.bR0 ※このコメントに返信する※
(e/d)
わざわざ新規に開発しなくても超漢字があるだろ…
※ 5.
2017年12月25日 12:55 ID:qfB6gfiM0 ※このコメントに返信する※
(e/d)
簡単な字に変えさせてくれ
先祖がアホなせいで迷惑だわ
※ 6.
私は名無しさん
2017年12月25日 14:44 ID:sxTg6hTN0 ※このコメントに返信する※
(e/d)
これ文字コードだけじゃなくて、フォントも作ってるからこんだけ時間かかってるんだぞ。
※ 7.
私は名無しさん
2017年12月25日 14:54 ID:.LchrH3N0 ※このコメントに返信する※
(e/d)
で、マイクロソフトはいつアップデートすんの?
※ 8.
私は名無しさん
2017年12月25日 15:44 ID:cClpp0C60 ※このコメントに返信する※
(e/d)
無能な役所が書き間違いを認めれば、字形を整理できて根本解決するだろ!
過去の過ちを認めず、それを埋め合わせするのに15年間もかけて税金を浪費し、文字コードの資源も浪費したということ。
無能に無能を上塗りしているのに、何を誇らしげに語っているのか…
本当に役所は無能だなwwwwww
※ 9.
私は名無しさん
2017年12月25日 17:35 ID:75Fjt.KJ0 ※このコメントに返信する※
(e/d)
一字一字で書類を作成して、担当者の上司・そのまた上司・そのまたまた上司の承諾ハンコを貰って、そうこうしてるうちに4月の人事異動で書類を再作成して、またハンコを貰いなおしてれば15年掛かるだろ!批判はいい加減にしろ!
※ 10.
あ
2017年12月25日 19:05 ID:n0le1tsO0 ※このコメントに返信する※
(e/d)
たまに難解な苗字の人がいるけど、それ以上に中国人が増えている背景もあるだろうね。特に運転免許は、中国と日本では漢字が違うからね。
※ 11.
私は名無しさん
2017年12月28日 17:14 ID:pfFsY2k10 ※このコメントに返信する※
(e/d)
なんで素直にすごいといえないのだろう...「間違いなく」6万文字使えるようにするってとてつもなく大変だろうに
コメント投稿

