【行政】日本IT界の鬼っ子「外字問題」解消を 経産省が着手[11/01/21]at BIZPLUS
【行政】日本IT界の鬼っ子「外字問題」解消を 経産省が着手[11/01/21] - 暇つぶし2ch2:やるっきゃ騎士φ ★
11/01/21 10:33:56
-続きです-
[2/2]
プロジェクトを進めるのは経済産業省と大手IT企業。
民間側の協議会は昨年12月6日に発足し、コンピューターで日本語を扱うのに不可欠なソフトを
作っているマイクロソフト、ジャストシステムなど9社・団体が加わった。
マイクロソフトの加治佐俊一CTO(最高技術責任者)は
「外字問題という、世界でも例のない日本固有の問題が解決に向かう」と語る。

経産省が動いたのは、官民ともにインターネットによる電子的な手続きの導入が進むなか、
正しい人名表記を扱う必要に迫られると考えたためだ。
法務省が幅広い電子化を目指して04年にまとめた「戸籍統一文字」(5万6040字)をもとに
5万8713字のデータベースを作る。世界共通の文字コード体系「ユニコード」に反映させ、
あらゆるコンピューターで人名や地名を網羅する狙いだ。

外字の存在はネット上の同じサービスを大勢の個人や企業が共有する「クラウド」化を妨げ、
日本が世界的な流れに取り残される原因にもなりかねないとされ、解決が急がれている。
政府側でプロジェクトを統括する経産省の平本健二さんは「1980年代から続く問題を解決したい」と語った。

普及が進む電子書籍についても成果が期待できる。
日本文芸家協会副理事長で芥川賞作家の三田誠広さんは「文字が1万字しか使えないのは大きなネックだ。
特に人名が表記できないのは致命的欠陥。文学書や歴史書を正確に電子書籍化できない」と語る。

      ◇

一方で、懸念の声もある。

国立国語研究所の高田智和准教授は「戸籍や地名にはすでに使われていない異体字や誤字も多い。
いたずらに使える字を増やすのでなく、使われているかどうかで仕分けるのが先ではないか」という。

プロジェクトが完了すれば、パソコンの日本語変換で「渡辺」の候補は現状の3から一気に22に増える。
JIS規格を決める際、多くの異体字を集約した東京外語大の芝野耕司教授(言語学)も
「多くの漢字が画面上に並ぶ中から、延々探せというのか。漢字を増やすことはコンピューターにとって
意味のある行為かも知れないが、人にとっては使い勝手が悪化するだけだ」と話している。

-以上です-
沢山ある“辺”の字
URLリンク(www.asahi.com)

3:名刺は切らしておりまして
11/01/21 10:41:08 SzR8SD4/
少数派は強制的に字を変えれば?

4:名刺は切らしておりまして
11/01/21 10:49:02 vBncAVVm
画像で保存してユニコード対応のOCRで読ませれば変換完了じゃん?

5:名刺は切らしておりまして
11/01/21 10:50:22 EBN2a6ae
>、使われているかどうかで仕分けるのが先
過去に使用例があるのなら「使われている」んだよw
書物というのは過去を記録するものだぞ。
現代社会で実用されているかどうかは関係ないだろw

6:名刺は切らしておりまして
11/01/21 10:52:54 eywC3fAz
常用漢字以外は徐々に使用制限しろや

7:名刺は切らしておりまして
11/01/21 10:53:25 jSwWLhCK
2バイト文字化け問題とか、日本語プログラミングは地獄だぜー
ヒャッハー!


8:名刺は切らしておりまして
11/01/21 10:55:44 iOEV4yVX
日本鬼子かと思った

9:名刺は切らしておりまして
11/01/21 11:00:48 bVIJjvh5
経済産業省と法務省が出てきた訳だが、総務省と文部科学省は絡まんのかな?

朝日的には、中共の指導者が正確に表記できない漢字コード体系を批判する
ものかと思ってたんだが...

10:名刺は切らしておりまして
11/01/21 11:10:23 sylbik8B
あの時、TRONにしておけば

後の祭りか

11:名刺は切らしておりまして
11/01/21 11:14:04 vc2JYzVq
 漢字をちゃんと書けない・表記できないなんて、せっかく中華文明圏に生まれたのに、
もったいない。

12:名刺は切らしておりまして
11/01/21 11:15:12 ziufMN4D
中国みたいに簡体字にするとか。
無理かな。

13:名刺は切らしておりまして
11/01/21 11:20:30 pqrjOQPl
>>4
ユニコードに入ってないから文字の統合をこれから検討するってことでしょ
当然BMPへの新たな漢字の追加は出来ないからサロゲートペアだよね

文字が増えると聞いてフォント買って来たのにソフトも買い替えなきゃならんのか!
なんてことになるな

14:名刺は切らしておりまして
11/01/21 11:20:57 cPChMpjF
鬼ッ子っていうか、IT界のメシの種じゃね?

15:名刺は切らしておりまして
11/01/21 11:31:43 P1eS0TxZ
ミスター鬼っ子

16:名刺は切らしておりまして
11/01/21 11:47:37 vJjQ4C7s
異字体をユニコードに登録することと
日本語入力プログラムで、すべての異字体を変換候補に出すことは
全く別の次元の話ではないか。
とりあえず、登録だけしておけばいいんじゃないの?

17:名刺は切らしておりまして
11/01/21 12:15:50 /OuPfBr/
超漢字スレ?

18:名刺は切らしておりまして
11/01/21 12:23:45 1/uNvrb9
ユニコードなんてアスキーしか使わないアメリカ人が
2バイトあれば世界中の文字を一括で扱えるじゃん→無理でした
で仕様変更しまくりのウンコだろ、もうあきらめろ


19:名刺は切らしておりまして
11/01/21 12:30:31 ZbgiIxSy
「邉」なんてどう考えても手書きで登録するときに
伝言ゲーム的に間違えてるだろ。

20:名刺は切らしておりまして
11/01/21 12:33:07 xtINEnix
> 外字を作るのは区職員

21:名刺は切らしておりまして
11/01/21 12:34:18 uZW6n0ZS
>>8


22:名刺は切らしておりまして
11/01/21 12:53:26 HkhjTgnb
「無駄な仕事」づくり。

23:名刺は切らしておりまして
11/01/21 12:55:26 mUDAkDBm
個人的には外字は全部似た時によせて
姓名地名はすべて標準のコードにあるものだけに
してしまえば良いと思う

24:名刺は切らしておりまして
11/01/21 12:57:12 P4Bl0Irx
20年くらい前の大阪では障害児のことを気を使って「ガイジ」って
呼んでました。

花子「◯年◯組の◯◯知ってる?」

太郎「ああ、あのガイジみたいなヤツ?」

25:名刺は切らしておりまして
11/01/21 12:59:06 VX3WkWJF
>>8
鬼っていう字も異字体があるな
URLリンク(www.kishimojin.jp)

26:名刺は切らしておりまして
11/01/21 13:12:05 Iq5Bvsi/
某大手でDMシステム組んでたが・・・物理的に不可能です
企業ごとに違うし同じ企業でもフランチャイズのチェーン店みたいなところでは店舗ごとにバラバラだったりするわけで・・・
ぶっちゃけPCの数だけ外字のパターンがあるので

仕事してるふりをするための予算獲得のためだけの理由づくりですね

27:名刺は切らしておりまして
11/01/21 13:14:28 ELrYqrnz
>>26
以前ならそうだけどunicode準拠でISO枠一個貰うだけでエラい違うと思うよ。
どっかの国は熟語まで枠もってってるしなぁ。

28:名刺は切らしておりまして
11/01/21 13:17:16 yvn/lFH3
モンゴル文字とかどうやってんだろ?

29:名刺は切らしておりまして
11/01/21 13:18:33 tARAkpg5
unicodeっていうか、iso10646だけど、コードポイントは充分にある。
最終的に31+1ビットまで拡張すれば、20億文字くらいは入るから心配いらない。
いま21ビットだけどこれでも充分。

ただ困るのは人間の側であって、似たような字が余り法則性もなくずらずら並んでいてもよくわからん。
検索の問題、どこまで異体字を収録するのかという問題、モバイル等小さいシステムに収容できるのか、
見やすくできるのか、といった問題がある。

すべての異体字を収録するのではなく、基本になる漢字にだけコードを与えて、
トリビアルな異体字に関しては、サブコードみたいのをくっつけて識別すべき。
というか、大方はそういう方向になっている(包摂)。

ただなにを基本(正字)として、なにを異体字とするかで議論がある。
日本の正字が中国では異体字だったりする。
ユニコードの特定のコードの漢字が、日本のWindowsでは正字で、中国では異体字で表示されることもある。

こういう規格とか標準とかは政治的に注目すべき。カネにもなるし。
気をつけていないと、これまでの標準化競争同様、日本は戦う前から負けることに。。。

30:名刺は切らしておりまして
11/01/21 13:19:12 UvYNahj7
漢字を減らす方を考えるべき。
無駄に多い漢字は無駄

31:名刺は切らしておりまして
11/01/21 13:23:47 Iq5Bvsi/
>>27
互換性とかあるからね
すでに完成して運用してるシステムやDBを新規に作り直すの完全な予算の無駄だから

32:名刺は切らしておりまして
11/01/21 13:25:05 ELrYqrnz
>>29
国毎に分けりゃいいだけだと思う俺。
(ていうか支那だけでも数パターンある訳だから
 めんどがらずに枠分けた方良くないかと思う俺

33:名刺は切らしておりまして
11/01/21 13:26:57 3avlT4DZ
昔は簡単な漢字でさえも、JISコードを直接叩いて表現していたもんぢゃ。

34:名刺は切らしておりまして
11/01/21 13:28:43 ELrYqrnz
>>31
今のシステムといってもあと数年もすれば入れ替わると思うぞ。
EUC-jpや昔のshift-JISが標準でなくなり始めた時の保守問題も新たに出てくるだろし

35:名刺は切らしておりまして
11/01/21 13:29:05 NmbvHppo
異字体の成立から何タイプかに分類してそれに統合しろよ


36:名刺は切らしておりまして
11/01/21 13:29:58 yvn/lFH3
グラフィックで登録して必要に応じて呼び出すんじゃだめなのかなぁ。

37:名刺は切らしておりまして
11/01/21 13:33:40 Iq5Bvsi/
>>34
オープン系に以降してくれればいいんだけどな
大企業ほどJEF78とかIBM90未だに普通に使ってるところが普通なんで簡単じゃない

38:名刺は切らしておりまして
11/01/21 13:36:08 vbFZq/LH
俺は戸籍は旧字だけど
普段は新字使ってる

39:名刺は切らしておりまして
11/01/21 13:38:26 ELrYqrnz
>>37
ぐぐってもまともに出てこんぞ、、、それ
>JEF78とかIBM90
昭和なシステムなのはなんとなく伝わってくるけど。

40:名刺は切らしておりまして
11/01/21 13:38:46 q0EMgdKe
要約すると
NTTデータと主要メーカーに予算つけました
って話か

41:名刺は切らしておりまして
11/01/21 13:42:14 Iq5Bvsi/
>>39
汎用機系の文字コード
データのやりとりこの時代に磁気テープだぜ
誰もが知ってるような企業ばっかで
ある程度の規模の会社になるとS-JISだのウニコードだの使ってるところなんて極少数派

42:名刺は切らしておりまして
11/01/21 13:44:04 ELrYqrnz
>>41
外野でこういう事いうべきじゃないんだろうけど、、
本気でその辺更新しないとそろそろイジれる人材すら危うくないか、、、それ。

43:名刺は切らしておりまして
11/01/21 13:45:16 fS1SGiBR
おまえら、道具はこき使って何ぼだ。
道具に使われるのはバカの証だ。

44:名刺は切らしておりまして
11/01/21 13:47:06 jaP8cUff
>>3
確か中国の市役所がそれをやって騒ぎになったニュースがあった。


45:名刺は切らしておりまして
11/01/21 13:49:36 r6An7iSZ
元々、漢字は個人の裁量で書かれていたものだしなあ。
無闇に増えると困るから、制限も大切。

46:名刺は切らしておりまして
11/01/21 14:14:06 YGuRCAhF
書き間違いをこれは間違ってない固有の字だと言い張っているから
際限なく増えていくんだ 同じ字で20種とか変だろ

47:名刺は切らしておりまして
11/01/21 14:32:46 P1eS0TxZ
それはそうと、なんで渡辺ばっかりなんだ?
佐藤の藤の字とか鈴木の鈴にはなんで異体字が少ないんだ?

48:名刺は切らしておりまして
11/01/21 14:37:14 xtINEnix
>>47
斉藤の斉の字ならいろいろあるよ。100とかじゃないけど。
URLリンク(www.myj7000.jp-biz.net)

49:名刺は切らしておりまして
11/01/21 14:38:57 yHMbTCKt
>>2
>日本が世界的な流れに取り残される原因にもなりかねない
そもそも日本語を使っている時点で・・・

50:名刺は切らしておりまして
11/01/21 14:41:24 vB8EaUeF
まーた鬼子か。

51:名刺は切らしておりまして
11/01/21 14:43:39 BOBRqRWe
昔は出生届に書いた字がまちがっててもそのまま登録されてたからなあ
おかげで俺の父の名前は誤字が正しいことになっちまった

52:名刺は切らしておりまして
11/01/21 14:49:56 ITGQR6gv
>>42
磁気テープというか、メタルテープというか、オープンリールというか
あの辺りは、日本では消そうにも消えない媒体になろうかと思います
かなり頑丈ですからね



53:名刺は切らしておりまして
11/01/21 15:03:39 P1eS0TxZ
>>48
うへ
甲冑着た武人だな

54:名刺は切らしておりまして
11/01/21 15:33:15 QFitq8Yh
無理やり仕事を作った感があるなw
もう何もしないで税金安くしろ。
需要があるのは民間が作ってくれるわ。


55:名刺は切らしておりまして
11/01/21 15:34:29 vVT5Armw
この通りになったら、これまで誤魔化し誤魔化ししてきたサロゲートペア問題がいよいよ本格的な頭痛の種になるなぁ


56:名刺は切らしておりまして
11/01/21 15:34:31 wmrNVqvc
変に体裁にこだわらず、カシオの「楽一」つかえば解決する問題です

57:名刺は切らしておりまして
11/01/21 15:40:07 wmrNVqvc
>>55
すでに、XPとVista以降では、表示できる漢字方式が変更になっているし
MSの仕様変更でお役所がふりまわまされるのは御免ってだけなんでしょね


58:名刺は切らしておりまして
11/01/21 15:40:16 9KuWOz2l
昔の日本人はそういうこともあろうかと、カナとカタカナを作ったんだよ。

日本民族恐るべし。

中国IT界の鬼っ子も論じてね。

59:名刺は切らしておりまして
11/01/21 15:42:00 wmrNVqvc
>>58
読み仮名に、ゐとかゑとか使う馬鹿がでます


60:名刺は切らしておりまして
11/01/21 15:43:34 wTBI8Yp/
異字体なんて落書きと同じなんだから
そのままイメージで登録してしまえばよいだけ

61:名刺は切らしておりまして
11/01/21 15:46:18 wmrNVqvc
中国人の養女とかが、名前を誤魔化すために生まれた落書きです
本来つきあう義理もない、助ける義理もない

62:名刺は切らしておりまして
11/01/21 15:47:05 fqi/viTG
そういう業務にはWindowsを投げ捨てて超漢字使えよ
良く知らんけど

63:名刺は切らしておりまして
11/01/21 15:47:10 KaH3lu46
TRONでかいけつしてなかったっけ?
ばかだなほんと日本のおかみは

64:名刺は切らしておりまして
11/01/21 15:49:54 wmrNVqvc
仕様だけを見れば、XP辺りで、超漢字の扱える漢字数を超えてしまったのでなんとも

65:名刺は切らしておりまして
11/01/21 16:02:35 qrWAorAc
ひらがなカタカナにも異体字があるんだよなー
こっちは明治政府にばっさり切り捨てられちゃったけど

66:名刺は切らしておりまして
11/01/21 17:41:01 V7G91aEJ
経産省は予算獲得の為にニュース流すよね。
実は目の前に、この問題が存在しているわけだが。

インターネット版「官報」 URLリンク(kanpou.npb.go.jp)
菅直人首相の「直」二画目 ナナメなんだと。
美しいフォントがあるのに体裁がよくない。見にくい。コピペが出来ない。

詰まるところ、縦割り行政を調整しないと、前に進まない。
国民総背番号制度で、税務情報の名寄せ問題は解決だ。これが大きい。
異体字は、本人の同意の元、標準体を使うべきだ。
同意が不可なら、ローマ字を当てるべきだ。
異体字探し出す、生産的でない時間。手間のかかる窓口事務の効率化。


67:名刺は切らしておりまして
11/01/21 17:46:28 2YDqI9Nm
PDFの浸透があるように、手書き文書をそのまま電子化する手法があるので
こんな活版を引きずってる考え方そのものが時代にそぐっていませんな


68:名刺は切らしておりまして
11/01/21 17:47:50 dS6xoUyk
お前ら、支那の簡体字みたいな発想してどうすんだよ

69:名刺は切らしておりまして
11/01/21 17:52:08 2YDqI9Nm
おまえもな
全部中国人が悪いんだよ

70:名刺は切らしておりまして
11/01/21 18:40:06 tARAkpg5
>>32
最初にiso10646が企画されたときは、そんな風になるはずだった。
国・言語ごとに16ビット6.5万字ほどの領域(256x256のプレーン)が割り当てられ、
漢字圏の国のようにたくさん文字を持っている場合は、複数のプレーンを与えられる。

そしてそれぞれのプレーンに、それぞれの国で使われているローカルな文字コード体系を
そっくり収めてしまう。プレーン自体も3万~6万面あるので、地球上の文字すべて収録しても余裕、
・・・のはずだった。

が、いろいろあって、iso10646(≒いまのユニコード)は6万字しか収容できない形で始まった。
そのため、字の似ている漢字・・・日本、中国、韓国etcの漢字には、同じコードが振られるようなことがおこった。
いわゆる「統合漢字」の問題。

71:名刺は切らしておりまして
11/01/21 19:04:14 Ysa6q05l
みんな「渡辺」でいいじゃん


72:名刺は切らしておりまして
11/01/21 19:12:06 h29QPkde
最近はチョンが帰化してもハングルで戸籍登録しろと言ってなかったっけ?

73:名刺は切らしておりまして
11/01/21 19:39:11 vVT5Armw
あらゆるシステムがウニコード対応になったら断る理由がなくなっちゃうかもね

74:名刺は切らしておりまして
11/01/21 19:48:50 SXyt/Wmx
異字体の大半は書き間違い

75:名刺は切らしておりまして
11/01/21 20:06:20 apLZkKkr
GTコード検索をベースに、文字コード規格をつくって、なんとかすれ

URLリンク(argent.shinshu-u.ac.jp)

一般社会じゃ必要ないかもしれんがね

76:名刺は切らしておりまして
11/01/21 20:20:53 CQiEarx3
ウチは産業機械やだけど、パソコンだけで完結しないからしばらくANSIで粘るわ
ユニコードがほんとに落ち着いたら組み込み用デバイスなんかも移行するのかしら

77:名刺は切らしておりまして
11/01/21 20:28:20 apLZkKkr
>>76
いや、ないと思う。

UTF-8自体がもう、完全に定着している感があるし。そもそも、外字は現実には
ほとんど利用する機会がない。まさに人名の為だけにあるようなもんで、他では、
新字で間に合っちゃっている。

組み込みデバイスも今や、LinuxやらNetBSDといった古株、Javaなんかが当たり前
になってきてそのうち、多分、PCと融合してちゃっうと思う。そうなると余計に外字が
珍種扱いになる。

世界で使えない以上、もう、極めて限られた世界でだけどうにかするものになっていく
か、消えるかどちらかだと思う。

78:名刺は切らしておりまして
11/01/21 20:32:02 cx9r7yHs
その為のユニコードだろ

79:名刺は切らしておりまして
11/01/21 20:36:31 UkQzK6Di
ない漢字作成するのもいいんだけど
外字の写研のBA-90も電子化して欲しいんですが。
URLリンク(www.fc1983.com)
憎めない奴だぜ


80:名刺は切らしておりまして
11/01/21 20:41:03 CQiEarx3
>>77
Windows系業務アプリの対応具合ってどんな感じなんでしょう?
規模が大きくなると、他システムとの連携があったりとか、社内ネットワーク
内の旧OS混在とかあったりして文字コードをあっさり変更出来ないような
感じがするんですけど。

81:名刺は切らしておりまして
11/01/21 20:49:25 9mROhTnl
そもそも旧字をコンピュータ上で再現する意味はあるのか?

単純に段階的旧字廃止政策を打ち立てて、法律的にコンピュータ上は旧字を新字に
置き換えるルールにすればいいだけだと思うんだけど

82:名刺は切らしておりまして
11/01/21 20:53:17 apLZkKkr
>>80
おもに、外字が問題になるのは給与計算システムかな。

昔からでも、行政と同じく、ビットマップフォントで対応しているものが多かった。
けれど、現在では、ほとんどが普通のアプリケーションと同じだから、外字はつ
らい。

社内ネットワークといっても、ここ数年でだいぶ整理された感もあって、また、
Windows系もサポート切れで強制移行みたいなところも多いから、Unicode
対応は、極めて古いものをいつまでも使っている一部以外は問題ない。

ただ、レンタルサーバではデフォルトをEUC-JPにしているところもある。結構
大きなレンタルサーバとか。あとは、クラウドサービスも推してきているね。
おそらくここ5年くらいで、UNICODE一色になるんじゃないかな。

83:名刺は切らしておりまして
11/01/21 20:55:59 apLZkKkr
>>81
一般企業では、普通に新字でやっているのが多いよ。システムが対応していない
から。

だが、問題は行政。とりわけ、社会保険ね。

年金受給の際に名称を提示するわけなんだが、旧字じゃないとだめだとかほざい
ているところも多いんだよ。社会保険やったことある人なら知っていると思うけれど。
官僚的っていうか役人仕事っていうかね。

中には大昔に、出生届で漢字を書きそこねて実在しない漢字を登録しちゃった
ケースがある。驚くべきことだが。

84:名刺は切らしておりまして
11/01/21 20:59:43 s5BJ0Ekz
俺の名字は朴だけど、書きにくいから木下って書いてもいいよな?

85:名刺は切らしておりまして
11/01/21 21:23:40 s5BJ0Ekz
俺の名字はピだけど、短すぎるからrainって書いてもいいよな?

86:名刺は切らしておりまして
11/01/21 21:29:30 4MBtIs9j
もう少し仕分けするべきだろう。無駄が過ぎる。
そしてそれを国がちゃんと推進しろ。

87:名刺は切らしておりまして
11/01/21 21:39:48 s5BJ0Ekz
そうですね

88:名刺は切らしておりまして
11/01/21 21:46:21 AMsUjQa0
ひらがなも異体字がめんどくさい
ほとんど死んでるのだが戸籍には記載されとるし

89:on windows
11/01/21 21:50:41 EpZ4ZhxY
DOS cp932(SJIS) と UNIX euc-jisx213 よりも、
Mac の外字がひどく問題だった。
割り当てられているコードが、重なっていたので、
まったく違う表示になった。

後で、docomo の絵文字を見たときはショックだった
また混乱すると思った

90:名刺は切らしておりまして
11/01/21 21:51:04 BtuTVPTe
itanium processorは、マシン語でも方言をできるだけ排除して簡単な言語で的確に処理することを目的としたけど
結局頓挫しました。もしかすると最後の64bitフルケールだったかもしれないのにな。
あまり関係ないかもしれませんが、能力を上げようとすると捨てるゴミみたいな処理は結構あるものです


91:名刺は切らしておりまして
11/01/21 22:17:50 HS3XOlWj
アスキーアートにすれば解決

92:名刺は切らしておりまして
11/01/21 22:22:09 rXtybX4Y
だから
マイクロソフトじゃなくてトロン使ってればそんな漢字の問題なんか
起きなかったのに超漢字があるじゃないか!!

93:名刺は切らしておりまして
11/01/21 22:23:29 fONyL7UF
渡辺なんて名前のヤツにロクなのいないのはなんでだろー


94:名刺は切らしておりまして
11/01/21 22:24:27 adiyDC9n
じゃあ、T-kernelで新型OSの開発だなあ
超漢字じゃ国産ARMで動かないぞ、とか言ってみる試験

95:名刺は切らしておりまして
11/01/21 23:02:37 W9oJRpeg
読めない名前問題はそれほど深刻じゃないか、、w

96:名刺は切らしておりまして
11/01/21 23:19:34 kQaT8PRE
戸籍の氏名をすべて正字にした自治体もあるよ。
大分市とか。
戸籍の字は渡邉だけど、普段は渡辺で書く人も多いし
戸籍の字を正字に変えれば殆ど解決する気がするけどな。

97:名刺は切らしておりまして
11/01/21 23:27:20 vz0aFYyx
>>95
上で書いたけど、結局できるのがカシオの「楽一」

98:名刺は切らしておりまして
11/01/21 23:33:30 Hqvv9ZST
うちは、名字の草かんむりが
┤├
だったが千葉市に戸籍移したとき、この字が無い言われ
  ++
になった。

99:名刺は切らしておりまして
11/01/21 23:34:47 Mz+VEMlq
>>98
だせーw パソコンに名字変えられてやんのw

100:名刺は切らしておりまして
11/01/21 23:43:20 ue3TJDmm
カイジ問題

101:名刺は切らしておりまして
11/01/21 23:47:00 +rKZgP/4
言語の英語化を進めた方が早いだろ

102:名刺は切らしておりまして
11/01/21 23:52:48 zgQAxy2Y
戸籍つくる時に窓口の役人に勝手に変えられたオレの名前の字も戻せるのか?

103:名刺は切らしておりまして
11/01/21 23:55:19 ye0PTVAv
異体字の多くの字が、書き間違いをルーツとするんだよな

104:名刺は切らしておりまして
11/01/22 00:00:18 a1L/O+5V
>このため、区はコンピューターがデータをやりとりする際に文字コードを変換するシステムを
>約1億8千万円かけて導入した。

ちゅうか変換テーブル差し込むだけだから100万でできるだろ
検証だの人件費だの全部込みで

105:名刺は切らしておりまして
11/01/22 00:02:21 AMsUjQa0
なにしろ扱ってるものが「戸籍」ですから

106:名刺は切らしておりまして
11/01/22 00:04:46 BuQmt0BT
システム毎の外字を統一するより、個人識別用のID振る方が早くないか?
漢字が全部で何種類あるのかすら決められないみたいだしさ。
自分の名前の漢字が少々違って表示されようが、道具が便利に使えればそれでいいじゃん。


107:名刺は切らしておりまして
11/01/22 00:06:55 j1W8Hlwc
つかさ戸籍が異体字だと運転免許も銀行口座もパスポートも戸籍の字体にしろってうるさいんだけどどうにかならないの

108:名刺は切らしておりまして
11/01/22 00:08:07 ZbV4r505
マスコミが言うことだから信用できないけど、年金を一人で二人ぶん貰える詐欺として
こういう外字登録が使われている。少しでも違えば別人だと言い張れるからね。

それと、全員にID登録する手間(番号発行も手数は大変だし設計も大変だ)とどっちが
楽なのかと考えると、現状でほーちみん状態なんだ



109:名刺は切らしておりまして
11/01/22 00:14:31 LiCHfmnq
こんなことよりもやることあるだろ経産省www


110:名刺は切らしておりまして
11/01/22 00:23:40 gQXjDI/n
>>104
100万やるから、おまいさんやってくれよ

111:名刺は切らしておりまして
11/01/22 00:24:21 Akfm2q0m
>>1
> 外字を作るのは区職員

本人に悪気は無かろうが、「絶対やらかしてる」。

112:名刺は切らしておりまして
11/01/22 00:24:58 1PRHeWsl
最近はギリシャやロシア文字の障害が多いんだがな
明らかにΣとかσとかдみたいな顔文字だろ

113:名刺は切らしておりまして
11/01/22 00:29:41 mV8JkWK+
>>110
ほんとうにくれるのか?
業務でさんざんこの手の変換テーブルメンテしてるが新規でも5万も請求できないんだよ・・・

114:名刺は切らしておりまして
11/01/22 00:30:29 BKjf2Ch8

朝日新聞の題字の「朝」って、外字になるの?


115:名刺は切らしておりまして
11/01/22 00:30:53 ZbV4r505
>>113
7崖でやれば
>>110
おまいらなんとかして仕事でやれ

116:名刺は切らしておりまして
11/01/22 00:31:04 Akfm2q0m
>>108
> 少しでも違えば別人だと言い張れる

一兵卒の小沢さんが、小澤さんになんか
うさんくさい贈与だかなんだかをしてたような。

117:名刺は切らしておりまして
11/01/22 00:31:44 TV2bLE8C
バカじゃないの。
異体字はすべて一つの字体に統一すればいいだけ。
デザインの違いみたいなもので、意味や読みは全く一緒なんだから。

118:名刺は切らしておりまして
11/01/22 00:33:29 ZbV4r505
ああ、馬鹿を増やすためのシステムだけど、業務はそんなもんだよ

119:名刺は切らしておりまして
11/01/22 00:33:47 Akfm2q0m
>>117
総背番号制なりとセットで統一したとして、現在以降は問題ない。
が、過去の記録とつき合わせたり電子化するときにメチャメチャになる。

120:名刺は切らしておりまして
11/01/22 00:35:31 z7ZaSd2K
渡邊さん他には悪いけど
さすがに統一しようよwww
せめて3つくらいには統合してくれ。たいした違いもないだろ。

121:名刺は切らしておりまして
11/01/22 00:40:11 ShusQXgX
もう文字コードで悩まなくていい
UTF-8だけで十分な時代が来る

122:名刺は切らしておりまして
11/01/22 00:41:12 1XUcpd47
>>93
同じこと思った。なんでだろう?

本当かどうか知らないけど、名前の順で点呼されるときに後の方になるから、
待つ癖がついて積極性がないとか、辺りを見渡すようになるから腹黒く成り易いとかなんとか

123:名刺は切らしておりまして
11/01/22 00:47:51 JZlHkvxr
待つ癖がついて積極性のない渡辺恒雄・・・ww

124:名刺は切らしておりまして
11/01/22 01:05:06 DiXMKzdc
ハシゴ高すら未だに解決できてないというのに

125:名刺は切らしておりまして
11/01/22 01:08:58 mV8JkWK+
塚と塚な
JIS78とそれ以降でコードが入れ替わってるという罠

126:名刺は切らしておりまして
11/01/22 01:40:09 NrZJ6paR
>>122
だった。
渡辺恒雄 ←こいつのせいじゃねえか?

こいつの老人優遇政策のせいで日本は窮地に立たされてるし。
今の経済状況でやるべきのことか?
しかも、NTTデータとか中国に給与データ処理依頼した所だろ。


127:名刺は切らしておりまして
11/01/22 04:01:25 CXGwIN7G
もう簡体文字に統一しる

128:名刺は切らしておりまして
11/01/22 04:49:37 JgVGlMYm
ワタナベで変換して候補が何百も出てきたらそれはそれで不便になりそうだな
まぁそれは現行の日本語入力システムの限界でもあるけど

129:名刺は切らしておりまして
11/01/22 05:17:23 E5/0/X+v
中国みたいに規制するしかないのかねえ

130:名刺は切らしておりまして
11/01/22 09:55:30 6FzNeGzZ
ほんとお上は無駄な仕事だけ増やすんだな

131:名刺は切らしておりまして
11/01/22 09:56:33 6FzNeGzZ
このシステムに何億かけるつもりだ
この会議に何人出ていくら使った?

TRONの超漢字は一切無視か?

132:名刺は切らしておりまして
11/01/22 10:08:11 TAft6GhU
一億だと、天下り団体に丁度いいサイズだからそういう事だよ
しかし、安易に批判もできない、なぜならおまいらの個人データを
守るって口先だけでも言ってるだから、中国人にされると困るしさ

133:名刺は切らしておりまして
11/01/22 10:24:11 6FzNeGzZ
官公庁の書類は全部本人の手書きを画像ファイル扱いとし
ソートは正確なよみがなで行えばいいだろうに

134:名刺は切らしておりまして
11/01/22 10:24:52 vTRqeTzz
>>98
それ手書きと活字の違いだろ
手書きで┤├ って書く文字を
活字では++ってなるんだよ
入とか之とか手書きではこんなふうに書かないだろ、それと同じ

135:名刺は切らしておりまして
11/01/22 10:25:55 Hqbwy2Cc
うちは関係無いっちゃ。

136:名刺は切らしておりまして
11/01/22 10:26:59 6FzNeGzZ
書体によっても違うからな
お役所のバカにはわからんのだろう

137:名刺は切らしておりまして
11/01/22 10:27:45 6FzNeGzZ
何度やっても間違う区役所のバカがいる限り
なにをやっても無駄

138:名刺は切らしておりまして
11/01/22 11:02:26 +0+SBwab

ああ、たぶんIDをつくっても、今後は 枝番号(えったばんごう)ができて堂々巡りになるとおもうよ



139:名刺は切らしておりまして
11/01/22 11:59:14 KVZ0LyYk
年金記録あたりもこのへんで問題起こってるんだよな

140:名刺は切らしておりまして
11/01/22 12:01:25 KVZ0LyYk
>>117
お前は「斉」と「斎」は実は意味が違うとか
知らないゆとりもしくは非日本人なのかね

141:名刺は切らしておりまして
11/01/22 13:14:07 NAAwbm5Z
日本独自をあきらめて、ID番号だけアメリカ番号と連動させる手もあるな
稼働実績からいうとアメリカ式の方が有る

なんのことはない、わんこだらけのドックタグを全員につける作業だ

142:名刺は切らしておりまして
11/01/22 13:52:04 9sJR6bDk
>>140
そんなもん現時点でもうグチャグチャでんがな
それとも隷変以前に戻れとか言うのか?w

143:名刺は切らしておりまして
11/01/22 15:09:44 Mzlx7/zA
超漢字はJISやらユニコードやらを単純に繋げただけなんで、あんま意味がない。

同じ「馬」という漢字でも、JIS由来の「馬」、ユニコード由来の「馬」で違うコードが振られてる。

144:名刺は切らしておりまして
11/01/22 15:46:28 gUagUjfF
>>143
超漢字の売り自体が、そうやってドンドンコードを足していっても破綻しないですよ!じゃなかったか。
国のやることなら、この手のシステムで、年1回くらいの摺り合わせ作業を全国的にやればいいのに。

ただ、戸籍なんかの場合は「それ、単に字が汚くてトメハネがおかしいだけじゃね?」って字体も別字に
なるのが難しいのだろうけど。

145:名刺は切らしておりまして
11/01/22 15:47:59 6FzNeGzZ
よくわからん学識者とかが呼ばれ
接待漬けになり
気がついたら100億くらい使って
結果はユニコードみたいなのりなんだろう

146:名刺は切らしておりまして
11/01/22 15:48:22 wuBmV/A8
外字が問題なんておおげさ
異体字がうまれる一番大きな原因は書き間違い
法律で全部正字に統一すればいいだけじゃん


147:名刺は切らしておりまして
11/01/22 15:52:21 9sJR6bDk
>>146
それに便乗して中華みたいに漢字の表音文字化を推進しようとする奴が絶対現れるからダメ

148:名刺は切らしておりまして
11/01/22 16:10:50 rrQyZ66z
面倒くさいから全部ローマ字表記にしちゃえよ
誰も困らないだろ



149:名刺は切らしておりまして
11/01/22 16:11:03 pVYrWgeQ
戦後も人名表記では「ゐ」や「ゑ」は残ったりしたけど、
それ以外は人名であっても旧仮名遣いから現代仮名遣いにしたんでしょ?
譲治=じやうぢ→じょうじ 相川=あひかは→あいかわ みたいに。
当時の人は自分の氏名の表記が変わってどう思ったのか知らんけど

漢字も強制的に整理しちゃえばいいんじゃないの?

150:名刺は切らしておりまして
11/01/22 16:15:32 gUagUjfF
>>149
それが当用漢字。戦後すぐに、「漢字は覚えるのが大変だから無くしましょう!」って事で移行処置として
公的に漢字を制限しはじめた。まぁ、同じ論理から漢字を撤廃させたのがハングルだ。

んで、運用してたら、「やっぱ漢字がないと色々とまずいでしょ…」と現状まで至るのだ。

151:名刺は切らしておりまして
11/01/22 16:27:01 pVYrWgeQ
当用漢字は最終的に漢字そのものを廃止させるのが目的だったんでしょ

そうじゃなくて、「吉」の字の上が長いか下が長いかとか、「角」の字の真ん中が下に出てるとか出てないとか、
しんにょうの点が1個とか2個とか、漢字の意味にも音にも関係ないような「誤差」は整理した方がいいんじゃないの
って言いたいんだけど。

152:名刺は切らしておりまして
11/01/22 16:29:21 fOBFlz9y
外字か懐かしいな

153:名刺は切らしておりまして
11/01/22 16:33:50 VlJsXOd+
そんなことよりオレのイボ痔の話を

154:名刺は切らしておりまして
11/01/22 17:00:12 /T6eWsSY
一つの字種の文字の字体は一つだけ
それ以外は公的に使えない
と法律で決めればいいだけなのにね


155:名刺は切らしておりまして
11/01/22 17:02:28 KVZ0LyYk
>>154
だから、一つの字種ってどこまでだよ

156:名刺は切らしておりまして
11/01/22 17:14:19 uzp35Z4t
>>155

URLリンク(www.tonan.jp)
TONAN'S WEB

〈字種〉というのは、その文字がその文字であるということです。
「未」と「末」は〈字体〉〈字形〉は似ていますが、違う〈字種〉です。
一方「天」には上の横画が長いものと短いものがありますが、どちらも同じ〈字種〉です。
「齊」と「斉」、「齋」と「斎」は字体は違いますが同じ字種です。


157:名刺は切らしておりまして
11/01/22 17:17:34 jxT5zT/e
ITシステムに合わせて環境を整備するのが欧米、
環境に合わせてITシステムを整備するのが日本とはよく言われるが……
IT界の鬼っ子って外字より複数並行で使われてる文字コードそのものな気が。


158:名刺は切らしておりまして
11/01/22 17:19:16 K34G6wP6
ぶっちゃけ言うと、中国語でも簡体字はどう考えても異字体だろ。
廣→広→广

これじゃあねぇ。

159:名刺は切らしておりまして
11/01/22 17:22:37 KVZ0LyYk
>>156
そんな事訊いてるわけじゃないんだが。

同一字種ということを誰がどうやって決めるのか
説が分かれていたりはっきりしない事例がある場合
どう処理するのかって訊いてるんだが。

160:名刺は切らしておりまして
11/01/22 17:35:27 6FzNeGzZ
全部金田一の孫にやらせて
それでOKとしろ

161:名刺は切らしておりまして
11/01/22 17:52:34 83Pg56na
>>153
病院池

162:名刺は切らしておりまして
11/01/22 18:29:42 cqvpFlJu
字なんてえいやっ!で決めるしかないしな。
GHQがアルファベットに統一といてくれれば
楽だったのに。

163:名刺は切らしておりまして
11/01/22 19:00:25 ch6rby3K
>>162 漢字圏で漢字を捨てて機能性文盲が致命的な韓国がお好みかな?

164:名刺は切らしておりまして
11/01/22 19:13:02 Mzlx7/zA
>>144
詳しくは省くが、超漢字は文字コードシステムと言うより
メタ文字集合とか異種コードシステム併存システムといったほうがいい代物なので、
電子的文字表現の整理手段としては、ほとんど期待できない。

165:名刺は切らしておりまして
11/01/22 19:43:06 /ObJaaXE
>>159
おまえ
漢字のこと全然わかってないな
いちから勉強しろ


166:名刺は切らしておりまして
11/01/22 20:03:00 jIJPVkFI
>>151
ありゃ敗戦で国民全体が精神的打撃を受けてたときだったから断行できたんだよ
旧仮名遣いが戦争の遠因ですとか吹き込まれたりね

いまだと人権どうこうとかで大騒ぎになるぞ

167:名刺は切らしておりまして
11/01/22 23:30:14 14dWi8wi
省庁向けシステムの開発プロジェクトにいたことがあるけど
国民の氏名を扱う箇所があったため
文字(コード)の担当だけで6人くらいいた。

168:名刺は切らしておりまして
11/01/23 02:07:09 xazo7G/q
明治に戸籍つくった時は手書きで、それが法的な正本だから、
百年前の誤字とか俗字が正式な氏になっちゃったんだよ。

ご先祖様の大事な誤字を、JIS規格ごときに包括するのは、
たぶん違法(原本に対する不実)だし人格権の侵害。

169:名刺は切らしておりまして
11/01/23 04:22:28 SnAXqktU
戸籍を作るとき、書き間違えた漢字、勝手に作った漢字とかは本来の正しい字体の漢字に改めさせろよ。

それと、83年のJIS改定のとき「掴」とか「涜」とか存在しなかった字体を勝手にでっちあげた学者、土下座して謝罪しろ。


170:名刺は切らしておりまして
11/01/23 04:52:53 z37015Iy
国家管理の辞書作って、国民の数だけ全漢字登録すればいいじゃん。
仮に世界政府が世界人口を全部って話でも、まず現時点で100憶は
いかないし、将来まで見据えても、64bitありゃ足りるだろう。

多数派ほど優先で変換されるオマケ付き。
不便だと苦情を言うなら、多数派の字に換えればいい。専用なんだから
誰に遠慮も要らない。家族にすら要らない。

32bitを越えるデータなんてのは、↑みたいな使い方して構わないレベル
だと思うんだがなぁ。

171:名刺は切らしておりまして
11/01/23 04:57:48 YqGSmVdp
おもしろい考えだが、MSとhpでDWH構成がすでに出ている
先をこされた、ぼったくりに乗るしか無いぜ

172:名刺は切らしておりまして
11/01/23 09:12:05 2Z2CAu1e
>>140
見当違いな事言うな。
辞書見た事あるか?
「斉」と「斎」は全く別字だろ。異体字でも何でもない。
URLリンク(detail.chiebukuro.yahoo.co.jp)

173:名刺は切らしておりまして
11/01/23 14:40:55 V/oEySEq
外字問題が鬼っ子なんじゃなくて、各市町村のごねまくる住民が問題なわけなんだが。

174:名刺は切らしておりまして
11/01/23 14:41:21 V/oEySEq
>>172
それ辞書じゃなくて、知恵袋サイトじゃんw

175:名刺は切らしておりまして
11/01/24 01:07:21 joXGnMtg
>>169
名前に「達」が一字入ってるんだが
中の羊の横棒が一本少ない字だったんだよ
で、20年くらい前に役所から
「一般的に使われてる【達】にしていいですか?」
ってお伺いきたよ(東京都文京区)

電子化が早かった東京の方では、
そういうところ少なくないんじゃないの?

176:名刺は切らしておりまして
11/01/24 08:19:52 lL0Js7d6
「逹」の字か?
これはJIS第二水準にあるから20年前の役所のコンピュータなら
「達」に書き換えなくてもいいだろうに

177:名刺は切らしておりまして
11/01/25 00:02:48 ZH9BdBTg
まあ名前や地名は法律上問題になるからな。
すでに多くの異体字が電子的にも存在してしまっている。
いまさらこれを統合したら、過去のデータが見分けがつかなくなる。

178:名刺は切らしておりまして
11/01/25 21:31:25 ggO8x1Wm
>>177
>いまさらこれを統合したら、過去のデータが見分けがつかなくなる。
名前のデータに拡大常用漢字で、もっとも近い表現などのフィールドを
追加だな。

179:名刺は切らしておりまして
11/01/26 02:36:41 X/yfVtk5
>>176
うんにゃ。
二点しんにょうじゃなくって
一点しんにょうだった。


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch