09/03/03 22:09:24
U+1B000がKATAKANA LETTER ARCHAIC E(片仮名「衣」由来のア行の「エ」)になってた。
名前がORIGINAL E(元々の「エ」)からARCHAIC E(古代の「エ」)に変更されてた。
平仮名ヤ行の「え」と違ってBMP外になってしまうけどしょうがないか。
Historic KanaというブロックでU+1B000から256文字分予約されたけど今後変体仮名とか重要な昔の仮名をU+1B001以降にも追加していくつもりなのかな?
182:デフォルトの名無しさん
09/03/04 00:21:44
256で足りるのw?
そこら辺の文字はよく知らないけど512から1024くらいあってもいいような。
183:デフォルトの名無しさん
09/03/04 00:29:59
変体かなは良く分からないけど、ここのページを見る限り、平仮名だけでも軽く600以上ありそう。
URLリンク(www10.plala.or.jp)
184:デフォルトの名無しさん
09/03/04 12:43:59
住基仮名だけなら256で足りるがな。
185:デフォルトの名無しさん
09/03/05 07:38:01
1バイト目に文字種を表すもんだけいれて後は可変でよろしくやればいいと思った
最低2バイト~な感じで
186:デフォルトの名無しさん
09/03/05 17:50:02
欧米人にはそれが理解できんのですよ。
たとえば、”うまれつき目の見えないひと” を想像してみてください。
その人に「海は青い」という事を、いったいどうやって教えればいいのか。
そのひとには、赤も青も黄色も無いんです。色という概念が全く無いんです。
だから理解不可能です。
3次元の世界で生活している我々が4次元の世界を理解できないのと同じく
1文字1バイト圏で生活している欧米人には、1文字が2バイト、3バイトになるのが
理解できんのです。ヤツらにとってマルチバイト文化は4次元の世界なのです。
187:デフォルトの名無しさん
09/03/05 18:06:53
物理的に無理なのと一緒にされても。
188:デフォルトの名無しさん
09/03/05 19:19:15
文字コード総合の次スレはここでござるな? しからば過去スレを貼り。
【UTF8】文字コード変換【SJIS】
スレリンク(tech板)
文字コード統一スレ 1文字目
スレリンク(tech板)
文字コード総合スレ part2
スレリンク(tech板)
文字コード総合スレ part3
スレリンク(tech板)
189:デフォルトの名無しさん
09/03/05 20:24:38
>>185
いきなり可変でよろしくやってるのがUTF-8です。
190:デフォルトの名無しさん
09/03/05 21:44:14
>>184
たとえば「安」から「あ」へ連続的に変化していく過程の文字の数々にどうやって包摂規準を
設定するのか、とか考えると住基仮名のようなclosed setしかありえない気がする
191:デフォルトの名無しさん
09/03/07 02:01:46
変体でも「あ」なら「あ」なのだから、「あ」に対して異体字セレクタの対応を決めればいいだけなんじゃね?
256種類まで対応できるんだから、多分足りるでしょ。
足りなきゃ、異体字セレクタの方を増やせばいい。
192:デフォルトの名無しさん
09/03/07 14:29:53
U+E0100~U+E01EFは漢字専用じゃなかったっけ?
193:デフォルトの名無しさん
09/03/07 15:36:34
それよりアラビア文字みたいに前後の文字で字形を変えるのを
サポートする必要があるんじゃないか
194:デフォルトの名無しさん
09/03/07 19:27:11
・縦書き
・前後の状況で字形を変える必要がある
・異体字セレクタに対応が必要
それなんてモンゴル文字?
195:デフォルトの名無しさん
09/03/07 22:28:59
草書を標準化するところから始めないと…
196:デフォルトの名無しさん
09/03/08 11:10:41
アラビア文字がまさに草書の電子化
197:デフォルトの名無しさん
09/03/09 02:11:40
文字コード総合スレ part5
スレリンク(tech板)l50
作ってきた。
即死回避に、だれか頼む。
あと、テンプレがまだ(40行)残ってるので。現在連投規制(5回)で書き込めないのを何とかしないといけない。
198:デフォルトの名無しさん
09/03/09 02:23:53
●かえ
199:デフォルトの名無しさん
09/03/09 02:36:52
●持ってない
取り合えず見切り発車してくれ。
200:デフォルトの名無しさん
09/03/09 22:10:13
>>197
乙
どんだけ書けば即死回避するんだっけ
201:デフォルトの名無しさん
09/03/23 19:29:17
>>192
あれって漢字専用なの?
漢字とモンゴル文字以外の場合はU+FE00~FE0Fを使わないといかんの?