UnicodeとUTF-8の違いは?at TECH
UnicodeとUTF-8の違いは? - 暇つぶし2ch570:デフォルトの名無しさん
08/08/09 13:07:27
以下でOK?

・(文字集合としての)Unicode
扱う文字の一覧を定めて、識別用に符号をつけたもの。
「あ」=U+3042、「A」=U+0041・・・

・UTF-8
Unicodeの文字列を電子データとして扱う際の表現を定める「エンコーディング」の一つ。
あA(U+3042 U+0041)→E3 81 82 41

エンコーディングの他の例としてシフトJIS・UTF-16 BE・マイクロソフトのUnicode 等がある。
よってUnicodeとは
 1. 符号化文字集合の一つ
 2. 文字コードの規格
 3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい
の3つの意味があり、一方UTF-8は、エンコーディングの一つとしての意味しかない。

571:デフォルトの名無しさん
08/08/09 13:21:53
>>570
> よってUnicodeとは
>  1. 符号化文字集合の一つ

こんな使い方はない。

>  3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい

アホドキュメント、アホアプリは無視するのがいい。


572:デフォルトの名無しさん
08/08/09 13:24:33
×符号化文字集合
○文字集合
だよね?
MSは無視できないほど規模があるのが憎たらしくて困ったチャンなわけで。

573:デフォルトの名無しさん
08/08/09 13:39:23
「マイクロソフトの」と書いているが、
まともなドキュメントもあるわけで…
メモ帳の文字コード選択ウィンドウとかそういう部分的なことで、
>  3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい
を言葉の定義の一つに同列に並べてるのは馬鹿っぽいね。

574:デフォルトの名無しさん
08/08/09 13:42:08
>>573
メモ帳もUnicode/Unicode big endianだけど。

575:デフォルトの名無しさん
08/08/09 13:52:08
とりあえず「UTF-8にBOM」という意味がわからん表現はやめて欲しいもんだ

576:デフォルトの名無しさん
08/08/09 15:01:15
>  3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい
典拠は?

>>552だけ?
これってSQL Server 2005のドキュメントだよね?

577:デフォルトの名無しさん
08/08/09 15:32:53
>>576
Office XP リソース キット
Unicode サポートと多国語ドキュメント
URLリンク(msdn.microsoft.com)
>Unicode では、どの文字に対しても 2 バイトからなる固有のエンコードが割り振られます。


578:デフォルトの名無しさん
08/08/09 15:51:22
やっぱりアプリ屋はフレームワーク屋よりレベル低くなるね。
周辺技術の知識については。

579:デフォルトの名無しさん
08/08/09 16:21:00
抱き合わせ販売禁止

というのが文字コード氾濫を招いた。

最初からOSとセットで組まれていれば文字コードはマイクロソフトのやつがスタンダードになって
ユーザーはいくつものコードに悩まされることがなかった

580:デフォルトの名無しさん
08/08/09 23:37:35
Shift JISで悩まされてた人って多いんじゃないの?

581:デフォルトの名無しさん
08/08/10 02:42:19
>>572
「符号化文字集合」でいいのでは?
文字の集合を定義して、各文字に対して符号化表現(例:A=U+41)を規定してるから。

582:デフォルトの名無しさん
08/08/10 02:59:24
「符号化文字集合」の定義はJIS/ISOとW3C/IETFですら違うからどちらのつもりなのか
くらいはっきりさせろ

583:デフォルトの名無しさん
08/08/10 05:13:31
>>580
それで悩むのはUNIX屋だけ。

584:デフォルトの名無しさん
08/08/10 07:29:26
>>579
えーっとどこから突っ込めば?(笑)

つーか貧弱な16bitマシンで日本語とかやろうとしてShiftJISなんてもんをつくったとこからおかしくなってるよなぁ、いろいろと。

585:デフォルトの名無しさん
08/08/10 07:57:24
>>583
携帯メール入れるとどのプラットフォームも悩ましいのでは?

586:デフォルトの名無しさん
08/08/10 09:20:58
>>584
しかも、SJIS作ったの誰だ?って話だよな。

587:デフォルトの名無しさん
08/08/10 10:57:11
当時の状況を考えれば仕方ないかんじだろ
一文字16bitなんて贅沢の極み

588:デフォルトの名無しさん
08/08/10 12:24:15
贅沢の極み。と言ってた人が、
年金記録問題を予見できなかったんだろうな~。
氏名をカナで管理ってありえねーよ。


589:デフォルトの名無しさん
08/08/10 14:08:27
むしろカナしかないだろ

590:デフォルトの名無しさん
08/08/10 22:24:23
仮に漢字を使っていたとしてもやっぱり年金問題は起こっていたと思う。
略字正字の入力がずさんだとか、読み方分かんなくてうやむやにデータ入力するとか。


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch