UnicodeとUTF-8の違いは? その2 at TECH
UnicodeとUTF-8の違いは? その2 - 暇つぶし2ch19:デフォルトの名無しさん
10/12/20 08:57:56
971 名前:デフォルトの名無しさん [sage]: 2010/05/24(月) 20:09:15
結局UnicodeとUTF-8の違いは何なのでしょうか。
符号化文字集合Unicodeにも各文字に符号が振られているのに
さらにUTF-8が符号化方式とかわけわかりません。


972 名前:デフォルトの名無しさん [sage]: 2010/05/24(月) 20:15:38
Unicodeは文字に番号を振っているだけ。ビットもバイトも関係ない。
そのUnicode番号を、バイト(正確にはオクテット)データの連続として
表現する方法の一つがUTF-8。


973 名前:デフォルトの名無しさん [sage]: 2010/05/24(月) 22:06:07
Unicode: 単なる「文字の表」で、あいうえお表のようなもの。
      便利にするために、文字ごとに番号がついてあるけど、
      その番号はコンピュータ上のデータとは何ら関係がない。単なる整理番号。

UTF-8, UTF-16など: Unicodeの表にある文字をコンピュータ上で表現したいとき、
      どういう手順で表せばいいかを定めた「決まりごと」。
      Unicode表の文字をコンピュータ上のデータに変換する規則、
      コンピュータ上のデータをUnicode表の文字に変換する規則が定められている。

Unicode系の規格では「文字の表」と「決まりごと」が一組そろってはじめて、文字とデータの対応付けができる。
ASCIIコードでは、表と決まりごとの区別はあんまり明確じゃない。

Shift_JIS, iso-2022-jp, euc-jpは全部「決まりごと」で、やっぱり「文字の表」がないと意味をなさない。
そいつらはUnicode表じゃなくて、JISコードって表のための決まりごと。


次ページ
続きを表示
1を表示
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch