06/09/26 01:28:35 kiyFOg6D0
rァ これがあったら
☞ これはいらないな
知ってるか?(ちなみに以降は不正確な表現を含むので概要の理解程度に留めて欲しい)
EUCもShiftJISもJISも1~94区1~94点の区点コードで表せる文字の表を
コンピュータ上で取り扱うに当たって違った符号化の表現をしているにすぎない。
一部の文字こそ機種依存であるが、基本的には全部同じものなのだ。
変換式をかませば簡単に相互に変換ができる。
しかしUnicodeは違う。
文字の表自体が上記のものとは完全に別モノで、日中韓の漢字やその他各国語をごちゃまぜにしてある。
つまりEUCやShiftJISやJISとの間は式で変換することはできない。
このUnicodeをコンピュータ上で取り扱うに当たっての符号化としてはUTF-7、UTF-8、UTF-16などがある。
さらにコンピュータ上の数字はOSなどによってバイト順が入れ替わったりするので
同じUTF-16でもLE、BEという2種類のルールがある。