09/03/11 18:58:00 bswrp0Lj0
>>221
UTF-8だな。
容量無制限のフリースペース借りてるし。
もう知ってるとは思うけど、UTF-8での日本語は基本的に3バイト。
代わりにアルファベットなどASCII文字は1バイト。
一方のUTF-16は基本的に全部2バイト。
ただしエンディアンが自由なんでその判定用に
2バイト頭にくっつく(Byte Oder Mark; BOM)。
UTF-8はビッグエンディアンだから基本的にBOMはいらないんだけど
ASCII文字が1バイトなせいで頭の悪いエディタでは判定に失敗することがままある。
で、UTF-16のBOMに相当する3バイトのBOMが
それを防ぐのに使えるもんだからBOMをくっつけることがあるんだね。
ASCII文字が1バイトだからタグとか英文が多ければUTF-16とは
あまり差が出ないと思うよ。