テキストエディタ総合 part8at MAC
テキストエディタ総合 part8 - 暇つぶし2ch223:名称未設定
09/03/11 18:58:00 bswrp0Lj0
>>221
UTF-8だな。
容量無制限のフリースペース借りてるし。

もう知ってるとは思うけど、UTF-8での日本語は基本的に3バイト。
代わりにアルファベットなどASCII文字は1バイト。
一方のUTF-16は基本的に全部2バイト。
ただしエンディアンが自由なんでその判定用に
2バイト頭にくっつく(Byte Oder Mark; BOM)。
UTF-8はビッグエンディアンだから基本的にBOMはいらないんだけど
ASCII文字が1バイトなせいで頭の悪いエディタでは判定に失敗することがままある。
で、UTF-16のBOMに相当する3バイトのBOMが
それを防ぐのに使えるもんだからBOMをくっつけることがあるんだね。

ASCII文字が1バイトだからタグとか英文が多ければUTF-16とは
あまり差が出ないと思うよ。


次ページ
続きを表示
1を表示
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch