11/01/14 10:43:47
まず、2chの文字コードがShift_JISで特殊文字(unicode)がそのまま扱えない。
それで特殊文字は10進数の数値文字参照(>>5)に変換されて処理される。
だから「漢」だとそのまま2バイト文字として処理されるが、
「漢」の簡体字の「汉」だと「汉」として処理されるため、2ch的には8Bytes必要となる。
それで、特殊文字(Unicode)の中でもさらに特殊なものがあって、
たとえば「」(口偏に七。「叱」の異体字)は
JaneXenoで直接投稿すると「��」(16Bytes)として処理される。
「��」で一文字。
本当は「��」(および「��」)ではなくて
「𠮟」や「𠮟」で解釈されるのが正しいんだが、対応されてないことも多い。
この「」自体、Vista以降の対応のため、WindowsVistaやWindos7でないと読めない(XPだと無理だったと思う)。
詳しくは「サロゲートペア(代用対)」でググれ。