20/09/05 15:41:23.97 dAk5cbFF.net
お題
UTF-8 は以下のように、先頭ニブル・4ビットで、1~4バイト文字を判別しています。
この法則を使って、この文字列のバイト数を求めよ
あaθ💀xΩ死🄫
1バイト文字: 0000~0111: 0~7
多バイト文字の2バイト目以降
1000~1011: 8~11(8~B)
2バイト文字: 1100~1101: 12~13(C~D)
3バイト文字: 1110: 14(E)
4バイト文字: 1111: 15(F)
Unicode
URLリンク(seiai.ed.jp)