04/03/14 12:25
>>514
>正規表現の . がある。
>これは任意の1文字にマッチングする。
>ASCII の1文字は1バイト固定だが、
>UTF-8 の1文字は1バイトとは限らない。
なるほど、それは確かにそうです。
UTF-8でも無修正で完全対応とは行かない例の一つですね。
考えるまでもなく、「文字数」が意味を成している部分はことごとく
駄目になります。今の場合でも、1文字ではなく「任意の文字の列」
でいいなら、「a.*a」で行けると思います。つまり、1「文字」と
いう「文字数を数える行為」に失敗しているのが原因なのですね。