文字コード総合スレ Part12at TECH文字コード総合スレ Part12 - 暇つぶし2ch■コピペモード□スレを通常表示□オプションモード□このスレッドのURL■項目テキスト232:デフォルトの名無しさん 19/03/15 14:05:00.83 SEjqglYP.net 漢数字の数字扱いまだ? 233:デフォルトの名無しさん 19/03/15 15:31:55.15 oAURdopD.net そして参とか陸とかまで数字扱いされて地獄へ 234:デフォルトの名無しさん 19/03/15 15:39:45.46 a2hOwysQ.net ソート順が萬>千>百>拾とかか 235:デフォルトの名無しさん 19/03/15 19:19:14.57 WyyrIOit.net Unicode 11の時点で十進法表記に基づく0-9相当の文字はNumeric扱いされてたようだから FF10..FF19は確かに漏れだな http://www.unicode.org/Public/11.0.0/ucd/auxiliary/WordBreakProperty.txt 236:デフォルトの名無しさん 19/03/15 19:36:37.30 t7/3/Ky+.net 正規表現ライブラリpcreは境界判定\bや英数字判定\wの判定方法をフラグPCRE_UCPで切り替えられるようになっている。 grepの-Pオプションはpcreを使うのだけど、境界判定\bが-Eオプションと違う動きになる。PCRE_UCPオプションを使ってビルドいないからだろうと思う。 次ページ最新レス表示レスジャンプ類似スレ一覧スレッドの検索話題のニュースおまかせリストオプションしおりを挟むスレッドに書込スレッドの一覧暇つぶし2ch