23/07/23 16:14:08.28 BnGP1dsy.net
その点は賛否あるだろうけど技術力もモチベも高そうな方だから期待してる
825:デフォルトの名無しさん
23/07/24 12:53:06.11 LBGWnldn.net
> 全角->半角変換 や >>785 の置換に対応
正規表現の中での表記はどういう仕様にするのがベストなのかな?
新しい予約語(?)の予感
826:デフォルトの名無しさん
23/07/25 00:28:01.42 ijwgoKNu.net
「正規表現には方言がある」
エディターを乗り換えた時に初めて気付かされたな
827:デフォルトの名無しさん
23/07/25 01:58:51.32 DaPN/KaH.net
\1(sed系)なのか、$1(perl系)なのかは、最初はいつも逆をやってしまう
828:デフォルトの名無しさん
23/07/25 02:10:59.59 m8SWwEXi.net
\1ってあちこちにあるものだったのか
EmEditorってエディタがそれでなんだこれって思ってた
829:デフォルトの名無しさん
23/07/25 16:23:19.14 hmH9EM9U.net
Onigumoで検索して気持ち悪くなる定期
830:デフォルトの名無しさん
23/07/29 20:32:41.26 xNvNUPTs.net
詳説正規表現の1章だけとりあえず読み終えたけど正規表現の使いどころがわからない
正規表現の便利な使い方教えて!
831:デフォルトの名無しさん
23/07/29 21:44:23.17 slvWQQxm.net
>>813
^(?=.*正規表現)(?=.*教えて)
832:デフォルトの名無しさん
23/07/29 21:46:27.76 slvWQQxm.net
>>813
途中で送信しちゃった
↓を専ブラのNGwordに入れて正規表現にチェックしてみ
^(?=.*正規表現)(?=.*教えて).*$
833:デフォルトの名無しさん
23/07/29 21:49:39.05 slvWQQxm.net
>>813
すまん間違えてたこれ
(?s:(?=.*正規表現)(?=.*教えて)).*$
834:デフォルトの名無しさん
23/07/29 21:51:07.45 Z2bzRt4C.net
俺のレス消えちゃうんじゃない?
?=がよくわからないけど後で調べとくよ
835:デフォルトの名無しさん
23/07/30 10:33:11.68 3uyXLeeN.net
テキストエディタで置換を行うときに「正規表現」と「選択範囲」をオン
検索: ^
置換: #
選択範囲の全ての行をコメントアウト出来て便利
--------------------------------------------------------
検索: [ \t]+$
置換: (なし)
行末の余計なスペースを削除出来て便利
836:デフォルトの名無しさん
23/08/12 18:48:03.89 g9Iw6FTW.net
URLリンク(hoge.com) URLリンク(fuga.net) URLリンク(moga.com)
の用に1行に複数URLがスペース区切りで記載されているものを、それぞれ単独で抜き出したいです。
https?://(?:[!-~]+.)+[!-~]+
だと最長一致になってしまうようで、1行丸ごと対象になってしまます
最短一致出来ればいいと思うのですが、どう正規表現を弄ればいいか教えてください。
837:デフォルトの名無しさん
23/08/12 18:56:16.40 IKZkjZuG.net
http[^\s]+
838:デフォルトの名無しさん
23/08/12 19:02:22.92 BmgakVsI.net
>>819
.をエスケープ
839:デフォルトの名無しさん
23/08/12 19:14:06.14 g9Iw6FTW.net
>>820
>>821
うぉぉ、ありがとうございました!
840:デフォルトの名無しさん
23/08/13 14:38:57.47 vv6Q6LsS.net
突然大きな声で叫ぶな
841:デフォルトの名無しさん
23/08/20 13:26:03.91 tG3c9Vi+.net
perl 正規表現で一発変換できませんか
"aaa \"bbb\" \"ccc\" ddd" # これを以下にしたい
aaa "bbb" "ccc" ddd
842:デフォルトの名無しさん
23/08/20 13:58:40.55 vZ93TkLb.net
正規表現で
my $s = '"aaa \"bbb\" \"ccc\" ddd"';
$s =~ s/(.*)/eval $s/e;
正規表現を使わずに
my $x = eval '"aaa \"bbb\" \"ccc\" ddd"';
843:デフォルトの名無しさん
23/08/20 14:00:17.67 vZ93TkLb.net
>>825
$s =~ s/(.*)/eval $s/e;
↓
$s =~ s/(.*)/eval $1/e;
844:0824
23/08/20 20:08:57.65 tG3c9Vi+.net
文字列をevalで再度評価させる
ありがとうございます、勉強になります
ただ文字列にシングルクォートはありません
文字列に2つのパターンがあります
hogehoge "aaa bbb ccc ddd"
hogehoge "aaa \"bbb \"ccc ddd"
s/hogehoge\s+"(.+)".*\n/$1/; # で弾いて
tr/\\//d; # 2回処理しています
845:デフォルトの名無しさん
23/08/20 20:26:08.36 vZ93TkLb.net
単純に
s/\\//g
でええんとちゃうん
846:0824
23/08/20 20:59:59.16 tG3c9Vi+.net
>>828
2回処理するのでindexで調べてtr使った方が早いでしょ
hogehoge "aaa bbb ccc ddd"
hogehoge "eee \"fff\" \"ggg\" hhh"
目的文字列
aaa bbb ccc ddd
eee "fff" "ggg" hhh
847:デフォルトの名無しさん
23/08/20 21:32:41.19 vZ93TkLb.net
一発変換したいんじゃないの?
s/hogehoge\s+(.+)/eval $1/e
848:0824
23/08/20 21:58:11.37 tG3c9Vi+.net
>>830
ありがとうございます
s/hogehoge\s+"(.+)".*\n/$1/;
これで弾いてるの"以後にコメントがあるかもしれないからです
849:デフォルトの名無しさん
23/08/21 20:43:15.01 Lyi1TDoI.net
eval思い付く人すごい、甲子園優勝
850:デフォルトの名無しさん
23/08/21 23:39:46.20 Frb3PbHb.net
>>824
これはUnix名前空間の全引数を" "で括ったものをほどくだけに見えるので、例えばLinux上では
文字列変換ではなく、printfコマンドを通せば一発だが。
$ printf '%s' "aaa \"bbb\" \"ccc\" ddd"
# aaa "bbb" "ccc" ddd
851:デフォルトの名無しさん
23/08/21 23:52:08.69 Frb3PbHb.net
見落としてたので補足しておくと、>>831のコメントの件もUnixの書式に則ったものなら大丈夫。
$ printf '%s' "aaa \"bbb\" \"ccc\" ddd" # ←のようにコメントがあっても、↓になる
# aaa "bbb" "ccc" ddd
852:デフォルトの名無しさん
23/08/22 01:30:15.60 RW2iO7Jr.net
>>perl 正規表現で一発変換できませんか
まあ参考にはなるけど質問の条件無視してドヤ顔で語られてもねえ‥
853:デフォルトの名無しさん
23/08/22 02:16:49.08 NJ9SPgik.net
>>833
単にシェルが引数処理してるだけじゃん
これで十分だろ
echo "aaa \"bbb\" \"ccc\" ddd" #
854:デフォルトの名無しさん
23/08/22 12:38:02.82 NJ9SPgik.net
>>831
(perlの)コメントがあっても動作するよ
855:0824
23/08/23 09:58:00.37 yShv/GWA.net
>>837
ありがとうございます、勘違いしてました
eval評価だからコメントあっても行けますね
856:デフォルトの名無しさん
23/09/02 20:40:48.54 PozNjemk.net
●Regular Expressionの使用環境
Lua
●検索か置換か?
検索
●説明
IPアドレス部分だけ抽出したいです
各セグメントが1-255の範囲内かどうかのチェックは無くてもOKです
※対象データの内xは文字としてのアルファベットのxです
\r\nは改行コードです
よろしく�
857:ィ願いします ●対象データ x\r\n192.168.10.1\r\n0\r\n\r\n ●希望する結果 192.168.10.1
858:デフォルトの名無しさん
23/09/02 22:43:12.64 JbZUXP6Y.net
(%d+%.%d+%.%d+%.%d+)
859:839
23/09/03 01:48:07.24 BSGxD5eG.net
ありがとうございました
860:デフォルトの名無しさん
23/09/03 01:50:43.78 BSGxD5eG.net
●Regular Expressionの使用環境
Lua
●検索か置換か?
検索
●説明
コロンとスペースの右側の数字だけ抽出したいです
よろしくお願いします
●対象データ
abe-gkm: 12
●希望する結果
12
861:デフォルトの名無しさん
23/09/03 06:04:52.16 ldBVlws1.net
自分で覚える気は一切ないんですね
862:デフォルトの名無しさん
23/09/03 14:44:19.10 QHfhMJE9.net
LUA5.1リファレンスマニュアル 文字列操作
URLリンク(milkpot.sakura.ne.jp)
863:デフォルトの名無しさん
23/09/03 17:01:33.87 7kfz6vsc.net
訂正がありました
よろしくお願いします
●Regular Expressionの使用環境
Lua
●検索か置換か?
検索
●説明
最後に現れるコロンの右側だけ抽出したいです
●対象データ
ab:e-gkm: 12
●希望する結果
12
864:デフォルトの名無しさん
23/09/03 17:20:26.33 ruPOb/mk.net
訂正がありました
よろしくお願いします
●Regular Expressionの使用環境
Lua
●検索か置換か?
検索
●説明
最後に現れるコロンの右側だけ抽出したいです
●対象データ
ab:e-gkm: ::12
●希望する結果
12
865:845 ◆06.HT2D93O4J
23/09/03 17:22:38.45 7kfz6vsc.net
>>846は別の人なのでトリップを付けておきます
よろしくお願いします
866:デフォルトの名無しさん
23/09/03 17:42:25.87 ruPOb/mk.net
訂正がありました
よろしくお願いします
●Regular Expressionの使用環境
Lua
●検索か置換か?
検索
●説明
最後に現れるコロンの右側だけ抽出したいです
●対象データ
ab:e-gkm: 121212
●希望する結果
12
867:デフォルトの名無しさん
23/09/04 00:12:22.18 SsZQexqW.net
>>843-844
>>846-848
夏休みキッズ達よ、答えられないor嫌なら見なければいい
>>845
[^: ]*$
868:デフォルトの名無しさん
23/09/04 13:01:20.01 c5K3sEzk.net
Excelの文字を取り出すLEFT関数、RIGHT関数、MID関数
正規表現でも相当がんばれば再現できなくはないけれど、努力に見合った意味が見つからない
869:デフォルトの名無しさん
23/09/04 13:08:00.64 nyO3ndTW.net
>[^: ]*$
こういうの後ろから見るよう最適化されるのかな
870:デフォルトの名無しさん
23/09/04 15:41:22.66 zA8RUwS0.net
ややこしい検索は正規表現だけよりも
awkなどで簡単な正規表現とif文や関数を組み合わせる方が早い
871:デフォルトの名無しさん
23/09/04 18:55:45.65 BoKCZaYW.net
今回のはややこしくはない
むしろ簡単
872:デフォルトの名無しさん
23/09/04 19:08:28.07 8gjbapjk.net
>>849
アホらしすぎて・・・
873:デフォルトの名無しさん
23/09/04 20:45:35.27 DgpCgO2R.net
>>854
相手の技量は千差万別
自分を基準に考えるからキッズなんだ
たとえそれがHello World!レベルであったとしても
テンプレ使ってちゃんと質問されているのだから
874:デフォルトの名無しさん
23/09/04 20:55:42.10 Tkae+foX.net
>>855
気に入らないレスに絡んでるのは貴方も同じ
嫌なら見るな
875:デフォルトの名無しさん
23/09/04 20:58:59.14 DgpCgO2R.net
>>856
気に入る気に入らないじゃなくて
スレを荒らさないで欲しいって事
876:デフォルトの名無しさん
23/09/04 21:05:24.79 NKgrLrxG.net
訂正がありました
よろしくお願いします
●Regular Expressionの使用環境
Lua
●検索か置換か?
検索
●説明
最後に現れるコロンの右側だけ抽出したいです
●対象データ
ab:e-gkm: 33
●希望する結果
12
877:845 ◆06.HT2D93O4J
23/09/04 21:07:00.10 3GWjSEvz.net
>>849
ありがとうございました
878:デフォルトの名無しさん
23/09/04 21:16:52.45 NTqFdCv7.net
自演荒らしが捗るなw
879:デフォルトの名無しさん
23/09/04 22:23:04.68 0+pR+e5l.net
コロンが無い場合はマッチでよかったのかな?
>>851
されない
right to leftにするオプションが必要
対象文字列が短ければ大差ない
880:デフォルトの名無しさん
23/09/06 02:59:30.44 lSkku4oe.net
インフラ屋は性格良い
プログラマは性格悪い
881:デフォルトの名無しさん
23/09/06 07:21:34.46 yobQfJn+.net
俺はインフラ屋
性格良いよ
882:デフォルトの名無しさん
23/09/06 09:14:00.91 UTcPybKQ.net
プログラマは正確悪いというより
無駄な事をしたくないだけっていう人が多い
883:デフォルトの名無しさん
23/09/06 09:1
884:8:47.39 ID:BQBp+rCO.net
885:デフォルトの名無しさん
23/09/06 09:44:01.14 HD7oM5sP.net
態度と性格を区別できない人々
886:デフォルトの名無しさん
23/09/06 09:45:30.51 Ygn1Ao5e.net
>>866
能書きだけはいっちょまえ
887:デフォルトの名無しさん
23/09/06 09:57:30.15 tVigPql1.net
それがプログラマの性分
888:デフォルトの名無しさん
23/09/08 08:44:01.58 07e9DMWQ.net
ぼくはインフラ屋だけど性格悪い(´・ω・`)すまんね
889:デフォルトの名無しさん
23/09/11 00:45:50.96 cvO0nzmM.net
●Regular Expressionの使用環境
サクラエディタ
●検索か置換か?
検索
●説明
REM半角スペースを検索してREM部分のみに一致させたい
●対象データ
REM TEST
●希望する結果
REM
890:870
23/09/11 00:53:10.22 cvO0nzmM.net
/REM(?= )/kで出来ました
891:デフォルトの名無しさん
23/09/13 16:39:29.09 qhl2oEPa.net
●Regular Expressionの使用環境
javascript
●検索か置換か?
検索
●説明
( ) 括弧の中の文字列の特定の文字の時だけ一致させたいです
例でいえば括弧の中が「横浜」の時だけヒットさせたいです
●対象データ
東京都(ただし新宿区は除く)に住みたいけれど、神奈川県(だけど横浜は家賃が)でもいい
●希望する結果
だけど横浜は家賃が
892:デフォルトの名無しさん
23/09/13 16:41:17.76 qhl2oEPa.net
ごめんなさい872の追記です
括弧は半角全角どちらでも対応できるようにしていただけると助かります
893:デフォルトの名無しさん
23/09/13 18:37:54.95 3qYEVVGq.net
>>872
[((]\K[^))]*横浜[^))]*+(?=[))])
894:デフォルトの名無しさん
23/09/13 20:55:54.73 T8/GYmvT.net
対象データがそれだけきれいに整っているならこれでいいんじゃないかな
[^()()]*横浜[^()()]*(?=[))])
895:デフォルトの名無しさん
23/09/13 21:32:58.14 qhl2oEPa.net
>>874-875
ありがとうございます。875さんの方でプログラムがパーフェクトに動くものが叶いました。
896:デフォルトの名無しさん
23/09/14 00:22:01.99 L47o5ku7.net
鬼車は結局Unicode15対応版がリリースされなかったな
897:デフォルトの名無しさん
23/09/16 22:56:08.84 dIGSEJlt.net
同じワードの繰り返し(回数指定)を除外する正規表現を教えてください
898:デフォルトの名無しさん
23/09/17 07:04:17.16 jNYPDoV+.net
除外??
899:デフォルトの名無しさん
23/09/17 10:23:51.82 ht+84nM7.net
こういうこと?
abcxyzacz → bxy
900:デフォルトの名無しさん
23/09/17 14:29:52.53 yn1jo0MJ.net
"にゃんたま"が3回以上登場する文字列から全ての"にゃんたま"を取り除く
\A(?=(?:(?:(?!にゃんたま)[\s\S])*にゃんたま){3})((?:(?!にゃんたま)[\s\S])*)にゃんたま|\G((?:(?!にゃんたま)[\s\S])*)にゃんたま
901:デフォルトの名無しさん
23/09/17 14:33:30.19 yn1jo0MJ.net
置換後の文字列: $1$2
902:デフォルトの名無しさん
23/09/17 15:23:07.94 yn1jo0MJ.net
スマン、\Gの前に(?!\A)を置いてくれ
903:デフォルトの名無しさん
23/09/17 16:53:03.56 oNTID2ix.net
3回連続して出現する単語を削除
//javascript
s = '鼠牛虎兎龍蛇ねこねこねこ牛牛牛虎虎蛇蛇蛇蛇蛇龍龍兎';
console.log(s.replace(/(?:(.+)\1{2})/g, ''));
#python
s = '鼠牛虎兎龍蛇ねこねこねこ牛牛牛虎虎蛇蛇蛇蛇蛇龍龍兎'
print(re.sub(r'(?:(.+)\1{2})', '', s))
904:デフォルトの名無しさん
23/09/17 17:05:16.38 Fm9hMrUa.net
\nを30回以上は非表示するにはどうしたらいいですか
905:デフォルトの名無しさん
23/09/17 17:18:53.47 jNYPDoV+.net
非表示??
906:デフォルトの名無しさん
23/09/17 17:41:10.52 PjfamyxI.net
\nがn回以上除外で
907:デフォルトの名無しさん
23/09/17 22:51:45.08 jyrM2LRG.net
●Regular Expressionの使用環境
Perl
●検索か置換か?
検索
●説明
後ろから2つ目の/以降を取得したい
●対象データ
/a/bb/ccc/dddd/eeeee/cgi/sample.cgi
●希望する結果
/cgi/sample.cgi
お願いします
908:デフォルトの名無しさん
23/09/18 01:07:38.93 e1xt8o+y.net
.*\K/.*/.*
909:デフォルトの名無しさん
23/09/23 15:35:56.62 UU1JiicL.net
何回連続とか何番目とかってのは正規表現じゃなくて言語でなんとかした方がいいのでは
可読性的な観点からでも
910:デフォルトの名無しさん
23/09/25 14:32:09.00 w/fMdm7Q.net
正規表現じゃなく言語表現をなんとかした方がいい
911:デフォルトの名無しさん
23/09/25 15:45:13.07 b6Bm13IE.net
正規表現じゃなく性器表現とした方がいい
912:デフォルトの名無しさん
23/09/25 15:46:57.59 b6Bm13IE.net
正規表現じゃなく性器表現とかなんとかにした方がいい
913:デフォルトの名無しさん
23/09/26 17:43:27.65 WhLFttTP.net
添削って受け付けてたっけ?
自分が求める結果は得られてるけど、それでいいのかどうか
914:デフォルトの名無しさん
23/10/03 15:05:59.66 pjWozC8L.net
>>894
You ここで見せちゃいなよ、meが見てあげるよ
915:デフォルトの名無しさん
23/10/15 05:59:22.52 qeiyy+lM.net
oniguruma Release 6.9.9
Update Unicode version 15.1.0
NEW API: ONIG_OPTION_MATCH_WHOLE_STRING
Fixed: (?I) option was not enabled for character classes (Issue #264).
Changed specification to check for incorrect POSIX bracket (Issue #253).
Changed [[:punct:]] in Unicode encodings to be compatible with POSIX definition. (Issue #268)
Fixed: ONIG_OPTION_FIND_LONGEST behavior
> ONIG_OPTION_MATCH_WHOLE_STRING マッチした終端の位置がendになることを要求
マッチした開始の位置はstartでなくても良いらしい
oniguruma/test/test_options.c
x2(ONIG_OPTION_MATCH_WHOLE_STRING, "a", "aaaa", 3, 4); // OK (4文字目のaにマッチ)
> [[:punct:]]
Changed the definition of [:punct:] in Unicode encodings from \p{P} to \p{PosixPunct} = \p{P} + \p{S}.
(PosixPunct is a new addition.)
916:デフォルトの名無しさん
23/10/15 06:13:36.53 qeiyy+lM.net
> Fixed: ONIG_OPTION_FIND_LONGEST behavior
oniguruma/test/test_options.c
x2(ONIG_OPTION_FIND_LONGEST, "a(b|bc)", "ab", 0, 2); // OK ( "ab" にマッチ)
最左最長一致からガチ最長一致になってる
917:デフォルトの名無しさん
23/10/15 06:27:13.95 qeiyy+lM.net
間違えた、こっちだった
oniguruma/test/test_options.c
x2(ONIG_OPTION_FIND_LONGEST, "a(b|bc)", "abc", 0, 3); // OK ( "abc" にマッチ)
// マルチバイト文字には非対応のまま
x2(ONIG_OPTION_FIND_LONGEST, "ab|あ", "abあ", 2, 5); // OK ( "あ" にマッチ)
UTF-32 にエンコードしてから使えばいいのかしら
918:デフォルトの名無しさん
23/10/20 08:36:56.63 S3IcPVBq.net
Strawberry Perl
URLリンク(strawberryperl.com)
32bit版が出なくなった。64bitに乗り換えよう。(全銀)
919:デフォルトの名無しさん
23/10/20 16:11:58.36 8kCGh912.net
>>899
ZIP edition が無い…
920:デフォルトの名無しさん
23/10/21 14:33:23.21 43n7K7Fq.net
tar.gzで我慢しなさい
921:デフォルトの名無しさん
23/10/29 10:19:38.81 zDgIETfO.net
アルファベットのみにマッチする文字クラスを[a-Z]と書けない
ASCIIコード表を決めた人達は今頃失敗したと思ってるんだろうか
922:デフォルトの名無しさん
23/10/29 12:34:50.74 vOjtdftv.net
初心者向けクイズ
Q: /w にマッチするアルファベット以外の文字がひとつあります。その文字とは、一体何でしょうか?
923:デフォルトの名無しさん
23/10/29 12:42:28.97 BaFdPLsN.net
アンダースコート
924:デフォルトの名無しさん
23/10/29 12:45:28.88 zDgIETfO.net
アンダースロー
925:デフォルトの名無しさん
23/10/29 13:20:31.22 y5KdwCim.net
アンダーニンジャ
926:デフォルトの名無しさん
23/10/29 15:41:31.84 zDgIETfO.net
ニンジャリバンバン
927:デフォルトの名無しさん
23/10/29 19:20:26.89 dO2GnsiA.net
正解はスラッシュでした
928:デフォルトの名無しさん
23/10/29 19:49:37.09 zDgIETfO.net
(/w\)
929:デフォルトの名無しさん
23/10/30 20:06:53.46 wzEyUd/K.net
ASCIIコード表について調べてみたら特定の1ビットを0にするか1にするかで
大文字小文字が変換出来るようにするための順番らしい
並びの便利さより処理効率が優先されてた、先人の知恵に敬礼
930:デフォルトの名無しさん
23/10/30 20:59:27.53 dhg2pdyL.net
どうせ範囲チェックはしないといけないんだから
それだったら引き算や足し算で大文字小文字変換できちゃう
まあ昔はbit演算より算術演算にステップ数が掛かってたからその当時は良かったんだろうけど
931:デフォルトの名無しさん
23/10/31 18:36:44.19 X00tNW2d.net
今時のマシンのことしか考えなくていいなら足し引きで良さそうだけど
遅いマシンのことまで考えるならビット演算一択になるんだろうな
アルファベットが32文字だったら隙間出来なかったのに
SHIFT_JISのダメ文字問題も最初からEUC-JPにしとけば苦労しなかったのにな
932:デフォルトの名無しさん
23/10/31 21:57:53.63 27STA2Pg.net
正規表現は改行の扱いが難しいなあ
やらかすときはたいてい改行の処理でミスる
933:デフォルトの名無しさん
23/11/01 09:19:33.19 DBguvWIQ.net
. が改行にマッチしないのを失念してってのは何度もやってる
934:デフォルトの名無しさん
23/11/01 11:38:27.61 ikHnu6pN.net
●Regular Expressionの使用環境
サクラエディタ(bregoing.dll Ver4.20 with Onigmo 6.2.0)
●検索か置換か?
検索
●説明
キムラタクヤの略称を検索するために
(キムラ)と(タクヤ)からそれぞれ1字以上使って並べた単語にマッチする正規表現を作りました
^(キ|ム|ラ|キム|ムラ|キラ|キムラ)(タ|ク|ヤ|タク|クヤ|タヤ|タクヤ)$
文字数や単語数が増えたときひどいのでもっと上手な書き方を教えてください
●マッチする文字列
キク
キラク
ムラタヤ
●マッチさせない文字列
キム
キムラ
タクヤ
935:デフォルトの名無しさん
23/11/01 11:38:37.53 ikHnu6pN.net
●Regular Expressionの使用環境
サクラエディタ(bregoing.dll Ver4.20 with Onigmo 6.2.0)
●検索か置換か?
検索
●説明
キムラタクヤの略称を検索するために
(キムラ)と(タクヤ)からそれぞれ1字以上使って並べた単語にマッチする正規表現を作りました
^(キ|ム|ラ|キム|ムラ|キラ|キムラ)(タ|ク|ヤ|タク|クヤ|タヤ|タクヤ)$
文字数や単語数が増えたときひどいのでもっと上手な書き方を教えてください
●マッチする文字列
キク
キラク
ムラタヤ
●マッチさせない文字列
キム
キムラ
タクヤ
936:デフォルトの名無しさん
23/11/01 12:08:10.81 oh2mJ3WA.net
^(?:キ?ム?ラ?)(?<=\S)(?=\S)(?:タ?ク?ヤ?)$
937:デフォルトの名無しさん
23/11/01 14:40:34.08 DBguvWIQ.net
同じ人かは分からないけど超優秀な回答者がここ1,2年前から来てくれてる
多くの閲覧者にとっても勉強になるからありたがいことです
938:デフォルトの名無しさん
23/11/01 16:00:59.53 G1jsC9Xy.net
じつはその人AIだよ
939:デフォルトの名無しさん
23/11/01 17:01:21.99 ikHnu6pN.net
>>917
ありがとうございます動きました
3語以上の場合はこれでできてますか?
^(?:キ?ム?)(?<=\S)(?=\S{2})((?:ラ?タ?)(?<=\S{2})(?=\S)(?:ク?ヤ?))$
940:デフォルトの名無しさん
23/11/01 17:03:51.95 DBguvWIQ.net
AIと言われても違和感が無いから困る、人間だったほうがいい
サクラエディタを少し触ってみたが
\r を \c-
\n を \c*
に書き換えてもマッチした
このことは恐らくbregoing.dllの作者氏でも知らないのでは
941:デフォルトの名無しさん
23/11/01 18:26:59.70 upaRAmPk.net
>>920
キムクヤにマッチするから駄目だね
>>916のように自分で組み合わせを展開する以外の方法はわからないね
942:デフォルトの名無しさん
23/11/01 21:03:12.97 bvA/YDb8.net
最後で語数チェックすれば?
(?<=\S{3})$
943:デフォルトの名無しさん
23/11/01 22:35:57.76 8ROMQdip.net
^(キ?ム?ラ?)(タ?ク?ヤ?)$(?!\1|\2)
^(キ?ム?)(ラ?タ?)(ク?ヤ?)$(?!\1)(?!\2)(?!\3)
^(キ?ム?)(?!.*+$\k<-1>)(ラ?タ?)(?!.*+$\k<-1>)(ク?ヤ?)(?!.*+$\k<-1>)$
^(?=(.++))(?:キ?ム?)(?!\k<-1>)(?=(.++))(?:ラ?タ?)(?!\k<-1>)(?=(.++))(?:ク?ヤ?)(?!\k<-1>)$
944:デフォルトの名無しさん
23/11/02 08:03:41.39 ztJD977Y.net
文字数も単語数も拡張性もばっちりです
ご指導ありがとうございました
945:デフォルトの名無しさん
23/11/02 09:18:56.98 /CeYlFrx.net
> $(?!\1|\2)
これもすごい、こんなの思い付かない
私なら(?(1))を使おうとしてグチャる
こういうのを作れる人になりたかった、羨ましい限りだ
946:デフォルトの名無しさん
23/11/02 09:22:55.91 kxWwWLf8.net
>>910
アルファベットが32文字だったら誰も困らなかったはず
947:デフォルトの名無しさん
23/11/02 11:56:22.72 YMFW9tw8.net
各文字列から最低2文字以上含まれてる略称にだけマッチすることもできる?
948:デフォルトの名無しさん
23/11/02 13:01:27.99 eLjTHeK1.net
^(?=.(.++))(?:キ?ム?ラ?)(?!.?\k<-1>)(?=.(.++))(?:タ?ク?ヤ?)(?!.?\k<-1>)$
^(?=.{1}(.++))(?:キ?ム?ラ?)(?!.{0,1}\k<-1>)(?=.{1}(.++))(?:タ?ク?ヤ?)(?!.{0,1}\k<-1>)$
949:デフォルトの名無しさん
23/11/02 19:36:53.03 /CeYlFrx.net
ラノベ 「1日でキムタクの一般項が出来てるからパソコンそっと閉じて見なかったことにする」
950:デフォルトの名無しさん
23/11/03 08:34:37.96 cY7DSC5H.net
^[キムラ]{1,2}[タクヤ]{1,2}$
951:デフォルトの名無しさん
23/11/03 09:08:43.70 PqFUo1lf.net
それはラキクタにマッチするからボツ(==.)
952:デフォルトの名無しさん
23/11/03 10:43:13.94 cY7DSC5H.net
ラキクタにマッチしたらダメって条件にはないんだけど‥
953:デフォルトの名無しさん
23/11/03 11:44:22.65 PqFUo1lf.net
確かに言葉ではそんな条件は書いてないね、曖昧3cm
954:デフォルトの名無しさん
23/11/03 11:50:18.95 zxzLPr4V.net
^?キ?ム?ラ?タ?クヤ?$が略称条件な流れ?
955:デフォルトの名無しさん
23/11/03 12:14:21.11 sAJhyk0D.net
^(?=A)(?=B).*$
956:デフォルトの名無しさん
23/11/03 12:18:03.55 PqFUo1lf.net
>>916を読めば文字順通りと受け取るのが妥当だね
ちなみにもしこのコマンドがあったら簡単に書けた
URLリンク(www.proxomitron.info)
^(キ?ム?ラ?)$TST(\1=..+)(タ?ク?ヤ?)$TST(\2=..+)$
perlなら(??{code})でこのコマンドと同じことが出来るけどサクラエディタのdllでは無理
dllに$SETと$TSTが実装されたら正規表現の幅がめっちゃ広がるけど無理そう
// \1 に日本語表記での色が代入される
blue$SET(1=青)|yellow$SET(1=黄)|red$SET(1=赤)
957:デフォルトの名無しさん
23/11/03 13:00:30.59 RnAsJxc7.net
>>924
^(?=(キ?ム?ラ?)(タ?ク?ヤ?)$)[キムラ]{1,}[タクヤ]{1,}$
(?=(キ?ム?ラ?)(タ?ク?ヤ?)(.*+))[キムラ]{1,}[タクヤ]{1,}(?=\3)
キキムタククク
958:デフォルトの名無しさん
23/11/03 18:04:12.94 328LomOy.net
キムラタクヤ人気で🌿
959:デフォルトの名無しさん
23/11/03 19:14:55.49 3J2AA+3k.net
>>937
他人には厳しい条件はたすくせに外部コマンドやperl使うのはokなのかw
960:デフォルトの名無しさん
23/11/03 20:09:52.31 PqFUo1lf.net
知ってる外部コマンドは使っていいに決まってる
頭の中では質問見た瞬間に出来てたよ
961:デフォルトの名無しさん
23/11/03 20:13:40.11 /gQFYHMn.net
「課す」を「はたす」って読んでるってマ?🤣
962:デフォルトの名無しさん
23/11/03 21:12:42.60 PqFUo1lf.net
この外部コマンドを考えた方は2004年に亡くなっている
URLリンク(en.wikipedia.org)
20年前にこのコマンドを実装済みだったのはやばいな
perlの正規表現ですらそんなに機能が無かった時代だ
963:デフォルトの名無しさん
23/11/03 21:17:14.08 N1OKG/2k.net
最初から略称と言ってるのに文字順不問だと思うほうがどうかしてる
964:デフォルトの名無しさん
23/11/04 08:36:40.13 w1sIftMp.net
(正直|ぶっちゃけぇ?)高度すぎて理解が追いつかない
965:デフォルトの名無しさん
23/11/04 11:16:01.85 PZuBSK2Q.net
カラクリを簡単に説明しよう
1、 (?:キ?ム?ラ?) で文字順を固定
2、 その他の部分でカッコ内でマッチする文字数の制限をかけている
例、 (?:キ?ム?ラ?) が0文字にマッチしたとしよう
\1が捕獲した中身は0文字に
966:なる (?!\1) の\1の中身が0文字だったら (?!\1) は (?!) と同じ動作になる (?!) は常にマッチを失敗させるから\1が0文字ならマッチ出来ない 結果的にこれが文字数制限になっている ちなみに正規表現にカウント機能があればもっと簡単に書けていた ( (?:キ$COUNT(x))? (?:ム$COUNT(x))? (?:ラ$COUNT(x))? ) $COUNT(0<x) perlは(?{code})でカウント可能、鬼車もカウント機能を実装済
967:デフォルトの名無しさん
23/11/04 14:47:51.87 Xn6+uSVd.net
perlジジイこのスレでも自演してんのかw
968:デフォルトの名無しさん
23/11/04 17:37:08.01 PZuBSK2Q.net
COBOLジジイからperlジジイにランクアップ
969:デフォルトの名無しさん
23/11/05 13:03:00.89 q8heJbgz.net
サクラエディタ
// 1
\1(a)
// 2
\k<name>(?<name>a)
2は1を名前付き括弧にしただけ
1は実行してもマッチに失敗するだけだが2はエラー
これはどちらもエラーになるほうが良い
970:デフォルトの名無しさん
23/11/05 13:07:33.08 q8heJbgz.net
ん?本当にそうか?分からん
971:デフォルトの名無しさん
23/11/05 15:52:16.56 q8heJbgz.net
2がエラーになるのは誤りだ、異論ある?
いつもの超優秀な人(AI?)の意見を聞かせて欲しい
972:デフォルトの名無しさん
23/11/06 06:59:13.82 j6L5l5bH.net
異論はないってことで良いかな、おそらく既知の問題(仕様)だと思われる
この問題に長年気付かないとは考えられないから
本来動くべきサンプルを貼って>>949の件は終了とする
x2("(?:\\k<n>b|(?<n>a))+", "aab", 0, 3); // ERROR: undefined name <n> reference
x2("(?:(?<n>a)|\\k<n>b)+", "aab", 0, 2); // OK
x2("(?:\\1b|(a))+", "aab", 0, 3); // OK
x2("(?:(a)|\\1b)+", "aab", 0, 2); // OK
973:デフォルトの名無しさん
23/11/06 19:00:47.89 j6L5l5bH.net
回避策
x2("(?<n>a){0}(?:\\k<n>b|\\g<n>)+", "aab", 0, 3); // OK
974:デフォルトの名無しさん
23/11/15 17:50:43.57 Karf8A+O.net
文字列の頭に部分一致するパターンなんですが・・・
「abcdefg」にマッチするパターンですが、
/^a(?:b(?:c(?:d(?:e(?:f(?:g)?)?)?)?)?)?/
と書くしかないですか?
文字列が長大な場合、ちょっと無理なんですが・・・
(文字はアルファベットとは限らず)
WindowsのJScriptですが。
975:デフォルトの名無しさん
23/11/15 18:12:27.94 ctqB5947.net
/^abcdefg/
976:デフォルトの名無しさん
23/11/15 18:41:54.66 /mJ+eeiZ.net
無いんじゃないか?
^(?:abcdefg|abcdef|abcde|abcde|abcd|abc|ab|a)
とどっちがマシかな
977:デフォルトの名無しさん
23/11/16 14:47:23.08 7i/8qZTv.net
/^m/ にマッチして map だけマッチして欲しくない
/^m[^a][^p]/ これだと man にマッチしてくれない
どう書けばいいですか
978:デフォルトの名無しさん
23/11/16 14:53:22.83 4tHpE5Jq.net
>>957
否定先読みが使えるなら^m(?!ap)かな?
979:デフォルトの名無しさん
23/11/16 15:59:06.48 7i/8qZTv.net
ありがとう
980:デフォルトの名無しさん
23/11/17 04:25:56.84 gwXFy+9L.net
特定の文字列を検出したい場合、\Q~\Eの~に、その特定の文字列を入れておけば、どんな文字が来ても大丈夫でしょうか?
981:デフォルトの名無しさん
23/11/17 06:13:31.18 28WV0iMa.net
\Eが来ると困る
982:デフォルトの名無しさん
23/11/28 12:33:08.74 vIU65Zk5.net
正規表現スレがいいと聞いてきました
ここがいい正規表現すれですか?
$ perl -e '$a="abc"; $a =~ s/(.*)/[$1]/g; print $a . "\n"'
[abc][]
なんで後ろにカッコが来るん?
.*に全部マッチするんだから
二個目の[]が来るなんてお菓子にゃん?
983:デフォルトの名無しさん
23/11/28 13:42:04.64 EkqG9ePT.net
perlよく知らんがgとったら消える
984:デフォルトの名無しさん
23/11/28 13:54:45.94 uy7CvN4q.net
推測だが、
1) .*にabcがマッチする -> [abc]
2) .*は0個でもいいので、末尾位置(NUL)にマッチする -> []
985:デフォルトの名無しさん
23/11/28 14:25:52.10 uy7CvN4q.net
2回目は$a=""の場合と同じだと思えばいい
ヌル文字列でも.*だとマッチするでしょ?
986:デフォルトの名無しさん
23/11/28 16:18:10.81 vIU65Zk5.net
>>963
gとったら消える。Rubyも同じらしい。
>>964
[]が出るってことはなにかにマッチしてるってことでしょ?
>>965
それなら最初の.*にもマッチするじゃん?
一回目にマッチしなくて、二回目にマッチする理由がわからんのよ
987:デフォルトの名無しさん
23/11/28 16:18:30.67 JJPCdnVt.net
仮に2回目でマッチする何かがあったとしても
.*はgreedyなんだから1回目で消費してないとお菓子イイ
988:デフォルトの名無しさん
23/11/28 16:20:34.59 JJPCdnVt.net
でもなぁ
バグなら今までこんなん気が付かないはずないと思うからどうなんだろ
989:デフォルトの名無しさん
23/11/28 16:21:19.02 vIU65Zk5.net
$ perl -e '$a="abc"; $a =~ s/(.*)$/[$1]/g; print $a . "\n"'
[abc][]
$ perl -e '$a="abc"; $a =~ s/(.*$)/[$1]/g; print $a . "\n"'
[abc][]
後ろに$入れても同じ
行末以降の何にマッチしてんのこれ?
990:デフォルトの名無しさん
23/11/28 16:22:48.63 vIU65Zk5.net
Rubyのコードも持ってきた。持ってきただけだから意味は知らん。
ruby -e 're=/(.*)/; puts %Q(abc).sub(re){ %Q([#$1]) }'
[abc]
ruby -e 're=/(.*)/; puts %Q(abc).gsub(re){ %Q([#$1]) }'
[abc][]
991:デフォルトの名無しさん
23/11/28 16:44:51.01 wVUnEJO+.net
ググってみたがperlのそういう”仕様”として定着してるみたいだな
引っかかったことなかったわ
992:デフォルトの名無しさん
23/11/28 16:47:59.11 uy7CvN4q.net
>>968
1回目の.*で文字列全体がマッチ、2回目でNUL文字列にマッチするのは
どの正規表現環境でも同じだと思うよ
993:デフォルトの名無しさん
23/11/28 16:49:01.41 CppHkuHl.net
0文字と一致させたくなければ.*ではなく.+と書けよ
994:デフォルトの名無しさん
23/11/28 16:59:51.73 fB6/42vV.net
>>972
Perlの文字列はNull Terminatedされてないよ
/gだとマッチできないか再度確かめるからzero-lengthのempty stringにマッチするんだとさ
でも同じ位置でempty stringに2回はマッチしないようなチェックが入ってるからそこで抜けるんだとさ
個人的にはバグだと思うけどPCRE準拠でみんな作ってるから同じ動きをさせたんだろうね
regex101で試すとRustだけが一般に期待する動作をしてる
995:デフォルトの名無しさん
23/11/28 17:02:27.57 fB6/42vV.net
/(.*)$/みたいに末尾のアンカー入れても結果変わらないから余計におかしい
^を入れたら当然防げるけど
996:デフォルトの名無しさん
23/11/28 17:09:04.46 vIU65Zk5.net
>>971
探したけど見つからんかった。
どこにあった? or どうやって探した?
キーワードがわからん
997:デフォルトの名無しさん
23/11/28 18:08:10.66 waKUlTL5.net
これは長さゼロでマッチした直後に長さゼロにマッチしてposが進まなかったときにマッチを終了するという、頭の悪い正規表現を書くマヌケのために配慮された動作が例外的なんだよ
そのおかげで頭の悪い正規表現を書いても無限ループさせずに済んだことにむしろ感謝するべきだね
998:デフォルトの名無しさん
23/11/28 18:30:16.15 mMoqXMUf.net
(ハクション!
999:デフォルトの名無しさん
23/11/28 19:16:57.98 6l9rHssS.net
単に便利だからゼロ幅マッチさせてるん
$str =~ s/()/$1,/g; やってみるといいのん
1000:デフォルトの名無しさん
23/11/29 13:08:47.77 yvH2v9xT.net
正規表現検索は失敗しないかぎり終わらないって話では
abcに対して(.*)$が検索される→「abc+末尾」がマッチ、この時点での位置はcの後ろのゼロ幅
残りの部分に対して再度(.*)$が検索される→「ゼロ幅+末尾」がマッチ、cの後ろのゼロ幅が消費される
残りの部分に対して再度(.*)$が検索される→対象を消費しきっているので失敗→検索終了
1001:デフォルトの名無しさん
23/11/29 14:41:21.44 lw8jVmFR.net
そういうもんだと思って使ってたわ
それをバグだと思ってる人がいてびっくりぽんや
しかしこういうことに疑問を持つ人は今後伸びるで
1002:デフォルトの名無しさん
23/11/29 17:53:32.44 AoutXZD6.net
>>980
その理屈で言えば1回目で対象を消費しきってるから2回目が失敗するべき
1回目で消費しきっているにも関わらず2回目のゼロ幅マッチが成功するなら3回目のゼロ幅マッチだって成功するはず
そうならないのは対象を消費しきってるかどうかを確認せずにマッチを実施しており最終的には2回連続同一箇所でのゼロ幅マッチという失敗条件に合致してはじかれているから
1003:デフォルトの名無しさん
23/11/29 18:01:27.70 lw8jVmFR.net
確かにその通りやな、1度目で消費しきっとるはずや
1004:デフォルトの名無しさん
23/11/29 18:06:42.76 lw8jVmFR.net
分かったつもりになってるだけで全然分かってへんのがおるから
ちゃんと本か何かで学習したほうがええで、今までそういう学習をしてへんやろ
1005:デフォルトの名無しさん
23/11/29 20:04:08.42 x7bR/xfi.net
/(.*)$(.*)$((.*)$){999}/
1006:デフォルトの名無しさん
23/11/29 22:25:25.39 yvH2v9xT.net
>>985
えーと、つまり
・ゼロ幅は消費されない。パーマネントにゼロであり続ける。なので無限にマッチ可能
・無限にマッチ可能→同じゼロ幅に2回連続マッチしたからといってposを進めたり終了するわけではない
てことかな?
2回目以降が発生するかどうかは、、どうなんだろう
前回と完全に同じマッチになるときは試行せず終わる、っぽいけど
1007:デフォルトの名無しさん
23/12/01 02:37:28.94 07OBAnmr.net
sedの基本正規表現と拡張正規表現だとゼロ幅にマッチしないね
元はPerlのバグだったのが仕様ってことになったのでは?
$ printf 'abc' | sed 's/\(.*\)/[\1]/g'
[abc]
$ printf 'abc' | sed -E 's/(.*)/[\1]/g'
[abc]
1008:デフォルトの名無しさん
23/12/01 08:09:57.11 RWimeGTM.net
/^\w+|$/[$&]/
これが[abc][]になるのはおかしいと感じないよね?
前半が末尾まで食い尽くすから$はマッチしないはずだと思う?
1009:デフォルトの名無しさん
23/12/02 00:36:44.31 /f7jnFb0.net
挙動を仕様書で厳密に定義しているJavaScriptではこうなってた
URLリンク(tc39.es)
・1回目のマッチが "abc" すべてを消費する
・2回目のマッチは文字列末尾から始まるけど正規表現が.*なのでマッチングに成功する
ただし空文字にマッチした場合、先へ進まなくなることを回避するために
次回開始位置を一つ後ろへずらす処理が入る (12.c.iii.2以下)
これにより3回目のマッチは文字列の終端+1という範囲外の位置から始まることになり失敗に終わる
1010:デフォルトの名無しさん
23/12/07 23:24:41.69 Ug9Hn2aN.net
KEEPのKはあるのにPが無い、何故?
1011:デフォルトの名無しさん
23/12/07 23:31:35.71 Ug9Hn2aN.net
(?<=uma)musu(?=me) 柿憎い
uma\Kmusu\Pme 柿安い
1012:デフォルトの名無しさん
23/12/10 09:57:52.47 8JqB6SG/.net
>>988
思うよ
+の後に$を置けば余計にそう思う
1013:デフォルトの名無しさん
23/12/10 13:04:54.79 t3u5G9tC.net
$は「後ろが終端である位置」の指定であって「最後まで全部」という意味ではない
なので.+$で文字列を末尾まで消費した後でも再度末尾のゼロ幅にマッチできることはバグでもなんでもない
1014:デフォルトの名無しさん
23/12/10 14:15:57.63 ayXeZXuA.net
実装上のバグではなく仕様バグだろって話をしてるのがわからないのか?
1015:デフォルトの名無しさん
23/12/10 15:43:26.80 e6Tz3fj/.net
.*と$でマッチするものが異なるのに.*と.*|$でマッチするものが変わらないのは明らかにバクってるな
正規表現のパターンを変えるだけでperlでは[abc][]にも[abc]にもできるのにsedではこのバグのせいで[abc][]には絶対にできなくなってる
$ printf 'abc' | sed -E 's/.*|$/[&]/g'
[abc]
1016:デフォルトの名無しさん
23/12/10 15:44:52.66 e6Tz3fj/.net
s/バク/バグ/
1017:デフォルトの名無しさん
23/12/13 11:48:29.08 wzNHEkEB.net
ただの仕様だよ、あほらし
次スレよろ
1018:デフォルトの名無しさん
23/12/16 09:00:59.04 KMxF6SWS.net
次スレ
スレリンク(tech板)
1019:デフォルトの名無しさん
23/12/16 09:36:31.90 pgUnJUCg.net
天地無用
1020:デフォルトの名無しさん
23/12/16 10:49:04.16 faoSWywL.net
>>998
ほめてつかわす
1021:1001
Over 1000 Thread.net
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 772日 14時間 59分 3秒
1022:過去ログ ★
[過去ログ]
■ このスレッドは過去ログ倉庫に格納されています