08/11/09 00:08:58 FgmEujmP0
>>99
thinkさんにレスもらえて感謝。
> <a\s[^>]++href= を <a(\s[a-z]+(=$AV(*)|(^=)))++\shref= に置換することで、対応します。
目的のhref以外の属性を =$AV(*) の繰り返しにマッチさせて消費してしまう
という解釈でよろしいでしょうか。大変参考になりました。
あのあと色々考えてみましたが、やはりすべてを思い通りに置換するのは難しそうですね。
そもそもその問題に遭遇したサイトがどこだったかも分からなくなり半ばどうでもよくなってますが、
>>46で指摘されたフィルタらしきものが見つかったので、書いておきます。
Name = "Escape Quoted Meta Characters (2002/06/21)"
Active = TRUE
Multi = TRUE
URL = "^$LST(SafeList)"
Bounds = "< [a-z] [^"'`<>]++ (=["'`]*["'`][^"'`<>=]+)++ >"
Limit = 3000
Match = "(*=)\1["'`](((^[%1B]\$B)?)++)\2(<$SET(3=&lt;)|>$SET(3=&gt;))(*)\4["'`]\5"
"$SET(#=\1"\2\3\4"\5)"
Replace = "\@"
このフィルタの"$B"という表現がよく分からないのですが、誰か分かる方おりますか?