07/05/21 03:11:04 2zo606qG0
参考資料は HTML4.01 が適当かな?
Basic HTML data types (ja)
URLリンク(www.asahi-net.or.jp)
上の資料によると、
・a要素のhref属性値は「CDATA」に分類される。
・「CDATA」は改行文字LFを無視し、改行文字CRは1つの空白文字で置き換える。
となっています。
ところが、実際には CRLF (\r\n) がhref属性値に存在しても無視されています。
Webブラウザの挙動に合わせるなら、
[Patterns]
Name = "Delete break inside tag attribute value [2007/05/21] type1"
Active = TRUE
Multi = TRUE
URL = "$TYPE(htm)"
Limit = 1024
Match = "(<[^>]++\s(href=|src=))\#"
"$AVQ((\#[\r\n]+{1,*})+{1,*}\#)(^(^[ >]))"
Replace = "\@"
となるのでしょうけれど、仕様書通りに動作しないのが気になりますね…。