08/12/12 02:02:42 4qgRnf9L0
>>422
良くできてますね。
マッチングコマンドがないのが不思議なくらいですが、正規表現としてみると美しい。(正規表現から覚えたのですね、きっと)
■高速化
$NEST(<script[ >],</script>) を使えば、Limitが足りない場合に「$NEST部分ではねられる=無駄にマッチしなくて済む」
有意な差は出ないでしょうが、どちらかといえば$NESTは誤爆回避の意味合いが強く、私はよく使います。
■コードの変化に強くする
>379のHTMLに少しの変化があっただけでフィルタは動作しなくなってしまいます。
そこでWeb制作者が変化させうる内容を予測して柔軟に対応できるフィルタにします。
▼XHTMLで書き換える
・language属性は(X)HTML仕様外なので、type属性に書き換える <script type="text/javascript">
URLリンク(www.tohoho-web.com)
・<script> 内のコメントアウトを無くす
URLリンク(www.kanzaki.com)
▼BOTによる解析を困難にする
・変数の名前をランダムにする (変数に使用できる名前は下記URL参照)
URLリンク(developer.mozilla.org)
基本的に言語仕様に則って更新内容を予測してます。
仕様外の書き方をする人はどの世界でもいますが、大体においてこの考え方で問題はないです。(経験上)
>>432
> \4のところは拡張子なので[a-z]+にすれば視認性がよくなるのでは?
野暮な突っ込みですが、拡張子は「数字」も扱えます…。(mp3とか777とか)