09/01/17 00:35:04 kLVGgKdD0
やっぱり目的を書かないと見当がつけにくいな。すまない。
重複する<br>を削除するフィルタを書くのが目的。
>675-676は製作途中のもので、>675は>676を元にして書き直してみたもの。
軽量化を兼ねた実験でブログ向けに絞ってみた。
>675はURLマッチの行が長過ぎと言われたので、複数行に分けて頭に「!!!! 」をつけた。
フィルタの製作方針は次の通り。
・<br>だけでなく、<br />や<br clear="all">などにもマッチさせる。
・<br>の直後にごみが混じっていたらそれも削除。
連続した<br>の間に全角空白・ ・ピリオドなどが混じっている場合に有効。
・<br><!-- comment --><br>などの場合も重複brだが、コメントはできれば残したい。
・<br><script></script><br>なども重複brだが、このへんをどうするかは再検討する。
>675-676の欠点は、一部マッチしない表現があること。
(条件)+{回数}のところが原因だと思っているのでそこを改善したい。
改善できたら>675-676のようにフィルタを分ける必要もなくなるだろう。
>673はさっき実験してみたけど思い通りの結果にはならなかった。
>674をざっと試してみると思い通りの結果になった。もっとやってみる。