Proxomitron フィルター作成スレッド Part10at SOFTWARE
Proxomitron フィルター作成スレッド Part10 - 暇つぶし2ch531:jMKLuDiSJ
08/12/19 07:20:19 B5qcfAfh0
URLリンク(ewaailis74.9ix.net) �ⅱ濵 璞瑣�

532:名無しさん@お腹いっぱい。
08/12/19 13:26:43 ZQvdsF+r0
think氏の
Kill pop-up windows [2007/08/21] fixed
がふたば虹裏URLリンク(jun.2chan.net)で誤爆するようになったな
サムネイルをクリックしても画像が表示されない状態
仕様が変わったらしい

533:名無しさん@お腹いっぱい。
08/12/19 14:38:08 TAL+2CrK0
$NESTの速度を測ってみたら$NESTを使ったほうが遅かった..

534:名無しさん@お腹いっぱい。
08/12/19 14:46:03 uLx+5K0i0
>>532

>>422>>497
これでJavaScript問題は回避できるかと
俺は上記をURLふたば限定+Repにimgタグを挿入と改変して使ってる

535:名無しさん@お腹いっぱい。
08/12/19 22:41:01 kqYO5/45P
wikiのGoogle Image: Image Change ありがと。

536:think ◆MM0nnAOCiQ
08/12/19 23:18:44 zDW6yqyI0
>>532
そのフィルタは「すべてのwindow.openを削除する」ので、誤爆というよりは使い方の問題かと思います。
あえてフィルタ側で対応するなら、

URL = "^$LST(AllowPopupURL)"

のように、ホワイトリストを指定するぐらいかなと。

遅まきながら、>>379のソースがようやく明らかになったので対応フィルタを公開しておきます。

[Patterns]
Name = "Futaba: window.open to <meta http-equiv="refresh"> [2008/12/19] test1"
Active = TRUE
URL = "$TYPE(htm)[^.]+.2chan.net/[^/]+/red/[0-9]+.htm"
Limit = 512
Match = "$NEST(<script[ ],[^>]+> "
"(<!--|)"
"( ([$_a-z][0-9a-z_]+)\0 = $AV(\1) ;$SET(FutabaURL=\0,\1\n$GET(FutabaURL)))+"
" window.open $NEST(\(, $AV(\#)( \+ ([$_a-z][0-9a-z_]+)\2$TST(FutabaURL=(*\n|)$TST(\2),([^\n]+)\#*))+"
"( \+ $AV(\#))+(,*|),\))"
"*,</script>)"
"$SET(FutabaURL=)"
Replace = "<meta http-equiv="refresh" content="0; url=\@">"

JavaScriptの window.open(URL, ウインドウ名) によるリダイレクトを、meta要素によるリダイレクトに変換します。
JavaScript無効/ポップアップブロック動作中の環境下でリダイレクトされない問題を解消します。

※window.open(URL, "self") によるウインドウ生成はリダイレクトと同じ動作です。

537:名無しさん@お腹いっぱい。
08/12/20 00:16:42 Nek9zt070
>>422のフィルタのほうが早いようです。
jsでURLを暗号化する方法は無限にあるからそこまで汎用性に気を使う必要性があるのかな?
think氏のフィルタでもコメント行を入れただけで動かなくなってしまう。
それと>>516の件は大丈夫なんでしょうか?

538:名無しさん@お腹いっぱい。
08/12/20 00:29:46 FhgRtZD20
No object!!(似非NoScript)を更新しました。
URLリンク(proxo.hp.infoseek.co.jp)

変更内容
・document.createElement、document.write、document.writelnの誤爆してたのを修正(出来てると良いな)
・水色がコメントに囲まれて表示されないのを回避

539:think ◆MM0nnAOCiQ
08/12/20 02:57:57 oFKFl7dL0
>>537
> >>422のフィルタのほうが早いようです。
経験上、一度だけマッチするフィルタの速度差は小さいと考えていまして、速度は計測していませんでした。
ただ、>536は $STOP(), \k がない欠点がありましたね。これは直します。

実際に下記URLのHTMLソースでテストしてみたところ、私の環境(Semplon3100+ & 1024MB)では有意な差を確認できませんでした。
URLリンク(jun.2chan.net)
とりあえず、手を入れられそうな部分だけ高速化しておきましたが、このフィルタでも速度差が確認できませんでしたので
本当に高速化出来ているかはわかりません。(理論上は高速化できているはずですが…。)

更新点
- $STOP(), \kの追加
- "window.open(url,name" までマッチした時点で置換処理に入るようにした
 (リダイレクトが確定した時点で後続処理を見る必要がなくなったため)
- 不要な $NEST を削除した

[Patterns]
Name = "Futaba: window.open to <meta http-equiv="refresh"> [2008/12/20] test3"
Active = TRUE
URL = "$TYPE(htm)[^.]+.2chan.net/[^/]+/red/[0-9]+.htm"
Limit = 512
Match = "<script\s[^>]+> (<!--|)"
"( ([$_a-z][0-9a-z_]+)\0=$AV(\1) ;$SET(FutabaURL=\0,\1\n$GET(FutabaURL)))+"
" window.open \( $AV(\#)( \+ ([$_a-z][0-9a-z_]+)\2$TST(FutabaURL=(*\n|)$TST(\2),([^\n]+)\#*))+"
"( \+ $AV(\#))+(^(^ [,)]))"
"$STOP()$SET(FutabaURL=)"
Replace = "\k<meta http-equiv="refresh" content="0; url=\@">"

540:think ◆MM0nnAOCiQ
08/12/20 03:24:28 oFKFl7dL0
>539の続き。

> jsでURLを暗号化する方法は無限にあるからそこまで汎用性に気を使う必要性があるのかな?
汎用性に拘るのはもう癖になってますw

1. 学習のため
2. あとで同系フィルタを作る時の流用するため

今はちょっとしたアイデアがあって、2. の理由が大きいですね。
以下、第一弾。(>>532の相性問題への対応策です)

ポップアップブロック影響下でwindow.openによるリダイレクトを可能にするフィルタ - think49の日記
URLリンク(d.hatena.ne.jp)

541:名無しさん@お腹いっぱい。
08/12/20 03:26:25 ye/JCkK+0
<html>
<head>
<script language="JavaScript">
function caesar(s, n) {
    var str = "";
    for (var i = 0; i < s.length; i++) str += String.fromCharCode(s.charCodeAt(i) + n);
    return str;
}
</script>
</head>
<body onLoad="eval(caesar('grkxz.(nkrru2&}uxrj(/A', -6));">
</body>
</html>


こんなショボい暗号化でも Proxomitron じゃもはや対処不可能でしょ。
ページ作成者が Proxomitron 対策を本気で練ってきたらほとんど無力になると思うよ。
今はこれでもまだまだ“知る人ぞ知るマイナーな存在”だから何とかなっているけど。

万能なフィルタなんて作れるわけがない。

542:think ◆MM0nnAOCiQ
08/12/20 03:27:43 oFKFl7dL0
>>540の続き。

>>537
> それと>>516の件は大丈夫なんでしょうか?
>516の件については、初め何のことを示唆しているのかわかりませんでした。
改めて>422氏のフィルタから見直すと

・>422は最初の $SET(qm=) でグローバル変数の初期化をしている
・>497は $SET(FutabaURL=) の行程を踏まずに、いきなり $GET(FutabaURL) を使用している
・>497も $SET(FutabaURL=) でグローバル変数を初期化すべきだ

という問題提起のように思えたので、その前提で話を進めます。(誤解でしたら、ごめんなさい)
結論からいうと、Proxomitronは一般的なプログラミング言語でいうところの「値無しでのグローバル変数の宣言」が出来ません。
下記はJavaScriptの例です。

▼JavaScriptでグローバル変数を宣言
var prx;
alert("Proxomitron");

これと同じ事をProxomitronで試みたのが下記ですが、これは期待通りに動作しません。

▼Proxomitronでグローバル変数を宣言
[Patterns]
Name = "Global val init [2008/12/20] test1"
Active = TRUE
Limit = 256
Match = "$SET(prx=)$TST(prx=*)$STOP()"
Replace = "Proxomitron"

検索表現を $SET(prx=1) に変更すると、期待通りに動作します。
このことから、「$SET(prx=) がグローバル変数の宣言処理となっていない」ことがうかがえます。

543:think ◆MM0nnAOCiQ
08/12/20 03:29:51 oFKFl7dL0
>>542の続き。

ちなみに、日本語公式ヘルプには、

-------------
グローバル変数をクリアするには、以下のように $SET を使ってください...

$SET(VarName=)

URLリンク(www.pluto.dti.ne.jp)
-------------

とあり、$SET(VarName=) は「変数の解放」を指していることがわかります。

初めに $SET(VarName=) を実行することは、宣言されていないグローバル変数を解放することであり、無駄な処理になってしまうと思います。


544:think ◆MM0nnAOCiQ
08/12/20 04:30:07 oFKFl7dL0
>>538
お疲れ様です。
適度に更新されると、安心して使い続けられますね。
私はNoScriptのホワイトリスト管理に疲れてすっかり遠ざかってしまいましたが、応援しています。

■>539,540のフィルタについて
>539と>540は共存できますが、ふたばちゃんねるではどちらか一方のフィルタしか働きません。
(両方適用しても問題有りませんが、ふたばちゃんねるでは一つしか働いていないため無駄になります。)

・JavaScript常時有効な環境 … 汎用性のある>540で対応する
・JavaScript常時無効な環境 … JavaScript不要な>530で対応する

545:名無しさん@お腹いっぱい。
08/12/20 07:05:01 cpxQuI4V0
なるべく一意の名前になる変数名を使えば問題は起きないだろうね。
場合によってはサイト名よりフィルタ名を変数名に含める方がより安全かもしれない。
ニコニコ界隈はそれほどスキルの高くない大勢が大量に一つのサイトのフィルタを作っているから
衝突が起こりかねない状態になってるなーと思うけど、通常はさほど心配ないんでないかね。
しかも衝突したところで直すのは容易だから、ま、心配するようなこっちゃないよ。

あ、別にニコニコのフィルタはドヘボばっかだなとかそういう変な意味はないのよ。

546:SpUKHlWqXr
08/12/20 08:01:24 YcACaKUb0
URLリンク(margaretaevangelos802.k2free.com) �ⅱ濵 粨蒟� 璞瑣�

547:IPJXIFatmF
08/12/20 08:03:15 p6xcSCXm0
URLリンク(helengo.awardspace.com) william patrick white


548:RxdSgLnvARboi
08/12/20 08:44:34 uGmJIDN+0
URLリンク(baptistechenaniah322.k2free.com) �ⅱ濵 粨蒟� 璞瑣�

549:defTiFmVxTEVR
08/12/20 08:48:24 NHtKM3XJ0
AAooNM

550:weXYqZaRYRRylvALv
08/12/20 10:21:52 BzIZ19780
URLリンク(michiencarnita949.gigazu.net) �ⅱ濵 粨蒟� 璞瑣�

551:GIdyHTxJtzLkhvcOX
08/12/20 10:48:14 1ZWi2fbZ0
URLリンク(encarnitabeitris645.gigazu.net) �ⅱ濵 粨蒟� 璞瑣�

552:TWqnYouXbhMA
08/12/20 11:14:55 xWlEUPTi0
URLリンク(daisukeajith402.k2free.com) 璞瑣� 粨蒟� �ⅱ濵

553:名無しさん@お腹いっぱい。
08/12/21 07:31:50 S9dMpMuF0
>>544
ありがとうございます。
きったないフィルタですがそう言って頂けるとやってる甲斐があります。

ところでオミトロンに詳しい方々にお聞きしたいのですが
(hoge|)\1test$TST(\1=?*)
このような時$TSTがtrueを返したら
ある文字列を返すみたいなのはどう書けばいいのでしょうか?
if文のようなものを書きたいのですが良く分かりません。

554:名無しさん@お腹いっぱい。
08/12/21 11:34:37 CDl70bdL0
condition が true なら flag = "true"
($TST(condition)$SET(flag=true)|)

condition が true なら flag = "true"、false なら flag = "false"
($TST(condition)$SET(flag=true)|$SET(flag=false))

555:名無しさん@お腹いっぱい。
08/12/21 13:07:44 epJI0pUF0
>>542
>このことから、「$SET(prx=) がグローバル変数の宣言処理となっていない」ことがうかがえます。
初心者がthink氏に意見するのは気が引けますが

空は$TSTできないので
Match = "$SET(prx=1)$SET(prx=)$TST(prx=*)$STOP()"
でも駄目だし、マッチさせるなら
Match = "$SET(prx=)(^$TST(prx=*))$STOP()"
だと思います。

556:名無しさん@お腹いっぱい。
08/12/21 14:39:56 3HwLxjnt0
>>555
いやいや、Matchさせることが目的じゃないよ。
nullが$TSTできない≒nullが$SETできない≒空$SETは変数宣言にはなっていないっていう話。

ただ>>542でthinkさんが心配している通り、問題を誤解してるかなーと思った。
thinkさんは>>516を「グローバル変数を使う前に変数宣言(兼初期化)しろ」という意味に
取ったみたいだけど、俺は>>545のように変数名の衝突を危惧して「初期化しろ」と言ったんじゃないかなと。
それなら>>545で現実的には解決、もしくはReplaceに条件分岐で解放処理を入れればいい。
ただそれだと「ゴミ拾い」という言葉の意味がよくわからないんだよな。

まぁ、>>516=ID:PdFDrgn00の投稿を見る限り…ねぇ。

557:名無しさん@お腹いっぱい。
08/12/21 14:41:47 ZzqEe8Sq0
いや、「マッチさせるなら」ってさ、
別に「マッチさせたい」んじゃなくて「マッチするか否かを見たい」んじゃね?

558:名無しさん@お腹いっぱい。
08/12/21 14:42:44 ZzqEe8Sq0
はいはい見事にかぶっちゃいましたよ、とorz

559:think ◆MM0nnAOCiQ
08/12/21 14:43:12 QiODl+0j0
>>553
> if文のようなものを書きたいのですが良く分かりません。
考え方としては、「$TST() がif文」でいいと思います。
true, falseの判定だけでいいなら、こんな感じです。

($TST(if=true)$SET(0=ifはtrueを返しました)|$SET(0=ifはfalseを返しました))

■(注意) ローカル変数を $TST() する場合

[Patterns]
Name = "local-val if [2008/12/21] test1"
Active = TRUE
Limit = 256
Match = "$SET(0=true)($TST(0=true)$SET(1=\\0はtrueを返しました)|$SET(1=\\0はfalseを返しました))$STOP()"
Replace = "\1"

ローカル変数を $SET() しても置換処理に移るまで初期化されないので、このタイミングでは $TST() に失敗してしまいます。
# "(hoge|)\1" のようにWeb上の文字列をキャプチャした場合は即時初期化されるので、上手く動作します。

[Patterns]
Name = "global-val if [2008/12/21] test1"
Active = TRUE
Limit = 256
Match = "$SET(if=true)($TST(if=true)$SET(0=ifはtrueを返しました)|$SET(0=ifはfalseを返しました))$STOP()"
Replace = "\0"

グローバル変数を $SET() すれば期待通りに動作します。

560:think ◆MM0nnAOCiQ
08/12/21 15:01:07 QiODl+0j0
>>555
既に指摘があるように、>542はグローバル変数が初期化されているか否かを確認するためのフィルタでした。
わかりにくくてすみません。

>556-557
フォローありがとうございます。

>>545,556
> 俺は>>545のように変数名の衝突を危惧して「初期化しろ」と言ったんじゃないかなと。
なるほど!
そういう風にも受け取れますね。合点がいきました。

> ただそれだと「ゴミ拾い」という言葉の意味がよくわからないんだよな。
「他のフィルタの変数の値 = ゴミ」→「他のフィルタの変数の値を拾う = ゴミ拾い」
ってことじゃないでしょうか…、おそらく。

561:名無しさん@お腹いっぱい。
08/12/21 17:42:47 S9dMpMuF0
>>554,559
ありがとうございます。
普通に()で括って書けば良かったんですね。


562:名無しさん@お腹いっぱい。
08/12/21 22:23:16 udR/vXI80
グローバル変数はフィルタがマッチしなかった場合でも変数への
代入は行われるので、関係無いスクリプトタグがHTMLソースの
上のほうにあった場合に以下略。

563:名無しさん@お腹いっぱい。
08/12/21 22:28:56 epJI0pUF0
555です。 ごめんなさい、言葉が足りませんでした。
>>556,557
>Matchさせることが目的じゃない
わかっています。
$TST(prx=*) か (^$TST(prx=*)) で
少なくとも実用上は期待通りの動作をさせられる
という意味で、付け足しました。

>>560
意図した通りには伝わらないものですね



言葉尻だけを浅い知識で解釈してごめんなさい。 orz

564:zgdXkjwvJnE
08/12/21 23:02:09 oS99OAak0
URLリンク(hideakizinovia150.gigazu.net) 砒�瑣濵� 粨蒟� 璞瑣�URLリンク(nobuabaddon967.gigazu.net) 砒�瑣濵� 粨蒟� 璞瑣�

565:QICFIJKp
08/12/22 01:00:27 2ane9rsh0
URLリンク(bentobaruch876.gigazu.net) 璞瑣� 砒�瑣濵 粨蒟�URLリンク(adaoran23.gigazu.net) 璞瑣� 砒�瑣濵 粨蒟�

566:名無しさん@お腹いっぱい。
08/12/22 01:29:03 XMj7yV430
レベル落ちたなぁ。 2003年前後の常連が復活してくれれば。。

567:名無しさん@お腹いっぱい。
08/12/22 07:16:25 YSQ75lhH0
これはこれは。レベルの高い常連さんっスか。スゲェっスね。(棒

568:名無しさん@お腹いっぱい。
08/12/22 08:22:15 KXNWeJis0
>>566
5年間も上達せずに乞食続けてんのかよ

569:名無しさん@お腹いっぱい。
08/12/22 08:37:42 I0tCQWOt0
吹いたwww

570:名無しさん@お腹いっぱい。
08/12/22 11:50:35 XMj7yV430
クレクレスレでクレクレして何が悪い

571:名無しさん@お腹いっぱい。
08/12/22 17:32:38 POMsfFfE0
だからと言ってフィルター製作者を蔑み叩く理由にはならない
5年も経ってるのにお前の人間的なレベルは上がってないのな

572:名無しさん@お腹いっぱい。
08/12/22 20:28:02 XMj7yV430
たいした知識もないのに偉そうなおまえらが悪い。
自分で作ったほうがマシなレベル。

573:名無しさん@お腹いっぱい。
08/12/22 21:44:16 zDNLL/zi0
今日はお薬多めに出しておきますね

574:名無しさん@お腹いっぱい。
08/12/22 22:42:31 SNok0v6o0
>>572
マー君、ちゃんとオムツして寝なさいね。
ママの言うこと聞かないと、またオシッコ漏らすわよ!

575:名無しさん@お腹いっぱい。
08/12/22 23:20:52 ur4icsVS0
まあ、例のいつもの人だから。
口では散々偉そうなこと言っておきながら、
自作のgoogle highlight(予定)では<b></b>に色つけて終わりで済ませてしまうような。
しかも誤魔化す為の小手先の仕込として外部へのリンクをつけた言う。

576:名無しさん@お腹いっぱい。
08/12/23 00:11:52 VaPrUbh10
なんでフィルター作ってくれないスレにしがみ付いてるの?マゾなの?

577:名無しさん@お腹いっぱい。
08/12/23 00:17:32 NMEHlIfT0
>>576
「気に入らないが他に頼れるものもないし仕方ないから使ってやるよ」

つかいい加減スルーするかアンカ付けてくれよ

578:名無しさん@お腹いっぱい。
08/12/23 00:17:40 Z3u2SfiO0
クリスマス前になると精神的に不安定になる奴が増えるからな…
察してやろうぜ

579:名無しさん@お腹いっぱい。
08/12/23 00:37:24 NMEHlIfT0
>>578
うっせー!バカバカまんこ!

580:名無しさん@お腹いっぱい。
08/12/23 07:32:05 vnuO8BoP0
ゴミ拾いの意味も理解出来ない人たちおはようございます。

581:名無しさん@お腹いっぱい。
08/12/23 16:24:11 15xz4RZI0
てs

582:名無しさん@お腹いっぱい。
08/12/23 21:08:30 kWQHS/OS0
URLリンク(goyaku.seesaa.net)
誰か左右のアマゾン広告取ってくれ
俺どうせ買わないからこんなに表示されてても重いだけで困るんだ

583:名無しさん@お腹いっぱい。
08/12/23 22:01:20 vnuO8BoP0
だが断る!

584:名無しさん@お腹いっぱい。
08/12/23 22:32:46 AY78PbbF0
>>582
[Patterns]
Name = ""
Active = TRUE
URL = "goyaku.seesaa.net/ $TYPE(htm)"
Limit = 80
Match = "(<div id="links-left")\#[^>]+>|"
"$NEST(<div class="sidetitle">,("
"[^<]++[%81][%95][%97][%7e][%82][%b5][%82][%a2][%95][%a8]|"
"amazon[^<]++TOP10$SET(\#=$STOP())"
"),</div>) (<div class="side")\#[^>]+>"
Replace = "\@ style="display:none">"

585:名無しさん@お腹いっぱい。
08/12/23 22:34:46 AY78PbbF0
>>582
ごめん変なことしちゃった。>>584インポートすると落ちるからこっち使ってね

[Patterns]
Active = TRUE
URL = "goyaku.seesaa.net/ $TYPE(htm)"
Limit = 80
Match = "(<div id="links-left")\#[^>]+>|"
"$NEST(<div class="sidetitle">,("
"[^<]++[%81][%95][%97][%7e][%82][%b5][%82][%a2][%95][%a8]|"
"amazon[^<]++TOP10$SET(\#=$STOP())"
"),</div>) (<div class="side")\#[^>]+>"
Replace = "\@ style="display:none">"

586:名無しさん@お腹いっぱい。
08/12/23 22:36:54 kWQHS/OS0
>>585
おー綺麗に消えてる
ありがとうございます

587:名無しさん@お腹いっぱい。
08/12/23 23:36:28 oCKcKdTH0
No object!!(似非NoScript)を更新しました。
URLリンク(proxo.hp.infoseek.co.jp)

変更内容
・document.createElement、document.write、document.writelnの誤爆してたのをさらに修正
・document.createElement、document.write、document.writelnで作られる
 applet、bgsound、embed、objectをAllow_Extで管理するように
・体感差はほぼないがほんのり遅くなった
・ver.20081219で四角を右上に表示するように変更。従来どおり右下に表示したいときはテキストの159行目を参照のこと

588:名無しさん@お腹いっぱい。
08/12/24 00:06:39 sDyrBFS+0
gifアニメーションを止めるにチェック入れても
効かないの私だけでしょうか

589:cLtQcUidInUIHoJKK
08/12/24 06:09:05 GNwEizvp0
URLリンク(www.stanford.edu) my sitemap

590:名無しさん@お腹いっぱい。
08/12/24 07:18:56 63zKslkr0
FirefoxかOperaなら設定から止めるようにしたほうがいいと思うけど

591:ZQRBybUEZzzRhMeen
08/12/24 08:11:16 rf2k32570
URLリンク(www.stanford.edu) my sitemap

592:名無しさん@お腹いっぱい。
08/12/24 08:45:02 3feL9TEH0
Far East Patch for Proxomitron 4.5 "JUNE"
Proxomitron 4.5(2003-6-1)+6


** USE THIS MODIFIED VERSION AT YOUR OWN RISK! **
** この改造バージョンは各自の責任で使用して下さい **


┌── 重要な注意点 ──

│「Freeze GIF animation(GIF アニメーション停止)」機能が
│**全く** 効かなくなります。

│Proxomitron のウィンドウで「Freeze GIF animation」にチェックを入れようが
│$FILTER(true) を使おうが、GIF アニメを止めることは出来ません。

└────────



これだったら氏ね、そうじゃなかったらすまん

593:名無しさん@お腹いっぱい。
08/12/24 10:36:40 sDyrBFS+0
>>592
すいませんでした、思い出しました

594:某395
08/12/24 15:01:12 tdtpGodJ0
>>575
呼んだ?

595:名無しさん@お腹いっぱい。
08/12/24 18:43:58 bfpLFrO/0
+7で
│「GIF アニメーションを止める」機能を復活させました。ただし
|チェックが入っていると、GIF ファイルに対して $FILTER(true)
|を実行してもウェブページフィルタが効かなくなります。
となっているわけだが…

596:某395
08/12/24 18:57:36 tdtpGodJ0
チェック入ってても止まらないgifがいっぱいあるから使えない機能だぞこれ。
昔この機能の代わりにWEBフィルタで止めようとしてた奴がいたからそのフィルタ使ってみたら。
どこにあるのか知らないがな。

597:名無しさん@お腹いっぱい。
08/12/24 21:18:24 HwL0UHRZ0
wiki見ればgif止め効いてるヴァージョンが分かるはず
チカチカ動く広告とか鬱陶しいだけだから重宝してるよ

598:某395
08/12/24 23:56:22 tdtpGodJ0
最近はflash広告がうざい。

久しぶりにオミトロン関係のスレ覗いてみたがニコニコスレはなかなか活気があっていいな。
俺もwrapper作成に参戦しようかな~

599:名無しさん@お腹いっぱい。
08/12/25 00:48:42 zKdY1JVO0
止まらないGIFのURLキボンヌ

600:名無しさん@お腹いっぱい。
08/12/25 01:09:08 +B7ulH7+0
著名なテストサイト
URLリンク(www.aiseikai.or.jp)

601:名無しさん@お腹いっぱい。
08/12/25 02:11:08 zKdY1JVO0
>>600
ありがとう。試してみたが確かに止まらないわw
っていうかスレ違いだったね、ごめんなさい。

602:名無しさん@お腹いっぱい。
08/12/25 02:18:16 IDm2Y/+V0
うそん +7アイコン偏光板で止まるぞ?

603:名無しさん@お腹いっぱい。
08/12/25 04:27:07 zKdY1JVO0
勘違いだった_| ̄|○ 愛生会止まりました。
寝不足じゃない時に調べて見ます。

604:名無しさん@お腹いっぱい。
08/12/25 05:18:13 OdK8gqid0
アクセスログの類をできるだけ排除したいんだけど
・明らかなログ採取用ドメインをブロック
・imgのsrcにcgiや?があったら例外を除いて削除
・高さと幅が0や1のimgをローカルファイルに置き換え
・cssファイル内のurl()を適当に削除(面倒だしインポ以外は全部消しちゃっても問題無い?)
この他に何かいいのないかな?
どうやってもこちらからは判断できない方法があるってのは分かってるが
実用に差し障りが無い範囲内でできるだけ排除する方向で。

605:名無しさん@お腹いっぱい。
08/12/25 08:56:00 rjTvXne/0
オフサイトのJavascriptを排除するってのもアリかもしれん
ブロックリストに漏れがあってもカバーできる

606:名無しさん@お腹いっぱい。
08/12/25 09:18:43 oF7FanGj0
cssファイル内の~はbackground、backgound-imageで拡張子が画像ファイルじゃなかったら削除のほうがいいね
あとcgiだけじゃなくてphpのアクセス解析にも対応しないと


607:名無しさん@お腹いっぱい。
08/12/25 15:19:57 7J6LFBII0
NINJA TOOLS だけでも300あるけどね > ブロック候補ドメイン
URLリンク(www.ninja.co.jp)

608:名無しさん@お腹いっぱい。
08/12/25 16:33:29 iGUDLeGx0
楽にやりたいならNoScriptとかも使わないと無理だろな
フィルタのでも良いだろうけど

609:名無しさん@お腹いっぱい。
08/12/27 18:25:29 3wjk0hIz0
特定のサイトが連続アクセスするとエラーを出す様になりました。
タブで一度に10個以上開くとNG
数秒毎にクリックしていくと問題有りません(あまり早いとNG)

上記を回避出来るようなフィルターはProxomitronで可能ですか?

50個くらいを一気に開いて一つ一つ開く時に数秒おいて特定サイトにアクセスしてくれる様に。
よろしくお願いします。

610:名無しさん@お腹いっぱい。
08/12/27 19:10:14 dMgc7I4U0
もう嫌がらせにしか思えないw

611:名無しさん@お腹いっぱい。
08/12/27 19:43:30 T+M1cOed0
荒らしダメ絶対!

612:名無しさん@お腹いっぱい。
08/12/27 19:53:38 ZEBoUiGw0
嫌がらせにしか思えない>>607を親切なページに見せる

[Patterns]
Name = "NINJA domain getyou! 20081227"
Active = TRUE
URL = "www.ninja.co.jp/hp/pop_domain.html $TYPE(htm)"
Limit = 100
Match = "<table[^>]+$SET(#=<textarea cols="30" rows="20" readonly="readonly" onClick="this.select()")|"
" <(/|)tr> |"
" <td[^>]+>$SET(#=\[\^.\]\+.)([a-z0-9-]+.[a-z]+{1,4})\#[^<]+</td>$SET(#=\r\n)|"
"</table>$SET(#=</textarea>$STOP())"
Replace = "\@"

なんでLast-Modifiedヘッダ発行してないんだクソッ

613:604
08/12/27 21:37:46 Zt8SdVIN0
アドバイスThx!

>>605
JSはどうしても必要なサイトだけソースに目を通しつつ1つずつ許可してるからそれほど気にする必要はないかな。

>>606
ページ本体をphpで生成してるようなサイトは結局必要以上の環境変数を送らないようにするしかないか・・・。

>>607
いくつかは既にブロックしたりしてたがこんなにあったとは。
だけどNINJAがいるサイトを見てみたけど少なくとも確認したところでは
imgのsrc内の?を検出して殺しておけば該当ドメインへのアクセスは皆無っぽい。

614:609
08/12/28 07:27:40 UDJ/HzPm0
そう言われれば嵐や嫌がらせですね~w

特定サイトとはブックオフオンラインです。
URLリンク(www.bookoffonline.co.jp)
毎日欲しい中古がないかブックマークを一気開くという作業してたので・・・

うーむ、Proxomitronではどうしようもないですかね~

615:think ◆MM0nnAOCiQ
08/12/28 12:17:14 Tn4v68TX0
>>614
> うーむ、Proxomitronではどうしようもないですかね~
JavaScriptの window.open と疑似Sleep処理(「sleep javascript」でGoogle検索してみてください) で実現できると思いますが、
そのフィルタを「公開」してしまうと「不特定多数が利用する→サーバが過負荷になる」
という状況が想定できるので誰も公開できないのではないかと…。

そういうフィルタは自分で作るか、親しい知人に作ってもらうなどしてこっそり使うものだと思います。

# 以下、脱線。
JavaScriptで低負荷なSleep処理を実現するアイデア。

1. iframeで <meta http-equiv="refresh" content="3;URL=sleep.html?page=hoge.html"> なHTMLをロード
2. JavaScriptで page=hoge.html を参照して処理を実行
3. JavaScriptでiframe生成
4. 1. に戻る (以下ループ)

local.ptron を利用してProxomitronと連携することが出来ると思います。

616:609
08/12/28 12:28:53 270ZtdQy0
>>615さま
なるほど、当方には無理だという事が分かりましたw
普通にクリックしていくことにします。
ありがとうございました。

617:名無しさん@お腹いっぱい。
08/12/28 12:33:03 jFUiBTAf0
>>616
開くページが決まってるなら、バッチファイルでスリープ入れながら開くとか。

618:名無しさん@お腹いっぱい。
08/12/28 12:46:48 xmayjd6T0
混雑時はステート403を返すみたいだから
403だったら時間をおいてリロードするようにすれば良いんじゃないかな。

619:名無しさん@お腹いっぱい。
08/12/28 13:49:49 ilN2ukZN0
そういえばテキスト置換ソフトを使う練習の際に>607の世話になったな。
>607からドメインだけ残してあとは削除。
そこに適宜コメントを加えてブロックリストに加えた。
[a-z0-9_]+.([a-z]+.|)$LST(ninja)/$TYPE(htm)
URLの絞り方はこんな風に。
$LST(ninja)から前の部分は現状で確認できる範囲だけにした。

620:名無しさん@お腹いっぱい。
08/12/28 14:52:27 HFNvH2tM0
>>614
wwwcかRSSで特定ページに新着(変化)があったら開くとかすればいいのに

621:名無しさん@お腹いっぱい。
08/12/28 15:10:49 jvNONNx00
それ以前にそこ入荷お知らせメールあるじゃん

622:名無しさん@お腹いっぱい。
08/12/29 00:58:05 ZWFk1FTd0
pixivの広告消しフィルターとかありますか?

623:名無しさん@お腹いっぱい。
08/12/29 14:00:03 +Kry/ODH0
本体は>1のを使ってれば間違いないんだよね?

624:名無しさん@お腹いっぱい。
08/12/29 14:10:43 +YsZrlgp0
>>622
さぁ?無いなら自分で作ってみたら?

>>623
うん

625:名無しさん@お腹いっぱい。
08/12/29 14:56:40 uoN2ks3Z0
pixivは結構いじり甲斐がありそうだな
ニコ並みにカスタマイズできるかも

626:名無しさん@お腹いっぱい。
08/12/31 13:17:34 qAyOlPfo0
<li id="post">hogehoge</li>
<li id="post">hogehoge</li>
<li id="post">hoge unko hoge</li>
<li id="post">hogehoge</li>
<li id="post">hogeho unko ge</li>
<li id="post">hogehoge</li>

で、unkoを含まないli部分を削除しようと

<li id="post">*(^unko)*</li>

としましたができません。
全部消えてしまいます。
(範囲マッチは<li id="post">*</li>です)


<li id="post">hoge unko hoge</li>
<li id="post">hogeho unko ge</li>

という結果にしたいのです。
どなたかアドバイスお願いいたします。

URLリンク(abc.s65.xrea.com)
のやり方で適用できそうなのは全て試しましたがダメでした。

627:某395
08/12/31 13:43:53 ZQfEfYVh0
(<li(^(^\s))[^>]++\sid=$AV(post)&$NEST(<li(\s[^>]+|)>,(^*unko)*,</li>))

<li(^(^\s))[^>]++\sid=$AV(post)[^>]+>((^unko|<).)+</li>

<li(^(^\s))[^>]++\sid=$AV(post)[^>]+>([^<]+&&(^*unko)*)</li>

どれでもおk。

628:某395
08/12/31 14:05:34 ZQfEfYVh0
↑真ん中の "." は "?" の間違い。

これが一番シンプルで分かり易いかな。

<li(^(^\s))[^>]++\sid=$AV(post)[^>]+>(^[^<]++unko)[^<]+</li>

(^123)???

↑これは "123" 以外の3文字にマッチする表現。

(^(^123))???
↑これは "123" にマッチする表現。

(^ ) の中の数字と "???" が同じ場所をそれぞれ1回ずつテストしている。

(^1)(^2)(^3)?
↑これは 1、2、3以外の一文字という意味になる。

629:某395
08/12/31 14:42:47 ZQfEfYVh0
木を付けなくてはいけないのが(^ )の前に*を置いたらいけないという点。

*(^unko)

の場合、後ろにunkoと続かない地点が一か所でもあればマッチしてしまう。

<li id="post">123unko</li>

というテキストがあったら、1の地点で *(^unko) までがマッチしてしまい、
その後ろは * なのでなんでもマッチしてしまう。

感覚的には

*(^unko)*

と書きたい場所では


(^*unko)*

にする。 カッコの中に最初の * を入れる、と覚えれば簡単な。

630:626
08/12/31 15:04:38 qAyOlPfo0
うひゃー!
すごすぎる。
ありがとうございます。
成功しました。

マッチングコマンドの知識が皆無だから勉強せねば…。

ちなみに
<li id="post(^*display_post_notes)*</li>
ですませちゃいました。

余談ですが、よく見ると
<li id="post7583
というように連番っぽくなってました。

一応参考までに。
Tumblrの自分がリブログしたやつ
URLリンク(www.tumblr.com)
の、ノートが付いてるものだけを表示するフィルタでした。


631:某395
08/12/31 15:29:09 ZQfEfYVh0
なるほどな。 否定マッチが苦手ならCSSで全<li>要素を"非表示"にして、
notesが付いた<li>要素だけオミトロンで"表示する"に戻す、という方法もある。

visibility:hidden; // 表示しない
visibility:visible !important; // 表示する

まあ、もう出来たんならいいか、ばいばい。

632:名無しさん@お腹いっぱい。
09/01/02 20:10:35 7uoMvOWo0
アマゾンの個別商品ページ(たとえば↓)
URLリンク(www.amazon.co.jp)
に、「&m=AN1VRQENFRJN5」という文字列を追加するフィルタを作って欲しい。
この文字列は何かって言うと、マーケットプレイスの値段よりAmazon.co.jpの値段を
優先して表示する文字列らしい。
マケプレは使わないので、常にAmazon.co.jpの値段優先にしたいんだ。

633:名無しさん@お腹いっぱい。
09/01/03 02:12:30 RyOuH/Jw0
>>632
それおまえのアフィだろ?

634:名無しさん@お腹いっぱい。
09/01/03 10:38:50 hUz6ReA00
>>633
ワロタw

635:632
09/01/03 14:57:30 q9lqTq+r0
ちょw
自分のアフィ踏むフィルタとか意味無いw

636:名無しさん@お腹いっぱい。
09/01/04 12:01:10 Z5Qh2SeG0
正規表現をた用スレ

ReplaceStr.txtを活用するスレ Part5
URLリンク(jane.s28.xrea.com)

637:名無しさん@お腹いっぱい。
09/01/04 15:40:47 Z5Qh2SeG0
>>1----------------------------------

638:名無しさん@お腹いっぱい。
09/01/04 15:42:06 Z5Qh2SeG0
誤爆すまそ

639:名無しさん@お腹いっぱい。
09/01/04 16:11:16 JoMYeTA70
>>638
許さん

640:名無しさん@お腹いっぱい。
09/01/04 23:57:26 b8fpOqI50
アニメーションPNGを停止させるフィルタを作ってみました。
再生できるブラウザは限られてる上に、アドオン等で対応したほうが高速かつ確実ですが、興味のある人はどうぞ。
URLリンク(f49.aaa.livedoor.jp)
リファラではじかれる場合は↓から。
URLリンク(f49.aaa.livedoor.jp)

641:名無しさん@お腹いっぱい。
09/01/05 18:51:14 Mwx5ba250
<CENTER><IMG WIDTH="300" HEIGHT="200" SRC="../ime/hoge.gif">
<H4>テストhogehoge
<FORM METHOD=POST ACTION="hoge.cgi" TARGET="test" >
<SELECT NAME="ACTION" >
<OPTION VALUE="test" selected >hoge
<OPTION VALUE="hoge" >hogehoge
</SELECT>
<INPUT TYPE="hidden" NAME="pwd" VALUE="ninnin">
</FORM>

上記HTMLの画像と文章とフォームの順番を逆にするフィルタで
No1とNo2があるんですがNo2フィルタが有効になりません。
テストウィンドウでは動作するのですが・・・。

//<h4>の閉じタグがないので補完するフィルタ
//<FORM~が複数ある場合があるので補完しないとダメ
Name = "No1"
Active = TRUE
Multi = TRUE
URL = "www.hoge.jp/~hoge_hoge/"
Limit = 256
Match = "</CENTER><h4>\1<FORM"
Replace = "</CENTER><h4>\1</h4><FORM"
//順番を入れ替えるフィルタ
Name = "No2"
Active = TRUE
URL = "www.hoge.jp/~hoge_hoge/"
Limit = 2560
Match = "<CENTER><IMG WIDTH="300" HEIGHT="200" (\w)\1></CENTER>(<h4*/h4>)\2"
"(<FORM\w/FORM>)\#+\#<BR><HR>"
Replace = "\@<IMG WIDTH="300" HEIGHT="200" \1><BR>\2<HR>"

642:名無しさん@お腹いっぱい。
09/01/05 18:52:09 Mwx5ba250
画像
文章
フォーム



文章
フォーム
画像

に変更するフィルタ(のつもり)です。

643:名無しさん@お腹いっぱい。
09/01/05 21:21:15 BFt6s0aC0
■質問
次のページにあるリンクの URL を【置換後】のように変えたいのですが、

「マブラヴ オルタネイティヴ」まとめWiki - 2ch過去ログ のアップロードファイル一覧
URLリンク(www9.atwiki.jp)

【置換前】
URLリンク(www9.atwiki.jp)
【置換後】
URLリンク(www9.atwiki.jp)

↓のフィルタはどのように変えれば良いでしょうか?
フィルタは自作したことがなく、既存のフィルタを参考にして書きましたが
動きませんでした…。
お手数とは存じますが、よろしくお願いいたします。

[HTTP headers]
In = TRUE
Out = TRUE
Key = "MuvLuvALWikiLogsLinkURLShort"
Match = "page=2ch%E9%81%8E%E5%8E%BB%E3%83%AD%E3%82%B0"
Replace = "pageid=48"

644:名無しさん@お腹いっぱい。
09/01/05 23:05:17 Mwx5ba250
>>643
2chの後のは全部一緒なら決め打ちでいいのかな。
Match=page=2ch*\&file=
Replace=pageid=48\&file=\1
これでtestウィンドウでは動作したけど?

645:名無しさん@お腹いっぱい。
09/01/05 23:09:18 Mwx5ba250
>>644
あ。書いたのはWebページフィルタのほう・・・アレ・・・

646:名無しさん@お腹いっぱい。
09/01/05 23:19:22 Mwx5ba250
連でゴメン。>>643
ページに書いてある文字を置換するのに、なんでヘッダフィルタ使ってるの?
ヘッダフィルタは目に見えない所をフィルタするだけで、目に見える所の
フィルタはしないよ。
というわけでWebページフィルタに>>644を放り込んでみてください。

647:名無しさん@お腹いっぱい。
09/01/05 23:35:21 BFt6s0aC0
>>646
出来ました!

>ヘッダフィルタは目に見えない所をフィルタするだけで、目に見える所の
>フィルタはしないよ。

そうなんですね。こんな基本的なことも知らないで質問して申し訳ないです。
本当にありがとうございます。

>2chの後のは全部一緒なら決め打ちでいいのかな。

そうですね。↓のフィルタでも希望通りに動きました。

[Patterns]
Name = "MuvLuvALWikiLogsLinkURLShort"
Active = TRUE
Limit = 64
Match = "page=2ch%E9%81%8E%E5%8E%BB%E3%83%AD%E3%82%B0"
Replace = "pageid=48"

ありがとうございました!
Proxomitron って本当にすごいですね。感動しました

648:名無しさん@お腹いっぱい。
09/01/05 23:41:07 fHNn7pwK0
>>641-642
Matchで</CENTER>を使っているみたいだけど、例のHTMLに</CENTER>が無い
その時点でもう無理かと・・・
どこかのサイト(掲示板?)ぽいけど、>>643のように具体的に書いてくれないとミリ

その例ならやっつけで
Matchが(<IMG*>)\0(*</FORM>)\1
Replaceが\1\0

649:名無しさん@お腹いっぱい。
09/01/05 23:53:25 Mwx5ba250
>>648
>例のHTMLに</CENTER>が無い
ゴメン、ここに書くときに間違えました(んで今気づきました)
本当はあります。あるのに2番目のフィルタだけマッチしないんです。

引っかかっているのはどうやら

(<FORM\w/FORM>)\#+\#<BR><HR>

この部分がマッチできていない模様。
<FORM>~</FORM>が「いくつあるかわからない」けど「二つ以上ある」のに
マッチさせたい。WIKIやHELPを見てこのように書いたのですが・・・

650:名無しさん@お腹いっぱい。
09/01/05 23:58:28 Mwx5ba250
例のHTML・・・書き直した方がいいかな・・・?
No1適用後のHTMLです。
<CENTER><IMG WIDTH="300" HEIGHT="200" SRC="../ime/hoge.gif"></CENTER>
<h4>テストhogehoge</h4>
<FORM METHOD=POST ACTION="hoge.cgi" TARGET="test" >
<SELECT NAME="ACTION" > <OPTION VALUE="test" selected >hoge
<OPTION VALUE="hoge" >hogehoge </SELECT>
<INPUT TYPE="hidden" NAME="pwd" VALUE="ninnin"></FORM>
<FORM METHOD=POST ACTION="hoge.cgi" TARGET="test" >
<SELECT NAME="ACTION" ><OPTION VALUE="test2" selected >hoge2
<OPTION VALUE="hoge2" >hogehog2e </SELECT>
<INPUT TYPE="hidden" NAME="pwd" VALUE="ninnin"></FORM>

651:名無しさん@お腹いっぱい。
09/01/06 00:14:28 chM6XXTZ0
<BR><HR>も例から抜けてるな・・・orz何度もすみませんorz
Matchから削っても変わらなかったですが。

652:名無しさん@お腹いっぱい。
09/01/06 00:23:49 chM6XXTZ0
>>648
自力解決断念。書いてくださったフィルタで十分でした。
ありがとうございました。


テストウィンドウでは動作するんだけどなぁ・・・orz

653:名無しさん@お腹いっぱい。
09/01/07 02:06:30 jCDaEcq30
てs

654:名無しさん@お腹いっぱい。
09/01/07 23:17:18 OuF3JxFi0
Name = "Futaba Ad Killer"
Active = TRUE
URL = "[^/]++.2chan.net/"
Limit = 2048
Match = "(広告:::<b>*</b>|<a\s[^>]++href=("|)http://(^[^/]++.2chan.net/)[^>]++> <img\s[^>]++> </a>"
"|<iframe\s[^>]++src=("|)http://(^[^/]++.2chan.net/)*</iframe>"
"|<object\s[^>]++>*http://(^[^/]++.2chan.net/)*</object>) (<br>|)"

これを使うとサムネイルが表示されなくなった・・・

655:名無しさん@お腹いっぱい。
09/01/08 22:16:05 +izuNcTa0
>>654
Name = "Futaba Ad Killer"
Active = TRUE
URL = "[^/]++.2chan.net/"
Limit = 2048
Match = "(広告:::<b>*</b>|<a\s[^>]++href=("|)http://(^[^/]++.2chan.net:81/)[^>]++> <img\s[^>]++> </a>"
"|<iframe\s[^>]++src=("|)http://(^[^/]++.2chan.net/)*</iframe>"
"|<object\s[^>]++>*http://(^[^/]++.2chan.net/)*</object>) (<br>|)"

最近のふたばは頻繁に変わるし板ごとに微妙に違ったりするからねえ
:81を足しただけだけど多分これで今は平気だと思う

656:名無しさん@お腹いっぱい。
09/01/09 00:01:09 SraD8dyT0
>655
ありがとうございました
動作確認しました

657:名無しさん@お腹いっぱい。
09/01/14 09:14:51 WQq9S7Oy0
Banner Replacerってフィルターがはてなブックマークに誤爆して、
はてなスターが2重になるんですけど、どなたか修正して下さいませんか?

658:fgrPNIYp
09/01/14 14:28:05 fYFLLYU/0
URLリンク(www.contrib.andrew.cmu.edu) woodbadge beads

659:jqMJflLItx
09/01/14 14:34:17 zvYMfJ0I0
URLリンク(www.contrib.andrew.cmu.edu) yahii

660:KnWOVNCKXZKvyCmwmX
09/01/14 14:50:10 3W4kn/450
URLリンク(www.contrib.andrew.cmu.edu) xv250 review

661:vEBEUotEblmldFd
09/01/14 15:30:09 cjughU8q0
URLリンク(www.contrib.andrew.cmu.edu) woodbadge beads

662:名無しさん@お腹いっぱい。
09/01/14 21:23:49 t4XwKbFX0
↓Thinking Archive(仮)という所で配布されていた広告カットフィルターなのですが、
<!-- 広告 -->や<!--==アフェリ===-->のように日本語のコメントで囲まれている
広告も消せるようには出来ませんでしょうか

[Patterns]
Name = "Kill nest ad [2006.03.27]"
Active = TRUE
URL = "$TYPE(htm)"
Limit = 8192
Match = "(<!-+[ ]+$LST(NestAd) -+>)\0*(<!-+[ ]+$TST(Nest1) ($TST(Nest2)|) -+>)\1"
"$SET(Nest1=)$SET(Nest2=)"
Replace = "\r\n\0\r\n"
"\r\n<!-- Killed nest ad -->\r\n"
"\r\n\1\r\n"

663:名無しさん@お腹いっぱい。
09/01/14 21:40:29 PV2zCLNu0
>>662
URLリンク(vird2002.s8.xrea.com)

664:名無しさん@お腹いっぱい。
09/01/15 18:01:43 oF1543lp0
<!--[if lt IE 7]>
<!-- No object!! External script -->
<meta http-equiv="imagetoolbar" content="no" />
<![endif]-->

これを

<div style="background-color: #80d5d5; width: 10px; height:10px; top: 35px; right: 5px; position: fixed; z-index: 9999;"></div>
<!--[if lt IE 7]>
<!-- No object!! External script -->
<meta http-equiv="imagetoolbar" content="no" />
<![endif]-->

にしたいのですがテストでは上記のようになるのに対し
実際にページを開くと一行目と二行目が逆になってしまうのですが
なぜだか分かる方いらっしゃいますでしょうか?

[Patterns]
Name = "No object!! sub [2009/01/15]"
Active = TRUE
URL = "$TYPE(htm)(^$KEYCHK(1))"
Limit = 1024
Match = "(<!--((^-->)?)++|)\1<!--\sNo\sobject!!\sExternal\s\2\s-->$STOP()"
Replace = "\r\n<div style="background-color: #80d5d5; width: 10px; height:10px; top: 35px; right: 5px; position: fixed; z-index: 9999;"></div>\r\n\1<!-- No object!! External \2 -->"

ページはURLリンク(ja.wikipedia.org)

665:名無しさん@お腹いっぱい。
09/01/15 21:33:37 Rda4IV6x0
>>664
1行目と2行目が逆になるってことは(<!--((^-->)?)++|)\1が空にマッチしたってことでしょ。
テスト範囲以外のところに誤爆して半端に引っ掛かったりしないように書き換えれ。
俺には実際のページで該当部分が見つからんから自分で調べれ。

666:名無しさん@お腹いっぱい。
09/01/15 22:15:14 oF1543lp0
えぇ、まさしく空にマッチしてるようです
<!--((^-->)?)++<!--は

<!--[if lt IE 7]>
<!--

にマッチするはずなんですが、どうにもマッチしないんですよね
何でマッチしないのか分かりますか?書き方自体は間違ってはいないと思うのですが

667:名無しさん@お腹いっぱい。
09/01/15 22:29:43 eCZUflGh0
|)

668:think ◆MM0nnAOCiQ
09/01/15 23:19:55 mwSn6dQW0
>>666
>665氏も同じようですが、

URLリンク(ja.wikipedia.org)

に下記HTMLがないので、マッチしませんでした。

<!--[if lt IE 7]>
<!-- No object!! External script -->
<meta http-equiv="imagetoolbar" content="no" />
<![endif]-->

連携するためのフィルタ(MULTI付き?)が別にあるのでは…。

669:名無しさん@お腹いっぱい。
09/01/15 23:43:22 oF1543lp0
あ、すいません。書くの忘れてました。
上のサンプルはアップローダーにあるNo object!! Ext [2008/12/23]を
適用した後のものです。仰るとおりマルチ付です。

670:ISRTikkpgB
09/01/16 08:04:34 HPSTkd/H0
URLリンク(www.stanford.edu) my sitemap

671:GnIENbDgpvftGJ
09/01/16 08:52:45 DuXEcHzp0
URLリンク(www.stanford.edu) my sitemap

672:名無しさん@お腹いっぱい。
09/01/16 23:50:50 IS38VD1M0
Proxomitronの検索表現って、
文字列を最短一致でマッチさせる方法がかなり面倒だと思うんだけどどうなんだろう。

<!--
を始点にして

-->
を終点にする方法がわからない。

$NESTを使うと最長一致になり、バイト制限が影響する。
[^>]++を使うと <!-- > --> のような場合でマッチしなくなる。

673:某395
09/01/16 23:56:36 Kldnmfbm0
<!--*-->

674:名無しさん@お腹いっぱい。
09/01/17 00:00:50 2vhuf6FC0
ものぐさなら気を付けて*を使えばいいし
心配性なら?++-->とでもすればいいと思うんだけど
そうじゃなくて?

675:名無しさん@お腹いっぱい。
09/01/17 00:10:35 kLVGgKdD0
Name = "continuous break deleter for blog (2009.01.04)"
Active = TRUE
URL = "(^$KEYCHK(m))(d.hatena.ne.jp/|[a-z]+.g.hatena.ne.jp/|
!!!! [a-z0-9]+.blog[0-9]+.fc2.com/|[a-z0-9]+.exblog.jp/|[a-z0-9]+.sblo.jp/|
!!!! [a-z0-9-]+.cocolog-nifty.com/|[a-z0-9]+.blog.shinobi.jp/|[a-z0-9-]+.jugem.jp/|
!!!! [a-z0-9]+.seesaa.net/|yaplog.jp/|blog.[^/]+/)($TYPE(htm)|$TYPE(js))"
Limit = 64
Match = "((<br /+> )+{2,*}<br clear="all"> )|"
"(<br clear="all" />(<br /+> )+ $SET(1=<br class="continuous-break"/>))|"
"((<br /+> )+{2,*}$SET(1=<br class="continuous-break"/>))"
Replace = "\r\n<!-- continuous break deleted for blog -->\1\r\n"

/* continuous break deleter for blog (2008.10.24) */
.continuous-break { display: block; margin-bottom: 0.5em !important; }

676:名無しさん@お腹いっぱい。
09/01/17 00:11:15 kLVGgKdD0
Name = "continuous break deleter (2008.06.02)"
Active = TRUE
URL = "(^$KEYCHK(m))($TYPE(htm)|$TYPE(js))"
Limit = 192
Match = "((</+br[^>]+> "
"([%81][%40] |[%A1][%A1] |[%E3][%80][%80] |. |\  |(^$KEYCHK(p))</+script[^>]+> |</+font[^>]+> |<spacer[^>]+> |<!-- (^tok2|St-HP-F)[^>]++ --> |(</(^br|html|body)[a-z]+> )\#)+"
")+{5,*})|"
"((</+br[^>]+> "
"([%81][%40] |[%A1][%A1] |[%E3][%80][%80] |. |\  |(^$KEYCHK(p))</+script[^>]+> |</+font[^>]+> |<spacer[^>]+> |<!-- (^tok2|St-HP-F)[^>]++ --> |(</(^br|html|body)[a-z]+> )\#)+"
")+{3,4}$SET(1=<br /><br />))"
Replace = "\r\n<!-- continuous break deleted -->\1\r\n\@"

677:名無しさん@お腹いっぱい。
09/01/17 00:35:04 kLVGgKdD0
やっぱり目的を書かないと見当がつけにくいな。すまない。
重複する<br>を削除するフィルタを書くのが目的。
>675-676は製作途中のもので、>675は>676を元にして書き直してみたもの。
軽量化を兼ねた実験でブログ向けに絞ってみた。
>675はURLマッチの行が長過ぎと言われたので、複数行に分けて頭に「!!!! 」をつけた。

フィルタの製作方針は次の通り。
・<br>だけでなく、<br />や<br clear="all">などにもマッチさせる。
・<br>の直後にごみが混じっていたらそれも削除。
連続した<br>の間に全角空白・&nbsp;・ピリオドなどが混じっている場合に有効。
・<br><!-- comment --><br>などの場合も重複brだが、コメントはできれば残したい。
・<br><script></script><br>なども重複brだが、このへんをどうするかは再検討する。

>675-676の欠点は、一部マッチしない表現があること。
(条件)+{回数}のところが原因だと思っているのでそこを改善したい。
改善できたら>675-676のようにフィルタを分ける必要もなくなるだろう。


>673はさっき実験してみたけど思い通りの結果にはならなかった。
>674をざっと試してみると思い通りの結果になった。もっとやってみる。

678:名無しさん@お腹いっぱい。
09/01/17 00:44:17 i6deXSYV0
<br(/|)>の連続を消したいだけならCSSでこんなのもあるよ
br {
display: block !important;
line-height: 0px !important;
}



679:名無しさん@お腹いっぱい。
09/01/17 01:05:48 kLVGgKdD0
URLリンク(mayokara.info)
URLリンク(d.hatena.ne.jp)
URLリンク(d.hatena.ne.jp)
参考。br + br { display: none; } は誰もが通る道なのか。

>678の場合は、brの数に関係なく改行がひとつしかないように見えてしまう。
その結果、<br><br>を段落の区切りとして使っている文書を読むと、
段落の区切りがどこかわからなくなってしまう。
margin-bottom: 0.5em !important;
を足すとわかるようにはなるけど、行間が空きすぎて読みにくい。

680:名無しさん@お腹いっぱい。
09/01/17 01:17:08 kLVGgKdD0
>676は&nbsp;をエスケープし忘れていたので、エスケープして貼り直し。

Name = "continuous break deleter (2008.06.02)"
Active = TRUE
URL = "(^$KEYCHK(m))($TYPE(htm)|$TYPE(js))"
Limit = 192
Match = "((</+br[^>]+> "
"([%81][%40] |[%A1][%A1] |[%E3][%80][%80] |. |\&nbsp; |(^$KEYCHK(p))</+script[^>]+> |</+font[^>]+> |<spacer[^>]+> |<!-- (^tok2|St-HP-F)[^>]++ --> |(</(^br|html|body)[a-z]+> )\#)+"
")+{5,*})|"
"((</+br[^>]+> "
"([%81][%40] |[%A1][%A1] |[%E3][%80][%80] |. |\&nbsp; |(^$KEYCHK(p))</+script[^>]+> |</+font[^>]+> |<spacer[^>]+> |<!-- (^tok2|St-HP-F)[^>]++ --> |(</(^br|html|body)[a-z]+> )\#)+"
")+{3,4}$SET(1=<br /><br />))"
Replace = "\r\n<!-- continuous break deleted -->\1\r\n\@"

681:名無しさん@お腹いっぱい。
09/01/17 01:22:02 i6deXSYV0
あぁ、なるほどね
確かに段落の区切りとしてbrを大量に使ってる場合は
改行と見分け付かない場合もあるだろうね
それなら段落だと分かるところには<p></p>を入れると言うのはいかが?

682:某395
09/01/17 03:35:58 KoR4Qv3c0
非表示にするときは?

display:none;  ← 初心者が使ってしまう

visibility:hidden; ← 識者が使う

違いはミングをやれば分かる。


>>677
>さっき実験してみたけど思い通りの結果にはならなかった。
まず実験の仕方から覚えないとダメ。

683:某395
09/01/17 03:42:05 KoR4Qv3c0
>>674
<!--*--> と <!--?++--> は同じ動作になるはずだがどこか違うのか?

684:名無しさん@お腹いっぱい。
09/01/17 03:53:13 KoR4Qv3c0
・・と聞いても恥ずかしくて出てこられないか。

685:名無しさん@お腹いっぱい。
09/01/17 08:29:34 tZkhjNpx0
時々、「このサイトは良心的なサイトだなぁ」って思う時がある、Proxomitronを外すまではね
今まで行ってた所が恐ろしいほど広告うってたって知った時の驚愕、お前らにもあるよね
俺の行ってるサイトでそういうサイトが沢山ある

驚いたのでうp
URLリンク(bull.s11.x-beat.com)


686:名無しさん@お腹いっぱい。
09/01/17 08:42:07 IP1El61M0
あなたの使っているソフトスレで
「オミトロン、これがないと死んでしまう」というコメントを見かけたことがあるが
説得力あるなと思った

687:名無しさん@お腹いっぱい。
09/01/17 09:34:50 D8MKcVPV0
俺はいつもdisplay:none
レイアウトが崩れるより空白の方が許せないから

688:名無しさん@お腹いっぱい。
09/01/17 09:39:16 47thSdBB0
display:none; と visibility:hidden; は使い分けるもんだとマジレス
初心者がどうとかの二択じゃないよね

689:名無しさん@お腹いっぱい。
09/01/17 10:20:31 tZkhjNpx0
>>680
これ良いね
ブログでは携帯向けに改行多すぎだから便利
今まで使ってたものも良かったから悩むなぁ・・・

でも、このサイトでは利かないなね
エンタメニュース - BIGLOBEニュース
URLリンク(news.biglobe.ne.jp)

690:名無しさん@お腹いっぱい。
09/01/17 10:24:49 tZkhjNpx0
>>680のフィルタ使うと
このブログでは凄い事にww

新人賞!!!|有川知里オフィシャルブログ ちりぶろ。 Powered by Ameba
URLリンク(ameblo.jp)


691:某395
09/01/17 11:58:20 KoR4Qv3c0
>>687-688
うはw スペースが残るのか、知らなかったw
いらないソースは全部HTMLからごっそり消してたから気付かなかったらしい、申し訳ない。。

>>682
>まず実験の仕方から覚えないとダメ。
おまえが言うな。

692:名無しさん@お腹いっぱい。
09/01/17 15:53:24 kLVGgKdD0
Name = "continuous margin deleter1 (2008.07.24)"
Active = TRUE
URL = "(^$KEYCHK(m))($TYPE(htm)|$TYPE(js))"
Limit = 128
Match = "(<p(^aram|re)[^>]+> ([%81][%40] |[%A1][%A1] |[%E3][%80][%80] |\&nbsp; |<[bh]r[^>]+> |<!-- [^>]++ --> |<font[^>]+> |</font> )+</p> )+{1,*}$SET(1=valid p margin)"
Replace = "\r\n<!-- continuous margin deleted - \1 -->\2\r\n"

693:名無しさん@お腹いっぱい。
09/01/17 15:53:56 kLVGgKdD0
Name = "block inner break deleter (2008.05.30)"
Active = TRUE
URL = "(^$KEYCHK(m))($TYPE(htm)|$TYPE(js))(^www.watch.impress.co.jp/|www.sofmap.com/)"
Limit = 128
Match = "("
"(</+(blockquote|body|center|div|form|h[1-6]|head|noscript|p|span|table|t[dhr])[^>]+>)\1 (<!--[^>]++-->|)\# (<br (/|class=$AV(*) )+> "
"([%81][%40] |[%A1][%A1] |[%E3][%80][%80] |. |\&nbsp; |(<!-- (^st-hp-f)[^>]++ -->)\# )+)+{1,*}$SET(9=memo全角空白にマッチしない))|"
"((<br (/|class=$AV(*) )+> ([%81][%40] |[%A1][%A1] |[%E3][%80][%80] |. |\&nbsp; |(<!-- [^>]++ -->)\# )+)+{1,*} (^(^</(body|div|p|d[dlt]|table|t[dh]|center)>)))|"
"((<br (/|class=$AV(*) )+> ([%81][%40] |[%A1][%A1] |[%E3][%80][%80] |. |\&nbsp; |(<!-- [^>]++ -->)\# )+)+{1,*} (^(^<t[dh])))|"
"((<br (/|class=$AV(*) )+> ([%81][%40] |[%A1][%A1] |[%E3][%80][%80] |. |\&nbsp; |(<!-- [^>]++ -->)\# )+)+{2,*} (^(^</(span$SET(2=<br/>))>))"
")"
Replace = "\1\@\r\n<!-- block inner break deleted -->\2\r\n"

694:名無しさん@お腹いっぱい。
09/01/17 15:54:28 kLVGgKdD0
Name = "inline inner break deleter (2008.07.24)"
Active = TRUE
URL = "(^$KEYCHK(m))($TYPE(htm)|$TYPE(js))"
Limit = 128
Match = "((<font[^>]+>)\1 (</+br /+> )+{1,*})|"
"((</+br /+> )+{1,*} (</a>)\1)"
Replace = "\1\r\n<!-- inline inner break deleted -->\r\n"

695:名無しさん@お腹いっぱい。
09/01/17 15:54:59 kLVGgKdD0
Name = "block outer break deleter (2008.07.24)"
Active = TRUE
URL = "(^$KEYCHK(m))($TYPE(htm)|$TYPE(js))(^www.watch.impress.co.jp/)"
Limit = 128
Match = "(<br[^>]+> )+{1,*} (( <!-- [^>]++-->)+)\2$SET(1=\2\r\n) (^(^<(blockquote|center|div|h[1-6]|hr|p|table)))"
Replace = "\r\n<!-- block outer break deleted -->\r\n\1"

696:名無しさん@お腹いっぱい。
09/01/17 16:04:21 kLVGgKdD0
これは本文長過ぎと言われたので2分割。
行も長過ぎと言われたので、区切っても問題なさそうなところで改行した。

Name = "continuous margin deleter2 (2008.12.22) (2009.01.17)"
Active = TRUE
URL = "(^$KEYCHK(m))($TYPE(htm)|$TYPE(js))(^images.google.co.jp/|cgi[24].nhk.or.jp/|www.watch.impress.co.jp/)"
Limit = 128
Match = "(<div\s[^>]++class=$AV(\3)&[^>]++id=$AV(\4)[^>]+> ([%81][%40] |[%A1][%A1] |[%E3][%80][%80] |\&nbsp; |<[bh]r[^>]+> |<spacer[^>]+> |<!-- [^>]++ --> )+</div> )"
"$SET(1=div margin)$SET(2=\r\n<div class="\3 continuous" id="\4"></div>)|"
"(<div\s[^>]++class=$AV(\3)[^>]+> ([%81][%40] |[%A1][%A1] |[%E3][%80][%80] |\&nbsp; |<[bh]r[^>]+> |<spacer[^>]+> |<!-- [^>]++ --> )+</div> )"
"$SET(1=div margin)$SET(2=\r\n<div class="\3 continuous"></div>)|"
"(<div\s[^>]++id=$AV(\4)[^>]+> ([%81][%40] |[%A1][%A1] |[%E3][%80][%80] |\&nbsp; |<[bh]r[^>]+> |<spacer[^>]+> |<!-- [^>]++ --> )+</div> )"
"$SET(1=div margin)$SET(2=\r\n<div class="continuous" id="\4"></div>)|"

697:名無しさん@お腹いっぱい。
09/01/17 16:05:24 kLVGgKdD0
"(<div\s[^>]++style=$AV(\5)[^>]+> ([%81][%40] |[%A1][%A1] |[%E3][%80][%80] |\&nbsp; )+</div> )"
"$SET(1=div margin)$SET(2=\r\n<div class="continuous" style="\5"></div>)|"
"(<div> ([%81][%40] |[%A1][%A1] |[%E3][%80][%80] |\&nbsp; )+</div> )$SET(1=div margin)|"
"(<p(^aram|re)[^>]+> (([%81][%40] |[%A1][%A1] |[%E3][%80][%80] |\&nbsp; )+<p(^aram|re)[^>]+>)+{1,*} "
"([%81][%40] |[%A1][%A1] |[%E3][%80][%80] |\&nbsp; )+)$SET(1=invalid p margin)|"
"(<td(^[^>]++background=$AV(*))[^>]+>"
"( [%81][%40] | [%A1][%A1] | [%E3][%80][%80] | \&nbsp; | <[bh]r[^>]+> | <spacer[^>]+> | </+font[^>]+> | <!-- [^>]++ --> |\s)+{1,*}</td> )"
"$SET(1=td)$SET(2=\r\n<td><!-- continuous margin --></td>)"
Replace = "\r\n<!-- continuous margin deleted - \1 -->\2\r\n"

>696の続きここまで。

698:名無しさん@お腹いっぱい。
09/01/17 16:13:35 Jkv+Cdf40
>>689
そこは改行が<p/><p/><br>になってるから効かないのは当然

699:名無しさん@お腹いっぱい。
09/01/17 16:18:40 kLVGgKdD0
以上、あらゆる手段で余計な縦方向marginを削除するフィルタ群。
完成度低くて恥ずかしいが、古いもののバックアップを除いて全部晒した。
>689-690で利用できるものも入っているし、
検索表現のどの部分がマッチしているかは
replaceされたコメントを見てもらえばわかるようになっている。

検索表現を見てもらえばわかるけど、
多彩な場面を想定して汎用的に対応させようとしたのが原因で
自分でもわけわからんくらいに検索表現が肥大化している。
>675はその見直しで、むだを少なくすることに重点を置いている。

700:名無しさん@お腹いっぱい。
09/01/17 16:45:28 PkKRV0OL0
No object!!(似非NoScript)を更新しました。
URLリンク(proxo.hp.infoseek.co.jp)

変更内容
・subが誤爆していたのを修正
・subをExtにまとめた
・水色がコメントに囲まれて表示されないのを更に回避


701:名無しさん@お腹いっぱい。
09/01/17 16:49:40 kLVGgKdD0
>681
<br><br>にマッチさせて</p><p>に置換させるとかだったら有用かも。
text/html でないと通用しないけど。これも実験してみる。

>682
念のため試してみたけど
br { visibility: hidden !important; } は意味がない。
不可視化するだけで要素そのものはなくならないから。

702:某395
09/01/17 16:58:56 KoR4Qv3c0
>>701
だな、ごめん。

昔の記憶を頼りにものを書くと間違いだらけになるようだ。
上のほうのGIFを止めるにチェックしたときの動作も記憶の中では機能してなかったはずが
今試してみたらちゃんと効いてるし。 当時検証したときにおそらくキャッシュが残ってたんだろうな。

自分の知識が穴だらけになってる予感。 以後検証し直してから書くようにするでござる。

703:名無しさん@お腹いっぱい。
09/01/18 14:37:12 1QoJMV1R0
>>700
いつも乙!

704:名無しさん@お腹いっぱい。
09/01/18 19:20:32 J5l7Tp3T0
>>156
これが最近効かなくなってきたんですが、だれか修正してもらえませんか?

705:名無しさん@お腹いっぱい。
09/01/18 19:31:34 AqvCJgrp0
<div id="default-language-box"

<div id="default-language-box" style="display:none"

706:名無しさん@お腹いっぱい。
09/01/18 20:00:00 J5l7Tp3T0
>>705
早速の修正どうもありがとうございました!

707:KpgLfSWL
09/01/19 04:02:46 rQDU4Ron0
URLリンク(www-personal.umich.edu) tusi m 533 manual

708:名無しさん@お腹いっぱい。
09/01/19 13:11:41 c2jYUHXy0
IEでjaneみたくbeへログインできるフィルター教えてください

709:名無しさん@お腹いっぱい。
09/01/19 20:17:05 lfHaPApL0
【Proxomitron】Jane用内部Proxy設定スレ【Privoxy】
URLリンク(jane.s28.xrea.com)

111 名前:Jane使いの名無しさん[sage] 投稿日:2009/01/19(月) 13:10:38 ID:rkWihxKO0
IEでjaneみたくbeへログインできる?

710:名無しさん@お腹いっぱい。
09/01/19 22:26:05 yB0INagb0
質問なのですが、意図的にURLリストをハッシュ化させる事ってできますか?
例えばふたばを↓のように書いているのですが、Non-Hashed Itemsに分類されてしまいます
[^/]++.2chan.net/

711:名無しさん@お腹いっぱい。
09/01/19 22:32:06 fKHXPlfg0
[^.]+.2chan.net/は?

712:名無しさん@お腹いっぱい。
09/01/20 00:44:22 54JBBHl70
>>703
ありがとうございます。


下記のURLのフィルタ郡でNo object!! subに行きつく前に
なぜかグローバル変数が開放されてしまいます。
なぜでしょうか?

URLリンク(proxo.hp.infoseek.co.jp)


713:名無しさん@お腹いっぱい。
09/01/21 12:33:25 FkS6DXiP0
ヘッダフィルタのAccept-encoding: Allow webpage encoding (out)とFix MIME系
って今のご時世(FireFox3とか)でも使った方が良いですか?

714:名無しさん@お腹いっぱい。
09/01/21 17:46:29 Q9aoLj8z0
もともと行儀が悪いサーバが返すものをFixするためのものだから、
自分が巡回するサイトと相談して決めればいい
ProxyでFixするのか、ブラウザの設定で対応するのか、という好みもあるだろうし

715:某395
09/01/21 21:56:12 ou4bx+A50
MIMEfixフィルタは諸刃の剣だから必要性を感じないなら入れない方がいいよ。
どういうフィルタかすら分かってない人が入れると後が大変。 素人にはおすすめ出来ない。

716:名無しさん@お腹いっぱい。
09/01/21 22:17:40 dbrp+rVd0
あ、やっぱり>>712は無しで
Proxomitronはただ単に上のフィルタの方が優先順位が高いだけで
フィルタは同時に実行でしたね


717:名無しさん@お腹いっぱい。
09/01/21 23:38:00 dbrp+rVd0
No object!!(似非NoScript)を更新しました。
URLリンク(proxo.hp.infoseek.co.jp)

変更内容
・イベントハンドラが存在するかどうかを分かるように(ワインレッドの四角形。↓の画像参照)
・水色の四角形を紫色の四角形に変更
・</body>や</html>等がなくても紫色が現れることが出来るようにした
・Replace full path for No object!!を少し修正
・No object!! subを復活させた

URLリンク(proxo.hp.infoseek.co.jp)
これの右上。黄緑色はAutoPageLoader
そのページにイベントハンドラしか存在しない場合ワインレッドの正方形
イベントハンドラが存在せず内部スクリプト等が存在する場合オレンジの正方形


718:名無しさん@お腹いっぱい。
09/01/22 00:16:31 oDsHeXoz0
>>717
GJ。ありがたくいただきます。

719:名無しさん@お腹いっぱい。
09/01/22 02:07:02 RjkZWSwf0
No object!!(似非NoScript)を更新しました。
URLリンク(proxo.hp.infoseek.co.jp)

変更内容
・Replace full path for No object!!で間違ってたところがあったのを修正

[Patterns]
Name = "Replace full path for No object!! [2009/01/22]"
Active = TRUE
Multi = TRUE
URL = "$TYPE(htm)"
Limit = 5120
Match = "(<(bgsound|embed|link|object|script)\s[^>]++(data|href|src)=)\0$AV((^[a-z]+://)("
"(./|)(^.+/)\2$URL(([^?#]++/)\1[^/?#]+((^?)|[?#]))|"
"//\2$SET(1=http://)|"
"/\2$URL(([a-z]+://[^/?#]+/)\1)|"
"../(^.+/)\2$URL(([^?#]++/)\1[^/?#]+/[^/?#]+((^?)|[?#]))|"
"(../)+{2}(^.+/)\2$URL(([^?#]++/)\1([^/?#]+/)+{2}[^/?#]+((^?)|[?#]))|"
"(../)+{3}(^.+/)\2$URL(([^?#]++/)\1([^/?#]+/)+{3}[^/?#]+((^?)|[?#]))|"
"(../)+{4}(^.+/)\2$URL(([^?#]++/)\1([^/?#]+/)+{4}[^/?#]+((^?)|[?#]))|"
"(../)+{5}(^.+/)\2$URL(([^?#]++/)\1([^/?#]+/)+{5}[^/?#]+((^?)|[?#]))"
"))"
Replace = "\0"\1\2""


720:名無しさん@お腹いっぱい。
09/01/23 13:52:27 sT5PB9BF0
amazonの商品ページを少しでも軽くしたいのですが
みなさんどういうところを削ってますか?
ごちゃごちゃいろんなのあるからどれ削ればいいのかわからない

721:名無しさん@お腹いっぱい。
09/01/23 18:10:39 3QAYg4U90
自分はJavascriptとiframe、Flashを切ってくるくらいだけど
Amazonって十分軽くない?

722:名無しさん@お腹いっぱい。
09/01/23 18:24:16 hZSMcZKg0
私はユーザーエージェントを偽装して
携帯サイトを見ています
恐ろしく軽いですよ。

723:名無しさん@お腹いっぱい。
09/01/23 21:24:27 8pW8Z1nZ0
<iframe[^>]++ad[^>]++>*</iframe>
やっつけで今作ってみたけどこんなんとか?w

俺は誤爆が嫌なんでフィルタはなるべくリスト化(#でコメ入れられるので整理しやすい)
及びURLマッチで固定して使ってるのだけど、Amazonは何もしてないです
firefox3+NoScriptで表示に一秒かからないし、ほとんどの画像が自社宣伝な気がするので・・・
(ただしblogにあるようなAmazonアフィは削ってます)

724:名無しさん@お腹いっぱい。
09/01/23 21:30:47 uYnHFkKP0
CSS内部の書き換えがうまくいかないんだけど、誰かアドバイスお願い。

Active = TRUE
URL = "$TYPE(css)"
Limit = 512
Match = "font-size:([0-9]|10)px"
Replace = "font-size:11px"

ブラウザの文字サイズ設定が利かないスタイルシートで固定されている
フォントサイズを、10px以下のものは11pxにしたい感じです

725:名無しさん@お腹いっぱい。
09/01/23 21:48:58 ZgxNc/gl0
使ってるブラウザがFirefoxなら最低フォントサイズ設定できるよ。

726:名無しさん@お腹いっぱい。
09/01/23 21:57:49 uYnHFkKP0
>>725
FirefoxとOperaなら標準の最低フォントサイズがあるの試した。
でもIEコンポのプニルから変えたくなくって、現状はStyleEditorってプラグインで
ページごとに小さいフォントを大きく編集するのが面倒で・・

>>724の設定で置換テストはうまく言ってるのに、ページ表示させると
適用されてなくって、読み込まれたCSS開いてみてもフォントサイズは変わってないままなんです

727:名無しさん@お腹いっぱい。
09/01/23 21:57:54 ftEmlAS80
>722
UAを何と名乗っているか教えてほしい。

728:名無しさん@お腹いっぱい。
09/01/23 22:11:43 sT5PB9BF0
>>722
どんなの使ってますか?
IE使いなんですがiphoneのだとユーザーレビューが表示されない


729:772
09/01/23 22:18:30 hZSMcZKg0
DoCoMo/1.0/F503i/c10
こんなんですが、レビューも見られます。

730:名無しさん@お腹いっぱい。
09/01/23 22:45:02 sT5PB9BF0
[HTTP headers]
In = TRUE
Out = TRUE
Key = "User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)"
URL = "www.amazon.co.jp"
Match = "*"
Replace = "DoCoMo/1.0/F503i/c10"

こうじゃだめなんでしょうか
URLリンク(www.amazon.co.jp)
なんかエラー用ページっぽいところに飛ばされる

731:772
09/01/23 22:59:05 hZSMcZKg0
私は
Proxomitron iモードサイト User-Agent
で検索して、一番最初に出たやり方でやっただけです
詳しくなくてごめんなさい。

732:名無しさん@お腹いっぱい。
09/01/24 00:09:06 9iZm7b+F0
In = TRUE
Out = TRUE
Key = "User-Agent: pretend to portable telephone (in+out) (test)"
URL = "www.amazon.co.jp/"
Replace = "DoCoMo/1.0/P501i"

Firefox/2.0.0.20使用で>730みたいにしてみたけど特に変わったところはないな。
>730が言うように飛ばされることもなかった。Matchは空欄。
ログウィンドウで動作確認も済ませた。

PC用のページから携帯用ページに転送できないかと考えたが、
URLに規則性がないと思われるため断念した。
キーワード+site:www.amazon.co.jp/gp/aw/
で検索したら、携帯用のページらしいものがリストアップされるようにはなった。
ただ、携帯用のページは必要な情報まで削っているから実用に値しないな。

733:名無しさん@お腹いっぱい。
09/01/24 12:40:59 zsP6TwyF0
>>724
それでやってみると肝心な所はフォント変わらなくて
どうでもいい所のフォントサイズが変わったw

734:名無しさん@お腹いっぱい。
09/01/24 15:45:20 dQDuGK7i0
font: bold 8px というような複合指定もあるし、
単位もpx以外にパーセントやpt、xx-smallなんかもけっこう使われてるんでは

735:think ◆MM0nnAOCiQ
09/01/24 16:19:41 8gXKxY/30
>>724,726
下記フィルタでどうでしょうか?(これ以上は実際のCSSを見てみないと、何とも言えません。)

[Patterns]
Name = "Resize font-size [2009/01/24] test1"
Active = TRUE
URL = "$TYPE(htm)|$TYPE(css)"
Limit = 32
Match = "font-size : [#1:10]px(^(^ [;}]))"
Replace = "font-size: 11px"

ただ、フォントサイズ変更のやり方は下記にあげるように様々で、
全てに対して置換を行うのは労力に見合わないのではないかと思います。(特に各単位への対応が難しい)

・font-sizeプロパティで指定(単位に「px」「em」「%」「ex」「small」等がある)
・fontプロパティで指定
・font要素で指定

ユーザーCSSで対応するのではダメでしょうか?

快適なウェブページ閲覧のために
URLリンク(park5.wakwak.com)
Font-size Enforcer | userstyles.org
URLリンク(userstyles.org)

736:某395
09/01/24 19:33:45 muYWD+rT0
>>724
IEのキャッシュを消すんだ。

737:名無しさん@お腹いっぱい。
09/01/24 21:23:11 v3iaeOzt0
DMMのアフェリのURLから、ID部分を削除するフィルタってないですか?

amazonアソシエイトはあったんですが、それ見て書き換えようと思ったけどうまくいかない。。。

738:名無しさん@お腹いっぱい。
09/01/24 21:23:57 9iZm7b+F0
ユーザスタイルシート使うのがベストだな。
CSSパーサがIE6相当の能力だと想定するなら
/* applet, big, br, button, col, colgroup, font, head, iframe, input, noframes, optgroup,
option, param, script, select, small, style, textarea */
a, abbr, acronym, address, area, b, bdo, blockquote, body, caption, center, cite, code,
dd, del, dfn, div, dl, dt, em, fieldset, form, h1, h2, h3, h4, h5, h6, hr, html, i, img, ins,
kbd, label, legend, li, link, map, meta, noscript, object, ol, p, pre, q, s, samp, span, strike,
strong, sub, sup, table, tbody, td, tfoot, th, thead, title, tr, tt, u, ul, var {
font-size: 100% !important; }
とか。


あえてフィルタにするなら
(font-size|font) : [^;}]+
にマッチさせて、置換テキストはなし。

739:某395
09/01/24 21:35:38 muYWD+rT0
小さすぎる文字を大きくしたいだけだからその他の文字サイズはいりじたくないんじゃね。
それだと全部100%に戻しちまう。

それと、 試してないが、

* {font-size: 100% !important; }

じゃ駄目なのか?

740:某395
09/01/24 21:51:05 muYWD+rT0
あー、恥ずかしかったら無理に出てこなくていいからな。

741:名無しさん@お腹いっぱい。
09/01/24 21:55:24 Aqt2LJvx0
>* {font-size: 100% !important; }
ってなに?試すってこれにマッチさせるってこと

742:某395
09/01/24 22:00:54 muYWD+rT0
いや、

a, abbr, acronym, address, area, b, bdo, blockquote, body, caption, center, cite, code,
dd, del, dfn, div, dl, dt, em, fieldset, form, h1, h2, h3, h4, h5, h6, hr, html, i, img, ins,
kbd, label, legend, li, link, map, meta, noscript, object, ol, p, pre, q, s, samp, span, strike,
strong, sub, sup, table, tbody, td, tfoot, th, thead, title, tr, tt, u, ul, var {
font-size: 100% !important; }

の代わりに

* {font-size: 100% !important; }

と書いても同じ結果になるんじゃない? って話。

743:名無しさん@お腹いっぱい。
09/01/25 00:58:06 KA//dUma0
100%は設定が中(12)なら全部12。

744:某395
09/01/25 08:13:31 PdWWV/Lq0
win7βでオミトロンが動くかどうかをテストするなら今のうちにダウソ。
URLリンク(www.microsoft.com)

745:名無しさん@お腹いっぱい。
09/01/25 08:23:30 iZevte2R0
>>744
7β 32bit版で使ってますが、問題なく動いてるようです

ver:Naoko 4.5(2003-6-1)+7

746:某395
09/01/25 08:31:36 PdWWV/Lq0
>>745
㌧㌧。

747:名無しさん@お腹いっぱい。
09/01/25 13:27:10 8OfCOBvF0
フィルターの作成お願いします。

グーグルの検索結果からwww.j-tokkyo.comを含む結果を削除したいです。
例えば「アルミ冠」でググると候補の二つめに出てきます。
常に検索上位に出現するにもかかわらず、殆ど必要な情報を含まないので
邪魔でしかありません。消え去って貰えれば、検索が楽しくなると思うので
よろしくお願いします。

748:名無しさん@お腹いっぱい。
09/01/25 13:31:54 30LkusQt0
>>747
「google Proxomitron」でググったらあったよ

Googleの検索結果から任意のノイズを取り除くProxomitronフィルタ - 隠れん坊将軍の隠れ蓑
URLリンク(d.hatena.ne.jp)

749:名無しさん@お腹いっぱい。
09/01/25 14:10:27 8OfCOBvF0
>>748
「任意のノイズ」の応用も利きそうですし試して見たいと思います。
ありがとうございました。

750:名無しさん@お腹いっぱい。
09/01/25 14:13:35 lEwN6u7g0
単に「アルミ冠 -j-tokkyo」で検索すれば良いという話も

751:名無しさん@お腹いっぱい。
09/01/25 14:55:59 zQrRvVrb0
>>748
はてなこそノイズだという声も

752:名無しさん@お腹いっぱい。
09/01/25 15:16:12 56lm6w6+0
某395とかいうのが痛々しすぎるw

753:名無しさん@お腹いっぱい。
09/01/25 16:08:14 swgMT+kL0
>>751
検索においてはてなのウザさは異常

754:名無しさん@お腹いっぱい。
09/01/25 16:45:31 swgMT+kL0
>>748
そこのフィルタ使ってOperaで検索したら
検索結果を異常なくらいDLしてる
400MB位でやめたけどw

kikiでも同じような感じ

755:名無しさん@お腹いっぱい。
09/01/25 19:03:39 JHnqwqKF0
>>748
Firefox3.1b2 でも使えなかった。

756:某395
09/01/25 20:09:36 PdWWV/Lq0
>>748
マッチの先頭でkeychkとかないわ。

>>752
恥ずかしがり屋ですぐ雲隠れするおまえらはかわいい。

757:think ◆MM0nnAOCiQ
09/01/25 23:46:51 jtezWQTN0
>>750
> 単に「アルミ冠 -j-tokkyo」で検索すれば良いという話も
その方式でフィルタしてみました。
Googleは検索クエリ32件までの制限があるので、スパムURLを追加していく使い方だと実用性が低そうですが…。

Googleの検索結果から検索エンジンスパムを除外するProxomitronフィルタ - think49の日記
URLリンク(d.hatena.ne.jp)

758:名無しさん@お腹いっぱい。
09/01/25 23:49:36 4VcA86cx0
試してないが、お手軽だし十分な機能としてはいい感じだね。
ただ、条件が面倒な事になるし、やっぱちゃんとしたフィルタ作った方がいろいろな意味で良さそう。

759:名無しさん@お腹いっぱい。
09/01/26 00:10:34 dIK9xHqt0
はてなとかホントうざいし除外できるといいよね。
そして除外したいサイトの演算子とか見たくないw

760: ◆FalkyLQgyg
09/01/26 00:39:29 GHvUrh1v0
>>754
> 検索結果を異常なくらいDLしてる
この意味がちょっとわからないのですが、よろしければもう少し教えてください。
読み込み量が大きく増えるような動作は組み込んでいないはずなのですが…。

>>755
すみません、確かにいろんなブラウザで動かなくなってるみたいですね。
2008/10/19の版は動作が確認できたので、もし必要でしたらそちらをどうぞ。

761:名無しさん@お腹いっぱい。
09/01/26 01:10:05 W9svX8uz0
おーこれはいい

762:think ◆MM0nnAOCiQ
09/01/26 01:28:26 Q+fIhsTo0
>757を更新。

フィルタ微調整とはてなのpre記法に関するゴミを取りました。
症状としては、

・pre記法の内部に「i<L」を書くと行末に </pp> が入る。「i < L」なら入らない。

調べてみたら、はてなのpre記法に不具合があるらしいですね。
使いやすいブログシステムってないなあ。結局、自作するしかないのか…。

Google検索: はてな pre記法 不具合
URLリンク(www.google.co.jp)

763:名無しさん@お腹いっぱい。
09/01/26 02:18:59 QNFxFXSL0
>>760
検索ページの下がいつまでも表示されず
プログレスバーのMBの数字が上昇
実際にHDDの残量で減ってたのを確認
なにをDLしてたのかはわかりません

ちなみにkikiでも固まった感じでHDDの残量みてたら減っていったよ

764:名無しさん@お腹いっぱい。
09/01/26 02:41:54 QNFxFXSL0
>>760
URLリンク(up.img5.net)

こんな感じで右上で延々何かをDLしてる様子
下の方は描写されず

765: ◆FalkyLQgyg
09/01/26 02:50:31 GHvUrh1v0
>>763-764
わざわざ検証していただいてありがとうございます!
thinkさんに見直していただいたのですが、どうやらmatchがループしてしまい
faviconを無限にDLしているようです。>>763さんの症状とも合致しますね。

URLリンク(sizuken.no-ip.com)
これだとどうでしょうか?

766:名無しさん@お腹いっぱい。
09/01/26 02:57:58 QNFxFXSL0
>>765
今の所、Opera・kikiとも異常無しです

767: ◆FalkyLQgyg
09/01/26 03:07:29 GHvUrh1v0
>>766
ありがとうございます!
根本的には解決できてないんですが、時間がかかりそうなのでひとまず公開版にしておきますね。
ご協力くださった皆様、ありがとうございました。

768:think ◆MM0nnAOCiQ
09/01/26 03:52:42 Q+fIhsTo0
>>763
私の場合、Fx3.0.5で URLリンク(www.google.co.jp) では落ちず、URLリンク(www.google.co.jp) で落ちる。
という症状でした。落ちる状態ではCPU使用率100%でメモリを消費し続けます。
ちなみに、 ((</div><br clear="all"/>|))\0 を (</div><br clear="all"/>)\0 に直したら落ちなくなりました。
(ただし、この場合は検索結果が1ページに収まるときにfaviconの表示ができなくなるそうです。)

769:think ◆MM0nnAOCiQ
09/01/26 03:55:29 Q+fIhsTo0
ありゃ、リロードすれば良かったですね。
失礼しました。m(_ _)m

一応、私の方でも作成したフィルタを公開しておきますね。
非JavaScript版でFx3.0.5での動作を確認しました。
URLリンク(vird2002.s8.xrea.com)

770:think ◆MM0nnAOCiQ
09/01/26 04:35:54 Q+fIhsTo0
「Google: Cleanup Search Engine Spam」(>769)を更新しました。
URLリンク(vird2002.s8.xrea.com)

更新履歴
2009/01/26 04:31
- 検索結果が1ページだった時にfaviconを表示しない不具合修正
- favicon挿入後にグローバル変数を解放するようにした
- リストファイル名を SearchEngineSpam.txt に変更

771:think ◆MM0nnAOCiQ
09/01/26 04:45:26 Q+fIhsTo0
「Google: Cleanup Search Engine Spam」を更新。
URLリンク(vird2002.s8.xrea.com)

更新履歴
2009/01/26 4:41
 - マッチしなかった時にもクリーンアップレポートを表示する不具合修正

初歩的なミスでした。m(_ _)m

772:名無しさん@お腹いっぱい。
09/01/26 09:56:03 qlCUvLRf0
誰のフィルターを使ってみるかは環境によるだろうけど、
このフィルターのアイデアは素晴らしいので(本当に!)
メンテも続けられることを願ってます。

773:名無しさん@お腹いっぱい。
09/01/26 10:27:13 Pp2dKcqS0
>>771
これを入れると「Google: High Light」が効かなくなる?



774:think ◆MM0nnAOCiQ
09/01/26 12:29:21 Q+fIhsTo0
>>773
「Google: High Light」と併用できますよ。(私の環境では効いてます。)
とりあえず、他のフィルタとの干渉を疑ってみるとか…。

# 「Autopagerize → 1ページ目しかfavicon表示されない」は回避しようがないかも。
# AutopagerizeのSITEINFOをProxomitron用に手直しして対処するぐらいかな。

775:think ◆MM0nnAOCiQ
09/01/26 12:57:45 Q+fIhsTo0
「Google: Cleanup Search Engine Spam」を更新。
URLリンク(vird2002.s8.xrea.com)

更新履歴
2009/01/26 12:49
- スパム消去フィルタのLimitを小さくした (4096 -> 2048)
- インデント表示されたページを消去できない不具合修正

ToDo
- prototip(JSライブラリ)対応
- favicon表示をはてなのfaviconAPIに変更 (試験的処置。後で戻すかも?)
- AutopagerizeのSITEINFOを修正して、スクロールしてもfavicon表示に永遠に追いつけない問題に対処

776:某395
09/01/26 21:46:06 iEt7zidV0
ぐぐる検索の検索結果ページで、ページ中盤までスクロールしたら次のページの
検索結果を表示中のページの下に追加表示するフィルタって需要ある?

777:名無しさん@お腹いっぱい。
09/01/26 21:53:19 cXYb2wpK0
あるんじゃね?
FxでAutoPager使ってるけど死ぬほど便利。

778:某395
09/01/26 22:05:16 iEt7zidV0
>>777
拡張があったのかw ajax使ってなんかやってみようかと思ったけどそれでいいやw
早速入れてくる。

779:名無しさん@お腹いっぱい。
09/01/26 22:09:14 cXYb2wpK0
どひゃーw

780:名無しさん@お腹いっぱい。
09/01/26 22:28:10 6awW+OzR0
AutoPagerizeは一度使うと、もう虜だよね

781:名無しさん@お腹いっぱい。
09/01/26 23:58:25 O0rbwb/10
>>775
非表示、下部faviconも便利なんですけど
URLリンク(userscripts.org)
ここのScreenshotみたいに色違いにして
一目で何がマッチしたのかが分かるような版も願いします

782:名無しさん@お腹いっぱい。
09/01/27 00:53:48 hqHp9xeR0
>>780
そうでもないぞ、どうせそんな後ろにヒットした結果なんてしれてるし
1週間ほど使って、特に必要がないことに気づいてやめたわ

783:名無しさん@お腹いっぱい。
09/01/27 00:55:43 shnPB5RI0
>>782
検索以外にも使えるでしょ

784:名無しさん@お腹いっぱい。
09/01/27 00:56:41 QpIQ3WL40
>>782
検索以外でも使うでしょ
例えばBlogだったり、ITmedia等の記事だったりさ

785:名無しさん@お腹いっぱい。
09/01/27 05:03:44 debhBFN60
>>782
Tumblrなんかには必須。
とあるWeb漫画を つらつらと読めたのは最高だった。

786:名無しさん@お腹いっぱい。
09/01/27 08:46:28 9l6c8/Vt0
使うページ使わないページをきっちり分けられるといいんだけどね
AutoPagerはこのページで使いますかーって聞いてくれるけど
一度答えるとその後変更する手段がなくてダメだった
ありゃ一体どうなってんだ

787:名無しさん@お腹いっぱい。
09/01/27 10:08:04 DovcIyXY0
>>786
AutoPagerアイコンを右クリックで「ページ設定を表示する」とか「設定の管理」とか。

788:think ◆MM0nnAOCiQ
09/01/27 11:18:06 bwSI9FHB0
「Google: Cleanup Search Engine Spam」を更新。
URLリンク(vird2002.s8.xrea.com)

更新履歴
2009/01/27 11:06
- favicon表示にはてなのfavicon APIを使うようにした (favicon表示の高速化)
- 「Autopagerizeとの連携」の説明を入れた (※テキスト内の後述参照)

# 「prototip」はID指定で実装するしかないのが痛いなあ。
# ID用の関数が必要になる。&start= から数値を得るか、ランダム文字列を生成するか…。

789:think ◆MM0nnAOCiQ
09/01/27 11:21:45 bwSI9FHB0
>>781
んー、出来なくはないんですが全く同じデザインにするとメンテが大変なので、各自で改変してください。
例えば、「Google: Cleanup Search Engine Spam 1 [2009/01/27] test1」を以下のように置換する形でどうでしょう?

<a href='\1' title='$GET(Temp)'><img style='margin-right: 1px;border:1px solid #eee;' src='URLリンク(favicon.hatena.ne.jp)(\1)' /></a>
 ↓
<a style='color: #999;' href='\1'>$GET(Temp)</a>


790:名無しさん@お腹いっぱい。
09/01/27 22:08:44 XTfRM7Ui0
>756
$KEYCHKで先頭でだめなのはなぜなのか教えてほしい。

URLリンク(vird2002.s8.xrea.com)
「1バイトずつURLテスト」と同じような理由だろうかとは思うが、どうなんだろう。
そもそも「1バイトずつURLテスト」がなぜ著しい速度低下を招くのかもわからない。
URLマッチとどこが違うんだろうか。

791:781
09/01/27 22:29:50 Um/WYqDA0
>>789
ありがとうございます。アドバイスを参考に試行錯誤してみます。

792:某395
09/01/27 23:05:09 xaJc5IsF0
>>790
いや、それと同じ原理。 マッチングコマンドは検索スピードがテラ遅いんだ。
無駄な処理を1バイト進むごとにすることになる。

フィルタ編集画面にある「テスト」ボタンを押せばテストウインドウが開くが、
このウインドウにある「プロファイル」ボタンを使えばマッチングテストにかかる時間を調べることが出来る。
検索対象になるフォームに大量の文字を入れてから

123$KEYCHK(a)



$KEYCHK(a)123

のタイムを比較してみ。 テスト時にAキーを押してる必要無し。

793:think ◆MM0nnAOCiQ
09/01/27 23:46:02 bwSI9FHB0
>>790
> URLマッチとどこが違うんだろうか。
・URLマッチ   … 通信リクエストを送るタイミングで「1回だけ」URLテストを行う。
・検索表現に$URL … 20byteのファイル読み込み時に1byte読み込む毎にURLテスト。「合計20回」のURLテストを行う。

当然、前者の方が速いです。

# URLマッチで $KEYCHK() すれば、通信リクエストを送るタイミングで1回だけ $KEYCHK を行うため、効率が良くなります。

794:名無しさん@お腹いっぱい。
09/01/27 23:59:48 XTfRM7Ui0
>792
ありがとう。
大きく差が出た。$KEYCHKを後に置く方が速かった。

ソースが公開されていない以上、検索のしくみを解明するのは難しいかもしれないな。
それはともかく、$KEYCHK大好きな自分にとっては痛手だ。
必要な場合だけフィルタを有効にできるので余計なフィルタリングをすることがなく、
誤爆防止にもなってたいへんよろしいと思っていたんだが。
URLマッチで頻繁に使っていたけど、必要かどうか見直してみる。

795:名無しさん@お腹いっぱい。
09/01/28 00:04:21 XTfRM7Ui0
>793
ああなるほど。順番を考えるとそういうことになるのか。
URLマッチで使うのは無難と見てよさそうだね。
安心した。こちらも感謝。

796:名無しさん@お腹いっぱい。
09/01/28 00:09:03 pjgS9wDf0
URL = "$TYPE(htm)www.google.co(m|.jp)/search\?"
って
URL = "www.google.co(m|.jp)/search\?$TYPE(htm)"
より速い? 全く同じ?

797:某395
09/01/28 00:11:06 Eag4e5tj0
一応補足しておくと、

123$KEYCHK(a)

の場合、"123" がマッチしたときのみ "$KEYCHK(a)" がテストされる。
つまりHTMLソースの中に "123" が無いページでは "$KEYCHK(a)" は一回もテストされない。

ゆえに$KEYCHKをMatch欄に使う場合は$KEYCHKを出来るだけ検索表現の後ろに置くことで
速度低下を最小限にする事が出来るのよ。

798:某395
09/01/28 00:12:53 Eag4e5tj0
>>796
後者のほうが圧倒的に速い。 ただ、URLマッチは一度しか実行されないからほとんど影響なし。

799:名無しさん@お腹いっぱい。
09/01/28 14:53:04 vhv06Qiv0
リンク化されてないテキストをリンク化するフィルタを
書いたのですが採点お願いします。

[Patterns]
Name = "textlinker [2009/01/28]"
Active = TRUE
URL = "$TYPE(htm)"
Limit = 5120
Match = "([>\r\n])\0([^<>()={}]++)\1(h t t p|f t p|ttp|tp|p)\2(s://|://)\3(["'\-_.!~*()a-zA-Z0-9;\/?:@&=+$,%#]+)\4($TST(\2=f*)$SET(5=ftp)|$SET(5=http))"
Replace = "\0\1<a href="\5\3\4" target="_blank">\5\3\4</a>"


800:某395
09/01/28 15:18:59 Eag4e5tj0
>>799
20点。 おそらくどこかのフィルタのパクリ、しかも元のフィルタを相当改悪してる。

801:名無しさん@お腹いっぱい。
09/01/28 16:17:14 vhv06Qiv0
一応、パクりではないんですが
それと改悪と思われる箇所を挙げて頂けないですか?

802:某395
09/01/28 17:02:07 Eag4e5tj0
URL文字の中に " が入ってるのがまずおかしい。 これはURLには使えない文字。

"URLリンク(www.google.com)"

という書き込みがあったら最後の " までをリンクにしてしまう。(コードを貼るスレでなりそう)
( &quot; のように文字参照になる掲示板があるかも知れないのでその対策があるのが望ましい )

<> はともかく ()={} を否定すると

(google) URLリンク(www.google.com)

みたいな書き込みをリンク化出来なくなる。

一行にリンク化するべきURLが複数あっても最初の1つしかマッチしない。

誤爆回避のためにURLの後ろに ">" が無いかをチェックするべき。
これをすればタグの中かどうかを判定がより正確になる。


でもな、リンク化フィルタに完璧を求めるのは間違い(不可能)だから実用に支障が無いなら
そのままでいいと思うぞ。 誤爆するサイトではリストで対象外にするとかすれば問題無かろう。
フィルタ職人を目指すなら別だが。


803:名無しさん@お腹いっぱい。
09/01/28 17:14:05 FvhTXC+d0
MediaFire
URLリンク(www.mediafire.com)

から日本語名のファイルを落とすと
落としたファイルの名前が文字化けするのですが
これをProxomitronで自動的に修正することはできますか?

804:名無しさん@お腹いっぱい。
09/01/28 19:30:12 e//jJHWA0
$KEYCHK()は実行するたびに WinAPI の GetAsyncKeyState を呼び出してる。
API経由でOSの機能を呼び出すってのは重い処理なので、
繰り返し実行されるようなマッチングルールの書き方をするとすごく遅くなる。

普通に123とかの文字だったら、読み込み済みのバッファの所定の位置にその文字が
入ってるかどうか自分で比較するだけなので、すごく速い。

805:名無しさん@お腹いっぱい。
09/01/28 20:38:10 Sb4urV0x0
pixivで、題名に特定の文字列を含むイラストのサムネ非表示にできるフィルターってありませんか?
自分でもとりあえず作ってみたけど、テストでは出来てるのに肝心のサイト上では動かない(´・ω・`)

806:名無しさん@お腹いっぱい。
09/01/28 21:59:05 FIm6dXlC0
>>805
まずそのフィルタを貼ったほうが反応はいいんじゃないかな

807:799
09/01/28 22:09:35 vhv06Qiv0
>>802
これでどうでしょうか
横一列にURLが並んでいるのはほとんど見ないのでパスで
=の否定はjs用です
\&のすぐ後ろの\は削除してください
長いので2つに分けます

[Patterns]
Name = "textlinker [2009/01/28]"
Active = TRUE
URL = "$TYPE(htm)"
Limit = 5120
Match = "(<[^>]++[\r\n][^>]++(http(s://|://)|ftp)[0-9a-zA-Z!#$%&'()*+,\-./:;=?@_~]++)\1"
"("
"[^0-9a-zA-Z!#$%&'()*+,\-./:;=?@_~]"
"|(^\&\amp;|\&\#33;|\&\#35;|\&\#36;|\&\#37;|\&\#38;|\&\#39;|\&\#40;|\&\#41;|\&\#42;|
\&\#43;|\&\#44;|\&\#45;|\&\#46;|\&\#47;|\&\#58;|\&\#59;|\&\#61;|\&\#63;|\&\#64;|
\&\#95;|\&\#126;)(\&[a-z]+|\&#[0-9]+);"
")\2"
"([^>]++>)\3"
"$SET(0=\1\2\3)"



次ページ
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch