Proxomitron フィルター作成スレッド Part6at SOFTWARE
Proxomitron フィルター作成スレッド Part6 - 暇つぶし2ch550:名無しさん@お腹いっぱい。
07/03/15 22:59:36 5XjJlvKV0
アクセスキーは例えば、検索画面等で
[Mat] $NEST(<input\s,\0name=$AV((query|p|q)\1)\2,>)
[Rep] <input \0name="\1"\2 accesskey="1">

pはyahoo,qはgoogle

な感じで色々使えそうな気がする。

551:think ◆MM0nnAOCiQ
07/03/15 23:00:00 ZDvtMegz0
と、対処法を書き忘れました。

フィルタは上に配置してあるものの優先度が高いので、特定のURLにのみ適用させるフィルタ等、出来るだけ有効にしたいフィルタは上に配置してください。
基本的に、上に配置してあるフィルタから作用しますが、マッチングパターンによっては下のフィルタが先に働く場合もあります。
例えば、以下の状況があるとします。

---- htmlソース
<a href="URLリンク(test.com)

---- フィルタ
Name="test filter1"
Match="TestLink"

Name="test filter2"
Match="$NEST(<a\s[^>]++href=$AV(URLリンク(test.com)),</a>)"

「test filter1」は「test filter2」より上に配置しています。
但し、Proxomitronはファイルの先頭から1バイトずつ読み込んでフィルタに合致する状況かどうかテストしています。
ですので、初めにマッチするのはa要素から始まる「test filter2」です。
「test filter1」を優先させたい場合は、

Match="<a\s[^>]+>[^<]++TestLink"

と書きます。
「test filter1」と「test filter2」はa要素から始まるパターンを持っている事になります。
同じ状況のフィルタが2つある場合は、優先度の高いフィルタから働きます。

552:名無しさん@お腹いっぱい。
07/03/15 23:19:06 uLDWt/T60
>551
下に置いたフィルタが先にマッチする現象は、ずっと前から疑問に思ってた。
Proxomitron の仕様なのね。

フィルタを書き直すなどしないとだめなのか……。
優先度を設定することができるといいんだけど。

553:名無しさん@お腹いっぱい。
07/03/16 07:41:06 kg1cd2iM0
そいうのは「仕様」とはいわないだろ。

むしろどうしてそれを疑問に思えるのかが疑問なくらいに
至極当たり前の挙動だ。

554:名無しさん@お腹いっぱい。
07/03/16 09:13:53 +6j5jdaH0
いや、日本語としては「仕様」で間違ってないと思うけど。
>>552>>553がどういうニュアンスで捉えているか知らんが。

555:名無しさん@お腹いっぱい。
07/03/16 10:31:21 9J0GOQta0
まさに、仕様。

556:名無しさん@お腹いっぱい。
07/03/16 14:29:20 Lin+siRH0
仕様であってると思うよ。 これが至極当たり前の挙動と思ってるほうがおかしい。
検索アルゴリズムにはいろいろあるがオミトロンのこの方式はその中の1つでしかない。

557:名無しさん@お腹いっぱい。
07/03/16 14:30:04 8/GkMkD20
まぁ確かに

0 < 1 と評価するのはProxomitronの仕様なのね

みたいなこと言われたら
日本語として見ても主張の内容として見ても100%正しいけど
なんか妙だなって違和感は覚える

どちらの言いたいことも分かるが

558:think ◆MM0nnAOCiQ
07/03/16 18:53:48 Hi6v4zHb0
>>552
「現在のProxomitronの動作」と「>552氏が求めるProxomitronの動作」をまとめると以下のようになると思います。

---- 現在のProxomitronの動作 (以降、「動作A」とする)
1. ファイルの先頭の1バイト目から読み込み、優先度の高いフィルタから順番にテスト
2. 1バイト進み、優先度の高いフィルタから順番にテスト
3. 「3. の動作」をファイルの末尾([EOF])まで続ける

---- 「フィルタの優先度」を最優先した場合のProxomitronの動作 (以降、「動作B」とする)
1. ファイルの先頭の1バイト目から読み込み、「優先度の最も高いフィルタ」をテスト
2. 1バイト進み、「優先度の最も高いフィルタ」をテスト
3. 「2. の動作」をファイルの末尾([EOF])まで続ける
4. ファイルの先頭の1バイト目から読み込み、「前回テストしたフィルタの次に優先度の高いフィルタ」をテスト
5. 1バイト進み、「4. でテストしたフィルタ」をテスト
6. 「4. ~ 5. の動作」をファイルの末尾([EOF])まで続ける

ここで、フィルタテストに必要とするバイト数に注目してみてください。

動作A … 「フィルタテストするバイト数 = 読み込んだファイルのサイズ」
動作B … 「フィルタテストするバイト数 = 読み込んだファイルのサイズ×フィルタの数」

このことから、「動作B」はフィルタの数が多ければ多いほど、Proxomitronの動作が顕著に重くなるでしょう。
「動作A」でもフィルタの数が多いほど、Proxomitronの動作が重くなりますが、フィルタテストするバイト数はファイルサイズ分だけに留まるため、「動作A」の負荷は「動作B」程には大きくならないと想像できます。

日本語としては私も「仕様」であっていると思いますが、上のところの内部事情を知っているか否かで見方が変わってきます。
特に、「フィルタの優先度」という表現は、如何にも「最優先されそうな設定」ですから、勘違いがあっても致し方ない気がします。

# 余談ですが、2chブラウザ「JaneDoe View」の ReplaceStr.txt は「動作B」に近い動作になっていると思われます。

559:名無しさん@お腹いっぱい。
07/03/16 20:42:00 HCDQ1kIb0
Jane板見たけど、結構大変そうなことやるつもりみたいだねぇ。
ガンガレ。

560:名無しさん@お腹いっぱい。
07/03/16 21:13:39 Lin+siRH0
JaneViewのReplaceStr.txtをオミトロン方式にしたら早くなるのではとViewスレに書き込んだら
複数の人に否定されたことがある。 何故なのか未だに分からない。

561:名無しさん@お腹いっぱい。
07/03/16 22:31:20 1wcXUPwP0
>558
ややっ、詳しい解説ありがとうございます。
そういう事情があると極めて妥当な動作ですね。
今後は、優先度を高くしたいフィルタは
ほかのフィルタと競合しても問題ないように努力します。

562:名無しさん@お腹いっぱい。
07/03/17 03:30:08 AadC9Up90
TOK2のWebスペースの広告が激しくUzeeeee!!
消すこと自体は簡単なんだが、
こちらが対応した数日~1週間後に10~数百バイトくらいずつ増やして、
バイト制限を潜り抜けてきやがる。
このまま増やし続ける気か(#゚Д゚)ゴラァ!

563:名無しさん@お腹いっぱい。
07/03/17 05:21:53 RWq7G/0N0
>562
自分の場合、limit は16384(16KB)になってる。
1回につき最低でも512バイト、最大で2KBくらい増やして、
いったい何回 limit を増やしたことか。

564:名無しさん@お腹いっぱい。
07/03/17 05:26:11 RWq7G/0N0
いま思いついたけど、

<!-- tok2_top --> → <div class="tok2-ad">
<!-- tok2_top_end --> → </div>
こんな感じで置き換えて、

div.tok2-ad { display: none !important }
こうすれば消える。
バイト制限を増やす必要がなさそうだし、動作も軽くなるかも。

565:名無しさん@お腹いっぱい。
07/03/17 11:02:34 HIHHgHWL0
>>560
あまり知らずに言ってるんじゃない?
手間と見返りを考えるとその価値があるかは別として、確かに悪くはなさそうな気はする。

566:560
07/03/17 12:29:59 MSvIFEtK0
>>565
どうなんでしょうね、検索アルゴリズムに詳しそうなレスを書く人ではありましたが
本当に詳しい人だったのか私には分かりませんでした。

567:名無しさん@お腹いっぱい。
07/03/17 13:22:55 AadC9Up90
>>563
自分は現在13160っす。

>>564
ユーザスタイルシートはキャッシュするからなぁ。
ソース見たときすっきりせんし。

568:名無しさん@お腹いっぱい。
07/03/17 18:08:19 MjkjkU7H0
BFilter
URLリンク(bfilter.sourceforge.net)
新顔ウェブフィルタープロクシらしい

569:名無しさん@お腹いっぱい。
07/03/17 18:37:53 jVQSctLy0
>>564 >>567
<noembed><nolayer><comment>で囲めばキャッシュしないはず。

570:名無しさん@お腹いっぱい。
07/03/18 07:59:30 s5Pb2Uih0
>>562
トクトクの人気ランキングに出てるサイトいくつか見たけど、そんなに広告だらけって感じでもなかったけど……


571:名無しさん@お腹いっぱい。
07/03/18 11:52:02 x92h/snR0
>>570
無料の方だよ。
人気ランキング上位は有料が多い気がする。

572:名無しさん@お腹いっぱい。
07/03/18 16:33:15 4oJ5D+yI0
URLリンク(www.1rk.net)
このサイトの広告を消すフィルターを作って頂けないでしょうか。
お願いします。

573:名無しさん@お腹いっぱい。
07/03/18 19:50:17 UeHdvFS20
URLの最後が.jpgで終わっててContent-Type: がimage/jpegで、中身が普通のhtmlになってると
WEBページフィルタ適応されないんですが対処方法ありませんか?

574:名無しさん@お腹いっぱい。
07/03/18 21:08:43 YcHYPNb90
>>562
とりあえず作ってみた。
広告部分にidが振ってあったのでCSSで消したよ。

Name = "TOK2"
Active = TRUE
URL = "[^/]++.tok2.com/$TYPE(htm)"
Limit = 120
Match = "(<script * </script> && *(prego.jp)*)"
"|</head>$SET(#=<style>\n<!--\n"
"#TOK2-TOP-BANNER, #TOK2-SIDE-BANNER, #TOK2-SEO { display: none; }\n"
"-->\n</style>\n</head>\n)"
Replace = "\@"


575:名無しさん@お腹いっぱい。
07/03/18 21:09:27 YcHYPNb90
>>572

Name = "1rk"
Active = TRUE
URL = "www.1rk.net/$TYPE(htm)"
Limit = 80
Match = "(<img *> && *(image.jpg)*)"
"|</head>$SET(#=<style>\n<!--\n"
".ad, p.ads, p.adw { display: none; }\n-->\n</style>\n</head>)"
Replace = "\@"


576:名無しさん@お腹いっぱい。
07/03/18 21:35:26 qf1arYv00
イメージファイルの中にアドビのタグ?が入っていると
誤爆するのを防ぐにはどうしたらよいですか

577:名無しさん@お腹いっぱい。
07/03/18 21:56:22 WywTxmu/0
>>573
Content-Type: をimage/jpegからtext/htmlに置換するフィルタで対処。
URL欄を使ってフィルタが動作するサイトを絞ってから使うといいよ。

[HTTP headers]
In = TRUE
Out = FALSE
Key = "Content-Type: image to html (In)"
URL = "www.hoge.com/"
Match = "image/jpeg"
Replace = "text/html"

>>576
画像ファイルはデフォルトではフィルタリング対象外のはず。
その画像を見れば対策方法が分かるかも。

578:ROMラー
07/03/18 23:52:16 WywTxmu/0
>>506
これで期待通りに動くようです。

# NoAddURL

(#?+)\9$URL(\8)$SET(ABS=\8\9)

./(?+)\9($TST(SWITCH1=1)$SET(ABS=$GET(CURRENTURL)\9)|
$URL(([^:]+://*/([^/]+/)+)\8)$SET(CURRENTURL=\8)$SET(SWITCH1=1)$SET(ABS=\8\9))

/(?+)\9$URL(([^:]+://*/)\8)$SET(ABS=\8\9)

../($TST(SWITCH2=1)$SET(NUM=$GET(LEVEL))|$URL([^:]+://*/$SET(NUM=1)
([^/]+/$LST(increment))+)$SET(SWITCH2=1)$SET(LEVEL=$GET(NUM)))
($LST(decrement)../)+$URL(([^:]+://*/([^/]+/$LST(decrement)
$TST(NUM=[^0]*))+)\8)(?+)\9$SET(ABS=\8\9)

([a-z]+:?+)\9$SET(ABS=\9)

(?+)\9$URL(([^:]+://*/([^/]+/)+)\8)$SET(ABS=\8\9)

579:名無しさん@お腹いっぱい。
07/03/19 00:42:49 tQMpuigO0
>>575
遅くなりましたが、ありがとうございます。

580:名無しさん@お腹いっぱい。
07/03/19 00:45:50 NXCUdEyC0
本スレが不毛な言い争いの場に…

DOCTYPE宣言があればそのまま、無ければ付加ってフィルタを作ろうと思ったのに
前者が実現できなくて問答無用に付加されてしまう
有効リストなり無効リストなりを作ってマッチさせる手もあるけど
それじゃ汎用性が落ちるからなぁ

581:ROMラー
07/03/19 00:48:14 7ZzHzeuq0
>>506
$GET(ABS)と\8\9が一致しない原因は以下のフィルターを試せば分かります。
テストウインドウに"abc"と書いて下の3つのフィルターを試して下さい。

Name = "$SET test1"
Active = FALSE
Limit = 256
Match = "*"
Replace = "<match>"

Name = "$SET test2"
Active = FALSE
Limit = 256
Match = "*$SET(\0=text)"
Replace = "<match>"

Name = "$SET test3"
Active = FALSE
Limit = 256
Match = "?+$SET(\0=text)"
Replace = "<match>"

1と2の違いは$SET(\0=text)が付いてるかどうかの違いしかありませんが結果が
変わっていると思います。 3では2で起きた問題を修正するために*を?+に書き換えています。

582:ROMラー
07/03/19 01:09:43 7ZzHzeuq0
>>506
何故こうなるかというと、*は後ろに何かがあれば最短一致として動作、無ければ
最長一致として動作するためです。 *の後ろに$SETコマンドがあると*は最短一致として
動作するようになってしまうので2のようにカラにマッチしてしまうわけです。
そこで後ろに何があっても最長一致をする?+を使うことでこの問題を回避しています。

>>580
こんな感じですかね。

Active = FALSE
Limit = 256
Match = "("
"(^(^ <!DOCTYPE))"
"|"
"$SET(0=<!DOCTYPE ....)"
")"
"$STOP()"
Replace = "\0"

583:580
07/03/19 06:43:35 NXCUdEyC0
>>582
お、これはありがとうごぜぇやす
ブックマークから適当に踏んで試してみたらXML宣言ありなページで誤爆したんで
回避する為に”(^(^ *<;!DOCTYPE))”に変えてしばらく使ってみるっす

そこでSTOPかけるのを思い付かんかったのと
宣言文に続く<HTML~まで見るようにしてたのが敗因か

584:名無しさん@お腹いっぱい。
07/03/19 18:06:50 WHlPa9sf0
>>577
ども
URL: Filter image extension をブラクラ用にオンにしてます
ログに Protect Contents except HTML が出てます

URLリンク(www.mxtv.co.jp) ここの画像がそうなります

585:名無しさん@お腹いっぱい。
07/03/20 16:44:20 0LIwAOV50
Amazonの長ったらしいURLを短くするフィルターありませんか?
こんな感じで

URLリンク(rag2ch.s151.xrea.com)

586:ROMラー
07/03/20 17:30:14 PPne+SNt0
>>584
Protect Contents except HTMLというフィルタが誤爆しているようなので
このフィルターを修正するしかないですが、ログを検索してみてもこのフィルターを
配布しているところが見つかりません。
よろしければここに貼るか、うpして頂けないでしょうか。

問題が起こるところがそのサイトだけならば (^([^/]++.|)mxtv.co.jp/) をそのフィルターの
URL欄の先頭に入れれば回避出来ますが、根本的な解決にはなりません。

587:名無しさん@お腹いっぱい。
07/03/20 20:49:41 PJkWD4Ws0
>>585
ヘボくてすんません、おかしかったら誰か直してやってください
勉強させていただきやす。

[HTTP headers]
In = FALSE
Out = TRUE
Key = "URL: Amazon URI Simplizer alpha.1.3.1"
URL = "www.amazon.co.jp/\w(ASIN(/|=)|obidos/|product/)[0-9A-Z]+{10}?"
Match = "*([0-9A-Z]+{10})\0"
Replace = "$JUMP(URLリンク(www.amazon.co.jp))$LOG(R[Amazon] URLリンク(www.amazon.co.jp))"

URLリンク(www.amazon.co.jp) じゃなくて
URLリンク(www.amazon.co.jp) に飛ばす仕様なんだけど
これだとまずいのかなぁ。飛べない商品とかあるかもしれない。
Amazonの仕様自体イマイチわかってないからそこも不安…。

588:名無しさん@お腹いっぱい。
07/03/20 23:25:12 4ptHUCsg0
>>585
www.amazon.co.jp/商品名/dp/*
という形式の商品名の部分が長くなる原因。
この商品名の部分は実は何でも良かったりする。削除しても良し。
これをを削除するだけなら>>587を改造してこうすれば良いと思う。

[HTTP headers]
In = FALSE
Out = TRUE
Key = "URL: Amazon URI Simplizer (out)"
Match = "URLリンク(www.amazon.co.jp)
Replace = "$JUMP(URLリンク(www.amazon.co.jp))"

589:名無しさん@お腹いっぱい。
07/03/20 23:33:47 0LIwAOV50
>587-588
ありがとうございました。
俺もそろそろ自分でフィルター作れるように勉強しないとな・・

590:名無しさん@お腹いっぱい。
07/03/21 00:13:13 1/lCY91m0
>>588
dpでいけるんですか…!

591:名無しさん@お腹いっぱい。
07/03/21 00:53:03 1/lCY91m0
ん、あれ?dpの商品名部分が削れればそれでOK?
>>587だと、(私の知る限りの)全ての形式のURIに対応、
かつASIN以降を全て消し去るという方向で書いてます。
お好きな方をお好みで、かな。

と思いきや、肝心の/dp/に対応してなかったので修正。
その他、商品画像ページ対応、ジャンプ先URIを更に短縮など。

[HTTP headers]
In = FALSE
Out = TRUE
Key = "URL: Amazon URI Simplizer alpha.1.4 (out)"
URL = "(www.|)amazon(.co|).jp/\w((ASIN|obidos|dp|product(/images|))(/|=))[0-9A-Z]+{10}?"
Match = "*((images/|)([0-9A-Z]+{10}))\0"
Replace = "$JUMP(URLリンク(amazon.jp))"

アカウントサービス内での誤爆が一番恐い。
URIに含まれる文字列と[0-9A-Z]+{10}?でのASIN探しで
一応の防御はしてるつもりなんだけど。

592:名無しさん@お腹いっぱい。
07/03/21 01:05:18 d4dDjrEw0
>>591
せっかく作ってもらってるのに贅沢は言えません。
コピーする時に後ろ削れば良いだけですし、確かにASIN以降削れればよりよいことは確かですが

そのフィルターだとASINが「hoge1-hoge2-hoge3」と言う形式だと「hoge1」と認識してしまうようです
URLリンク(www.amazon.co.jp)
確認用

593:名無しさん@お腹いっぱい。
07/03/21 01:35:35 1/lCY91m0
>>592
これは恥ずかしい…。
URLマッチばっかり気にして実際のマッチを手抜きしてたのが原因でした。

[HTTP headers]
In = FALSE
Out = TRUE
Key = "URL: Amazon URI Simplizer alpha.1.4.5 (out)"
URL = "(www.|)amazon(.co|).jp/\w((ASIN|obidos|dp|product(/images|))(/|=))[0-9A-Z]+{10}?"
Match = "\w((ASIN|obidos|dp|product)(/|=))((images/|)([0-9A-Z]+{10}))\0"
Replace = "$JUMP(URLリンク(amazon.jp))"

まだまだ弄ってみたら、今のところ不具合が
・ユーズド商品関連に対応できない
・商品画像ページで他のカラーが見れない
どんどん冗長になってくし、やっぱり>>588ぐらいシンプルな方が
機能的にも精神衛生的にもいいみたいです。勉強になりました。

594:think ◆MM0nnAOCiQ
07/03/21 01:55:04 lHqDQGV30
Amazonの商品紹介ページ(URL)をいくつか見ました。
どうやら、/dp/ の手前は「メーカー名-商品型番-備考」で構成されているようなので、以下の形でどうでしょうか?

[HTTP headers]
In = FALSE
Out = TRUE
Key = "URL: Omit Amazon URL [2007/03/21] test1"
Match = "http://(www.|)amazon.(co.|)jp/[\%0-9a-z]+{1,*}(-[\%0-9a-z]+)+{1,*}/(dp/[^/]+/)\0"
Replace = "$JUMP(URLリンク(www.amazon.co.jp))"

# 商品紹介(ASIN)
URLリンク(www.amazon.co.jp)商品コード/...
 ↓
URLリンク(www.amazon.co.jp)商品コード/

# リダイレクタ
URLリンク(www.amazon.co.jp)商品コード%25...
 ↓
URLリンク(www.amazon.co.jp)商品コード/

他にも亜種がいくつかあるようですが、最近は /dp/ に統一しようとしている流れに見えますね。

595:名無しさん@お腹いっぱい。
07/03/21 04:23:54 pz60mXe50
タブブラウザでJavascriptが有効だとアドレス短くならないよね?
IEだと短くなるね

596:名無しさん@お腹いっぱい。
07/03/21 19:42:09 /5cB5deu0
>>593-594
ありがとうございます。便利になりました。
私はこれで十分ですが発見した不具合でも

・Amazon外部からのURLが反応しない
>>593はページを右上の「Would you like to see this page in English?」が効かなくなる
(ただし、外部から飛んできた時これをクリックするとURLが短くなるので英語を必要としない場合逆に便利)
URLリンク(www.google.co.jp)
確認用

597:名無しさん@お腹いっぱい。
07/03/21 22:05:22 xaNVUTV40
アマゾンのアフィリエイトをやっている身としては、
アソシエイトIDまで削られるのは遺憾だな。

598:名無しさん@お腹いっぱい。
07/03/21 23:22:57 NszwPh7m0
オミトロン使うような奴ならアフィは全殺しするだろ・・・常識的に考えて

599:名無しさん@お腹いっぱい。
07/03/21 23:30:02 8H5gmtUL0
確かアフィIDを指定のものに書き換えるフィルタっていうのも以前あったな

600:名無しさん@お腹いっぱい。
07/03/22 00:55:58 fq9nmX0b0
アマゾンのアフィリエイトは真っ先に殺す。

601:名無しさん@お腹いっぱい。
07/03/22 08:11:08 LPlM1PA70
アフィが見えなくなるのは別に構わないけどさ、
でも自ら進んで踏んだものは有効にしようよ。

602:名無しさん@お腹いっぱい。
07/03/22 16:25:24 uFlrt95P0
htaccessを無効にするフィルタ希望
ていうかURLリンク(karen.saiin.net)を表示させるフィルタ希望

603:名無しさん@お腹いっぱい。
07/03/22 16:37:01 IfmMON990
( ゜σ・・ ゜) ホジホジ

604:名無しさん@お腹いっぱい。
07/03/22 16:58:02 h6gQqGsT0
>>602
Content-Encoding: text/html; charset=csiso2022kr

605:名無しさん@お腹いっぱい。
07/03/22 17:12:43 IfmMON990
つ SJIS

606:名無しさん@お腹いっぱい。
07/03/22 20:49:05 i23UPNfh0
>602に行ってみたけど、
ヘッダで文字コードを詐称されると、フィルタがまったく効かなくなるね。
これは Proxomitron を無効化させるための手段になる。危険だな。

607:名無しさん@お腹いっぱい。
07/03/22 21:03:40 HF+LFNrU0
変なContent-Encodingは消したほうが良いみたいだな
gzip, chunk 以外知らんけど

608:名無しさん@お腹いっぱい。
07/03/22 21:10:10 CuyAqdZm0
>>599
それ教えて( ゚д゚) ホスィ・・・

609:名無しさん@お腹いっぱい。
07/03/22 21:43:52 h6gQqGsT0
>>602
[HTTP headers]
In = TRUE
Out = FALSE
Key = "Content-Encoding: Kill Content-Encoding (in)"
Match = "*"

[HTTP headers]
In = TRUE
Out = FALSE
Key = "Content-Type: Kill charset (in)"
Match = "text/html; charset="
Replace = "text/html;"

>>606-607
ですね。

610:名無しさん@お腹いっぱい。
07/03/22 22:24:29 LqIcExhd0
Match = "(^gzip|x-gzip)?"
とかにしとかなくていいの

611:名無しさん@お腹いっぱい。
07/03/22 22:57:21 h6gQqGsT0
>>610
URLリンク(www.youtube.com)
駄目だ、これ開いたら一面文字だらけになった。

612:名無しさん@お腹いっぱい。
07/03/23 00:57:41 zEKCeVAb0
文字コード詐称されてフィルターが効かないと言う状態なら
ブラウザも正しく認識出来ないのだからどっちにしろ危険は無いんじゃないのか?

613:名無しさん@お腹いっぱい。
07/03/23 16:29:48 3Pg7luNE0
オミトロン装備してるとどうも一部の頁が西ヨーロッパ言語になってしまうんだが、どうすればいい?

614:名無しさん@お腹いっぱい。
07/03/23 16:33:29 3Pg7luNE0
すまない。スレ違いだった。

615:名無しさん@お腹いっぱい。
07/03/23 21:25:45 +CQ+E6V20
>>609
駄目だった・・・

616:think ◆MM0nnAOCiQ
07/03/24 14:25:23 Vct6LEbc0
>>602,615
こちらの環境では、「>609の "Content-Type: Kill charset (in)" を取り入れて、JavaScriptを有効に」すれば、支障なく閲覧できています。
万が一問題があるようでしたら、以下のフィルタを取り込んでみてください。

[HTTP headers]
In = TRUE
Out = FALSE
Key = "Content-Type: Fix g-kaizou charset (in) [2007/03/24]"
URL = "karen.saiin.net/~g-kaizou/"
Match = "text/html; charset=(^shift_jis|euc-jp|iso-2022-jp|utf-(8|16))"
Replace = "text/html; charset=shift_jis"

617:think ◆MM0nnAOCiQ
07/03/24 14:38:04 Vct6LEbc0
>616の続き。

Content-Typeヘッダの不正が原因なわけですが、Firefox, Opera9 (IE6, IE7 は [日本語(自動選択)] にチェックONで正常に閲覧可) で閲覧不可では少なからず訪問者を逃がしてしまいます。管理人の運営方針にもよりますが、サイト側の問題と受け取れると思います。
当分は、Proxomitronで凌ぐとしても、サイト運営者に報告しておいた方がお互いの益になるのではないでしょうか。

該当Webサイトのトップページには

-------------
2007年3月18日
なぜか全ページが文字化け(原因不明)
-------------

とあるので、運営者は原因を把握していないと思われます。
おそらく、htaccess に

AddType "text/html; charset=csiso2022kr" .html .htm

の記述があるので、これを

AddType "text/html; charset=shift_jis" .html .htm

に変更すれば、問題は解消されるでしょう。
…ということを運営者に報告してあげてください。

文字化け対策としての.htaccess
URLリンク(www.shtml.jp)
@IT:Javaの文字化け対策FAQ(1)
URLリンク(www.atmarkit.co.jp)

618:think ◆MM0nnAOCiQ
07/03/24 15:26:50 Vct6LEbc0
問題提起されている件は、

Content-Encoding: text/html; charset=csiso2022kr

でProxomitronフィルタが無効になるという現象ですね。

# Content-Typeの方はフィルタの挙動とは無関係のようです。
# 何より、Content-Typeヘッダを意図的に不正にするとWebブラウザでの閲覧の支障が出るので、そういう設定にされる可能性は低いと思います。

で、この

Content-Encoding: text/html; charset=csiso2022kr

という記述は、正しい書式なのでしょうか?
よく解らないなりに、調べてみると以下の文献が見つかり、

-----------------
内容コーディングは、section 3.5 にて定義されている。使用例を見よ。

HTTP/1.1: ヘッダフィールド定義 - 14.11 Content-Encoding
URLリンク(www.practical-lamp.com)
-----------------
最初は、登録機構は以下のトークンを登録している。... gzip, conpress, deflate, identity

HTTP/1.1: プロトコルパラメータ - 3.5 内容コーディング
URLリンク(www.practical-lamp.com)
-----------------

とあるので、少なくとも>602のWebサイトの出力するContent-Encodingヘッダの書式は誤っているような気がします。


619:think ◆MM0nnAOCiQ
07/03/24 15:28:47 Vct6LEbc0
>618の説が正しいとすると、Content-Encodingヘッダも運営者側で修正する方が望ましいので、サイト運営者が .htaccess から

AddEncoding "text/html; charset=csiso2022kr" .html .htm

を削除するという配慮があると有り難いですね。(書式は少し自信がないです…。)


あえて、Proxomitron排除のために残すというサイトがあった場合は、以下のフィルタで回避できる…と思います。

[HTTP headers]
In = TRUE
Out = FALSE
Key = "Content-Encoding: Kill faulty value (in) [2007/03/24]"
Match = "(^gzip|compress|deflate|identity)"

620:名無しさん@お腹いっぱい。
07/03/25 00:39:47 U32bBhWY0
乙。 httpd.confも疑ったほうがいいですな。

>>619
Content-Encodingヘッダが無い時でもマッチしてしまうようだ。

621:名無しさん@お腹いっぱい。
07/03/25 00:44:01 ykWCl22f0
Match = "(^gzip|compress|deflate|identity)?+"

622:think ◆MM0nnAOCiQ
07/03/25 01:03:18 sQ09AHw80
>>620-621
レス有難う御座います。
>621を取り込ませていただきました。m(_ _)m

[HTTP headers]
In = TRUE
Out = FALSE
Key = "Content-Encoding: Kill faulty value (in) [2007/03/25]"
Match = "(^gzip|compress|deflate|identity)?"

> httpd.confも疑ったほうがいいですな。
>602は自宅サーバじゃないようなので、httpd.conf を編集する権限がないと思います。多分…。

623:名無しさん@お腹いっぱい。
07/03/25 01:43:58 U32bBhWY0
メンテの後文字化けしたんじゃなかったっけ? 運営側が何かやらかしたのでは。

624:think ◆MM0nnAOCiQ
07/03/25 02:57:05 sQ09AHw80
>>623
その可能性には思い至りませんでした。
ざっと調べてみたところ、同サービスの他のサイトでは同様の症状(Content-Type, Content-Encoding 含めて)が発生していないようです。

Google検索: site:saiin.net
URLリンク(www.google.co.jp)

一部のサイト(サーバ)だけ設定が誤っている可能性も否定出来ませんが…。

625:think ◆MM0nnAOCiQ
07/03/25 03:26:51 sQ09AHw80
何にしても両方チェックしておくに超したことはないですね。

その辺りも加味して、>602のサイトへ報告しておきました。

626:名無しさん@お腹いっぱい。
07/03/25 11:34:40 civrXBG40
ローカルに保存したhtmlをこれを通して閲覧する方法はありますか?
極力改変を加えずに保存し、閲覧時には無駄な広告やflashへのリンクを
殺して動作を軽くしたいです。

627:think ◆MM0nnAOCiQ
07/03/25 13:44:12 sQ09AHw80
>>626
URLコマンドの file// がありますが、ローカルファイルに対して常にProxomitronを通すには他のユーティリティを利用しないと無理だと思います。
URLリンク(www.pluto.dti.ne.jp)

他に、ローカルにWebサーバを立ち上げる方法があります。


628:626
07/03/25 15:25:33 Dk5Qg+wy0
>>627
そうですか・・
ありがとうございます。

629:think ◆MM0nnAOCiQ
07/03/25 22:23:31 sQ09AHw80
>602のサイト復旧。
結果的に、"Content-Type: text/html", Content-Encodingなし の状態に落ち着いたようです。
# 匿名で報告したので、具体的な対処法(原因)は判りませんでした。

何はともあれ、>602氏の問題は解決しました。

630:think ◆MM0nnAOCiQ
07/03/25 22:28:52 sQ09AHw80
失礼。
>629の件ですが、掲示板に復旧までの経緯が記載されていました。
.htaccess は無関係で、サーバの管理者に報告したのみ…ということです。

631:名無しさん@お腹いっぱい。
07/03/26 17:25:13 z4qaU8SK0
すべらない名無し(URLリンク(by774.blog73.fc2.com))にある、
Brainerのテキスト広告をカットしたいのですが、下記ではうまく仕事をしてくれません。
どなたかご教授願えせんでしょうか。

[Patterns]
Name = "[User] AD @ Brainer"
Active = TRUE
Limit = 1139
Match = "$NEST(<script[^>]+>,</script>)<script[^>]++ad.brainer.jp[^>]+></script>$NEST(<iframe[^>]+>,</iframe>)"
Replace = "<!-- AD @ Brainer - Blocked by Proxomitron -->"



>>626
FirefoxならAdblockが使える。

632:think ◆MM0nnAOCiQ
07/03/26 18:51:02 hy1J35Zo0
>>631
該当Webサイトのhtmlソースを拝見しました。
マッチさせたい箇所は以下の部分ですよね?

<script type="text/javascript"><!--
brainer_partner_id = "****";
...
brainer_channel = "****";
//--></script>
<script type="text/javascript" src="URLリンク(ad.brainer.jp)

## 引用元: URLリンク(by774.blog73.fc2.com)

iframe要素が見あたらないために、マッチしていないと思われます。
更に簡単に書くならば、<script type="text/javascript" src="URLリンク(ad.brainer.jp) だけにマッチさせても良いですね。
前述のscript要素の内容コードは、変数の初期化だけですので本元の処理部分をカットするだけでも広告を取り除けます。(script要素の順番に配慮しなくても良いのも利点)
細かいことをいえば、ad.brainer.jp はsrc属性値に限定した方がベターだと思います。

633:名無しさん@お腹いっぱい。
07/03/26 21:21:23 z4qaU8SK0
>>632
どうもありがとうがざいます。
火狐の「選択した部分のソースを表示する」を使ってしまい、確認を怠っていましたorz
今までのテストでおkなのに引っ掛からなかったフィルタも確認しなければ(´・ω・`)
前半の$NEST部分は仰るとおり必要ないのですが、
ソースを見たときに痕跡があると何故かヽ(`Д´)ノフォオオオ!となるので、
個人的にくっつけていたりいなかったり。

[Patterns]
Name = "[User] AD @ Brainer"
Active = TRUE
Limit = 640
Match = "$NEST(<script[^>]+>,</script>)<script[^>]++src="URLリンク(ad.brainer.jp)
Replace = "<!-- AD @ Brainer - Blocked by Proxomitron -->"



634:620
07/03/27 21:51:05 WBi+faku0
>>629-630
お疲れ様でした。 運営側のミスでしたか、こういうこともあるんですね。

>>626
ブラウザを起動してるときにProxomitronのメインウインドウに目的のhtmlファイルをD&Dすれば
フィルタリングされたページがブラウザに表示されます。 このときブラウザのアドレスバーに
表示されるURLをお気に入りに入れておくと便利かも知れません。

635:名無しさん@お腹いっぱい。
07/03/28 07:07:18 LqglA30l0
ローカルファイルに対してフィルタをかけたいんですが、うまくいきません。
具体体には、FirefoxのRSSリーダであるSageが作成するページに
フィルタリングをかけ、記事中に割り込んでくる広告を削除したいのですが。
URLリンク(file)でローカルファイルをWebページと同様にフィルタリングが
出来ると言うところまではわかったのですが(無論プレフィックスも設定しています)、
Webページフィルタの「URLのマッチ」の欄に、
URLリンク(file)
と入れてもマッチしていない様なのです。
フルパスだと
URLリンク(file)~/chome/sage.html
と言う感じで、フルパスで書いても同じ現象でした。
ダミーとして簡単なHTMLファイルをC:直下において、URLリンク(file)
やってみたのですが、やはりフィルタリングされない模様です。
どこか記述や使い方など、間違っている部分があればご指摘願いたいのですが・・・。

636:名無しさん@お腹いっぱい。
07/03/28 09:25:12 zqd/h+Lp0
「URLのマッチ」欄では"http(s|)://"は含めないで下さい。

637:名無しさん@お腹いっぱい。
07/03/28 13:17:57 YK1sZGBa0
>>635
「URLのマッチ」の欄を消したらフィルタは期待通りに動く? 動かないなら論外。 動くのなら>>636の確認と、
Proxomitronの 「設定」 - 「アクセス」 - 「URLベースのProxomitronコマンドを無効にする」 のチェックが入っていれば外す。

あと、Firefoxで広告消すならAdblockもあるよ。 新しいコマンドが追加されてて面白そう。

【CSS】Mozilla広告ブロック【Adblock】
スレリンク(software板:584-585番)

638:名無しさん@お腹いっぱい。
07/03/28 22:54:30 YK1sZGBa0
>>634の方法だとファイルパスの中の ":" が何故か "%7C" に置換されてしまう。( %7C = "|" 、正しくは %3A。)
このためページが見つからずにエラーになるのでそれを修正するURL Control系のリスト用コード。

--------------------------------------------------------------------------------------------
# ProxomitronウインドウにhtmlファイルをD&Dした時のURLを修正。 "prefix.." は各自のprefixに書き換える。
http://prefix..file//([a-z]+{1,2})\0%7C/\1&$JUMP(http://prefix..file//\0:/\1)
--------------------------------------------------------------------------------------------

この現象はデフォルトの4.5June、4.5 338で確認。

639:名無しさん@お腹いっぱい。
07/03/29 01:40:52 oWBN6QKE0
>>636-637
試してみましたが、期待通りに動きませんでした・・・論外って事ですね。
フィルタ自体はテストも動くし、同一内容のhtmlをコピーして別サーバにアップして試したところ
問題なく動いたので、フィルタが間違っているわけでは無いと思うのですが・・・。

ログを見ているとローカルに対しては全くフィルタを適用しようとしていない様に見えます。
設定のチェックは外しているのですが。

諦めます・・・レスありがとうございました。

640:名無しさん@お腹いっぱい。
07/03/29 01:47:44 nwH5ZQHV0
Sageは使ったことないからよく知らないけど、
広告だったら何か規則性があるんでないの?
<div class="ad"> の中に入っているとか、
<a href="広告サイトのURL"> とか。
スタイルシートで消すことが可能かもしれない。

641:名無しさん@お腹いっぱい。
07/03/29 04:02:19 oWBN6QKE0
ありがとうございます。
おっしゃるとおりで、普段はIEとFirefoxを使い分けているので、どちらかのブラウザに
依存する方法で広告削除はしたくなかったのですが、今回はFirefoxに依存した
問題なのだから、FirefoxのCSSで消してしまえば良かったのですよね。
Proxomitronで消す事ばかりを考えてしまって、そこに考えが至りませんでした。

件の広告はCSSを用いて無事に削除出来ました。
フィルタがローカルに適用されないというのが未だに解決していないのが
気持ちの悪いところではあるのですが、ともあれレスをくれた皆さん、
ありがとうございました。

642:名無しさん@お腹いっぱい。
07/03/29 07:31:26 ve+QA7+t0
>>639
Ctrl+F5で強制リロードしてもダメ?

643:名無しさん@お腹いっぱい。
07/03/29 07:56:26 oWBN6QKE0
>>642
キャッシュを読まずにリロードって事ですよね?
ダメでした・・・。

644:名無しさん@お腹いっぱい。
07/03/29 09:22:28 ve+QA7+t0
検索表現で改行コードを"\n"にしている。

WebにASCIIモードでアップ → 改行コードが 0Ah となり、マッチ
ローカルでフィルタリング → 改行コード 0Dh 0Ah でマッチせず

とか。(苦しいか...)

645:名無しさん@お腹いっぱい。
07/03/29 12:00:10 Tylg9NKN0
>643
chrome://sage/content/feedsummary.html?uri=[URL]
URLがこういう感じの形式だからじゃないの?

646:名無しさん@お腹いっぱい。
07/03/30 02:27:46 N5oMoR0M0
>>644
検索条件に改行コードは含んでいないです。

>>645
ロケーションバーに表示されるsageのURLは、
file:///C:/Documents%20and%20Settings/UserName/(省略)/chrome/sage.html
です。省略部分は一般のプロファイルの場所です。

レスが頂けるのは大変嬉しく勉強にもなるのですが、
流石にスレ違いな気がしてきたので、スルーしていただいて結構です・・・。
すみません、ありがとうございます。

647:名無しさん@お腹いっぱい。
07/03/30 03:28:46 Fk+PoKNY0
FXがローカルのファイルを直接開いてるんじゃないの?
そうだとしたら対処不能

648:名無しさん@お腹いっぱい。
07/03/30 14:55:49 fRAcFZO30
URLリンク(www.bbsnews.jp)
ここのトップだけscriptタグを範囲にしてマッチさせようとしても広告消してくれないんですが上手い方法ってあるんでしょうか?
他のランキングは消せたので原因がよくわかりません

649:think ◆MM0nnAOCiQ
07/03/30 21:43:47 z1oSbQ+H0
>>648
特に問題は見あたりませんでした。
マッチしないフィルタを開示できるのであれば、アドバイスできるかもしれません。

650:名無しさん@お腹いっぱい。
07/03/31 13:04:14 qvhXZMuJ0
とりあえずのこの脆弱性対応
URLリンク(www.microsoft.com)

Name = "Cut Cursor"
Active = TRUE
Limit = 500
Match = "cursor (:|=) [^;}>]+"

超誤爆上等注意
まぁ、見ただけでアウトな脆弱性だから対応パッチが出るまでのしのぎレベルで
#私は昔から常用してるフィルタなんだけどねw

651:名無しさん@お腹いっぱい。
07/04/01 00:28:32 uRgnshK20
<font style="&#x63;ursor:url(mailto:kuso.ani)">feffeffe</font>

652:名無しさん@お腹いっぱい。
07/04/01 15:01:41 0jf8ZLJk0
TOK2広告、4月1日現在、Limit = 13640
確実に増え続けている。
Proxomitronを意識しているとしか思えないんだが。

653:名無しさん@お腹いっぱい。
07/04/01 15:05:11 NVBogZYX0
↑馬鹿

654:名無しさん@お腹いっぱい。
07/04/01 17:20:26 EDThOvVs0
やっつけ
Match = "(c|\c)(u|\u)(r|\r)(s|\s)(o|\o)(r|\r) (:|=) [^;}>]+"

655:名無しさん@お腹いっぱい。
07/04/01 17:23:40 EDThOvVs0
ぐは
これでどうだ
Match = "(c|\&#x63;)(u|\&#x75;)(r|\&#x72;)(s|\&#x73;)(o|\&#x6F;)(r|\&#x72;) (:|=) [^;}>]+"

656:名無しさん@お腹いっぱい。
07/04/01 17:29:21 EDThOvVs0
これ、10進とかにも対応とか考えると重くなるだけな気がするな
$UESCの検索側版って無いのかな?

657:名無しさん@お腹いっぱい。
07/04/01 19:16:38 CvldivIu0
CSS内の数値文字参照を本来の文字に戻してから、
他のフィルタで処理したほうが良いような

658:名無しさん@お腹いっぱい。
07/04/01 20:55:33 NqLKJzxg0
>>652
>>574 では駄目なのか


659:名無しさん@お腹いっぱい。
07/04/01 21:20:06 YuF/sEJL0
>>650
ユーザースタイルシートで
*{cursor:auto!important;}
とやったらどうかな

660:名無しさん@お腹いっぱい。
07/04/02 00:01:33 BXoP6IEA0
IE6じゃ!important使えなかった希ガス

661:名無しさん@お腹いっぱい。
07/04/02 00:48:07 UKQKuB2c0
>>660
え??????

662:名無しさん@お腹いっぱい。
07/04/02 13:43:50 poYN2CYf0
>>653>>658
うん、TOPではなくUNDERのほうだよ。
TOPは増えないから通常通りで大丈夫。

663:名無しさん@お腹いっぱい。
07/04/02 20:31:38 ezmG3rBo0
>>659
なるほど、その方法は良さそうだな
考えつけなかった

664:名無しさん@お腹いっぱい。
07/04/03 00:33:16 J5HArJ7i0
>>659,663
それ、ちゃんと機能する?
IE6では駄目だった。

>>650,655の10,16進大文字小文字対応…重いかな?
実体参照の区切り文字 ; が無くても有効だ!
Match = "(c|\&#(x63|x43|67|99)(;|))"
"(u|\&#(x75|x55|85|117)(;|))"
"(r|\&#(x72|x52|82|114)(;|))"
"(s|\&#(x73|x53|83|115)(;|))"
"(o|\&#(x6F|x4F|79|111)(;|))"
"(r|\&#(x72|x52|82|114)(;|)) (:|=)[^;}>"]+"

実体参照が有効なのはインラインでのスタイル定義(>>651)だけで
.cssファイルと<style>ブロック内では無効みたいだね。

665:名無しさん@お腹いっぱい。
07/04/03 01:34:59 NxFim7nS0
アニメーションカーソルはfaviconにも使えるそうだし拡張子偽装も出来るそうだから
弾くの難しいだろうね


666:名無しさん@お腹いっぱい。
07/04/03 01:58:18 +KrQYJGn0
IEを使わない。これで>665も解決できると思われ。
MIME-Type もろくに見ないようなブラウザを使うのが悪いと言わざるをえない。
favicon は、*.ico か image/x-icon を\kすればいいのかな。

667:名無しさん@お腹いっぱい。
07/04/03 02:49:31 6wNViq4u0
うは、数字前部複数の 0 、文字間に %00 があっても有効だった。
キリがない…orz もう、これで終わりにしますぅ。>>664でした。
Match = "(c|\&#(x[0]+{0,*}(63|43)|[0]+{0,*}(67|99)) (;|)) "
"(u|\&#(x[0]+{0,*}(75|55)|[0]+{0,*}(85|117)) (;|)) "
"(r|\&#(x[0]+{0,*}(72|52)|[0]+{0,*}(82|114)) (;|)) "
"(s|\&#(x[0]+{0,*}(73|53)|[0]+{0,*}(83|115)) (;|)) "
"(o|\&#(x[0]+{0,*}(6F|4F)|[0]+{0,*}(79|111)) (;|)) "
"(r|\&#(x[0]+{0,*}(72|52)|[0]+{0,*}(82|114)) (;|)) (:|=) [^;}>"]+"

668:名無しさん@お腹いっぱい。
07/04/03 02:50:32 O0ftgExI0
>>664
ちょいと&#x063;とかにすりゃもうすり抜けられちゃうし。
こういうのってそうやってゴチャゴチャ書いててもやっつけ解決にすらならんよ。

669:668
07/04/03 02:52:16 O0ftgExI0
入れ違いになってしまった。

670:名無しさん@お腹いっぱい。
07/04/03 02:55:49 O0ftgExI0
ちなみにキミの書いているのは(文字)実体参照ではなくて数値文字参照だ。

どうでもいいけど。

671:名無しさん@お腹いっぱい。
07/04/03 03:58:17 u5Y7aheh0
>>667補足です。
>・・・文字間に %00 があっても有効だった。

& # x 0 0 6 3 ; u r s o r :
 ↑半角スペースを %00 と読み替えて下さい。
当然ながら>>667ではマッチしませんから…中途半端でスマソでした。

>>669-670
了解です。

672:名無しさん@お腹いっぱい。
07/04/03 04:53:45 +KrQYJGn0
仮に理想的なフィルタができたとしても、
よほど処理が軽くない限りは使いたくないものだな。
そこまで悪意を持ったサイトなんてあるんだかというのが知りたい。
まあ、精神的ブラクラを集めたような物好きサイトがあるのも確かだが。

673:名無しさん@お腹いっぱい。
07/04/04 03:51:09 j6rLwbwp0
この手の物をおみとろんで全部弾くには相当な手間になると言う事か
>>672
半分は思考実験かと
今回だけでなく、今後にも役に立つ可能性が残るし

674:名無しさん@お腹いっぱい。
07/04/04 09:03:43 Ww/FJYxO0
プロファイル結果...
サンプルテキスト : 30000 バイト(このスレのhtmlソース)
成功マッチ数 : 1
(5回試行した平均値)
>>650 平均時間 : 0.37 (ミリ秒)
>>655 平均時間 : 0.72 (ミリ秒)
>>664 平均時間 : 0.73 (ミリ秒)
>>667 平均時間 : 0.73 (ミリ秒)

   ↓平均時間 : 0.73 (ミリ秒)
Match = "(c|\& # (x (0 )+{0,*}(6 3|4 3)|(0 )+{0,*}(6 7|9 9)) (;|)) "
"(u|\& # (x (0 )+{0,*}(7 5|5 5)|(0 )+{0,*}(8 5|1 1 7)) (;|)) "
"(r|\& # (x (0 )+{0,*}(7 2|5 2)|(0 )+{0,*}(8 2|1 1 4)) (;|)) "
"(s|\& # (x (0 )+{0,*}(7 3|5 3)|(0 )+{0,*}(8 3|1 1 5)) (;|)) "
"(o|\& # (x (0 )+{0,*}(6 F|4 F)|(0 )+{0,*}(7 9|1 1 1)) (;|)) "
"(r|\& # (x (0 )+{0,*}(7 2|5 2)|(0 )+{0,*}(8 2|1 1 4)) (;|)) (:|=) [^;}>"]+"

興味本位の改変なので、突っ込まんで下され。

>>672-673
同意。

675:名無しさん@お腹いっぱい。
07/04/04 09:19:38 /oqEdOnS0
<font style="cursor feffeffe:url(mailto:kuso.ani)">nmooi</font>
URLリンク(www.microsoft.com)

676:名無しさん@お腹いっぱい。
07/04/04 09:54:55 qTxRbb9j0
>>675
パッチ来たのか、今回は随分早いな。

677:名無しさん@お腹いっぱい。
07/04/05 03:37:36 l42HB2fw0
>>675
おお!
他にどんなパターンが考えられますか?

678:名無しさん@お腹いっぱい。
07/04/05 14:38:16 /B+A98J/0
nico動画のID表示フィルタってありませんか?

679:名無しさん@お腹いっぱい。
07/04/06 13:25:48 /V316V1o0
URLをリストで管理する際に、ずっと感じている疑問。
href=$AV((URLリンク(|)">URLリンク(|URLリンク(www.google.co.jp)

のように検索パラメータまでアンエスケープされてしまいますので、ご注意下さい。
特に、/&? のアンエスケープは予期せぬ不具合の原因となりそうな気がします。

683:名無しさん@お腹いっぱい。
07/04/06 20:48:20 ZQc0Ffc80
パッチも出たことだし用済みとなりましたが…
>>650,655,664,667,674
>>651,671,675
Match = "cursor[^:=}]+(:|=) url\([^)}]+\)(;|) \1}$SET(0=\1})|"
"style=$AVQ(\1"
" (c|\& # (x (0 )+{0,*}(6 3|4 3)|(0 )+{0,*}(6 7|9 9)) (;|))"
" (u|\& # (x (0 )+{0,*}(7 5|5 5)|(0 )+{0,*}(8 5|1 1 7)) (;|))"
" (r|\& # (x (0 )+{0,*}(7 2|5 2)|(0 )+{0,*}(8 2|1 1 4)) (;|))"
" (s|\& # (x (0 )+{0,*}(7 3|5 3)|(0 )+{0,*}(8 3|1 1 5)) (;|))"
" (o|\& # (x (0 )+{0,*}(6 F|4 F)|(0 )+{0,*}(7 9|1 1 1)) (;|))"
" (r|\& # (x (0 )+{0,*}(7 2|5 2)|(0 )+{0,*}(8 2|1 1 4)) (;|))[^;"]+ \2"
")$SET(0=style=\1\2)"
Replace = "\0"

サンプルテキスト : 30000 バイト
平均時間 : 0.511000 (ミリ秒)

一行目を {} で括って {\1cursor[^:=}]+(:|=)[^;}]+(;|) \2}$SET(0={\1\2}) のようにすると
平均時間 : 0.881000 (ミリ秒)

a{ cursor アXXXイ ウYYYエ: url( mailto: kuso.ani オZZZ ) } ←こんなのも有効でした。
半角スペースの部分は[%00]から[%20]までマッチさせた方が望ましい。

684:679
07/04/07 06:24:57 xLSZD1g90
どうもありがとうございます。
遅くなる上に誤動作の可能性ありですか。パワーのないマシンでは厳しい。

$LST(ROOT) を使う場合、中身は以下のようになるのかな。
(/|/index.html|)(^?)
(/|/index.php|)(^?)
index.php などになっているサイトもあるので。

wƾw.google.co.jp$LST(ROOT) のような場合、
ドメイン名の後に$LST(など、何かしらの文字)を書かねばならないので、
見やすくはなるものの、(/|/index.html|)(^?) を書くのとあまり変わりないかもしれない。
軽さを重視して、何より誤動作させたくないのであれば>679のままでよさそう。

余談だけど>679を書いたのは、
\kの対象などになる URL のリストが長くなったのがきっかけ。
一度登録すると削除することがなかなかないものだから、
ドメインなどのリンク切れチェックや誤爆チェックをするため、
URL を最初から書き直すことにした。
個人サイトのウェブリングや、中小規模のショップなどはリンク切れがけっこうありそう。
1年から2年に1回くらいはリストを書き直すといいかもしれない。

685:680
07/04/07 08:35:42 8xuLEh/P0
>>684
すみません、質問の内容を勘違いしてました。
$LST(ROOT) はサイトのトップだけでなくその他のURLもリストに登録するような場合に使うと便利ですが、
サイトのトップだけをリストにまとめる場合には無駄になります。
この場合はthink氏のようにフィルター側で対応するべきでした。

>$LST(ROOT)の誤動作
私の知る限りは誤動作する心配はいらないと思います。 むしろ(/|/index.html|)(^?)を書く際の
記述ミスの心配が無くなり確認もラクになるので二者択一の場面があれば私なら積極的に使います。

>>682
実際にフィルターを書く場合にはURLの一部を取り出し、そこだけ変換するような書き方になると思います。
しかしURLの一部を改変してしまうことには変わりはないので何らかの不具合は覚悟の上で使うことになります。
この方法は (~|%7E) と比べると余計に面倒なことになるのであまり現実的ではありませんね。

686:think ◆MM0nnAOCiQ
07/04/07 16:55:40 cyEdAINr0
>>683
流れを追い切れてませんが、お疲れ様です。

>>684
誤動作に関しては、しっかりとテストを行えば、クリアできる課題だと思います。
しかし、遅くなるのはどうしようもありませんね…。
(/|/index.html|)(^?) の書き方をする場面は限られてくると思うので、速度も気になるのでしたら、テキストエディタの「一括置換」で管理する方が用途に合うと思います。

>>685
> しかしURLの一部を改変してしまうことには変わりはないので何らかの不具合は覚悟の上で使うことになります。
>682の他に、マルチバイト文字をデコードしたときにも誤爆する可能性があることに気がつきました。
ASCII文字のみに絞ってURLエンコードされた文字列を指定すれば、誤爆を回避できそうですが、面倒なことには変わりなく。
以下の表現からの派生を考えてみましたが、思いの外、時間がかかりそうだったので中断しました。

(URLリンク([_0-9a-z-]+{2,*})(.[_0-9a-z-]+{2,*})+{1,*}(:[0-9]+|(^:))/)\#
(([^#?/%]++)\#(((%([0-7][0-f]))+)\0$SET(#=$UESC(\0))((%[0-f]+)+[^#?/%]+)\#)+(/)\#)+\#

687:名無しさん@お腹いっぱい。
07/04/09 02:20:48 zSOO4a+F0
チラシの裏。

リストの拡張子を.cfgに変更して、.cfgをメモ帳よりもちょっと高機能なエディタに関連付けした。
.txtはいまだにメモ帳を使っているけど、
リストを編集するときにはアンドゥくらいは楽にできるとよいので
拡張子変更という手段をとってみた。
タスクトレイのアイコン右クリックからでも、指定したエディタが起動してなかなかよさげ。

688:名無しさん@お腹いっぱい。
07/04/09 02:22:55 5sO+vonU0
妙な関連付けを一般化するよりは
エデター+パラメターでショーツカッツ作った方が利口そうに思えるのだが

689:名無しさん@お腹いっぱい。
07/04/09 02:35:43 zSOO4a+F0
>688
1. 使用したいエディタのショートカットをSendToフォルダに入れる。
2. リストがあるフォルダを開いてから右クリック→送る
こういうやり方でもいいかなーと思ったけど、
タスクトレイのアイコン右クリックから開けるのが便利なので関連付けすることにした。
.cfgなんて拡張子はProxomitron以外だとあまり見かけないし、
.cfg専用にアイコンを設定しておいたので、開きたくない.cfgを誤って開くこともないかなと。

690:名無しさん@お腹いっぱい。
07/04/09 03:06:58 7Je96E6Q0
いずれにせよ
100歩遅れてるぞ

691:名無しさん@お腹いっぱい。
07/04/09 10:04:18 fUCp2oiA0
それなりのエディタ持っててメモ帳使う意味が分からん。

692:名無しさん@お腹いっぱい。
07/04/09 10:13:25 f4aajwxY0
cfgはOTBEditに関連付けしてる。 関連付けして不都合でもない限りしたほうが利口だと思う。

693:名無しさん@お腹いっぱい。
07/04/09 10:16:15 bCBiMOfp0
ニコニコ動画のURLリンク(www.nicovideo.jp)のgifを
指定のgifにするフィルタってないかな?
030.gifに固定したいんよ…

694:名無しさん@お腹いっぱい。
07/04/09 11:49:27 Lin40nlx0
>>693

[Patterns]
Name = "nicovideo randomgif to static"
Active = TRUE
URL = "www.nicovideo.jp/random $TYPE(htm)"
Limit = 256
Match = "<script type="text/javascript" src="js/illust.js"></script></a><noscript><img src="img/tpl/head/illust/000.gif" alt=""></noscript>"
Replace = "</a><img src="img/tpl/head/illust/030.gif" alt="">"

695:名無しさん@お腹いっぱい。
07/04/09 12:10:25 bCBiMOfp0
>>694
申し訳ありません
効果無いです…

696:名無しさん@お腹いっぱい。
07/04/09 12:37:48 f4aajwxY0
>>695
[HTTP headers]
In = FALSE
Out = TRUE
Key = "URL: niko 030.gif (out)"
Match = "URLリンク(www.nicovideo.jp)(^030.gif)[0-9]+.gif(^?)"
Replace = "$JUMP(URLリンク(www.nicovideo.jp))"

697:名無しさん@お腹いっぱい。
07/04/09 12:43:21 bCBiMOfp0
>>696
ありがと~ございます!

698:名無しさん@お腹いっぱい。
07/04/09 13:00:49 Lin40nlx0
>>695
きまぐれ検索ページ限定じゃなかったんだな。
ごめんな。

699:名無しさん@お腹いっぱい。
07/04/09 17:15:19 kYTyr62b0
こちらこそごめんなさい。

700:名無しさん@お腹いっぱい。
07/04/11 01:50:11 1C3+uH/D0
>>683修正
Match = "$NEST({,\1cursor[^:=]+(:|=)[^;]+(;|) \2,})$SET(0={\1\2})|"
"style=$AV(\1"
" (c|\& # (x (0 )+{0,*}(6 3|4 3)|(0 )+{0,*}(6 7|9 9)) (;|))"
" (u|\& # (x (0 )+{0,*}(7 5|5 5)|(0 )+{0,*}(8 5|1 1 7)) (;|))"
" (r|\& # (x (0 )+{0,*}(7 2|5 2)|(0 )+{0,*}(8 2|1 1 4)) (;|))"
" (s|\& # (x (0 )+{0,*}(7 3|5 3)|(0 )+{0,*}(8 3|1 1 5)) (;|))"
" (o|\& # (x (0 )+{0,*}(6 F|4 F)|(0 )+{0,*}(7 9|1 1 1)) (;|))"
" (r|\& # (x (0 )+{0,*}(7 2|5 2)|(0 )+{0,*}(8 2|1 1 4)) (;|))[^;]+(;|) \2"
")$SET(0=style="\1\2")"
Replace = "\0"

<font style = ' cursor feffeffe : url( " mailto: kuso.ani " ) '>nmooi</font> ←に対応

1行目比較
サンプルテキスト : 30000 バイト
平均時間 : 0.571000 (ミリ秒) ← cursor[^:=}]+(:|=) url\([^)}]+\)[^;}]+(;|) \1}$SET(0=\1})
平均時間 : 0.821000 (ミリ秒) ← {\1cursor[^:=}]+(:|=)[^;}]+(;|) \2}$SET(0={\1\2})
平均時間 : 0.701000 (ミリ秒) ← $NEST({,\1cursor[^:=]+(:|=)[^;]+(;|) \2,})$SET(0={\1\2})

701:名無しさん@お腹いっぱい。
07/04/11 22:23:13 cQGpqEHg0
特定のサイトだけUAをIEに変えるフィルターありませんか?
具体的に言うとDELL・・

702:名無しさん@お腹いっぱい。
07/04/12 01:55:46 yoxqXBik0
そのくらい自分で

703:名無しさん@お腹いっぱい。
07/04/12 11:03:10 MOcLIRDj0
>>701
自分でやって覚えようってことで、テンプレを示してみるってのはどうかと思ったが

[HTTP headers]
In = FALSE
Out = TRUE
Key = "User-Agent: Template (out) "
URL = ""
Match = "*"
Replace = ""

ほとんど空白になったのでまぁ自分でがんばれ。
URL MatchにDELLのURLを入れて、Replaceに任意のUAを入れるんだよ。

704:名無しさん@お腹いっぱい。
07/04/12 14:05:18 NgCTnRpZ0
ワイルドカードいらない

705:名無しさん@お腹いっぱい。
07/04/15 09:19:20 gMOTS18V0
Vectorでダウンロードのたびに、Vアップ通知画面見させられるの回避するフィルター教えてください。
JUMPとか使いそうなんですけどさっぱりわかりません。

706:名無しさん@お腹いっぱい。
07/04/15 10:58:16 xcMSre2P0
>>705
Vector ってゲームとソフトとで別の構成なのよね。
Vアップ通知画面を回避するという意味で、こんなのはどう?

Leeyes(WindowsNT/2000/XP / 画像&サウンド)
URLリンク(www.vector.co.jp)

とかの、ダウンロード画面でいきなりリダイレクトするWEBページフィルタ。

[Patterns]
Name = "Vector Soft DL Redirect"
Active = TRUE
URL = "*vector.co.jp/soft/dl/"
Limit = 200
Match = "<META NAME="download" CONTENT="\0">"
"$STOP()"
Replace = "<meta http-equiv="refresh" content="0;url=\0">"
"\k"

707:名無しさん@お腹いっぱい。
07/04/15 11:48:44 UGe0bqze0
[Patterns]
Name = "Vector download add link- (2007/04/15)"
Active = TRUE
URL = "www.vector.co.jp/soft/(dl/|)win"
Limit = 256
Match = "(<META NAME="download" CONTENT="http://download.\8">)\0$SET(_link=\8)|"
        "(<META NAME="ve_@title" CONTENT="\8">)\0$SET(_title=\8)|"
        "(<!-- soft data -->\s<table id="soft_data">)\8"
        "$SET(\0=\8\n"
        "<tr>\n"
        "   <td class="celltitle">Download : </td>\n"
        "   <td> <a href="ftp://ftp.$GET(_link)">FTP</a> <a href="http://download.$GET(_link)">HTTP</a> $GET(_title)</td>\n"
        "</tr>\n"
        ")$STOP()"
Replace = "\0"

ダウンロードのリンク追加するフィルタ



708:名無しさん@お腹いっぱい。
07/04/15 12:12:08 2puWsnLs0
漏れもメタタグを置換してリンクにしてる

709:名無しさん@お腹いっぱい。
07/04/15 12:42:36 gMOTS18V0
>>706
助かります!事前にリンク持ってくるって手もあるんですね、なるほど。
似たような例探していじってるだけだから全然応用力ない('A`)

>>707
さらに便利そうだと思って試したら何故かうちの環境じゃCPU100%で固まる・・・

710:名無しさん@お腹いっぱい。
07/04/15 14:11:03 6jv7Rx080
うちでも固まった
どこで暴走しているんだろう

711:名無しさん@お腹いっぱい。
07/04/15 15:05:01 UGe0bqze0
うちでは使えてるんだけどなぁ…

712:名無しさん@お腹いっぱい。
07/04/15 15:39:19 6jv7Rx080
他のフィルタ全部切って>>707だけにしても固まるなあ

一応環境書いておくか
Win2kSP4 IE6SP1 Naoko4.5+日本語化
開こうとしたURLは>>706

713:名無しさん@お腹いっぱい。
07/04/15 16:04:18 BZwh9YcC0
URLリンク(www.goti-death.com)

714:名無しさん@お腹いっぱい。
07/04/15 16:11:13 UGe0bqze0
全部切っても動作した

XPSP2 Firefox2.0.3 4.5June+6
開いたURLは>>706

なにが駄目なのかはわからん

715:名無しさん@お腹いっぱい。
07/04/15 16:52:40 X62yZfmp0
みんなVectorをそんなに利用しているのか。
自分はゲームの新作チェックを週1回と、
よく使うソフトの一部がたまにバージョンアップするときくらいかな。
(こっちは不定期チェック)

広告消しなら作ったけど、リダイレクトのフィルタは使ってないなあ。

716:名無しさん@お腹いっぱい。
07/04/15 19:34:46 xcMSre2P0
Vectorのなにもかも削ぎ落として、
直接ファイルへのリンクを張るWEBページフィルタ。

Treasure Search
URLリンク(www.vector.co.jp)

動いたり動かなかったりだけど、とりあえず ↑みたいなソフト紹介のページ用。

[Patterns]
Name = "Vector Soft All cut"
Active = TRUE
URL = "*vector.co.jp"
Limit = 20000
Match = "<HTML>*"
"<META NAME="download" CONTENT="*/pack/\9">*"
"<META NAME="ve_@title" CONTENT="\1">*"
"<META NAME="ve_@description" CONTENT="\2">*"
""
"treeOnOff'*</script>"
"\0<div class="fr">*<!-- left -->*<!-- /left -->"
"*<!-- soft data -->*<!-- soft data -->\6 <BR clear="ALL">"
"$STOP()"
Replace = "<HTML><head><TITLE>\1</TITLE></head><BODY>"
"<table border="0" width="700" align=center><tr>"
""
"\0 <!-- directory navi -->"
"<hr noshade="noshade" />"
"<font size=6><a href ="URLリンク(my.vector.co.jp) </font> <!-- title -->"
"\6 <!-- explanation -->"
"\k"

717:名無しさん@お腹いっぱい。
07/04/15 20:05:03 2puWsnLs0
URLリンク(my.vector.co.jp)
これだと結局リダイレクトされるから
URLリンク(ftp.)
に置換してやる方が早いかなと思う

でも一つのページで
98用とXP用とかシェア版とフリー版とか
複数のファイルがある場合、メタタグに
URLが書かれないケースがあるんよね

718:名無しさん@お腹いっぱい。
07/04/16 13:54:00 /FD4Gd9i0
>>717
おおっ。確かに、ラスト三行のとこははこれで十分だった。
すっきりしてよかった。ありがとう。

"<font size=6><a href ="URLリンク(ftp.vector.co.jp) </font> <!-- title -->"
"\6 <!-- explanation -->"
"\k"

メタタグに書かれてないアドレスは、拾うのがめんどくさいよなー。

719:名無しさん@お腹いっぱい。
07/04/22 23:44:54 ZzK8n97j0
URLリンク(vird2002.s8.xrea.com)
の汎用Webフィルタ集内のReplace vlink colorフィルタなのですが
background-colorにも誤爆してしまいます
どうすれば誤爆しないように出来るのでしょう?

以下コピペ
Name = "Replace vlink color (html+css) [2005/11/24]"
Active = TRUE
URL = "$TYPE(htm)|$TYPE(css)"
Limit = 256
Match = "(<body(^[^ ]))\#("
"([^>]++\svlink=)\#$AV(\0)([^>]+>)\1&"
"[^>]++\slink=$AV($TST(\0))"
"$SET(#="purple"))|"
"(a:visited {[^}]++color : )\#([0-9a-z#]+)\0"
"([^>]++a:link {[^}]++color : $TST(\0))\1"
"$SET(#=purple)|"
"(a:link {[^}]++color : ([0-9a-z#]+)\0"
"[^>]++a:visited {[^}]++color : )\#$TST(\0)"
"$SET(#=purple)"
Replace = "\@\1$STOP()"


720:think ◆MM0nnAOCiQ
07/04/23 01:25:28 OjjxmJmi0
>>719
懐かしいフィルタですねー。
CSSの表現はスマートな書き方ができなくて苦慮した覚えがあります。

> background-colorにも誤爆してしまいます
[^}]++color を ([^}]++[\t\n\r ;]|)color に変更してやれば、回避できると思います。
ご報告ありがとうございました。

[Patterns]
Name = "Replace vlink color (html+css) [2007/04/23]"
Active = TRUE
URL = "$TYPE(htm)|$TYPE(css)"
Limit = 256
Match = "(<body(^[^ ]))\#("
"([^>]++\svlink=)\#$AV(\0)([^>]+>)\1&"
"[^>]++\slink=$AV($TST(\0))"
"$SET(#="purple"))|"
"(a:visited {([^}]++[\t\n\r ;]|)color : )\#([0-9a-z#]+)\0"
"([^>]++a:link {([^}]++[\t\n\r ;]|)color : $TST(\0))\1"
"$SET(#=purple)|"
"(a:link {([^}]++[\t\n\r ;]|)color : ([0-9a-z#]+)\0"
"[^>]++a:visited {([^}]++[\t\n\r ;]|)color : )\#$TST(\0)"
"$SET(#=purple)"
Replace = "\@\1$STOP()"

721:名無しさん@お腹いっぱい。
07/04/23 21:52:44 9qLGs43x0
mixiの広告が書き込み後にまで出てくるのでばっさりしたいのですが
どなたかお願いできませんでしょうか

722:名無しさん@お腹いっぱい。
07/04/23 23:45:06 WunQE0DL0
ごめんなさいとか負けましたとか、相手に言わさないと気が済まないタイプだな

723:名無しさん@お腹いっぱい。
07/04/24 00:02:18 iDBm5yeQ0
ごめんくさい

724:名無しさん@お腹いっぱい。
07/04/24 06:35:10 VqzAMHe80
禿げました

725:名無しさん@お腹いっぱい。
07/04/24 21:37:27 dm3t6qtQ0
このスレ開く度に JS.WindowBomb.G 検出する

726:名無しさん@お腹いっぱい。
07/04/24 22:08:16 Iun5v+tK0
>>713のせいだろ

727:名無しさん@お腹いっぱい。
07/04/27 00:48:04 xXKAhs370
Multiを有効にしたフィルタAが動作(マッチ)した際にフラグを立て、
フラグが立っているときのみフィルタBをバイパスすることはできませんか?
$TSTを使えばよいのかと思うものの、
$TSTの使い方はいつまで経ってもよくわからない……。

728:名無しさん@お腹いっぱい。
07/04/27 03:24:57 sTe/59Oa0
慣れれば簡単
以下はテキストエリア以外のスクリプトタグを全てテキストエリアに代えるサンプル

[Patterns]
Name = "$in_textarea = true (1/2)"
Active = TRUE
Multi = TRUE
Limit = 256
Match = "<textarea"
Replace = "$SET(in_textarea=1)<textarea"

Name = "$in_textarea = false (2/2)"
Active = TRUE
Multi = TRUE
Limit = 256
Match = "</textarea*>"
Replace = "$SET(in_textarea=0)</textarea>"

Name = "if (not $in_textarea) <scripit> to <textarea>"
Active = TRUE
Limit = 256
Match = "<(/|)\0script\1>"
        "(^$TST(in_textarea=1))"
Replace = "<\0textarea rows=5 cols=100><\0script\1>"

729:名無しさん@お腹いっぱい。
07/05/01 15:13:54 XSGQ9HTn0
ニコニコ動画の広告を削除するフィルタきぼん

730:名無しさん@お腹いっぱい。
07/05/01 16:03:37 z7gVZ/0O0
ニコ動のID表示のために導入したけど
なんか面白そうだなw

731:think ◆MM0nnAOCiQ
07/05/01 16:45:44 a5J7jX0x0
>>729
AdListに ad.nicovideo.jp/ を登録してください。
他、便利フィルタは「じょんじさんの日記」をウォッチしてれば、新しいフィルタが見つかると思います。

Proxomitron全角NGワードの変換方法 [日記] ニコ動画SNS
URLリンク(nicosns.inventor.jp)

732:名無しさん@お腹いっぱい。
07/05/01 17:01:26 Dwbx2m+p0
>>731
どうでもいいけど、今現在時間限定開放ユーザはいませんよ
60万までのIDは全て24時間開放。

733:名無しさん@お腹いっぱい。
07/05/01 17:16:46 YHXz+5I40
>>729
頻繁に書式変わってるから自分でメンテできないと無駄だ

734:think ◆MM0nnAOCiQ
07/05/01 17:16:58 a5J7jX0x0
>>732
ニコニコ動画アカウントは最近取得しましたが、ログイン時に「02:00~19:00間限定、80万番まで開放」という旨の警告が表示されましたよ。
公式なニュースでは、75万IDまで解放とあるようですが…。

ニコニコ動画、時間限定で75万IDまで開放--登録後すぐ利用可能に - CNET Japan
URLリンク(japan.cnet.com)

735:think ◆MM0nnAOCiQ
07/05/01 17:26:48 a5J7jX0x0
む…、>732をよく見ると「今現在時間限定開放ユーザはいません」ですね。
文章は良く読もう。orz

736:名無しさん@お腹いっぱい。
07/05/01 18:13:43 XSGQ9HTn0
>>731
駄目だった
>>733
無駄か、残念

737:名無しさん@お腹いっぱい。
07/05/01 21:34:59 WujtkzIE0
>>736
とりあえず……どう?

[Patterns]
Name = "nicovideo.jp UPPER AD cut"
Active = TRUE
URL = "*www.nicovideo.jp"
Limit = 250
Match = "<DIV*"
""URLリンク(ad.nicovideo.jp)
"</DIV>"
"$STOP()"
Replace = "<!-- CUTTED -->"

738:名無しさん@お腹いっぱい。
07/05/01 21:44:40 XSGQ9HTn0
>>737
駄目だった
URLリンク(ad.nicovideo.jp)なんかの広告は消えない

739:名無しさん@お腹いっぱい。
07/05/02 05:30:33 W7TO92+P0
まあ頻繁に書式変わってるからすぐに使えなくなるけどな

740:名無しさん@お腹いっぱい。
07/05/02 05:31:29 W7TO92+P0
やっべ、寝ぼけて同じ内容書いちまったorz

741:名無しさん@お腹いっぱい。
07/05/02 06:17:45 MsarYhgY0
知らない間にニコニコ絡みで話題になってたのね。
どうせそのうちニコニコ側でIDあぼーん実装するんだろうけど、
Greasemonkey全盛の時代にこんなイベントが発生するとは。

742:名無しさん@お腹いっぱい。
07/05/02 07:14:37 IuVgBXyJ0
[Patterns]
Name = "Kill NicoNico Ad"
Active = TRUE
URL = "www.nicovideo.jp"
Limit = 256
Match = "<a href="URLリンク(ad.nicovideo.jp)
Replace = "<!-- Kill nicovideo ad -->"

[Patterns]
Name = "Kill NicoNico Ad2"
Active = TRUE
URL = "www.nicovideo.jp"
Limit = 1024
Match = "<tr><td*<strong>dwango.jp*</td></tr>"
Replace = "<!-- Kill nicovideo ad -->"

適当に書いたんだけど一応いまは消えた

743:名無しさん@お腹いっぱい。
07/05/02 15:58:03 s+ecP+200
おまえらFlash広告どうやって消してるの?

744:名無しさん@お腹いっぱい。
07/05/02 17:22:18 sUS3A/Us0
>728
遅くなりましたが、どうもありがとうございます。懲りずに練習します……。

>743
見えなくするだけだったら、
ヘッダフィルタでapplication/x-shockwave-flashを\kするとか。
CSSだったらobject[data$=".swf"], embed[src$=".swf"] { display: none !important; }とか。

745:名無しさん@お腹いっぱい。
07/05/02 19:18:28 6Ctk8iEj0
サイトのにあわせて作る

746:think ◆MM0nnAOCiQ
07/05/02 22:10:53 32+xZaXm0
>>736,738
今日、いくつかの動画閲覧しましたが、AdListの方法(>731)で広告は消えているように見えました。

キャッシュが残っているか、他のフィルタが先にマッチしているか。
そのあたりを確認してみてはどうでしょうか。

747:名無しさん@お腹いっぱい。
07/05/02 23:55:22 qmLcqwLu0
オミトロンでニコニコ動画のNGIDじゃなくてNGワードって出来ないですかね・・・

748:名無しさん@お腹いっぱい。
07/05/03 00:01:27 /8nwxjhj0
とっくに出来てる

749:think ◆MM0nnAOCiQ
07/05/03 00:29:50 nPc5NiPX0
>>747
この辺を渡り歩けば、きっと見つかります。

ニコニコ動画(γ)の時間
URLリンク(nico.studio89.jp)
nikoniko027 オミトロンでニコニコ
URLリンク(nikoniko027.blog.shinobi.jp)
ニコ動画SNS - じょんじさんのプロフィール
URLリンク(nicosns.inventor.jp)
【教えて君は】ニコニコ動画専用オミトロン【半年ROMれ】
スレリンク(streaming板)
Thinking Archive(仮) - Download
URLリンク(vird2002.s8.xrea.com)

750:名無しさん@お腹いっぱい。
07/05/03 00:31:57 QMUIUr520
自分のID偽装は?

751:名無しさん@お腹いっぱい。
07/05/03 00:35:08 rIudHI5H0
>>749
ありがとうございます。

752:名無しさん@お腹いっぱい。
07/05/03 04:02:10 fXOrahMQ0
>>749
wikiも載せてやれよww
URLリンク(abc.s65.xrea.com)

753:名無しさん@お腹いっぱい。
07/05/03 11:57:23 5Pd/xwrv0
URLリンク(www.myj7000.jp-biz.net)
このサイトの左上のgif広告の絵を消したいんだけど、知識が少なくてできないっす
単純にblockfile→noimagesに追加しても駄目なんですか

gif止めるとさらに・・生理的に駄目なんです、こういう顔

754:think ◆MM0nnAOCiQ
07/05/03 13:49:41 nPc5NiPX0
>>752
うっかりしてました。ご指摘ありがとうございます。

>>753
広告はまず、AdListを試してみてくださいな。

www.bb-chat.tv/ で消えます。
「Kill href/src ad」なら bb-chat.tv/

755:名無しさん@お腹いっぱい。
07/05/03 14:05:00 RdDv3z2I0
>>754
できました、ありがとう

756:名無しさん@お腹いっぱい。
07/05/03 15:36:36 C1vsNmZH0
>>746
AdListの方法きぼん

757:名無しさん@お腹いっぱい。
07/05/03 18:31:50 pgaHKdjc0
AdListってスラッシュ入れないと機能しないの?

758:think ◆MM0nnAOCiQ
07/05/03 18:54:22 nPc5NiPX0
>>756
1. Proxomitronを起動
2. $LST(AdList) を含む広告削除フィルタを無効に
3. 「Thinking Archive(仮) - Download」(URLリンク(vird2002.s8.xrea.com)) へ
4. リスト型の広告除去フィルタ集をダウンロード
5. 添付テキストに従い、フィルタを適用
6. [デフォルトの設定に保存]
7. Webブラウザを終了し、キャッシュをクリア
8. ニコニコ動画 (URLリンク(www.nicovideo.jp)) へ

Google検索: ブラウザ キャッシュ クリア
URLリンク(www.google.co.jp)

>>757
/ を付けると、「URLスタイル」のハッシュ化が有効になります。
「固定プレフィックス スタイル」のハッシュ化も有効なら、そちらが優先されますが。

マッチングコマンド - $LST
URLリンク(vird2002.s8.xrea.com)
Using Blocklists
URLリンク(www.pluto.dti.ne.jp)

759:名無しさん@お腹いっぱい。
07/05/03 22:55:47 RgqQ9N5g0
ハッシュ化というのは前から気になっているんだけど、
リストの用途によっては「/」で終わらせることができなくて悩む。

href="*click.*"
こういうものにマッチさせようとするときとか。
ドメイン名にマッチさせるときはだいたい問題ないようだけど、
ファイル名や特定の文字列にマッチさせるときは諦めるしかないのかな。

760:think ◆MM0nnAOCiQ
07/05/03 23:43:36 nPc5NiPX0
>>759
ファイル名や文字列にマッチさせるときには、「固定プレフィックス スタイル」のハッシュ化を利用するぐらいしかないです。
条件は「行頭から7文字目までにワイルドカードを含まない」という緩いものなので、何とか頑張って条件を満たすしか。

761:名無しさん@お腹いっぱい。
07/05/05 00:05:45 esZE5ph10
Last-Modifiedの値をSaved from URLみたいにページ内にコメント出来ますか?
できるならフィルターの作成をお願いしたのです。


762:名無しさん@お腹いっぱい。
07/05/05 05:17:15 d65anNt70
>>743
とりあえずソースを見て、script、object、embed などで検索して該当箇所を探す。

763:名無しさん@お腹いっぱい。
07/05/05 15:02:25 HXVXg19h0
URLリンク(level.s69.xrea.com)
これ、うまくやればテキストの選択がしやすくなるかも。
CSSでやった方がいいかな。

764:名無しさん@お腹いっぱい。
07/05/06 19:59:12 0RrzqTzs0
proxomitronをつかって、Adsense、Amazon広告とか消せますか?

765:名無しさん@お腹いっぱい。
07/05/06 21:43:54 v0/J9yLJ0
消せます

766:名無しさん@お腹いっぱい。
07/05/07 01:06:36 xcM0UFPs0
2ちゃんのレス内容の「w」を「・」に変えるフィルターって作れますか?
もし作れるなら作ってくれると嬉しいです。

767:think ◆MM0nnAOCiQ
07/05/07 02:32:12 PhUD95sD0
>>766
> 2ちゃんのレス内容の「w」を「・」に変えるフィルターって作れますか?
そのフィルタを利用する「ブラウザ」は何でしょう?
それによって、回答が変わってくると思います。

ReplaceStr.txtを活用するスレ
URLリンク(jane.s28.xrea.com)
【Proxomitron】Jane用内部Proxy設定スレ【Privoxy】
URLリンク(jane.s28.xrea.com)
Thinking Archive(仮) - Download (2ch-BBS: Replace BlockList character)
URLリンク(vird2002.s8.xrea.com)
Thinking Archive(仮) - Download (ReplaceStr: BlockList)
URLリンク(vird2002.s8.xrea.com)

「2ch-BBS: Replace BlockList character」はいくつか問題があるので、非推奨です。
ReplaceStr.txt の方が使い勝手が良いと思います。

768:名無しさん@お腹いっぱい。
07/05/07 16:38:01 xcM0UFPs0
>>767
利用するブラウザは「Jane Doe Style」です。
ReplaceStr.txtはJane Doe Styleだと使えないみたいなんですよね・・・

769:名無しさん@お腹いっぱい。
07/05/07 19:13:59 KgnicPXJ0
postするデータを書き換えたいんですが
<div len="-10" ver=5 />のlen=を必ず-500にするにはどうすれば良いのでしょうか
ヘッダでオウトをonにして
[HTTP headers]
In = FALSE
Out = TRUE
Key = "New-HTTP-header"
Match = "<div\slen=$AV(-[0-9]+)
Replace = "<div len="-500"
にしてるんですが、作動していないみたいです

770:名無しさん@お腹いっぱい。
07/05/07 19:15:08 KgnicPXJ0
間違えた。必要な”も削ってしまった

[HTTP headers]
In = FALSE
Out = TRUE
Key = "New-HTTP-header"
Match = "<div\slen=$AV(-[0-9]+)"
Replace = "<div len="-500""
です

771:名無しさん@お腹いっぱい。
07/05/07 22:30:04 GFsNvVxc0
最近のHTTPヘッダはHTMLタグを含むのか、すごいな

772:名無しさん@お腹いっぱい。
07/05/07 22:38:28 Fucx00y60
RFC2616始まったな

773:名無しさん@お腹いっぱい。
07/05/07 23:32:43 GFsNvVxc0
のちのHTTP/2.0である

774:think ◆MM0nnAOCiQ
07/05/07 23:42:50 BqlZ9hkC0
>>769-770
その特徴的な属性名を見ると、ニコニコ動画で得るコメント数をUPするフィルタを作ろうとしているように思えるんですが…。

> postするデータを書き換えたいんですが
ProxomitronはPOSTデータを書き換えできないので、間接的に書き換える方法を模索してください。

TIPS - Proxomitron等に関するWiki
URLリンク(abc.s65.xrea.com)

# 「JavaScriptでPOSTしている→JavaScriptのコードを書き換える」も可能だと思います、多分。

775:名無しさん@お腹いっぱい。
07/05/07 23:46:11 KgnicPXJ0
>>774
属性名変えたのにバレバレっすかw

776:think ◆MM0nnAOCiQ
07/05/07 23:52:52 BqlZ9hkC0
>>775
某スレッドでコメント取得の話題が出たばかりですからw

777:名無しさん@お腹いっぱい。
07/05/08 00:16:45 rO/jdOj20
URLリンク(yp.peercast.org)

このサイトの下のほうにあるPage: 1, 2, 3, 4, 5, 6 >>>をページの
上のほうにも表示させるフィルタ作ってくれる人はいませんでしょうか。
出来れば1から8までのリンクが常に表示されるようにして頂けるととてもありがたいです。

778:think ◆MM0nnAOCiQ
07/05/08 21:27:01 iAoRBsh/0
>>768
ごめんなさい。レスし忘れていました(汗)
「Jane Doe Style」では「2ch-BBS: Replace BlockList character」のフィルタで置換できるということしかわかりません…。(>767)

779:名無しさん@お腹いっぱい。
07/05/08 23:26:39 Iqon7aVp0
>>778
チカンは犯罪です。 w

780:名無しさん@お腹いっぱい。
07/05/08 23:42:48 7lg4DeCw0
解決しましたので、このスレは削除依頼出しておきます。
答えてくださった方々、本当にありがとうございました。

781:名無しさん@お腹いっぱい。
07/05/09 02:22:21 10IZTesj0
>>778
ありがとうございます。
とりあえず「2ch-BBS: Replace BlockList character」を試してみます。

782:名無しさん@お腹いっぱい。
07/05/09 10:24:27 7zUtyw880
変数の比較についてどうしてもうまくいかないので質問です。
\1と\2を比較して一致しているかで分岐したいのですが、
$TST(\1=\2)
と記述すると比較ではなく代入になってしまうのですが仕様なんでしょうか。
$TST(1=\2)
でもうまくいきません。今度は常にヒットしなくなります。
文字変数に代入して比較したりいろいろと工夫してみてもやっぱり駄目。
どう記述するのが正しいんでしょう?

783:名無しさん@お腹いっぱい。
07/05/09 10:30:23 vkCHQC3j0
$TST(\1=$TST(\2))

784:名無しさん@お腹いっぱい。
07/05/09 11:31:08 7zUtyw880
>>783
できたー(・∀・)
即レスサンクス。

785:名無しさん@お腹いっぱい。
07/05/09 19:52:29 dnGknlhn0
>>783
感動した

786:名無しさん@お腹いっぱい。
07/05/11 18:34:01 rADFD0Jg0
スレリンク(software板:369番)

366 :名無しさん@お腹いっぱい。:2007/05/10(木) 01:28:26 ID:LPeEjSkM0
正規表現でフィルタ作れるプロクシ作ったけどいる?
gzip/deflate圧縮対応、utf-8変換機能有り

369 :名無しさん@お腹いっぱい。:2007/05/10(木) 19:34:43 ID:9b3E3OvP0
XPでしか試してない。
最低でも2000以上じゃないと動かないはず。
sageでオミトロン使いに気づかれないようにこっそり進行でお願い。

372 :369:2007/05/10(木) 20:21:47 ID:9b3E3OvP0
URLリンク(www-2ch.net:8080)
パスは「dl」(小文字ででぃーえる)
URLリンク(www-2ch.net:8080)


787:名無しさん@お腹いっぱい。
07/05/11 19:19:18 tqsDsZ1K0
>sageでオミトロン使いに

なんていうか・・・卑屈だな
そんなに仲悪いの?

788:名無しさん@お腹いっぱい。
07/05/11 19:24:41 mO/La/9C0
何か嫌われてるみたいだな

789:名無しさん@お腹いっぱい。
07/05/11 19:30:19 fHP/rSL30
Arneだろ

790:名無しさん@お腹いっぱい。
07/05/12 11:31:47 zsEONeG60
そりゃこのフィルタスレ見てたってまともに自分で使えない厨房がいっぱいだし
うざいってことじゃないのかな

791:777
07/05/12 11:36:19 u1eBPKNo0
どうもすみませんorz

792:777
07/05/12 13:24:28 u1eBPKNo0
見よう見まねで作ってみました。 上下に2列ずつページリンクが出て変だけどこれで妥協しよう。

[Patterns]
Name = "YP Link 070512"
Active = TRUE
URL = "yp.peercast.org/(\?|(^?))"
Limit = 512
Match = "(<hr\ssize="1">)\0|(Page:(([^<]|<<<)+<(/|)[ab](^[a-z])[^>]+>)+[^<]+)\3"
"$SET(4=<br><br>)$STOP()$SET(5=\r\n<style type="text/css">\r\n"
"<!--\r\nspan#pagelink { position: absolute; top: 140px; left: 340px;"
" font-size:16px; font-weight:bold; }\r\n-->\r\n</style>\r\n\r\n"
"<span id="pagelink">\r\n\3\r\n</span>\r\n\r\n)"
Replace = "$SET(6=&#160;&#160;<a href="?from=)\0\r\n<div style="font-size: 16px;"
" font-weight:bold;">\r\n\3\4\r\nPage:\61">1</a>\r\n\621">2</a>\r\n\641">"
"3</a>\r\n\661">4</a>\r\n\681">5</a>\r\n\6101">6</a>\r\n\6121">7</a>\r\n"
"\6141">8</a>\r\n\6161">9</a>\r\n\6181">10</a>\r\n</div>\r\n\5"

URLリンク(yp.peercast.org)

793:名無しさん@お腹いっぱい。
07/05/12 20:35:12 hAIBizt30
2ch見ててウイルスコード書く奴が居てアンチウイルスが過剰反応するので、
このウイルスコードを読み込まない様にするフィルターが欲しいんですが。<(_ _)>


794:名無しさん@お腹いっぱい。
07/05/12 20:56:03 50Uhoets0
アンチのほうで除外できんのか

795:名無しさん@お腹いっぱい。
07/05/12 20:56:14 1OsLhWl60
datファイルの場所を検査除外するようにすればいいだけ

796:名無しさん@お腹いっぱい。
07/05/12 21:23:41 hAIBizt30
>>794-795レスドウモデス
出来るとか出来ないとか話がありますが、これからそう言う書き込みが増えそうな予感がするのでオミトロンで出来れば遣りたいな、と思いまして。

797:名無しさん@お腹いっぱい。
07/05/12 21:34:47 1OsLhWl60
ウィルスコードに共通する部分が無いと駄目かと

798:名無しさん@お腹いっぱい。
07/05/12 21:36:20 vD81c/Ks0
増えそうならますます795の方が良いと思うけどなあ。
その度にフィルタ増やすより。

799:名無しさん@お腹いっぱい。
07/05/12 23:40:32 QLoGUdha0
>>796
いまさら誰もそんな予感はしてない
自分の希望を他人のせいにすんな

800:名無しさん@お腹いっぱい。
07/05/12 23:45:22 hAIBizt30
>>795datファイルの除外では無く、そのレスだけ除外してアンチウイルス補助(と言うか2ch対策?)
みたいな感じに使えたらと思ったんだけど。
>>797 の言う通り共通コードとか考えるとちょっと使い方違うかなとは思った。
でもフィルターだけ作っておけば後は除外コードを追加していけば・・・、
何て素人考えでいたんだけど。(^o^;; とりあえづ、除外とか対策があるのでありがとう。

801:名無しさん@お腹いっぱい。
07/05/12 23:46:23 2BPV17nj0
ニコ厨

802:名無しさん@お腹いっぱい。
07/05/13 00:30:44 9GHFhxcy0
>>800
申し訳ないが仰っている意味が全くわからない

803:名無しさん@お腹いっぱい。
07/05/13 02:07:48 4aDa1u7g0
無理しなくていいよ

804:名無しさん@お腹いっぱい。
07/05/13 02:44:46 8nmUBfmr0
ウイルス対策ソフトなんて使ったことないが、オミトロンだけあれば十分でないか?
よほど凝ったしかけでもされなければ、ウイルスを入れられることはないと思うが。
(使っているフィルタにもよるけど)
あとはIEを使わないとか、ブラウザを選択するだけでもある程度の効果はあるだろう。

805:名無しさん@お腹いっぱい。
07/05/13 02:47:22 gLrYIWfD0
ウイルスは油断してる奴ほど引っかかりやすい。

806:名無しさん@お腹いっぱい。
07/05/13 03:24:17 gLrYIWfD0
>>800
そういうフィルタを作ることは出来るよ。 2chブラウザのNG処理みたいなことをオミトロンで
やればいいだけだから簡単。 もしかしたら既成のNGフィルタで出来るかも。

ただし、登録の仕方を工夫しないとフィルタ内のウイルスコードがアンチウイルスソフトに
ウイルス認識されてしまい、その結果オミトロンの設定ファイルがまるごと消されたり、
隔離されたりしてしまうことが考えられるので注意されたしw


余談だが、アンチウイルスの設定でdatのある場所を除外するという方法は、
この場所にウイルスが投下された場合に無防備になるという欠点があるので
これをやればいいというレスは正しいとは言えない。
今回はオミトロンで回避するにはどうすればいいかという質問なのでこれは答えになってない。

こういう場合はアンチウイルスの設定でも回避出来ることを示しつつ、
オミトロンで実現するにはどうすればいいかを書くべきだろうと思う。

807:名無しさん@お腹いっぱい。
07/05/13 03:45:48 No4VdHhW0
<#`∀´>ノ よっ

808:名無しさん@お腹いっぱい。
07/05/13 06:26:16 Y7joxdUo0
(-@∀@)ノ

809:名無しさん@お腹いっぱい。
07/05/13 10:51:54 jtfDIeTY0
>>806 その通りだな。

810:名無しさん@お腹いっぱい。
07/05/13 11:05:52 5QE9Ptp+0
定型文から一部当たったらその場所を適当な文字に置き換えればいいが
ただし容量が変わると次の読み込み時に読み込み開始位置がずれるので
Janeでのdatの置き換えは実用的でない

811:名無しさん@お腹いっぱい。
07/05/13 11:21:20 bUgHmLCf0
ウイルスが投下って、テキストなんだから投下されてもええやん。

812:名無しさん@お腹いっぱい。
07/05/13 11:56:48 j4dYgaDi0
>>811
ウィルスに感染した際に、datフォルダが作業フォルダになってしまうってことでは?

813:名無しさん@お腹いっぱい。
07/05/13 12:21:35 OxtBhJpp0
何かもうチンプンカンチンだな

814:名無しさん@お腹いっぱい。
07/05/13 14:04:52 DlZ/oUSV0
おまいら日本語を勉強しなおして来い

815:名無しさん@お腹いっぱい。
07/05/13 14:06:57 lJbqJQb50
ニホンゴノ ベンキョウハ トテモ ムズカシイデス。

816:名無しさん@お腹いっぱい。
07/05/13 15:53:48 ZlFJMo5X0
>>810
Jane系ならWickedStr.txtで解決

817:名無しさん@お腹いっぱい。
07/05/14 04:45:34 ypZMCifm0
全角文字と半角文字を区別しないのが問題悩みの種なんですが、
たとえば検索条件に「@」を指定すると「 」(全角空白)にヒットしたりしますよね。
こういうのは根本的に解決できないんでしょうか。

818:名無しさん@お腹いっぱい。
07/05/15 01:13:26 bvbbhwzO0
プロ櫛rgx
スレリンク(software板)

2 :名無しさん@お腹いっぱい。:2007/05/14(月) 23:05:44 ID:WKifu00Y0
元は↓から始まったソフトproxrgxのスレ

スレリンク(software板:366番)
366 :名無しさん@お腹いっぱい。:2007/05/10(木) 01:28:26 ID:LPeEjSkM0
正規表現でフィルタ作れるプロクシ作ったけどいる?
gzip/deflate圧縮対応、utf-8変換機能有り


次ページ
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch