連番のH画像/動画を一気にダウンロードする3at UNIX
連番のH画像/動画を一気にダウンロードする3 - 暇つぶし2ch2:名無しさん@お腹いっぱい。
10/04/30 17:37:36
乙。
前スレ700辺りからの加速が凄まじかったな。

3:名無しさん@お腹いっぱい。
10/04/30 17:46:26
新スレ記念に何か上げるかな
artemisのダウンローダーとか


4:名無しさん@お腹いっぱい。
10/05/01 02:35:10
おつ

5:名無しさん@お腹いっぱい。
10/05/02 01:41:42
ダウンロード関係総合スレ
スレリンク(linux板)

6:名無しさん@お腹いっぱい。
10/05/02 15:16:26
>>1

>>2
サイト管理側が対策すると対抗心を燃やすのが此処の住民の性

7:名無しさん@お腹いっぱい。
10/05/02 20:43:24
なんで禁書厨が紛れ込んでいるのかがわからない

8:名無しさん@お腹いっぱい。
10/05/04 01:45:43
今必要なのは新しいネタ

9:名無しさん@お腹いっぱい。
10/05/04 18:58:20
そして破壊と創造

10:名無しさん@お腹いっぱい。
10/05/04 20:21:23
大抵「作品名+HCG」でググれば見つかるけど、
スクリプトが面白いからこのスレがあるのかい?

11:名無しさん@お腹いっぱい。
10/05/04 20:24:25
>>10
スクリプトで全自動化して全然手間かからなくなるからこのスレがある
それとwgetを日本で一番使いこなしている集団のはずだ


12:名無しさん@お腹いっぱい。
10/05/04 20:28:16
e-hentaiの最新の仕様変更に対応できない…。
上手く抜けてる人が居たらヒントをくれないか or2

13:名無しさん@お腹いっぱい。
10/05/04 21:09:15
俺はwgetやperlじゃなく、Cでsend/recvしてやってるけど。
3月中の変更のgzip化は、gzip本家のソース組み込んで逃げた。
ソースコードだけgzip化されている。レスポンスヘッダー\r\n\r\nの後のデータをgzipでデコードすればいい。
目的のアドレスの中にamp;が含まれている場合があって、むしろこっちに引っかかってた。

3末だったか4月頭にも、もう一度修正来たけど、これはダミーのアドレスが大量に含まれているバージョンで
正しいアドレスを抽出する仕方は人それぞれ。俺はaltとファイル名でマッチした奴を選んでる。
jpg.jpg, png.png, gif.gifを例外にしてる。

Cでやる場合は、webサーバーのレスポンスコードに注意する必要があるよ特に400系。
1月頃までは300系レスポンスとかもやっていたサイトなので当然対応できるようにしておいた方がいい。
せっかく画像のアドレスゲットしても、こっちが光でも当の画像サーバー糞重い場合もあるので
レジュームリクエストにも対応しておいた方がいい。

14:名無しさん@お腹いっぱい。
10/05/04 21:12:06
普通に落とせたが?
せめてどのスクリプトがどこでどんな風に失敗するのか説明しないと、
エスパー待ちしてても仕方ないかと

15:名無しさん@お腹いっぱい。
10/05/04 21:30:06
ツール房やしねしね君が来るので弄るのは、ほどほどにね
まだGW終わってないし

16:名無しさん@お腹いっぱい。
10/05/04 22:18:24
e-hentaiってどういう技術使ってるの?
他のサイトがあの技術使い出したら面倒だなあ

17:名無しさん@お腹いっぱい。
10/05/04 22:26:59
他のサイトと変わらんけどな。httpd.confの設定次第だし。
HTTPソース+jsスクリプトでアドレスを動的に生成されるサイトを前スレで紹介してたけど
あっちの方が面倒くさそう。髪金ねーちゃんだから解読する興味わかなかったけど。

18:名無しさん@お腹いっぱい。
10/05/04 23:19:15
最も面倒なのはFlashや専用プラグインを要求するタイプのやつ
保存されるのが絶対に嫌なんだろうな

19:名無しさん@お腹いっぱい。
10/05/04 23:30:34
たしかにそうなったらスルーだな。
swfはデコンパイルして画像取れそうだけど。
Flashとかフォーマット公開されたmpeg系の動画形式でも
一枚一枚漫画を再生で表示とかなったら、好きにしてくれって思うな。

20:名無しさん@お腹いっぱい。
10/05/05 01:23:00
URLリンク(www.geocities.jp)

21:名無しさん@お腹いっぱい。
10/05/05 01:36:12
前スレから拾ってきた物
URLリンク(ideone.com)
URLリンク(ideone.com)

今でも使えるかどうかは、判りませんが個人的には参考になりました

22:名無しさん@お腹いっぱい。
10/05/05 02:56:25
e-hentaiはとにかく機械的なロリ八分がうざすぎる
その辺の奴が適当に付けたタグを信用してどうする

ダウンローダを作るより現仕様を逆手に取って
無差別にlolicon/shotaconタグをつけて回る方が良いんじゃなかろうか…
何とかして機械的分類の意味をなくして方針を見直さざるを得ない状態にできんかなぁ

23:名無しさん@お腹いっぱい。
10/05/05 06:57:46
適当に付けられたロリショタタグはパワーでかい人に消されることが多いだろうな
その人の基準でロリショタか否か決められちゃうけど削除されるわけじゃあるまいしどうでもいいだろ

24:名無しさん@お腹いっぱい。
10/05/05 09:28:50
機械的に処理する以外の現実的な解決策って存在しないでしょ
無差別にダグつけるバカがいたらそいつが付けたタグだけ処理するだろうし
対処できないような状態になったらサイトごと消えるだけ

25:名無しさん@お腹いっぱい。
10/05/05 14:19:00
そもそも語句が結構広いんだけど
loli/shota/childでもダメ

>>23
>その人の基準でロリショタか否か決められちゃうけど削除されるわけじゃあるまいしどうでもいいだろ
前は「見えにくい」だけだったが今はページごと抹消されてる
loliタグで生存してるギャラリーの方が少なくなってきた

26:名無しさん@お腹いっぱい。
10/05/05 17:23:46
>>25
それらはlolicon/shotaconのSlaveTagだから仕方ない
現在の対象タグはlolicon/shotacon/incest/bestialityじゃないかな
獣姦はともかく他3つは該当するの多いね、特に雑誌だと
見えにくいってのはそういう意味じゃないよ、今でも画像は消えてない

27:名無しさん@お腹いっぱい。
10/05/05 18:10:09
すまん、childはSlaveTagじゃないな
というかchildってTag自体がほぼ存在しないようなもんか
Tagじゃなくてギャラリーのタイトルにloli/childとかが含まれてるのも検索にかからなくなってるんだな
タグと違ってギャラリー自体は普通に見れるみたいだけど、最初からこうだっけ?

28:名無しさん@お腹いっぱい。
10/05/05 19:28:19
>>27
E-hentaiはフォームから検索すると部分一致で検索結果が出てくる
(クリックからの動作は検証してないが基本的に同じだと思う)
要するにpixivと同じ形式なんだが、「loli」で検索すると出てくるのは「.*loli.*」になる

childっていうタグ自体にそれほど意味は無いんだけど
本来「child」で検索すれば絶対可憐チルドレン(Zettai Karen Children)が出てくるはずなのが0件になる
「kodomo」(.*kodomo.*⇒こどもの時間)とかで試したけど作品名で規制されてるのは今のところ見つからないんだよね

29:名無しさん@お腹いっぱい。
10/05/05 20:19:51
>>28
その辺は一応わかってるつもりのを3行目に書いたつもりだった
childが含まれるタグはそれなりにあるけど、childのみのタグはほぼ無いようなもんだったから・・・
>>27にも書いたけどタイトルにchildが含まれるだけなら検索には引っかからないがギャラリーは普通に見れる
これはchildを含むタグを持つ場合も同様みたいでloliconとかとは別な対応をしているみたい
もっとも絶対可憐チルドレンはloliconタグ付いてるのがほとんどっぽいが

30:名無しさん@お腹いっぱい。
10/05/05 20:26:53
>>26
>見えにくいってのはそういう意味じゃないよ、今でも画像は消えてない
いや、俺もあくまで「ページが消されてる」と言ったつもりなんだ…
画像の掲載ページが見られない場合は不規則に生成されてる画像のURLが取れないので
例え画像が残ってても俺には取れない
取る方法があるなら教えてほしい

31:名無しさん@お腹いっぱい。
10/05/05 22:18:00
時代は連番ではなくスクレイプ&mechに……

同人誌サイトを攻略するための専用のスクリプト
URLリンク(ideone.com)
路地裏が使ってる四つのロダに対応
axfcとexploderは未対応


32:名無しさん@お腹いっぱい。
10/05/05 23:09:20
この前2chにe-hentaiの画像を直リンで貼れることを初めて知ったんですが、
画像の固定アドレスを見るとg.e-hentai.orgではなく、鯖が分散してるんですね

試した感じだと、画像の固定アドレスに直にアクセスすると
転送量やダウンローダの監視が走っていないような気がします
一度Firefoxのautopagerizeで全部のページを開いた後、
Generate a static forum image link(※中ボタンクリック)でリンクを一つ一つ取得してから
一括ダウンロードにかけたんですが、怖いくらいすんなり落ちてきてしまいました

もし転送量やダウンローダの判定を
(分散された各鯖ではなく)g.e-hentai側で行っていると仮定すると
画像のURLを動的に生成するスクリプト(g.e-hentai鯖)を自分のIPで踏まなければ
制限を突破できる気がします

こういうアルゴリズムで実装されている方はいますか?

串(公開串、Torなど)を使ってページを踏む
(or串を使って「Generate a static forum image linkを踏む」相当の操作)
→画像の固定URLを生成(画像の読み込みが完了していなくてもそのまま破棄)
→得られたURLを生IPでダウンロード

33:名無しさん@お腹いっぱい。
10/05/06 03:12:37
本当だ。画像のURLの実体だけわかればwgetでも取れるのか
知らなかった

ついでに試してみたが本家にアク禁されても画像のURL直打ちなら取れるわ

34:名無しさん@お腹いっぱい。
10/05/06 08:25:32
HTMLソースコード(PHP)のサーバーと画像のサーバーは別だからな。
でも、あのリンクって時限式じゃないのかな?
2ちゃんに貼る勇者が居るならツール上げてもよくね?

35:名無しさん@お腹いっぱい。
10/05/06 08:44:30
俺のはlofiのみ掲載でも、一応g.e-hentai.orgでアクセスして無ければ(ページ強制転送されたら)
lofi.e-hentai.orgの/3/サイズを見に行くというスタンスだから
俺も最初気づかなかったけど画像までプロキシ介して落としてたら切断の嵐。

36:名無しさん@お腹いっぱい。
10/05/06 16:54:55
手動保存便利すぎワロタwwww
どんなアクシデントにも大抵対応できるwwwwww

37:名無しさん@お腹いっぱい。
10/05/06 17:50:58
>>30
なんていうか探せば見つかる的な事を言いたかったんだ
ぶっちゃけ移転したようなものなんだ
ただ自分はスクリプトとか全然使ってないから既存のサイトと同じスクリプトでいけるかはわからないよ

38:名無しさん@お腹いっぱい。
10/05/06 22:28:51
>>37
すまん、過去ログ掘ってようやくlofi理解した
しばらく離れてたもんでまずそこで躓いてたわ…

39:名無しさん@お腹いっぱい。
10/05/09 11:27:51
>>28
たとえば 'zet*ren -eng -fre -spa' で検索すると 「'zet*ren' を含み 'eng','fre','spa'を含まない」
って条件になるって、意外と皆知らない? *と%は複数文字に、_と?は1文字に、'-'は除外ってやつ。

40:名無しさん@お腹いっぱい。
10/05/09 11:36:08
除外は基本どこでも通じるので自然とここでも使ってた
ワイルドカードは使ったことないな

41:名無しさん@お腹いっぱい。
10/05/09 13:51:51
>>32
htmlを読んで画像のURLがimage.phpを含む場合は画像を読まずに再度htmlを
リロードするっていう動作を試したことがあるよ。
何度かリトライすれば分散しているサーバに変わることもあれば、しつこくhentaiverse
が続くこともある。結局効率が上がらずやめてもた。

42:名無しさん@お腹いっぱい。
10/05/12 09:03:13
e-hentaiのhathdlがときどき違ってんなこのやろう
あれを当てにするのはダメか

43:名無しさん@お腹いっぱい。
10/05/13 05:03:28
携帯版の方の攻略クッソ楽だなこれ
本家鯖だけだから目付けられるかも知れないけど通常のファイルも携帯版にリダイレクトした方が速い

44:名無しさん@お腹いっぱい。
10/05/20 21:30:29
guなる鯖が増えたな

45:名無しさん@お腹いっぱい。
10/05/20 22:52:24
なんか普通にシェルスクリプトで落とせるようになってるんだな
有名串使っても帯域超過全然来ないから無傷だし
ロリ隔離して転送量減ったのか?

46:名無しさん@お腹いっぱい。
10/05/21 00:27:45
>>45
g.e-hentai.orgの画像と
lofi.e-hentai.orgの画像の大(リンクが/3/)の画像を比較すればわかるけど
/3/の画像はピクセルサイズが大きいけど、
そもそもの画像(g.e-hentai.orgの画像)より小さいし画質も粗い。
同じ画像のファイルサイズを比較すればわかるけどlofiの方が小さいよ。

47:名無しさん@お腹いっぱい。
10/05/21 02:31:20
>>46
lofiがザルで/3/にしても画質が悪いのは知ってるんだがなんかg.e-hentai側も規制緩くなってね?
わざわざget.plでやるまでもなくなってて拍子抜けしちゃったよ
和製CG目当てに殺到してた奴が減って運営に余裕が出たのかなぁとか思ったりした

48:名無しさん@お腹いっぱい。
10/05/21 08:43:21
変更きた
lofiもphpにアクセスするようになった
串使ってるから関係ないけど

49:48
10/05/21 08:44:39
htmlソースの方じゃなくて画像へのリンクの方ね

50:名無しさん@お腹いっぱい。
10/05/21 20:44:07
lofiからgの画像のURLわかるけど403返されるよね?
元画質で取る方法は無いんかなぁ

51:50
10/05/21 20:44:54
>画像のURL
Gellery not availableになってる画像ね

52:名無しさん@お腹いっぱい。
10/05/21 22:42:34
元画像に一般ユーザーが簡単にアクセス出来る仕組みを残しておくなんて思えない。
普通、管理者権限でログインしてアレコレする様になってんじゃね。
たとえば、なんらかの抜け穴が残っていたら、すぐに塞ぐだろうし。
画像が見られるだけでもいいじゃないか。

53:名無しさん@お腹いっぱい。
10/05/21 23:13:08
>>50
一旦gの方のソースとれば確実。
強制転送ページが来たらlofiに戻ればおk。

細かく言うと
lofiの方がgより先にアップされるから、基本lofiに対してアクセスする。
①lofiの1ページ目のアドレスを取得して、サーバー名だけgに変更してgのページソースを取る。
②強制転送ページが来たらlofiのソースページを取得して、/1/のサイズを/3/に変更して画像取得。
③lofiは目次ページが無いことがあるから、1ページ目のリンクから入って
次ページのリンクが現在のページのアドレスと同じ物になるまで拾う。
①→②→③ or ①→③を終わるまで続ける。

※gの方のソースページの画像アドレスの抽出方法は>>13の真ん中3行のような感じで取ってる。
※弱点:時々画像のないNotFoundのページ(レスポンスコードが404ではない)が現れる。
目次方式ではないため、これがくると途中で取得をやめてしまう。(親切な人が再うpしてくれるけど)

54:50
10/05/22 02:22:15
>>53
Gellery not availableになってる場合gの方のソースは存在しない
(Gellery not available共通ページのgzipが落ちてくる)
のでlofiから強引に画像のURLを推察する方法を探している

画像のリダイレクト前URLはこんな感じ
lofi: URLリンク(gu.e-hentai.org)ハッシュ1]-[ID1]-[画像の幅]-[高さ]-jpg/[ID2]-[ハッシュ2]/1/[ファイル名]
g: URLリンク(g.e-hentai.org)ハッシュ1]-[ID1]-[画像の幅]-[高さ]-jpg/[ID2]-[ハッシュ2]/[ギャラリーのID]-[何枚目の画像か]/[ファイル名]

ハッシュ2以外は全てどちらも共通しているのでハッシュ2だけわかれば
lofiに残ってる画像からgの画像のリダイレクト前アドレスを生成して直接叩ける

手元に試行した痕跡が残ってないので確証はできないがlofiの画像鯖がguになる前はハッシュ2も共通していたはず
それで403が出たので元画像を取る方法は無いのかなと

55:名無しさん@お腹いっぱい。
10/05/22 14:38:02
どうでもいいから修正版貼りたまえよ

56:名無しさん@お腹いっぱい。
10/05/22 16:47:10
何の修正版だ

57:名無しさん@お腹いっぱい。
10/05/22 16:57:06
>>48からのレスがみえねーのかよ

58:名無しさん@お腹いっぱい。
10/05/22 17:00:48
>>57
正確には>>44だな

59:名無しさん@お腹いっぱい。
10/05/22 17:40:00
本家みたいに解凍してgrepして画像のURL叩くだけでしょ

60:名無しさん@お腹いっぱい。
10/05/22 17:58:49
>>55
おまえみたいのがいるから(ry

61:名無しさん@お腹いっぱい。
10/05/22 22:40:44
lofiになんか仕様変更か規制でもはいったの?
携帯で見ようとしたら画像に繋がらないんだけど

携帯じゃもう閲覧できないのかスペシャリストの方教えて下さい


62:名無しさん@お腹いっぱい。
10/05/23 00:06:04
HTTPリクエストヘッダーのHostフィールドを
Host: lofi.e-hentai.org\r\n
にすればおk。そういうことじゃなくって?

63:名無しさん@お腹いっぱい。
10/05/23 20:05:59
>>61 うむ、報告ご苦労。また監視の作業に戻ってくれたまへ。
次に繋がらない場合はビジネスとして放棄されたと判断して欲しい。

64:名無しさん@お腹いっぱい。
10/05/24 17:00:59
503

65:名無しさん@お腹いっぱい。
10/05/24 17:24:46
>>54
SHA-1のハッシュ値だから、元がわからないと無理。
ハッシュ1は画像ファイルのハッシュ値だけど、ハッシュ2は不明。
多分、ハッシュ2もファイル情報(+α?)を使ってる。

ファイル情報からURLを生成する仕組みなら、
ダウンロードする前にURLを推測するのはほぼ不可能になる。

まあ、自分ならそんな風に作る(作った)と言うだけで本当のところは知らない。

66:名無しさん@お腹いっぱい。
10/06/03 19:21:29
ところで.plはどこをどの様に直せば良いのですか?

67:名無しさん@お腹いっぱい。
10/06/03 21:33:59
怒涛の大量アップが来たからそのことかと思った・・・最大スレッド数設けないと

68:名無しさん@お腹いっぱい。
10/06/03 21:59:46
画像サーバー死んでるだけだった

69:名無しさん@お腹いっぱい。
10/06/06 02:50:08
e-hentai.orgでautopagerが上手く動かないな・・・
kaonもhomerも駄目だ

70:名無しさん@お腹いっぱい。
10/06/06 21:54:18
>>26 guro
も入ってますがね…
そうそうE-Hentai Galleriesについて…
Yahoo!知恵袋にて質問があったから参考になりそうな回答しておきました。
"E-Hentai Galleries"っと調べれば見つかると思います。

71:名無しさん@お腹いっぱい。
10/06/06 22:02:55
秘中の秘とか笑えること書いてんな

72:名無しさん@お腹いっぱい。
10/06/06 23:14:25
秘中の秘(笑)
exの事だったら今更すぎて笑える

73:名無しさん@お腹いっぱい。
10/06/07 05:39:17
まぁ向こうに送られるとVisitsとか途端に伸びなくなるから知らない人というかアカウントすら取ってない人が多いんだろうとは思う

74:名無しさん@お腹いっぱい。
10/06/07 12:40:36
その都度対応版の供給があればおk

75:名無しさん@お腹いっぱい。
10/06/08 01:37:14
アクセス元隠すことしか考えてなくて入会とか一切念頭になかった
メリットあるなら考えるか

76:名無しさん@お腹いっぱい。
10/06/10 17:33:33
loliconタグついてるのlofiでも見られなくなったな

77:名無しさん@お腹いっぱい。
10/06/10 20:11:27
普通に見れるよ

78:名無しさん@お腹いっぱい。
10/06/12 11:06:09
「普通に」ではないけどexのcookie送ったら見れるんだ。知らんかったわ。

79:名無しさん@お腹いっぱい。
10/06/13 03:03:38
exってどこでしょうか
過去ログと検索をしましたが分からなくて…
教えていただけないでしょうか

80:名無しさん@お腹いっぱい。
10/06/13 08:26:55
>>79
嘘付け、前スレにでてるぜ。

81:名無しさん@お腹いっぱい。
10/06/13 08:59:44
俺も分からないなぁ
調べてみてもなんかパンダみたいのがしょぼくれる画像しかでないw
誰か詳しく書いてほしい・・・

82:名無しさん@お腹いっぱい。
10/06/13 09:08:04
世間でいう応用力のないあなたにヒント。
しょぼくれたパンダは中学英語で "sad panda"。
まずエロサイトめぐる以前にgoogle使えるようになろうよ。


83:名無しさん@お腹いっぱい。
10/06/15 09:40:01
>>82
見つかりました
どうもご親切にご教示ありがとうございます

84:名無しさん@お腹いっぱい。
10/06/15 13:54:11
92.61.36.211が落ちてから1日くらい経ってるんだが、
こういうののリトライとかどうしてる?

85:名無しさん@お腹いっぱい。
10/06/15 14:39:07
92.61.32.0/20この範囲で全部逝ってるのか

86:名無しさん@お腹いっぱい。
10/06/17 08:40:00
lofiでもloやショタタグついてるやつファーストページでも見れなくなった…
どうしたらいい?

87:名無しさん@お腹いっぱい。
10/06/17 09:25:12
意地悪しないで教えてください…

88:名無しさん@お腹いっぱい。
10/06/17 09:45:09
わるわるしないで…

89:名無しさん@お腹いっぱい。
10/06/17 23:33:07
>>86
でかい乳に明日への活力を見出せ。乳は素敵だぞぅ

90:名無しさん@お腹いっぱい。
10/06/18 01:37:04
何が原因かは分からないけどLofiから全部閲覧できる
やったことと言えば、本家ログインか、exhentaiにクッキー書き換え?
クッキーの方は適当にやったからできてるのかすら分からん
つか、こんな風に普通に閲覧できない状況だと、あげてくれる人も廃れるんじゃなかろうか

91:名無しさん@お腹いっぱい。
10/06/18 01:41:15
>>89
ロリコンでもショタコンでもないんだ
大きな胸のお姉さんが大好き
ただ、漫画とかで相手の男が子供ってだけでショタタグがついてる…
それで見られないんだ、すごく残念

92:名無しさん@お腹いっぱい。
10/06/19 10:34:59
携帯ユーザーでも余裕で見れると言うのに……。


93:名無しさん@お腹いっぱい。
10/06/19 16:41:45
リクエストヘッダーうpして

94:名無しさん@お腹いっぱい。
10/06/20 10:19:57
>>92
教えてください、お願いします
意地悪しちゃ、嫌…

95:名無しさん@お腹いっぱい。
10/06/20 12:02:26
>>94
まだ見れてないの?ちゃんとレス読んでけよ。

96:名無しさん@お腹いっぱい。
10/06/20 12:13:53
Set-Cookie: exhentai
って追加したけど駄目だった

97:名無しさん@お腹いっぱい。
10/06/20 15:29:25
"Set-Cookie:"はサーバから送られてくるもんだ。こっちから送るのは ""Cookie:"。
なんかスタートラインにも辿りつけとらんぞ。

98:名無しさん@お腹いっぱい。
10/06/20 16:38:55
間違いますた。
でもCookie: exhentaiで送ってるけどやっぱり駄目です。

99:おまえはエパミナンダスか。
10/06/20 17:43:30
そんなこと聞いてるようだからexhentaiにアクセスするとパンダが出てくるんだろうが
そのときどんなcookieが送られてくるか見ること。ブラウザの使い方は...知ってるよな。
そしたら次にその名前でググってみる。

100:名無しさん@お腹いっぱい。
10/06/20 18:34:28
多分これかなっていうのを見つけました!
本当にありがとうございます!
302っぽいんでちょっと書き直して挑戦してみます!

101:名無しさん@お腹いっぱい。
10/06/20 18:40:22
この情報は貴方のお役に立てましたか?
私のヘルプ枠は5回/年です。
しかし今年既に前スレで4回死ねって言われたので減点4が発生しており、
次回の助言は翌1月1日以降となります。
以上宜しくお願い致します。

102:名無しさん@お腹いっぱい。
10/06/20 22:59:49
馬鹿だろお前w

103:名無しさん@お腹いっぱい。
10/06/21 05:32:29
読んだけどわからないな…
手順教えて欲しいのに
みんな意地悪しないで

104:名無しさん@お腹いっぱい。
10/06/21 06:13:26
てかPC持ってない俺でも見れるぞ
てかまだあれをしてないんじゃないか?

105:名無しさん@お腹いっぱい。
10/06/21 21:35:28
えぱみなんだすやえぱみなんだすおまえはほんとにあたまがないねぇ

106:名無しさん@お腹いっぱい。
10/06/21 23:46:26
スレタイが「蓮舫のH画像~」に見えた。

寝るか・・・

107:名無しさん@お腹いっぱい。
10/06/22 09:41:01
わかりません
教えてください、お願い

108:名無しさん@お腹いっぱい。
10/06/22 11:09:28
何がわからないのかもわからない

109:100
10/06/22 13:01:58
>>107
>>99さんのおかげでわかった

例えば
URLリンク(lofi.e-hentai.org)

などで、This gallery is currently unavailable. が現れたら、リンク加工

URLリンク(exhentai.org)

上をGETリクエストするときに以下のフィールドも追加するとページソースが取得できる。

Cookie: ipb_member_id=1; path=/; domain=.exhentai.org
Cookie: ipb_member_id=1 これだけでもいいかも

ソース内の画像のリンクにそのままアクセスすればおk

110:100
10/06/22 13:06:38
exhentai.orgにクッキー指定無しでアクセスするとipb_member_id=0になって
sadpanda.jpgが落ちてくる。

111:100
10/06/22 13:37:02
あ、302で正しいアドレスに飛ばされるので、自作ブラウザの人は対応してください。

112:名無しさん@お腹いっぱい。
10/06/22 21:38:01
言ってしまえば>>82を見て exhentai "sad panda" でググればもうそこに答えが
あったんだがここまで具体的に言われるまでピンとこないのは例の教育方針のせいなのか。

113:名無しさん@お腹いっぱい。
10/06/22 22:49:28
つーかもしかして100は普通にブラウザで見ることもできてないのか?

114:名無しさん@お腹いっぱい。
10/06/23 11:35:19
FxだとWeb Developerで簡単に見られるな。
>>100は、自作ダウンローダーでも作ってんじゃね?

115:名無しさん@お腹いっぱい。
10/06/24 21:06:09
URLリンク(sinkai.s13.dxbeat.com)
こんな感じの
ページ‐画像一覧‐画像(html表示)
みたいなページで楽にダウンロードできるツール無いですか?
お願いします

116:名無しさん@お腹いっぱい。
10/06/24 22:29:17
>>115
そこは、オンラインショッピングサイトなので、ダウンロードツールじゃ
ありません。
どのサイトでも1クリックするだけでダウン出来るツールは、残念なが
ら今のところありません。

有名なサイト以外は、wget,curlなどの汎用ツールやスクリプトなどを使って
個々に対応するしか方法がありません。

117:名無しさん@お腹いっぱい。
10/06/24 22:59:19
苦労することに悦楽を感じながら他人には涼しい顔で簡単さと言いたがる漢が集まるところで聞いてもだめだよ。

118:名無しさん@お腹いっぱい。
10/06/24 23:25:02
ツール厨が現れるのは、いつものことじゃないか。気にスンナ

119:名無しさん@お腹いっぱい。
10/06/27 19:31:33
e-hentaiってどうやってかせいでんの?
閲覧投稿無料で広告もないし

120:名無しさん@お腹いっぱい。
10/06/28 10:09:44
gは広告出てる

121:名無しさん@お腹いっぱい。
10/06/28 22:29:01
どこをどうアクセスすれば広告が無いように見えるのか甚だ疑問である。

122:名無しさん@お腹いっぱい。
10/06/28 22:47:45
広告フレーム除去してた

123:名無しさん@お腹いっぱい。
10/06/30 11:59:33
E-HENつながらない

124:名無しさん@お腹いっぱい。
10/06/30 12:27:20
E-HENは閉鎖だな

125:名無しさん@お腹いっぱい。
10/06/30 12:28:44
exも見れなくなるって

126:名無しさん@お腹いっぱい。
10/06/30 12:31:27
トップやログイン画面は見れるからメンテナンスしてるだけじゃね
7 hours ago: Put up another small patch forGalleries to enable some future functionalityelsewhere.
21 hours ago: Updating some stuff on a fewservers. Could make things a bit slower than usualuntil it finishes.

翻訳サイトで翻訳したけどワケワカメだった
アップデートとか書いてあるから大丈夫だろ

127:名無しさん@お腹いっぱい。
10/06/30 13:22:38
エキサイト翻訳によると
CreditCardのPayがどうのこうの

と一般ユーザーは制限がどうのこうの書いてあった

128:名無しさん@お腹いっぱい。
10/06/30 14:47:15
とりあえず続けて欲しいわ
まあ漫画は消されそうだけどね

129:名無しさん@お腹いっぱい。
10/06/30 14:49:18
ソースの変更無さそうです

130:名無しさん@お腹いっぱい。
10/06/30 14:54:21
E-HENはたまにこういう変な事するからなぁ
まあ一週間も経てば元に戻るのでは


131:名無しさん@お腹いっぱい。
10/06/30 14:55:31
しばらく様子見

132:名無しさん@お腹いっぱい。
10/06/30 14:55:42
URLリンク(e-hentai.org)に、Everything is back up and running.って書いてた。


133:名無しさん@お腹いっぱい。
10/06/30 14:57:58
メンテ後の新たなデータ上がってきたようだけど、やっぱり規則変わってない
バックアップとサーバー移転・高速化が目的だったのかと

134:名無しさん@お腹いっぱい。
10/06/30 15:00:33
すべては、バックアップとランニングです。
↑つまりどういうことだ

135:名無しさん@お腹いっぱい。
10/06/30 15:15:20
大事なことはデータのバックアップを取ること、それと適度な運動
ってことだ。

136:名無しさん@お腹いっぱい。
10/06/30 15:17:10
E-HEN元に戻ったな

137:名無しさん@お腹いっぱい。
10/06/30 20:14:40
すべて戻ったよ、起動して走ってるよ、だろ

138:名無しさん@お腹いっぱい。
10/06/30 21:00:57
パンダのページ落ちてる?
EXはもちろんパンダさえ出ないんだが

139:名無しさん@お腹いっぱい。
10/06/30 22:04:34
たしかに繋がらない。pingは通る。それになんかloli系のアップが無くなった気がする。
一時的なものかな?それともルール変更?

140:名無しさん@お腹いっぱい。
10/06/30 22:16:21
exは死んだか…

141:名無しさん@お腹いっぱい。
10/06/30 22:26:27
ってかE-Hentai GalleriesとExHentai.orgの違いとかあるの??

142:名無しさん@お腹いっぱい。
10/06/30 23:15:01
震度2程度で毎度毎度うれしそうに報告すんなよ。

143:名無しさん@お腹いっぱい。
10/06/30 23:39:31
EX元に戻った

144:名無しさん@お腹いっぱい。
10/07/04 17:45:48
今はどんな方法で落とせばいいの?
まずg.e-hentaiを見て509の画像が出たらlofi.e-hentaiから/3/で取ってるんだけどもっと良い方法があったら教えてください

145:名無しさん@お腹いっぱい。
10/07/04 17:53:09
509がでても対処できるだろ

146:名無しさん@お腹いっぱい。
10/07/04 18:25:15
>>144
509は、そのIPでのアクセスをちょい休んでくださいってことだから。
串変えればいいだけ。

147:名無しさん@お腹いっぱい。
10/07/04 20:07:12
>>144
基本待てばいいんだよ。ちょっと間を置けばまた取れるようになるさ。
自動化しておきながら張り付いてる訳じゃないだろう。時間はたっぷりあるさ。
待ちのアルゴリズムを追求すんのも夏の暇つぶしにはもってこいだよ。

148:名無しさん@お腹いっぱい。
10/07/04 20:50:36
e-henて昔ダウンローダーあったんだよな。
一度作って配布するところまで考えがいったのに何でやめたんだ?

予想以上に負荷が凄かったから?

149:名無しさん@お腹いっぱい。
10/07/04 20:55:32
>>119が続けて釣ってるつもりか?今でもあるのにスレ汚しめ。

150:名無しさん@お腹いっぱい。
10/07/05 00:52:25
>>145-147
プロキシ介したら落とせましたありがとうございます

151:名無しさん@お腹いっぱい。
10/07/05 18:23:33
509でもHTTPステータスが200のときと404のときがあると思うのですが何故でしょう?

152:名無しさん@お腹いっぱい。
10/07/05 20:42:47
>>115
artemisからのダウン?
mech使えば簡単だよw
今も自作のスクリプトがバックグラウンドでブイブイ動いてるww


153:名無しさん@お腹いっぱい。
10/07/09 16:10:11
altが無くなったから、ファイル名で保存すると泣けることに

154:名無しさん@お腹いっぱい。
10/07/09 20:14:08
変更の意図は汲みかねるが小変更で済む範囲だったね。これを始めに週単位で来るのかな?
そういえば前の変更ラッシュも日本時間の金曜だったし。

155:名無しさん@お腹いっぱい。
10/07/09 22:05:15
取れねーと思ったらちょっと変更来てた
相変わらずcurlで行けるんだな

156:名無しさん@そうだ選挙に行こう
10/07/10 21:46:53
509になったらどのくらい待てばいいのかしら
1日くらい?

157:名無しさん@そうだ選挙に行こう
10/07/10 22:46:26
何で自分で試してみない?それともよっぽどの

158:名無しさん@そうだ選挙に行こう
10/07/11 05:26:57
>>156
集合住宅で同一回線とか(一IPを複数人で共有してたり)、
プロバイダーと動的IP契約を結んでいたら(個人で固定IPはほとんど無いと思うが)
アドレスプール(IP束)を複数人で共有するため、時間でどうこうなるものでもない。
接続IP帯域にE-henユーザーが居ればの話だけど。

159:名無しさん@お腹いっぱい。
10/07/14 04:46:02
まーたソース変更しやがった

160:名無しさん@お腹いっぱい。
10/07/14 09:13:45
そーっすか

161:名無しさん@お腹いっぱい。
10/07/16 07:30:33
総帥か

162:名無しさん@お腹いっぱい。
10/07/17 16:15:44
ソーナンス

163:名無しさん@お腹いっぱい。
10/07/17 16:46:37
そーすっと
どうすればいいの?

164:名無しさん@お腹いっぱい。
10/07/23 01:00:46
403が出る条件ってなんですか?
ほとんど落ちるのですがたまに403が混ざってしまいます

165:名無しさん@お腹いっぱい。
10/07/24 00:40:51
URLにexhentai.orgとうってもパンダの画像しかでないのですが・・・。

166:名無しさん@お腹いっぱい。
10/07/24 07:16:30
exhentai.orgから受け取ったcookieのipb_member_idの値を1にしたら入れたよ

167:名無しさん@お腹いっぱい。
10/07/25 04:57:19
アカウント取らなくていいんだもんな
やたらと対策凝ってる割に肝心なところで抜けてんな…

168:名無しさん@お腹いっぱい。
10/07/26 13:37:14
privoxyでヘッダ改ざんすればブラウザで普通にex見れそうなんだがなんか上手くいかない
誰か同じ事やってる人いない?

今のところ外部アクセスでしかやってないからわからんけどexの検索って本家で除外されてるのも出てくるの?

169:名無しさん@お腹いっぱい。
10/07/26 14:22:01
URLリンク(g.e-hentai.org)でloliconで検索したら0件だったけど
URLリンク(exhentai.org)でloliconで検索したら22,355件でるな

普通のブラウザならFirefoxならCS Liteとかで>>109のクッキー作成でいけるけど。
連続して落とすことが目的だから普通のブラウザなんて使ってられないわな。

170:名無しさん@お腹いっぱい。
10/07/27 15:09:48
久しぶりにきてみたけどget.plの時代は終わった感じかな?

171:名無しさん@お腹いっぱい。
10/07/27 23:53:17
改竄とか偽装って書くと「俺ってハッカー」みたいな気分になれるな。
中学生の頃を思い出すぜ。

172:名無しさん@お腹いっぱい。
10/07/28 12:06:38
>>170
1年もたてば時代は終わる罠。
新しいの作るよ 夏厨のために7月中に


173:名無しさん@お腹いっぱい。
10/07/28 16:16:29
オマエらの能力があればダウンロードスクリプトじゃなく
画像ファイルの自動生成できるんじゃないか?
もう21性器だぜ
肉色と肌色を巧みに児童合成してエロ画像ぐらい作れるだろ

174:名無しさん@お腹いっぱい。
10/07/29 16:03:18
改良した
g.e-hentai.org 用スクリプト、ehg.pl version 2.0
URLリンク(www1.axfc.net)


175:名無しさん@お腹いっぱい。
10/07/29 17:56:23
>>174
GJ!

176:名無しさん@お腹いっぱい。
10/07/29 23:02:40
ありがとう。ソースを参考にしてget.plに適用させてもらった

177:名無しさん@お腹いっぱい。
10/07/29 23:35:01
と思ったら早速対策?されたっぽくてワロタ
矢印の画像しかとれねえ・・・また修正するのめんどくせええええ

178:名無しさん@お腹いっぱい。
10/07/30 01:32:03
お前らなんでわざわざ画像1個ずつシコシコ保存してんの?
クレジット使ってダウンしろよw

179:名無しさん@お腹いっぱい。
10/07/30 01:32:52
過ぎた要望とはわかってるんだがcybersyndromeの公開串一覧を読み込んで
・反応がある→使う
・反応がない/503が出る→串を変える(ランダムに)
ってな機能を追加してくれないだろうか

善意でやってるのはわかるんだが
夏厨一斉に生IPで高速ダウンロードとかすると今までざるだった部分まで抜本的な対策に持ってかれない

180:名無しさん@お腹いっぱい。
10/07/30 01:36:15
むしろ串無しで使った猿が全員アク禁に入れられて終了コースだから現仕様の方が望ましい

181:名無しさん@お腹いっぱい。
10/07/30 01:44:39
お前らなんでe-henみたいな糞サイトでわざわざ画像1個ずつシコシコ保存してんの?
クレジット使ってダウンしろよw

182:名無しさん@お腹いっぱい。
10/07/30 01:45:37
>>180
なげーんだよなここのアク禁

183:名無しさん@お腹いっぱい。
10/07/30 22:58:51
>>181
ダウンローダつかってるよ

184:名無しさん@お腹いっぱい。
10/07/30 23:48:58
ドロシー導入したけど使えなくてワロタ

185:名無しさん@お腹いっぱい。
10/07/31 16:55:05
僕たち人種は違っても結局は同じなんだね

186:名無しさん@お腹いっぱい。
10/07/31 20:07:34
しっかし最近午後8時(JST)過ぎたとたんに509で引っかかり易くなるぜ。

187:名無しさん@お腹いっぱい。
10/08/01 14:05:42
hentaiverseがクールダウンする昼過ぎからが良かろうて。

188:名無しさん@お腹いっぱい。
10/08/03 20:23:42
つい最近まで使えたダウンローダーあったらしいな。

早く誰か作ってくれないかな。

189:名無しさん@お腹いっぱい。
10/08/13 13:18:18
嫌です

190:名無しさん@お腹いっぱい。
10/08/14 00:06:37
e-hentai 実写系の画像が丸ごと削除されちゃってるな。
アイドルや白人美女画像もけっこう置いてあったから重宝してたのに。

191:名無しさん@お腹いっぱい。
10/08/14 00:23:51
どうりで糞みたいな外人3Dばっかだと

192:名無しさん@お腹いっぱい。
10/08/14 15:06:40
g.e-hentai.org 用スクリプト、ehg.pl version 2.0
これってもう対策されてるの?
自分でエラー治してみたけど
なんかダメっぽい

193:名無しさん@お腹いっぱい。
10/08/15 00:30:37
>ehg.pl version 2.0
150ファイル(23Mぐらい)ぐらいDLするとIP弾かれた。

何十個かDLしたら数分スリープさせたり
途中ページからDLさせられるよう改造中。


194:名無しさん@お腹いっぱい。
10/08/16 04:19:21
Can't call method "url_abs" on an undefined value at C:\aa\ehg.pl line 84.

このエラーが出るのは俺だけか・・・?
環境に問題があるのか
それとも、元々84行目を修正する必要があるの?


195:名無しさん@お腹いっぱい。
10/08/16 06:46:58
WWW::Mechanize
が入ってないとか


196:193
10/08/16 13:22:44
sleep 3から9へ書き換え、
50個落としたら5分休憩、
DL済みファイルはスキップ。

こう改造して、294個落としたURLで再度挑戦。
12個さらに落としたところで蹴られた。

URLリストを作成させて、irvineとかで落としたほうがいいのかな。

197:名無しさん@お腹いっぱい。
10/08/16 22:04:47
一個一個シコシコと落とさないの馬鹿なの?

198:名無しさん@お腹いっぱい。
10/08/16 22:22:38
ワンクリックで画像保存できるツールあるよ
マウスの親指サイドボタンをそれに割り当てた
かなり捗るぞ

199:名無しさん@お腹いっぱい。
10/08/17 06:52:25
>>197,198
自宅警備の人かよ

200:名無しさん@お腹いっぱい。
10/08/17 07:45:55
>>196
画像で気にするのはURLがhentaiverse.netのimage.phpの場合だけで良い。
他は帯域制限の集計に入ってないので長く待つ必要はない。一度画像の
URLを記録しながらトライしてみれ。

201:名無しさん@お腹いっぱい。
10/08/17 14:34:06
もうプログラムで落とすのが目的だからねえ。
画像なんて見ないよ。


202:名無しさん@お腹いっぱい。
10/08/17 21:30:06
とりあえずthat is itを何十冊上げれば気がすむのかと

203:名無しさん@お腹いっぱい。
10/08/19 06:19:22
一定時間毎に串を切り替えるよう組んでるせいか帯域制限は来ない
その代わり低確率で取得失敗するからチェックしないといけないけど

それより元ファイル名で保存しようとするとたまにかぶってるのがうざい…
同人CG集とかでディレクトリごとに分かれてるはずのファイルが全部トップディレクトリにぶちまけられてる状態でうpられてる

204:名無しさん@お腹いっぱい。
10/08/19 09:20:55
串ができるならリネームも15分くらいでできんじゃね?

205:名無しさん@お腹いっぱい。
10/08/19 09:34:55
>>204
とりあえずリネームはしてるんだけど元ファイル名いじると何か釈然としなくてな…
今はページ番号をファイル名の前に付けてる(1-○○とか01-○○とか)

206:名無しさん@お腹いっぱい。
10/08/19 16:57:18
しかしe-hentai(exhentai)はどんどん攻略が楽になってくな
wgetでアクセスしたら変な落書きが落ちてきて頭抱えた時代が懐かしい

207:名無しさん@お腹いっぱい。
10/08/19 18:14:49
裏e-hentaiってロリとかショタが見られるようになるだけで
それ以外は全て同じなの?
最近グラドル系の画像がほとんど消えてしまったので
もしかして裏に回ったのかなと思ってるのだが。。

208:名無しさん@お腹いっぱい。
10/08/19 19:10:43
詳しくは分からんけど運営費用がかさんで
サーバーを縮小したかららしいよ
いくつかサーバがなくなってる
和訳してググレ



209:名無しさん@お腹いっぱい。
10/08/19 20:53:33
exがいつまでザル仕様かもわからんしまた新たな規制が入るかも知れないし急ぐべきかもしれんな

210:名無しさん@お腹いっぱい。
10/08/19 20:58:53
ver.2.1にアップしないの?



211:名無しさん@お腹いっぱい。
10/08/20 15:59:03
連番でH画像をダウンロード出来るサイトを紹介するスレじゃないのかよ

212:名無しさん@お腹いっぱい。
10/08/20 17:55:29
違います

213:名無しさん@お腹いっぱい。
10/08/20 18:13:22
目的も設定せずに手段にだけ傾倒するなんて
実にオタクらしいやり方だ

214:名無しさん@お腹いっぱい。
10/08/20 18:19:08
一日でどれだけDLできるかなーと1GB以上ダウンロードした後700MB分くらいはzipで見つかるんじゃないかと気付いた

215:名無しさん@お腹いっぱい。
10/08/20 18:26:04
目的は個々人の中にあるんだよ。

216:名無しさん@お腹いっぱい。
10/08/20 18:38:11
攻略するのが目的であって、画像DLは二の次だ。


217:名無しさん@お腹いっぱい。
10/08/20 18:41:08
>>211
半角へどうぞ

218:名無しさん@お腹いっぱい。
10/08/20 20:20:44
あたらしいな

219:名無しさん@お腹いっぱい。
10/08/20 20:56:41
Perlの勉強の為に。
ファイル名を”連番.オリジナルファイル名"で保存、同名ファイルスキップ。

sub getImage
{
my $imageURL = shift or die $! ;
my $pageNow = shift or die $! ;
my $saveDir = shift or die $! ;
my $na = getImageName($imageURL);
my $name = sprintf ( "%03d.$na" , $pageNow ) ; # note: extension
print "OutPut FileName : $name \n";
chdir ("./$saveDir") ;
if( -f $name) {
print "exist $name \n";
} else {
my $mech = WWW::Mechanize->new() ;
$mech->get( $imageURL ) ;
open ( my $out , "> $name" ) or die $! ;
binmode $out ;
print $out $mech->content() ;
close ( $out ) ;
}
chdir ("..") ;
return 1 ;
}


220:219
10/08/20 20:57:33
sub getImageName
{
my $ImageUrl = shift or die $! ;
my $num = rindex($ImageUrl, '=');
my $ImageTemp = substr($ImageUrl,$num+1);
$num = rindex($ImageTemp, '/');
my $ImageName = substr($ImageTemp,$num+1);
return ($ImageName);
}
これ導入後、エラーが増えた気も…orz

221:名無しさん@お腹いっぱい。
10/08/20 21:03:49
Perlのファイルあるのは嬉しいけど、具体的な使い方の解説を頼む

222:名無しさん@お腹いっぱい。
10/08/20 21:08:55
>>221
関数を差し替えるだけ
具体的には、その部分に上書きするようにコピペ


223:219
10/08/20 21:17:07
>219 のソースは上書き。
>220 のソースは219の下に挿入か、ソース末尾に追加。

オリジナルファイル名が時々ランダムファイル名になるのは何でかね。

224:名無しさん@お腹いっぱい。
10/08/20 21:26:41
色々いじったら一つ飛ばしになった

225:名無しさん@お腹いっぱい。
10/08/21 01:27:40
シェルスクリプトでよければクッソ汚い自作コード公開するけど需要ある?

226:名無しさん@お腹いっぱい。
10/08/21 01:57:11
>>214
画像の方は、大体5~9GBくらいのデータが1日で上がるぞ。

227:名無しさん@お腹いっぱい。
10/08/21 19:47:32
一部リンクがおかしいのか画像表示されないのがあるな。
ehg.plだとエラー出て終了しちゃう。
なんとかエラーでもスキップさせて継続できないかな。

228:名無しさん@お腹いっぱい。
10/08/21 20:29:40
>>227
ページソース取り直してるとそのうち正しい画像リンク取れるよ。
一括でリンク集めるより、正しい画像を取得できてから次のページってした方がいいと思う。
なるべく人がデータを拾うようなフローにした方がいい。

フォーマット判定とか適当だけど、下で今のとこ平気だった(Windows cですんません)

unsigned char szFormatCheck[16];
unsigned char jpegID[2] = { 0xFF, 0xD8 };
unsigned char pngID[8] = { 0x89, 0x50, 0x4E, 0x47, 0x0D, 0x0A, 0x1A, 0x0A };// { '\211', 'P', 'N', 'G', '\r', '\n', '\032', '\n' };
unsigned char gifID[3] = { 0x47, 0x49, 0x46 };// { 'G', 'I', 'F' };

::ZeroMemory( szFormatCheck, 16 );

fpDownloadFile = _wfopen( szImageFilePath, L"rb" );
fread( szFormatCheck, 1, 8, fpDownloadFile );
fclose( fpDownloadFile );

if ( memcmp( szFormatCheck, jpegID, 2 ) != 0 )
{
  if ( memcmp( szFormatCheck, pngID, 8 ) != 0 )
  {
    if ( memcmp( szFormatCheck, gifID, 3 ) != 0 )
    {
      result = enum_RECV_IMG_FILEFORMAT_ERROR; // Jpegでもpngでもgifでも無かった
    }
  }
}

229:228
10/08/21 20:36:36
>>227
ごめんなさい。ホントに画像リンクが消えてる場合あるね。
その時は、1枚の取得に1時間以上トライしてたら次ページ行くようにしてます。

230:名無しさん@お腹いっぱい。
10/08/21 23:41:37
ルーターの再接続をDOSコマンドで実行できたら楽なのに。

231:名無しさん@お腹いっぱい。
10/08/22 01:27:50
"C78"の検索結果がいい感じに増えてきたなぁ

232:名無しさん@お腹いっぱい。
10/08/22 04:03:22
gで無い時は、lofiの/3/いけば意外とあるけど、exで画像リンク切れしてたら諦めてスキップしてます。

233:名無しさん@お腹いっぱい。
10/08/22 08:13:44
ないというか、おそろしく反応がにぶい鯖があるよね。
そういうときはタイムアウトさせてlofiからとってるわ

234:名無しさん@お腹いっぱい。
10/08/22 08:25:07
>>233
基本php規制が来るのは、ソースページの時だけだからプロキシはソースページ取得時だけで
画像取得は自分のIPでいいんだけど。
その状態の画像サーバーが現れる場合は、画像取得も海外の串経由で落とした方が早く落とせるよ。
重い画像サーバーのIPポートを記憶して(定期的に変わるので)、そのIPの時は串経由で落とすように実装した方がいい。

235:名無しさん@お腹いっぱい。
10/08/22 11:32:50
>>230
だいたいブラウザから操作できるようになってんだろ。
hentaiにスクリプトでアクセスするのと変わらんと思うが?

236:名無しさん@お腹いっぱい。
10/08/22 13:40:30
Perlの知識とかが無い俺には使い方が全く分からないです。
誰か解説を・・・(;´∀`)

237:名無しさん@お腹いっぱい。
10/08/22 13:46:43
>>236
ここUNIX板なんだけど、UNIX使ってるのにperl全く使ったことないの?

238:名無しさん@お腹いっぱい。
10/08/22 13:48:10
よし、ポートを開いてIPアドレスと共にログイン名とパスワードを書いてくれたまえ。

239:名無しさん@お腹いっぱい。
10/08/22 14:07:07
>>232
俺は通信がらみのエラーは2分置きに3回リトライし、それでだめなら &nl=1 で取る。

240:名無しさん@お腹いっぱい。
10/08/22 14:11:17
?nl=1とかいつの間にできたんだろうな
これに気付いてから取得成功率100%になった

241:名無しさん@お腹いっぱい。
10/08/22 14:23:41
>>240
ずいぶん過去。過去過ぎて過去ログ。

242:名無しさん@お腹いっぱい。
10/08/22 14:35:39
>>241
俺が気づかなかっただけか…

>547 名前:名無しさん@お腹いっぱい。 [sage]: 2010/03/22(月) 00:16:01
>?nl=1
>
>704 名前:名無しさん@お腹いっぱい。 [sage]: 2010/03/28(日) 23:46:49
>?nl=1 は10枚程度で速攻規制かかるよね

画像URLを引き直すって言うよりはメイン鯖(gu.e-hentai.orgなど)の画像に明示的に繋げるURLだよね
串なら気にせず踏んでいいけど生IP派はできるだけ避けたほうがいい

243:名無しさん@お腹いっぱい。
10/08/22 14:56:53
>235
ある程度落としたところで自動的にIP変更して規制回避出来るやん自宅警備員。

244:名無しさん@お腹いっぱい。
10/08/22 15:29:52
週末パートの自宅近衛兵だがIP変更した位で規制回避できるならこんな板立たないだろ。

245:名無しさん@お腹いっぱい。
10/08/22 17:21:16
>IP変更した位で規制回避できるならこんな板立たないだろ。
BATファイル+ehg.plでDL
509エラーでmenu_right.gifを落とし始める。
ルーター再接続でIP変更
DL続行

こんな感じで作業してるけど。
ページ途中からDLできるように改造中。

246:名無しさん@お腹いっぱい。
10/08/22 19:17:23
>509エラーでmenu_right.gifを落とし始める。
これって画像URL取り出しの段階で防げないっけ

247:名無しさん@お腹いっぱい。
10/08/22 20:06:53
ehg.plのgetImageURLで$imageURL調べて"menu_right.gif"だったら
IP変更促してpause&再取得させれば楽になるかな?

248:名無しさん@お腹いっぱい。
10/08/22 20:27:40
改善は根本的なところから始めるべき。庇の上に建て増しても良い事無いよ。

249:名無しさん@お腹いっぱい。
10/08/22 20:41:33
>>248
根本的なところって例えばどういうの?

250:名無しさん@お腹いっぱい。
10/08/22 20:41:54
ehg.pl使ってないから改善のアドバイス出来ないけど
そもそも画像のファイル名かjpg.jpgとかで抽出すればmenu_right.gifは絶対出てこないはず
あと確かにIP変更すれば一応その場は再DLできるけど何回もやってるとISPごと焼かれる

251:名無しさん@お腹いっぱい。
10/08/22 20:47:57
>そもそも画像のファイル名かjpg.jpgとかで抽出すればmenu_right.gifは絶対出てこないはず
        ∧∧
       ヽ(・ω・)/   ズコー
      \(.\ ノ
    、ハ,,、 

252:名無しさん@お腹いっぱい。
10/08/22 20:58:10
>>251
>>13

253:名無しさん@お腹いっぱい。
10/08/22 21:00:18
"menu_right.gif" などで比較しても向こうの胸先三寸でころころ変えられちゃったら面倒でしょ?
そもそも何で "menu_right.gif" を拾っちゃうのか、拾わねばならんのかその原因を突き止めて
その上で全体の問題点に気づかないと手に負えなくなっちゃうよって意味で根本的と言ったのよ。

はっきり言うが自分で設計して作らんとそこから先には進めん。

254:名無しさん@お腹いっぱい。
10/08/22 21:25:45
*.gifでうpしてる人もいるけどな。

255:名無しさん@お腹いっぱい。
10/08/22 21:37:30
>>254
古いエロゲーのimage setで試してみたけど>>13の処理で普通に取れるけど

256:名無しさん@お腹いっぱい。
10/08/22 21:51:09
>>248,253だが、DBの根幹部だろうからそうそう弄れまいと思って前スレで "[0-9a-f]{40}-" で見るべきと書いたのが私。
ちなみに"最上位のdivセクション"も私。あの後この組み合わせで引っかかってしまったのは"&"の時だけ。
固定の文字列比較は愚の骨頂だし"例外"を用意するのは美しくないと思う。

257:名無しさん@お腹いっぱい。
10/08/22 22:00:52
509はどうしたら回避できるの?


258:名無しさん@お腹いっぱい。
10/08/22 22:11:11
うん、根本的かつ哲学的な質問だね。
それに対する答えは現代医学ではまだ判らないんだ。

259:名無しさん@お腹いっぱい。
10/08/22 22:17:37
プログラム講座はもういいからツールくれ。

260:名無しさん@お腹いっぱい。
10/08/22 22:17:51
>>256
最上位のdivセクションにこだわる理由はよくわからんが抽出方法は参考にさせてもらうわ
ありがとう

261:名無しさん@お腹いっぱい。
10/08/22 22:24:08
評価するのが高々1個の<a-/a>で済むのだ。

262:13,153
10/08/23 04:39:53
>>255
あれ?
lofiの仕様は変わらないけど・・・exとgは変わったよね?
今ソース見たらstyle属性見てjpg,jpeg,png,gifの拡張子チェックしてるだけな感じなんだけど。
jpg.jpgとか書いてない。
各自適当だろうから取れてるならいいけど。

263:255
10/08/23 05:11:12
>>262
今のgは"return sl("以降を見ればすぐ取れるから画像のURLを見る必要はないね

exの方はそれが用意されてないので文字列のマッチで画像のURLを適当に抽出してる
このやり方だとファイル名+(jpe*g.jpe*g|png.png|gif.gif)を使ったほうが楽
(大文字表記の拡張子や".jpeg"は一件も遭遇していないが念のため入れてる)
ちなみにもうexしか使ってない

264:255
10/08/23 05:19:35
書き込んでから間違いまくってることに気付いたので訂正

gの方のファイルはろくにメンテしてないので今更気付いたが"return sl("以降の画像URLだとメイン鯖叩くことになるからだめだ
画像URLの抽出もstyle="が含まれるタグ内で抽出かけた方が早いから確かに>>13の処理はもう必要ないわ…

265:名無しさん@お腹いっぱい。
10/08/23 16:44:38
my $mech = WWW::Mechanize->new() ;
$mech->agent_alias( 'Windows Mozilla' ); #added

こうすると幸せになれるかも(´・ω・`)

266:名無しさん@お腹いっぱい。
10/08/23 18:13:27
eh鯖落ち>94.23.191.10

267:名無しさん@お腹いっぱい。
10/08/24 19:41:32
俺ここ半年以上User-Agentには
Mozilla/5.0 (PET 2001; Commodore; U; en-US)
を送ってるな。

268:名無しさん@お腹いっぱい。
10/08/25 01:29:06
再現性がわからないんだがあるページで4x4で102バイトのpngが落ちてくる状況が頻発したから再取得の条件に入れといた

269:名無しさん@お腹いっぱい。
10/08/25 21:54:35
509エラー出たら15分休憩、それでも出たらさらに15分って処理いれて(2回程度で解除された)
DL止まらないようにしたけど、24時間かかって300Mぐらい。

やっぱIP更新させんとキツイか。


270:名無しさん@お腹いっぱい。
10/08/26 00:07:46
ルータをネット経由で操作云々寄りは串でやった方が楽だと思うよ…

271:名無しさん@お腹いっぱい。
10/08/26 01:03:59
ehg.plで串の刺し方教えてくださいませ

272:名無しさん@お腹いっぱい。
10/08/26 01:38:55
>>271
>WWW::Mechanizeでプロキシは使えますか?

>使えます。
>あらかじめ環境変数「HTTP_PROXY」、「HTTPS_PROXY」などにプロキシを設定しておくと、これが利用されます。
>内部ではコンストラクタ(newメソッド)内で、$self->env_proxyが呼び出されています
>(これの働きはもちろん、親クラスであるLWP::UserAgentのenv_proxyメソッドと同じです)。
>最初にこれが確認されるだけで、リアルタイムで現在の環境変数を見ているわけではないことには注意してください。

273:名無しさん@お腹いっぱい。
10/08/26 02:33:30
ありがとう
調べてみたけど、さっぱりわからない;
自分にはまだ早かったようです。。。

274:名無しさん@お腹いっぱい。
10/08/26 10:35:36
バッチファイルに

set HTTP_PROXY=串1
ehg.pl URL1 Dir1

set HTTP_PROXY=串2
ehg.pl URL2 Dir2

って書いとけばいいんじゃないの?

1URLに100ファイル以上あると効果薄いだろうけど。


275:名無しさん@お腹いっぱい。
10/08/26 14:27:29
ehg.plって初めて中身見たけど初代get.plと比べるとずいぶんコンパクトになったな

276:名無しさん@お腹いっぱい。
10/08/26 14:43:08
正に裏ってカンジね

277:名無しさん@お腹いっぱい。
10/08/26 23:47:59
バッチて...TOSBAC,HITAC,AOCS...懐かしい...

278:名無しさん@お腹いっぱい。
10/08/27 17:54:50
なんかしらんが今日は落ちまくってるな

279:名無しさん@お腹いっぱい。
10/08/28 00:19:29
マイナーチェンジきたっぽい
うざいなぁ

280:名無しさん@お腹いっぱい。
10/08/28 07:58:57
SayMove!も自動で落とせそうだけど、ネタ動画の判定無理っぽいから
メールとかで必要なインデックスだけ投げて目視で判定するしかないのか

281:名無しさん@お腹いっぱい。
10/08/28 12:20:18
難儀なことせんでも直接プロキシに接続して "GET URLリンク(exhentai.org) HTTP/1.1" すりゃ良いじゃん
と首をかしげるのは俺がphpだから?


282:名無しさん@お腹いっぱい。
10/08/29 00:50:04
生でやってたらどれくらいでアク禁になるの?

283:名無しさん@お腹いっぱい。
10/08/30 19:00:40
NEWの位置が変わったな

284:名無しさん@お腹いっぱい。
10/09/01 21:12:18
ehg.plかってに改造

1.>219 >220 適応
2.URLを "URLリンク(g.e-hentai.org)"のタイプにも適応
3.hentaiverse.netと他のサーバーでスリープ時間変更
4.509エラー時に長期スリープ
5.DLエラー時にログファイルに記録し、次のページから続行

こんだけ改造したらソースがスパゲティーにorz
誰か要る?

285:名無しさん@お腹いっぱい。
10/09/01 21:25:09
一日かけてどれくらい取れるの?
生だとスリープ変えても帯域制限に引っかかるから結局遅くなると思うんだけど

286:名無しさん@お腹いっぱい。
10/09/01 21:27:55
>>284
欲しいです!


287:284
10/09/01 22:00:17
ehg.pl改造版
URLリンク(www1.axfc.net)
バグや改善点見つけたら報告お願いします。


>一日かけてどれくらい取れるの?
IP更新してスグで百数十ファイル落とすと509エラーになった。
その後は1時間に40~80ファイルとバラバラ。
画面見て509エラーになってたらIP変更やって(日中は仕事)1000ファイルで19時間かかってた。


288:284
10/09/01 22:19:21
追伸.
perl弄り始めて数週間なので改造部分のソースは汚いです。すいません。
スリープ時間やログファイル名等はソースのコメントを見ながら各自でいじって調整してください。


289:名無しさん@お腹いっぱい。
10/09/01 23:32:28
あーびっくり。一瞬前スレ開いたのかと思った。

290:名無しさん@お腹いっぱい。
10/09/04 03:25:21
>>288
とりあえず動作確認
これ-p使える?浦島なんだが以前のplじゃプロクシ噛ませられたよな

291:名無しさん@お腹いっぱい。
10/09/04 15:54:29
>290
使えない


>271-272

292:名無しさん@お腹いっぱい。
10/09/04 19:52:47
そか
ミジンコだからワケワカメというか
一言でいうとメンドイ感じになってしまったんだな
プロクシtxt読むの便利だったのに

293:名無しさん@お腹いっぱい。
10/09/04 20:59:23
何言ってるのかよく判んないけど「多分僕はやればできる子」でOK?

294:名無しさん@お腹いっぱい。
10/09/04 22:06:01
前のehg.plではプロクシをテキストで保存したリストを読み込んで画像を落とせてたんだよ


295:名無しさん@お腹いっぱい。
10/09/04 23:20:32
ソースあるなら自分で書き換えたらどうだ?

296:名無しさん@お腹いっぱい。
10/09/04 23:32:15
いやいや自分では作らないからこそ自分の意思を明確に伝える努力が大切だよ。

297:名無しさん@お腹いっぱい。
10/09/04 23:54:10
なら金払って買ってこい。

298:名無しさん@お腹いっぱい。
10/09/04 23:56:35
ダウソ厨の考えは理解できません

URLリンク(sankei.jp.msn.com)

299:名無しさん@お腹いっぱい。
10/09/05 00:01:31
まあ待て。

A)
そうでしたか。
私も自分で調べようと考えたのですが他愛のない技術しか持ち合わせておらず
一言で言うと調べるのが面倒臭くなったのですよ。
前のehg.plではプロクシの一覧をテキストで読む機能が便利でした。

B)
そうでしたか。
作者はまだ初心者なのでオリジナルのコードを深く理解することができず
一言で言うと機能を取り込むことが面倒臭くなったのでしょう。
前のehg.plではプロクシの一覧をテキストで読む機能が便利でした。

いずれにせよ遠回しに「対応して下さい」と言ってるに違いない。
大体日本人の多くは発注下手なんだよ。

300:名無しさん@お腹いっぱい。
10/09/05 12:36:18
>>299
ちょっと違うな。

C)
作者はWWW:Mechanizeでもproxy使えると思ってた


301:名無しさん@お腹いっぱい。
10/09/05 20:29:40
まとめると現状でも動作は大丈夫だったが希望としては将来的にそういった機能を盛り込んでもらえると楽
一気にダウンロードするスレ的に歓迎される

302:名無しさん@お腹いっぱい。
10/09/05 21:00:51
そだな。
技術的に面倒なことはなんもないというか
この機会にsocketも覚えるんだな。
httpはrfcを読んでおくといい。


303:名無しさん@お腹いっぱい。
10/09/05 21:18:35
みんながんばってね。

304:名無しさん@お腹いっぱい。
10/09/05 22:00:45
画像のURLを収集する処理と実際に画像をダウンロードする処理を別プロセスにするんだ。
収集側はギャラリー毎にスレッドを分けて共有テーブルから応答時間を基準にしたラウンド
ロビンで選んだプロクシ経由で接続してURLをキューイングし、ダウンロード側はホストに
応じてスレッドを振り分けるんだ。
すげぇ効率良いぞ。
排他忘れんな。
歯磨けよ。

305:名無しさん@お腹いっぱい。
10/09/05 22:08:01
>>304
windowsのperlでforkできんだっけ?


306:名無しさん@お腹いっぱい。
10/09/05 22:42:10
後の移植を考えるとプロセス間通信絡みのI/Fは自分でライブラリを書くんだ。書けるよな。

307:名無しさん@お腹いっぱい。
10/09/06 08:46:09
移植も何もPerlなんだしthreadsでいいじゃん。

308:名無しさん@お腹いっぱい。
10/09/06 09:53:37
ithread ってまともに動くようになったの?


309:名無しさん@お腹いっぱい。
10/09/06 16:09:49
厳密にスレッド制御するならともかく
ダウンロード用にスレッド分けるくらいならithreadsで問題ない

310:名無しさん@お腹いっぱい。
10/09/06 18:10:33
そもそもこの板の住人的にわざわざperlでやる必要あるのか?
curl+最初から入ってるコマンドの組み合わせで全部事足りるはずだけど

311:名無しさん@お腹いっぱい。
10/09/06 18:23:02
目についたタイトル片っ端から放り込んで3時間で1Gとかやってみたけどぶっちゃけそこまでやると目を通せないんだよね
見終わったエロ漫画とか最初の数ページ見ていいと思った奴を取得リストに貯めといて寝てる間に取っとく程度でいい

312:名無しさん@お腹いっぱい。
10/09/06 19:02:23
>>310
perlの布教と達成感と自己満足


313:名無しさん@お腹いっぱい。
10/09/06 19:42:40
>>310
そう単純に行かないサイトがあるからやってんじゃん?

314:名無しさん@お腹いっぱい。
10/09/06 19:54:54
perl以外がおとなしいって言うかperlが我がもの顔をしたがるのか
いずれにせよ全力で兎を追うのが狩りの醍醐味。しかもエロバニーだ

315:名無しさん@お腹いっぱい。
10/09/06 19:57:44
別にrubyとかpythonとかでもいいんじゃね

316:名無しさん@お腹いっぱい。
10/09/06 20:04:15
文字操作に関してperlは、早々からライブラリが充実してたからな。
俺は他人のスクリプトルールで詰まったり調べるのめんどいからCでやってるけど。

317:名無しさん@お腹いっぱい。
10/09/06 20:31:35
今のe-hentaiは登場した当初と違ってそれほど中身は凝ってない
単に画像のURLを取り出してアクセスするよりも規制をどう回避するかに注力した方がいい

318:名無しさん@お腹いっぱい。
10/09/06 20:51:42
>>317
そこはもう自分の中でクリアしちゃったからもんだから今暇なんだ。

319:名無しさん@お腹いっぱい。
10/09/06 21:12:06
元のhtmlだけ串経由で取って画像は生で取る
hentaiverseが割り当てられてるか?nl=1で取得し直した画像は串で取得(バックグラウンド実行にしていい)
たったこれだけの話なのにperlで書くからややこしくなる

320:名無しさん@お腹いっぱい。
10/09/06 21:12:15
>>311,317
自動化すると見なくなるよな。
とりあえず、タグ配置変更きたらメール飛ばして知らせるような仕組みでも追加してれば。

321:名無しさん@お腹いっぱい。
10/09/06 21:28:54
>>319
それではややこしくない方法をご教授ください


322:名無しさん@お腹いっぱい。
10/09/06 21:31:49
>>319
思い込み。hentaiverseでも画像だけ取りにいく分には規制のカウント外。
心配せずに直に取りにいってOK。プロクシのオーバーヘッドだけ損してるぞ。
nl=1で取りに行くのは本文なのでプロクシ経由が吉。

だからといって全部nl=1で取りに行くなよ。メインサーバが重くなるので
嫌われる。

323:名無しさん@お腹いっぱい。
10/09/06 21:39:49
>>320はタグの配置が変わった程度でコケる可哀相な仕様なの?

324:名無しさん@お腹いっぱい。
10/09/06 21:42:40
>>323
神仕様おせーて

325:名無しさん@お腹いっぱい。
10/09/06 21:54:57
>>323 自分で考え出して悦に入るのも醍醐味じゃ、ほっほっほ。

326:名無しさん@お腹いっぱい。
10/09/06 22:11:42
「醍醐」は牛や羊の乳を精製する五段階の最終過程を意味し、その汁は甘く濃厚という。
転じて「本来の愉悦」をさして「醍醐味」と呼ぶようになったのはおそらく豆であろう。

327:名無しさん@お腹いっぱい。
10/09/06 22:23:29
perl開発ユーザー以外は全く公開しないな。


328:名無しさん@お腹いっぱい。
10/09/06 22:25:40
>>327
んじゃ別の言語のを公開してみ。

329:名無しさん@お腹いっぱい。
10/09/06 22:36:51
日本語ツール
ソース

「ウpレカス」

330:名無しさん@お腹いっぱい。
10/09/06 22:40:26
ミジンコ的には何で開発しようが適当にリドミ読んで理解できて楽に一気にダウンロードできりゃ問題ない

331:名無しさん@お腹いっぱい。
10/09/06 22:41:56
スレ的にはそういうスレだ

332:名無しさん@お腹いっぱい。
10/09/06 22:42:12
>>330
ミジンコどころか……


割れ神(ピラミッドの頂点=神)
      ↑
    放流厨←─┐
      ↑        │
┌→吸出し厨 ┐ウイルス厨
│          │
├→購入厨─┤
│          │
└─販売厨←┘
    ↓  ↑
    卸し厨
    ↓  ↑
    製造厨
    ↓  ↑
    開発厨(食われるだけの存在=ミジンコ)


333:名無しさん@お腹いっぱい。
10/09/06 22:53:31
実はperl使い以外はperlは過去の産物、寄って集って拡張した挙句に
ぐちょぐちょになって言語と呼ぶには恥ずかしい化け物に成り果て
「perlを書いて一人前」と勘違いして泥沼に嵌り顎まで漬かってなお
あがいている奴が哀れでならないと思っている。

334:名無しさん@お腹いっぱい。
10/09/06 22:59:12
perl使い叩きのスレはここですか?

335:名無しさん@お腹いっぱい。
10/09/07 08:40:23
ほとんどのヒトはその時に一番使いやすい言語でやればいいだけと思っているので
言語にいちいち文句言ってるやつが哀れでならないと思っている。

336:名無しさん@お腹いっぱい。
10/09/07 11:14:16
生み出されれば使うだけ
叩かない、使って落とせりゃおk
いちいち言語とか気にしてるのは残念な人

337:名無しさん@お腹いっぱい。
10/09/07 13:33:58
perlでやればパイプを一杯使わなくても文字の操作が一発でできる
しかしperlモジュールでダウンロードするよりcurlとかwgetでやった方がお手軽に各種設定ができる
今のehg.plの欠点は効率的な串の使い方が出来ないことなので後者が提案された

この辺が落とし所かと

338:名無しさん@お腹いっぱい。
10/09/07 18:37:25
公開されてるツールがperl版しかない。
スクリプト言語だから読めれば改造が楽。
一から作るより既存のツールいじったほうが楽。

故にperl版使用。

ただニワカperlユーザーだから大きくソース改変するほどの知識が…。

339:名無しさん@お腹いっぱい。
10/09/08 09:49:43
作者がwindowsだからperlだけで書いてるだけじゃね?
windowsでUNIX/LINUX環境整えるのはめどいし。
perlとかの言語だけならそのインタプリタ入れるだけで
間口がUNIX以外にも広がるじゃん

340:名無しさん@お腹いっぱい。
10/09/08 10:39:37
言語に優劣は無いがユーザーに優劣は存在する。


ダメ出ししかしないクズは氏ネ。

341:名無しさん@お腹いっぱい。
10/09/08 12:39:40
そういや最初のget.plもUNIXで動かすとディレクトリのパーミッションでこけてたな
ここってWinユーザー多いのかもな

342:名無しさん@お腹いっぱい。
10/09/08 17:30:00
そんなに串.txt読みに行かせるのって難しいの?
当時それができたplがあったけど、それうpっても参考にはならんか

343:名無しさん@お腹いっぱい。
10/09/08 18:32:57
文句言うなら使わないか、自分で何とかしろ。
慈善事業じゃねえんだ。

344:名無しさん@お腹いっぱい。
10/09/08 19:05:41
自分で何とかしてるけどこうしたらいいんじゃないかと提案しただけ

345:名無しさん@お腹いっぱい。
10/09/08 19:19:59
すれ違う想い

346:名無しさん@お腹いっぱい。
10/09/08 21:23:30
>342
うp希望。

347:名無しさん@お腹いっぱい。
10/09/09 22:19:49
このスレ怖い

348:名無しさん@お腹いっぱい。
10/09/09 23:31:29
ははは何言ってんだい
スレが怖いんじゃねえ
板が怖いんだ

349:名無しさん@お腹いっぱい。
10/09/09 23:33:05
頭痛が痛い

350:名無しさん@お腹いっぱい。
10/09/09 23:42:29
ま、まんじゅうなんて別に怖くなんかないんだからねっ!
だからさっさとまんじゅうもってきなさいよ!


351:名無しさん@お腹いっぱい。
10/09/10 00:19:13
ここらでひとつ、おまえがイタい。

352:名無しさん@お腹いっぱい。
10/09/10 09:44:26
>>342
>そんなに串.txt読みに行かせるのって難しいの?

epiphanyで在れば読める可能性は在るかも知れ無いですね…

353:名無しさん@お腹いっぱい。
10/09/10 11:01:53
ファイルアクセスは基本面倒。
既存ファイル?新規?追記?上書き?テキスト?バイナリー?
形式あってる?読み込みバッファのオーバーフロー大丈夫?
文字コードは?

難しいわけではないけど面倒。

354:名無しさん@お腹いっぱい。
10/09/10 12:09:55
シェルでやりゃいいじゃねえか
この板に来たのも何かの縁だしcygwinなりcoLinuxなり入れろよ

355:名無しさん@お腹いっぱい。
10/09/10 12:23:39
なにそれこわい

356:名無しさん@お腹いっぱい。
10/09/11 21:04:32
自分は今までスクリプト起動時にプロクシリストを読んで随時切り替えながら
処理結果からプロクシを採点して次に使う際の基準にしてたんだ。
でも複数を同時に起動したとき互いの採点が共有できないのが難点。
スクリプトも標準入力から複数のギャラリーを繰り返し入力できるものの
閉じたとき学習結果を保存せず毎回ゼロからスタートしちゃうのも難点。

んでここに触発されて今日'プロクシ選択サーバ'を書いたよ。スクリプトでね。
socket通信なのでサーバはどこにでも置ける。スクリプトは毎回サーバから
プロクシをチェックアウトし、htmlを読んだら結果と共にチェックイン。
サーバがチェック時間や処理結果から重み付けを更新して適宜ファイルに反映。
動的な追加削除もできるようにした。これで同じプロクシを頻繁に選んじゃう
こともないし状態も共有できる上に学習速度も速いだろうと期待。

リスト自体は前から別スクリプトでcybersyndromeを読み応答が良好でhentaiに
繋がって且つ弾かれないものを収集して作ってる。この収集だけで小一時間
かかるのが面倒で、作ったら一週間程継続使用してる。
ちなみに'chunked'なんてものがあるってのはそこで初めて知った。

だが断る。

357:名無しさん@お腹いっぱい。
10/09/11 21:18:06
そこまでエロにこだわる執念の恐ろしさを知った…
俺も5年くらい前まではそうだったかも試練けど、最近は丸くなったな思うよ。

358:名無しさん@お腹いっぱい。
10/09/11 21:31:06
うん、何かにつけて凄い凝り性なんだ。
極みまで達した日には飽きもするんだろうけど
少しも青二才から抜け出せた気がしないんだよね。

359:名無しさん@お腹いっぱい。
10/09/11 22:25:03
httpdの勉強になって良いよな。

360:名無しさん@お腹いっぱい。
10/09/11 22:33:25
んじゃあその熱意に応じて

普通のプロキシは良いものを選んでも気がつくと使えなくなっていることが多い
また速度との兼ね合いからある特定のプロキシに群がることが多い
その点、Torを使えば、ほぼ100%の確率で接続が有効で、潤沢にある中からランダムに割り当てられたプロキシが取得できる
規制されたり極度に遅い串に当たったら、その出口ノードを排除する設定にして再起動することでノードの引き直しができる

Torはデータディレクトリとポート割り当てさえ変えれば多重に起動できる
またTorポート一つにつきsocksからhttpに変換するためのソフトを一つ起動する必要がある

361:名無しさん@お腹いっぱい。
10/09/11 22:50:28
だがその勉強で収入が上がるかといえばそんなことはない

362:名無しさん@お腹いっぱい。
10/09/11 23:00:52
>>359
今回のサーバは別にhttpを使ってる訳ではないが、まあ画像をデータベース化して
ブラウザから検索閲覧できる自前のhttpサーバはhentaiとセットで使ってる。
さすがにスクリプトではないけど。
>>360
へぇ面白そうだね。P2Pってところは反射で気になるけど。
>>361
収入はさておき会議と納期と折衝とSPICEと金勘定でがんじがらめの仕事に比べたら
好き勝手できるここは天国だよ。明日への活力ってところか。

363:名無しさん@お腹いっぱい。
10/09/12 13:47:30
なんか臭くなってきたな

364:名無しさん@お腹いっぱい。
10/09/12 15:10:51
今時は分析と設計だけ日本でやって下流の工程は中国に投げちゃうからね。
「俺も書きてぇ」っていう欲求不満はこんな所でしか晴らせないよな。

365:名無しさん@お腹いっぱい。
10/09/12 15:42:11
串リストの入手が面倒であきらめ。

URLリンク(www.multiproxy.org)
ここのリストからいくつか適当に選んで"LANの設定"のプロクシサーバーにセットしてみたけど無効なのばっかりだった。

366:名無しさん@お腹いっぱい。
10/09/12 17:33:19
IEでOKボタンいっぱい押しながら試したりして大変だったね。
自分ならtelnetでHTTP送ってみるかな。

367:名無しさん@お腹いっぱい。
10/09/12 21:57:54
>>365
笑えよ。"updated: 11-Feb-2009" だってさ。

368:名無しさん@お腹いっぱい。
10/09/12 22:34:41
串なんてツールで使えるS判定のコピペるだけ
それをtxtにして読みに行かせれば・・・出来たわけだし

369:名無しさん@お腹いっぱい。
10/09/13 21:41:56
1.プロクシリストから1行読み込み
2."http://"付けて $ENV{HTTP_PROXY} にセット
3.$mech = WWW::Mechanize->new()
4.$mech->get() 成功!

5.リストから次のプロクシ読み込み
6."http://"付けて $ENV{HTTP_PROXY} にセット
7.$mech->get() 失敗!
8.エラーコードは200

HTTPステータスコード
>200 OK
>OK。リクエストは成功し、レスポンスとともに要求に応じた情報が返される。
ブラウザでページが正しく表示された場合は、ほとんどがこのステータスコードを返している。

370:369
10/09/13 21:45:34
途中で送っちゃったorz
6と7の間に$mech = WWW::Mechanize->new()入れ忘れてるし。

で、
9. 以後5~8を繰り返し

なんか初期化処理必要なのか?

371:369
10/09/13 21:54:42
orz
$@ を$!と書き間違えてた・・・

なんとかなりそう。
ただ元のソースいじり過ぎてスパゲティ状態(URLリストファイル対応、自動題名取得、エラーファイル再取得バッチ出力)
何処に追記すればいいのやらorz

372:名無しさん@お腹いっぱい。
10/09/13 22:46:22
いろいろ試行錯誤紆余曲折してるようだけど
proxyが a.b.c.d:p とするとポートpでa.b.c.dに接続して

GET URLリンク(exhentai.org) HTTP/1.1<cr><lf>
Host: a.b.d.d:p<cr><lf>
User-Agent: Mozilla/5.0<cr><lf>
Accept: text/html,*/*<cr><lf>
Accept-Encoding: gzip<cr><lf>
Connection: Close<cr><lf>
Cookie: ipb_member_id=1<cr><lf>
<cr><lf>

なり送れば済むんじゃないかい? Mechanizeは強力なんだろうけど
袋とじを開けようとしてチェンソーに振り回されているみたいだよ。
>>281は言いたかったと思う。

ついでに "RFC 2616" で検索したものを読んどいた方がいいと思う。
>>302も言いたかったと思う。

373:名無しさん@お腹いっぱい。
10/09/14 03:42:24
あまりにも大量すぎて画像の状態だと管理できなくなってきたのでtarで固めてcomixで読むことにした

374:名無しさん@お腹いっぱい。
10/09/14 09:57:20
1日に300以上あげられてるからなぁ

375:名無しさん@お腹いっぱい。
10/09/14 18:39:37
自分で固めたなら問題ないと思うけど、comixってパスワード付き書庫開くとX道連れにしない?
ctrl+alt+f1の画面でパスワード入力を受け付けるプロンプトが出てるみたいだけどパスワード入れてもだめ

376:名無しさん@お腹いっぱい。
10/09/14 20:12:34
>>375
うわ マジか
同人誌はzip配布の場所では取ってないから試したことなかった。気を付ける

最初はtar.gzかzipで固めてたんだけどふとtarでいいじゃんって思って試したら使えたので全部tarにしてしまった
もともと中身全部圧縮済み画像だからファイルサイズも大して変わらんし(当然だが)tarの方が展開速度が明らかに速い
似たような理由でWindowsだと無圧縮zipが使われてるらしいな

今までcomixってイマイチなソフトだなぁと思ってたんだがアーカイブ対応ビューワとしては及第点かな…

377:名無しさん@お腹いっぱい。
10/09/16 19:21:38
保守

378:名無しさん@お腹いっぱい。
10/09/18 20:23:34
Proxyテストプログラム
URLリンク(www1.axfc.net)

g.e-hentai.orgにアクセス出来るかテストするツール。

379:名無しさん@お腹いっぱい。
10/09/20 12:24:02
物色したギャラリーやページを待ち行列に追加する手作業が面倒だったんだけど
ブラウザの「リンクのURLをメールで送信」で自前のプログラムに渡せば楽チンって気が付いた。
Firefoxの拡張を自分で書ければ一番いいんだけど。

380:名無しさん@お腹いっぱい。
10/09/21 12:25:06
なかなかうまくスクレイピングできないなーと思ってぐぐったら
他の方々も苦労してらっしゃったのですね…

もう中身とかどうでもいいからいかに完璧にダウンロードできるかを極めたい。
今は普通にスクレイピングしながら509くらったら串きりかえしてるんだけど
すぐ串が足りなくなってしまう…

381:名無しさん@お腹いっぱい。
10/09/21 12:47:07
取得失敗対策もやって100%取れるようになったけど
一つだけハマったのはうpの段階で途切れたり壊れてるjpgがある

382:名無しさん@お腹いっぱい。
10/09/21 13:12:47
以前の串対応plが神過ぎたんだな

383:名無しさん@お腹いっぱい。
10/09/21 15:04:25
>>381
実際のダウンロードデータのサイズとContents-Lengthの比較はしてる?

384:名無しさん@お腹いっぱい。
10/09/21 15:48:21
>>383
してない
imagemagickの適当な処理に通してエラーが出たら三回まで再試行してる

385:名無しさん@お腹いっぱい。
10/09/21 17:23:07
途中で途切れるjpegは、重い画像サーバーに当たってるかもね。
レジュームリクエストするか長めのウェイトで必ず全データとれるよ。

386:名無しさん@お腹いっぱい。
10/09/21 18:04:32
多分ファイルが壊れてると思うけどなぁ
試行ごとに鯖が変わってるのも確かめたし?nl=1も試したが全部同じところで途切れてる
ついでにギャラリーのページでサムネイルもチェックしたが全く同じところで途切れてる

まぁそういうのは滅多にないから気にしないほうがいいか…
俺はconvertに通してstderrに何か出るようなら再取得するようにしてるけど
元から破損してる場合はContent-Lengthでチェックした方がちゃんと取れると思う

387:名無しさん@お腹いっぱい。
10/09/21 21:17:05
>287 と >378 を組み合わせて509出る度にプロクシ変えるよう改造した。
合計16時間ほどまわして1.15G(約3600ファイル)落ちた。
66ファイル 500:ERROR GETing 出てるけど。

388:名無しさん@お腹いっぱい。
10/09/21 21:31:37
66ファイルは取得ミス?
だとしたらちょっと多いな。500エラーだったら?nl=1につなぎ直せば回避できる気がする
速度的にはそんなもんが関の山だと思う
(串無しで画像に繋げばもっと速くなるがぶっちゃけ速くする必要もないし管理者にバレないという保証もないので)

389:名無しさん@お腹いっぱい。
10/09/21 22:05:26
速くなってありがたかったといえば無人稼動が無くなったこと位かな。

390:名無しさん@お腹いっぱい。
10/09/22 00:26:41
串通して落としてたら急に破損画像が連発。
元々壊れてたのか串が悪かったのか…。
画像DL時串無効に設定しなおして再挑戦。

391:名無しさん@お腹いっぱい。
10/09/22 00:34:41
たまに空文字返すPROXYはあるよね。
PROXYのせいなのか、あるいはhentaiが意図的にそう返しているのかは知らん。
あといちいち串と書くな恥ずかしい。

392:名無しさん@お腹いっぱい。
10/09/22 01:06:09
串でいいじゃん1文字だし

393:名無しさん@お腹いっぱい。
10/09/22 09:56:57
普通は串って書くよな
>>391が情弱すぎるだけ

394:名無しさん@お腹いっぱい。
10/09/22 14:51:50
なに通ぶってんだよw

395:名無しさん@お腹いっぱい。
10/09/22 17:09:29
素人の俺でも串って言うわ
2ちゃん住人ならほとんどが串って言うんじゃねーの

396:名無しさん@お腹いっぱい。
10/09/22 17:12:53
なんと言ってもいいけど○○って言わない奴は情弱って言うような人は頭が悪いなぁとは思う


397:名無しさん@お腹いっぱい。
10/09/22 18:13:31
ちがうちがうよ、見てるこっちが恥ずかしいって意味。
よくあるだろ、電車の中とかの物知り顔な中学生の会話。

398:名無しさん@お腹いっぱい。
10/09/22 18:20:17
くっしーさーん!
出てきてくださーい!

399:名無しさん@お腹いっぱい。
10/09/22 18:39:28
言わないからじゃなく、昔から使われてる名称を物知り顔で非難してるから叩かれてるんだよ。
もう少し読解力つけろ。

400:名無しさん@お腹いっぱい。
10/09/22 18:50:01
串でもproxyでもプロクシでもプロキシでもかまわんが
大文字でPROXYは解説書か環境変数以外で見ると違和感があるな。

401:名無しさん@お腹いっぱい。
10/09/22 18:52:48
通でも何でもないだろ
普通でもない
好きなようにしろよ
俺は一気にダウンロードが最終的に楽になりゃなんでもいいわ

402:名無しさん@お腹いっぱい。
10/09/22 18:55:14
「串」はアングラを気取った一部の連中が使いだしたもの。奴らは隠語を使うのが
格好いいと思ってた。
「串」は、一文字で済む、刺すという動詞と相性がいいので進化の勝者になった。
が、今更使うなよって感じだな。

若いおねーちゃんのファッションをババアが真似しだして更に10年経過した段階。
恥ずかしくて見てらん無い。

403:名無しさん@お腹いっぱい。
10/09/22 19:01:43
鯖とか垢とかもね

404:名無しさん@お腹いっぱい。
10/09/22 19:08:55
串教えてくださいと言って焼き鳥の串のアドレス貼られたのはいい思い出

405:名無しさん@お腹いっぱい。
10/09/22 21:19:00
>が、今更使うなよって感じだな。
独りよがりな意見だな。
その感覚を押しつけないでください。無視しててください。

406:名無しさん@お腹いっぱい。
10/09/22 21:21:15
ババア必死。ww

407:名無しさん@お腹いっぱい。
10/09/22 21:49:41
お前も必死www

408:名無しさん@お腹いっぱい。
10/09/22 21:58:55
正しいことを言った者が正義ではない
ツールを上げた者が正義なのだ

409:名無しさん@お腹いっぱい。
10/09/22 21:59:24
>>404
俺はプロキシ拾える場所教えてくれって言ったらプロ棋士一覧のサイト貼られたわw

410:名無しさん@お腹いっぱい。
10/09/22 22:32:40
どんだけ張り付いてんだか、ツールくれは技術的なこと以外の話になると今が出番とワラワラ沸いてくるな。
もう>>397は撤回するから好きに鯖でも串でも使ってくれ。膣内と書いてナカと読ませるのには慣れた。

411:名無しさん@お腹いっぱい。
10/09/23 00:04:31
ieの右クリックメニューで現在見ているwebページのURLをテキストファイルに追記するツール
URLリンク(www1.axfc.net)

Cドライブのルートに解凍→レジストリ実行で準備完了(ファイル消しちゃダメ)
詳しくはreadme.txtとhtmlソース(javaスクリプト)見て。

412:名無しさん@お腹いっぱい。
10/09/23 00:40:24
面白い試みだがここってUNIX板なんだよね

413:名無しさん@お腹いっぱい。
10/09/23 01:43:00
つられんなってw

414:名無しさん@お腹いっぱい。
10/09/24 21:02:53
プロキシ通したらデータ化けで数時間で止まるようになったorz
使った串が悪いんだろうけど。

415:名無しさん@お腹いっぱい。
10/09/24 21:11:15
網タイ穿いたボンレスハムババアが現れた。

416:名無しさん@お腹いっぱい。
10/09/24 21:58:51
どれだけ必死なのゆとりDQN。

417:名無しさん@お腹いっぱい。
10/09/24 23:15:58
ふむ、その趣味は無いが非常に興味深い事象に思えるな。参考までに画像を張りたまえ。
誤解の無いように言っとくが決してその手の趣味があるわけではないから勘繰るなよ。
いいから張りたまえ。早く!今すぐにィ!

418:名無しさん@お腹いっぱい。
10/09/25 08:27:11
URLリンク(erog3jigen.blog49.fc2.com)

419:名無しさん@お腹いっぱい。
10/09/25 14:12:12
jpegファイル破損検出用
URLリンク(blog.livedoor.jp)

420:名無しさん@お腹いっぱい。
10/09/27 00:37:09
串通さなきゃいけないような仕様はやめてほしい

421:名無しさん@お腹いっぱい。
10/09/27 06:45:16
そしたら鯖に負荷かかるだろうが馬鹿か
一枚づつシコシコと保存しろよ

422:名無しさん@お腹いっぱい。
10/09/28 00:15:52
いまひとつ歯車が噛み合っとらんけど、変に律儀なのは日本人の美徳だな。
たとえばGoogleの統計では全世界のe-hentaiの検索で日本からの検索なんて
グラフにもならん程少ない。自意識過剰気味。高楊枝っぽくって好きだけどな。


423:名無しさん@お腹いっぱい。
10/09/28 00:49:58
大量のプロキシからの同時接続で一瞬で1冊完成させるスクリプト組んでみた

424:名無しさん@お腹いっぱい。
10/09/28 01:58:07
>>423
高速で取っても読むのがどうせ追いつかなくなるだけだよ
あと物色する段階までは生IPで見てるだろうから向こうが本気になれば足がつく
以前プロキシ付きget.plの使いすぎでアク禁された俺が忠告しとく

425:名無しさん@お腹いっぱい。
10/09/28 11:32:33
一つで完結する面倒くさくないプロキシ付きget.plは必要だけどな
物色する段階で自重すりゃいいだけだし

426:名無しさん@お腹いっぱい。
10/09/28 18:24:45
まだ売ってるものは買えよ。

427:名無しさん@お腹いっぱい。
10/09/28 22:54:02
エロ漫画見たさに一晩中PC付けっぱなしにしてることに何の疑問も持たない奴は馬鹿

428:名無しさん@お腹いっぱい。
10/09/28 23:22:57
自鯖あるし。

429:名無しさん@お腹いっぱい。
10/09/28 23:25:18
uploader運営すれば勝手に集まる。

430:名無しさん@お腹いっぱい。
10/09/29 00:22:25
>>427
そこは別に
エロ漫画見たさにこんなスレにたどり着くことに比べれば屁でもないだろ

431:名無しさん@お腹いっぱい。
10/09/29 00:47:48
何の疑問もないw

432:名無しさん@お腹いっぱい。
10/09/29 10:10:32
>419
jpeginfo -c で十分だなぁ

433:名無しさん@お腹いっぱい。
10/09/29 18:27:02
>>287
これ使ってて500エラー時に?nl=1を足して再試行するには
どうしたらいいんだろうか?

434:名無しさん@お腹いっぱい。
10/09/29 18:53:10
>>419
俺は>>228

435:名無しさん@お腹いっぱい。
10/09/30 01:16:43
画像鯖のダウン放置なげえな

436:名無しさん@お腹いっぱい。
10/10/01 01:26:09
PNGの途中切れ判定関数作った

sub is_png
{
my $data = shift or die $!;

my $sig = substr( $$data, 0, 8 );
my $iend = substr( $$data, -8, 8 );

return
$sig ne "\x89\x50\x4E\x47\x0D\x0A\x1A\x0A" ? 0
: $iend ne "\x49\x45\x4E\x44\xAE\x42\x60\x82" ? 0
: 1 ;
}

437:名無しさん@お腹いっぱい。
10/10/01 10:39:30
>>436
GJ!

438:名無しさん@お腹いっぱい。
10/10/01 22:18:55
そこまでかたくなにContent-lengthを拒む姿勢には何かすがすがしいものを感じる訳が無い。

439:名無しさん@お腹いっぱい。
10/10/01 22:50:59
>>438
プロキシ経由の場合はプロキシ鯖のほうが勝手にContent-Lengthを書き換えるから、
切れていてもContent-Lengthと実ファイルのサイズは同じになる。

440:名無しさん@お腹いっぱい。
10/10/01 23:01:04
あぁそうなのか。画像は自IPで取ってるからそうとは知らなかった。
しかしそれはそれでどうなのよ。勝手にリサイズしたり減色したり
センサードするプロキシもありそうなもんだな。

441:名無しさん@お腹いっぱい。
10/10/01 23:29:22
勝手にエロに変換してくれるとか。

442:名無しさん@お腹いっぱい。
10/10/01 23:50:58
フィルタリングプロキシと勘違いしてんじゃねえか

443:名無しさん@お腹いっぱい。
10/10/02 09:33:10
プロキシはjpgとか返さないけどな

444:名無しさん@お腹いっぱい。
10/10/02 09:34:15
何言ってんだ返すよ

445:名無しさん@お腹いっぱい。
10/10/02 09:47:17
content-type見てた

446:名無しさん@お腹いっぱい。
10/10/02 21:31:04
ウチはハヤテが丁寧に保存してくれてるから苦労したことはないな

447:名無しさん@お腹いっぱい。
10/10/02 21:45:05
ハヤテてなソフトがあんの?
Winユーザだからしらん

448:名無しさん@お腹いっぱい。
10/10/02 22:36:20
>>447
専用執事がいるってことだよ
言わせんな恥ずかしい(////)

449:名無しさん@お腹いっぱい。
10/10/02 23:46:30
幽霊神父が勝手にDL用HDD追加してそうだな。

450:名無しさん@お腹いっぱい。
10/10/03 22:50:55
lofiがロリコン規制されてるんだが
ログインしても見れない

451:名無しさん@お腹いっぱい。
10/10/04 01:45:16
おまえらperlの最新版の定期報告忘れてね?
ちゃんとしてくれなきゃ困るんだけど

452:名無しさん@お腹いっぱい。
10/10/04 07:14:56
>>446
君みたいな美少女でもえっちな画像集めたりするんだね

453:名無しさん@お腹いっぱい。
10/10/04 22:27:30
ehg.pl勝手に改造

URLリンク(www1.axfc.net)

>>287からの更新内容
URLの代わりにURLリストファイル指定可能
保存フォルダ指定しないとタイトル名でフォルダ作成
オプション(/1)で1ファイルだけDL指定可能
保存フォルダ内にインターネットショートカット作成
DL失敗時 ?nl=1 オプション添付。それでもダメなら再取得用バッチファイル出力
ログ出力機能搭載。
グロ等の警告、ブック削除警告ページ対応。

Win環境で開発しており、UNIX環境では修正が必要(文字コード変換、再取得用スクリプト出力等)。
バグ報告、改善アドバイス等よろしく。

454:名無しさん@お腹いっぱい。
10/10/04 22:34:21
>>453
勉強させてもらいます

455:名無しさん@お腹いっぱい。
10/10/04 23:13:45
大体みんな作るもん似通ってくるんだな
俺もタイトルから自動でディレクトリ作る機能と取り逃し用の一ファイルのみDL機能はつけてる
あと後でタグ付ける用にギャラリーページの1ページのHTMLも全部保存してある

俺は漁ったものだけ取るから特殊なページの対策はしてないけど
あと最初にファイル名の最初にページ数を入れといてダウンロードが終わったらリネーム(0をつけて桁揃え)してる

456:名無しさん@お腹いっぱい。
10/10/05 00:12:59
$mech->res->filename
でファイル名が取得できるんだが、$PageNowで強制的に番号付きのファイル名にするのどうして?

457:名無しさん@お腹いっぱい。
10/10/05 00:24:40
>>456
単純に、いまどこのページまで取得したかが簡単に分かるから。
ついでに、フォルダ名で分けている同一名のファイルの重複を防ぐため。


458:名無しさん@お腹いっぱい。
10/10/05 00:24:55
CG集とか取ってみるとわかるよ

459:名無しさん@お腹いっぱい。
10/10/05 00:38:09
なるほど

460:名無しさん@お腹いっぱい。
10/10/05 00:47:30
トトンクス
でも串txt丸読みには手出さんね皆

461:名無しさん@お腹いっぱい。
10/10/05 00:48:46
>>460
鯖に負荷がかかるからね。
我々とE-HENTAIは共存関係にあるのだよ。

462:名無しさん@お腹いっぱい。
10/10/05 02:00:17
E-hentaiのlofiの方でShota,Loli入れても何にも検索できない。試しにロリ漫画の名前を入れたら出るには出るがThis gallery is currently unavailable.と表示されて見れない。どないせーちゅうねん

463:名無しさん@お腹いっぱい。
10/10/05 02:11:12
過去ログ読めばいいと思うよ

464:名無しさん@お腹いっぱい。
10/10/05 02:51:49
過去ログってどういう事?
ログインしたら見れるって奴か?ログインしたけど見れないぞ
昨日辺りから急に規制されたんだけど
でトップのニュース見たら「いくつかのサービスは少しの間利用できません」
みたいな事書いてあった、規制のことかな

465:名無しさん@お腹いっぱい。
10/10/05 02:55:46
loliconとかのタグを避けたくてlofiを使ってた人はexに移った

466:名無しさん@お腹いっぱい。
10/10/05 02:57:37
表のEHENはもはやロリコンは扱ってませんよ、っていうカモフラージュなんだろ

467:名無しさん@お腹いっぱい。
10/10/05 15:50:59
gifファイルもダウンロードする可能性があるのか・・・
is_gif関数も作るか・・・

468:名無しさん@お腹いっぱい。
10/10/05 16:29:30
gifイメージ途中切れ判定関数
完全なイメージなら常に1を示すが、不完全な場合は概ね0を示すが偶然1を示すこともある。
参考程度に。
sub is_gif
{
my $data = shift or die $!;

my $sig = substr( $$data, 0, 3 );
my $bt = substr( $$data, -2, 2 );

return
$sig ne "\x47\x49\x46" ? 0
: $bt ne "\x00\x3B" ? 0
: 1 ;
}


469:名無しさん@お腹いっぱい。
10/10/05 16:45:22
>>468
どうやってつかうのん?

470:名無しさん@お腹いっぱい。
10/10/05 16:51:00
>>469
文字列のリファレンスを渡してください

471:名無しさん@お腹いっぱい。
10/10/05 18:16:20
requireで読み込んだpmモジュールのグローバル変数と
plソース側のグローバル変数ってスコープ違うんだ。
やっぱ基本から勉強しないと駄目だな。

472:名無しさん@お腹いっぱい。
10/10/05 21:45:01
>>461
それじゃ今位の時間帯で1000枚/時、深夜なら2500枚/時を超える
スピードで走ってる俺は庶民の団欒を乱す珍走団扱いか。
乗ってるのはADSL8Mの原チャだが。

473:名無しさん@お腹いっぱい。
10/10/05 22:55:40
毎晩俺の部屋の前で吹かしてるのはお前か!!
夜はとっとと寝ろ!!

474:名無しさん@お腹いっぱい。
10/10/05 23:02:24
そしてどういうわけか、lofiで普通にロリ見れるように戻ってるな

475:名無しさん@お腹いっぱい。
10/10/05 23:07:46
とりあえずipb_member_idの有効期限を1年先位に変えておけば.

476:名無しさん@お腹いっぱい。
10/10/06 00:24:23
時速1000枚で3.5時間回したら一枚一秒で流し見してもチェックで約一時間かかるんだけど
そんなん必要なのかね

串でもパラレルダウンロードすれば普通に速度出るけど
みんな相手を怒らせるリスクを犯してまでやりたがらないだけだよ
今年になってせっかくボット相手のガードが緩んだのにまたガチガチに固められたら困るし

477:名無しさん@お腹いっぱい。
10/10/06 20:35:02
複数起動したスクリプトが独立して複数のタイトルを平行して落とすんではなく
複数のプロセスが協調して1個のタイトルに当たるんだねこれが。
それで300pのコミックも10分そこらで完了するってわけだ。
そして君と同じ時間をかけて沢山ダウンロードするんじゃなくて君と同じ量を
短時間でぱぱっと済ませるんだ。多分私のモノサシは君よりちょっと長い。

478:名無しさん@お腹いっぱい。
10/10/06 20:41:13
いやそのご自慢の速度を実現できるけど誰もやらないだけだよって話
ていうか自慢するほど大した技術でもないのはわかってると思うけど

479:名無しさん@お腹いっぱい。
10/10/06 20:45:13
>>477
だから、鯖に負荷がかかるでしょ
ここで晒してみんなが使ったらすぐに規制はいるでしょ
そしたらすぐに使えなくなるでしょ
って話

480:名無しさん@お腹いっぱい。
10/10/06 20:50:20
exの方のUU数だったら調査すれば誰が暴れてるかくらいすぐわかる
管理者側の厚意に甘えてることも知らずに完璧なプログラム組んだ気になってるんだろうな

481:名無しさん@お腹いっぱい。
10/10/06 21:06:14
・大量に取るなら速度を抑えろ
・高速で取るなら量を抑えろ

これさえ守ってくれてるならどうでもいい
もし100KB/sで24時間駆動とかやってるならクローラの限度超えてる

482:名無しさん@お腹いっぱい。
10/10/06 21:28:32
まぁ、共存関係なんだから餌場荒らしはご法度だぜ

483:名無しさん@お腹いっぱい。
10/10/06 21:29:07
うむ、ごくろう。

484:名無しさん@お腹いっぱい。
10/10/06 21:35:38
u

485:名無しさん@お腹いっぱい。
10/10/06 21:38:15
そもそも、そんなにして何を取るんだって話

486:名無しさん@お腹いっぱい。
10/10/06 21:44:13
物色しながら読もうと思った一個か二個を読みやすくするために落とすんでしょ。
そういう場合は落とすスピードが重要だと思う

487:名無しさん@お腹いっぱい。
10/10/06 21:44:41
いつものアスペの人だし実際規制されるまでは何言っても無駄だろ

488:名無しさん@お腹いっぱい。
10/10/06 22:27:41
おっ、そういや最近PerlおぼえたWindows君来ないけど元気かな。

489:名無しさん@お腹いっぱい。
10/10/06 23:02:11
エラー吐く→DL官僚と思ったら一枚抜けとかあったりする→メンドイ
ログ取ってこのアドのこの一枚抜けてたぜ、再度取りに逝くよとかやってくれる?


次ページ
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch