連番のH画像/動画を一気にダウンロードする3at UNIX
連番のH画像/動画を一気にダウンロードする3 - 暇つぶし2ch262:13,153
10/08/23 04:39:53
>>255
あれ?
lofiの仕様は変わらないけど・・・exとgは変わったよね?
今ソース見たらstyle属性見てjpg,jpeg,png,gifの拡張子チェックしてるだけな感じなんだけど。
jpg.jpgとか書いてない。
各自適当だろうから取れてるならいいけど。

263:255
10/08/23 05:11:12
>>262
今のgは"return sl("以降を見ればすぐ取れるから画像のURLを見る必要はないね

exの方はそれが用意されてないので文字列のマッチで画像のURLを適当に抽出してる
このやり方だとファイル名+(jpe*g.jpe*g|png.png|gif.gif)を使ったほうが楽
(大文字表記の拡張子や".jpeg"は一件も遭遇していないが念のため入れてる)
ちなみにもうexしか使ってない

264:255
10/08/23 05:19:35
書き込んでから間違いまくってることに気付いたので訂正

gの方のファイルはろくにメンテしてないので今更気付いたが"return sl("以降の画像URLだとメイン鯖叩くことになるからだめだ
画像URLの抽出もstyle="が含まれるタグ内で抽出かけた方が早いから確かに>>13の処理はもう必要ないわ…

265:名無しさん@お腹いっぱい。
10/08/23 16:44:38
my $mech = WWW::Mechanize->new() ;
$mech->agent_alias( 'Windows Mozilla' ); #added

こうすると幸せになれるかも(´・ω・`)

266:名無しさん@お腹いっぱい。
10/08/23 18:13:27
eh鯖落ち>94.23.191.10

267:名無しさん@お腹いっぱい。
10/08/24 19:41:32
俺ここ半年以上User-Agentには
Mozilla/5.0 (PET 2001; Commodore; U; en-US)
を送ってるな。

268:名無しさん@お腹いっぱい。
10/08/25 01:29:06
再現性がわからないんだがあるページで4x4で102バイトのpngが落ちてくる状況が頻発したから再取得の条件に入れといた

269:名無しさん@お腹いっぱい。
10/08/25 21:54:35
509エラー出たら15分休憩、それでも出たらさらに15分って処理いれて(2回程度で解除された)
DL止まらないようにしたけど、24時間かかって300Mぐらい。

やっぱIP更新させんとキツイか。


270:名無しさん@お腹いっぱい。
10/08/26 00:07:46
ルータをネット経由で操作云々寄りは串でやった方が楽だと思うよ…

271:名無しさん@お腹いっぱい。
10/08/26 01:03:59
ehg.plで串の刺し方教えてくださいませ

272:名無しさん@お腹いっぱい。
10/08/26 01:38:55
>>271
>WWW::Mechanizeでプロキシは使えますか?

>使えます。
>あらかじめ環境変数「HTTP_PROXY」、「HTTPS_PROXY」などにプロキシを設定しておくと、これが利用されます。
>内部ではコンストラクタ(newメソッド)内で、$self->env_proxyが呼び出されています
>(これの働きはもちろん、親クラスであるLWP::UserAgentのenv_proxyメソッドと同じです)。
>最初にこれが確認されるだけで、リアルタイムで現在の環境変数を見ているわけではないことには注意してください。

273:名無しさん@お腹いっぱい。
10/08/26 02:33:30
ありがとう
調べてみたけど、さっぱりわからない;
自分にはまだ早かったようです。。。

274:名無しさん@お腹いっぱい。
10/08/26 10:35:36
バッチファイルに

set HTTP_PROXY=串1
ehg.pl URL1 Dir1

set HTTP_PROXY=串2
ehg.pl URL2 Dir2

って書いとけばいいんじゃないの?

1URLに100ファイル以上あると効果薄いだろうけど。


275:名無しさん@お腹いっぱい。
10/08/26 14:27:29
ehg.plって初めて中身見たけど初代get.plと比べるとずいぶんコンパクトになったな

276:名無しさん@お腹いっぱい。
10/08/26 14:43:08
正に裏ってカンジね

277:名無しさん@お腹いっぱい。
10/08/26 23:47:59
バッチて...TOSBAC,HITAC,AOCS...懐かしい...

278:名無しさん@お腹いっぱい。
10/08/27 17:54:50
なんかしらんが今日は落ちまくってるな

279:名無しさん@お腹いっぱい。
10/08/28 00:19:29
マイナーチェンジきたっぽい
うざいなぁ

280:名無しさん@お腹いっぱい。
10/08/28 07:58:57
SayMove!も自動で落とせそうだけど、ネタ動画の判定無理っぽいから
メールとかで必要なインデックスだけ投げて目視で判定するしかないのか

281:名無しさん@お腹いっぱい。
10/08/28 12:20:18
難儀なことせんでも直接プロキシに接続して "GET URLリンク(exhentai.org) HTTP/1.1" すりゃ良いじゃん
と首をかしげるのは俺がphpだから?


282:名無しさん@お腹いっぱい。
10/08/29 00:50:04
生でやってたらどれくらいでアク禁になるの?

283:名無しさん@お腹いっぱい。
10/08/30 19:00:40
NEWの位置が変わったな

284:名無しさん@お腹いっぱい。
10/09/01 21:12:18
ehg.plかってに改造

1.>219 >220 適応
2.URLを "URLリンク(g.e-hentai.org)"のタイプにも適応
3.hentaiverse.netと他のサーバーでスリープ時間変更
4.509エラー時に長期スリープ
5.DLエラー時にログファイルに記録し、次のページから続行

こんだけ改造したらソースがスパゲティーにorz
誰か要る?

285:名無しさん@お腹いっぱい。
10/09/01 21:25:09
一日かけてどれくらい取れるの?
生だとスリープ変えても帯域制限に引っかかるから結局遅くなると思うんだけど

286:名無しさん@お腹いっぱい。
10/09/01 21:27:55
>>284
欲しいです!


287:284
10/09/01 22:00:17
ehg.pl改造版
URLリンク(www1.axfc.net)
バグや改善点見つけたら報告お願いします。


>一日かけてどれくらい取れるの?
IP更新してスグで百数十ファイル落とすと509エラーになった。
その後は1時間に40~80ファイルとバラバラ。
画面見て509エラーになってたらIP変更やって(日中は仕事)1000ファイルで19時間かかってた。


288:284
10/09/01 22:19:21
追伸.
perl弄り始めて数週間なので改造部分のソースは汚いです。すいません。
スリープ時間やログファイル名等はソースのコメントを見ながら各自でいじって調整してください。


289:名無しさん@お腹いっぱい。
10/09/01 23:32:28
あーびっくり。一瞬前スレ開いたのかと思った。

290:名無しさん@お腹いっぱい。
10/09/04 03:25:21
>>288
とりあえず動作確認
これ-p使える?浦島なんだが以前のplじゃプロクシ噛ませられたよな

291:名無しさん@お腹いっぱい。
10/09/04 15:54:29
>290
使えない


>271-272

292:名無しさん@お腹いっぱい。
10/09/04 19:52:47
そか
ミジンコだからワケワカメというか
一言でいうとメンドイ感じになってしまったんだな
プロクシtxt読むの便利だったのに

293:名無しさん@お腹いっぱい。
10/09/04 20:59:23
何言ってるのかよく判んないけど「多分僕はやればできる子」でOK?

294:名無しさん@お腹いっぱい。
10/09/04 22:06:01
前のehg.plではプロクシをテキストで保存したリストを読み込んで画像を落とせてたんだよ


295:名無しさん@お腹いっぱい。
10/09/04 23:20:32
ソースあるなら自分で書き換えたらどうだ?

296:名無しさん@お腹いっぱい。
10/09/04 23:32:15
いやいや自分では作らないからこそ自分の意思を明確に伝える努力が大切だよ。

297:名無しさん@お腹いっぱい。
10/09/04 23:54:10
なら金払って買ってこい。

298:名無しさん@お腹いっぱい。
10/09/04 23:56:35
ダウソ厨の考えは理解できません

URLリンク(sankei.jp.msn.com)

299:名無しさん@お腹いっぱい。
10/09/05 00:01:31
まあ待て。

A)
そうでしたか。
私も自分で調べようと考えたのですが他愛のない技術しか持ち合わせておらず
一言で言うと調べるのが面倒臭くなったのですよ。
前のehg.plではプロクシの一覧をテキストで読む機能が便利でした。

B)
そうでしたか。
作者はまだ初心者なのでオリジナルのコードを深く理解することができず
一言で言うと機能を取り込むことが面倒臭くなったのでしょう。
前のehg.plではプロクシの一覧をテキストで読む機能が便利でした。

いずれにせよ遠回しに「対応して下さい」と言ってるに違いない。
大体日本人の多くは発注下手なんだよ。

300:名無しさん@お腹いっぱい。
10/09/05 12:36:18
>>299
ちょっと違うな。

C)
作者はWWW:Mechanizeでもproxy使えると思ってた


301:名無しさん@お腹いっぱい。
10/09/05 20:29:40
まとめると現状でも動作は大丈夫だったが希望としては将来的にそういった機能を盛り込んでもらえると楽
一気にダウンロードするスレ的に歓迎される

302:名無しさん@お腹いっぱい。
10/09/05 21:00:51
そだな。
技術的に面倒なことはなんもないというか
この機会にsocketも覚えるんだな。
httpはrfcを読んでおくといい。


303:名無しさん@お腹いっぱい。
10/09/05 21:18:35
みんながんばってね。

304:名無しさん@お腹いっぱい。
10/09/05 22:00:45
画像のURLを収集する処理と実際に画像をダウンロードする処理を別プロセスにするんだ。
収集側はギャラリー毎にスレッドを分けて共有テーブルから応答時間を基準にしたラウンド
ロビンで選んだプロクシ経由で接続してURLをキューイングし、ダウンロード側はホストに
応じてスレッドを振り分けるんだ。
すげぇ効率良いぞ。
排他忘れんな。
歯磨けよ。

305:名無しさん@お腹いっぱい。
10/09/05 22:08:01
>>304
windowsのperlでforkできんだっけ?


306:名無しさん@お腹いっぱい。
10/09/05 22:42:10
後の移植を考えるとプロセス間通信絡みのI/Fは自分でライブラリを書くんだ。書けるよな。

307:名無しさん@お腹いっぱい。
10/09/06 08:46:09
移植も何もPerlなんだしthreadsでいいじゃん。

308:名無しさん@お腹いっぱい。
10/09/06 09:53:37
ithread ってまともに動くようになったの?


309:名無しさん@お腹いっぱい。
10/09/06 16:09:49
厳密にスレッド制御するならともかく
ダウンロード用にスレッド分けるくらいならithreadsで問題ない

310:名無しさん@お腹いっぱい。
10/09/06 18:10:33
そもそもこの板の住人的にわざわざperlでやる必要あるのか?
curl+最初から入ってるコマンドの組み合わせで全部事足りるはずだけど

311:名無しさん@お腹いっぱい。
10/09/06 18:23:02
目についたタイトル片っ端から放り込んで3時間で1Gとかやってみたけどぶっちゃけそこまでやると目を通せないんだよね
見終わったエロ漫画とか最初の数ページ見ていいと思った奴を取得リストに貯めといて寝てる間に取っとく程度でいい

312:名無しさん@お腹いっぱい。
10/09/06 19:02:23
>>310
perlの布教と達成感と自己満足


313:名無しさん@お腹いっぱい。
10/09/06 19:42:40
>>310
そう単純に行かないサイトがあるからやってんじゃん?

314:名無しさん@お腹いっぱい。
10/09/06 19:54:54
perl以外がおとなしいって言うかperlが我がもの顔をしたがるのか
いずれにせよ全力で兎を追うのが狩りの醍醐味。しかもエロバニーだ

315:名無しさん@お腹いっぱい。
10/09/06 19:57:44
別にrubyとかpythonとかでもいいんじゃね

316:名無しさん@お腹いっぱい。
10/09/06 20:04:15
文字操作に関してperlは、早々からライブラリが充実してたからな。
俺は他人のスクリプトルールで詰まったり調べるのめんどいからCでやってるけど。

317:名無しさん@お腹いっぱい。
10/09/06 20:31:35
今のe-hentaiは登場した当初と違ってそれほど中身は凝ってない
単に画像のURLを取り出してアクセスするよりも規制をどう回避するかに注力した方がいい

318:名無しさん@お腹いっぱい。
10/09/06 20:51:42
>>317
そこはもう自分の中でクリアしちゃったからもんだから今暇なんだ。

319:名無しさん@お腹いっぱい。
10/09/06 21:12:06
元のhtmlだけ串経由で取って画像は生で取る
hentaiverseが割り当てられてるか?nl=1で取得し直した画像は串で取得(バックグラウンド実行にしていい)
たったこれだけの話なのにperlで書くからややこしくなる

320:名無しさん@お腹いっぱい。
10/09/06 21:12:15
>>311,317
自動化すると見なくなるよな。
とりあえず、タグ配置変更きたらメール飛ばして知らせるような仕組みでも追加してれば。

321:名無しさん@お腹いっぱい。
10/09/06 21:28:54
>>319
それではややこしくない方法をご教授ください


322:名無しさん@お腹いっぱい。
10/09/06 21:31:49
>>319
思い込み。hentaiverseでも画像だけ取りにいく分には規制のカウント外。
心配せずに直に取りにいってOK。プロクシのオーバーヘッドだけ損してるぞ。
nl=1で取りに行くのは本文なのでプロクシ経由が吉。

だからといって全部nl=1で取りに行くなよ。メインサーバが重くなるので
嫌われる。

323:名無しさん@お腹いっぱい。
10/09/06 21:39:49
>>320はタグの配置が変わった程度でコケる可哀相な仕様なの?

324:名無しさん@お腹いっぱい。
10/09/06 21:42:40
>>323
神仕様おせーて

325:名無しさん@お腹いっぱい。
10/09/06 21:54:57
>>323 自分で考え出して悦に入るのも醍醐味じゃ、ほっほっほ。

326:名無しさん@お腹いっぱい。
10/09/06 22:11:42
「醍醐」は牛や羊の乳を精製する五段階の最終過程を意味し、その汁は甘く濃厚という。
転じて「本来の愉悦」をさして「醍醐味」と呼ぶようになったのはおそらく豆であろう。

327:名無しさん@お腹いっぱい。
10/09/06 22:23:29
perl開発ユーザー以外は全く公開しないな。


328:名無しさん@お腹いっぱい。
10/09/06 22:25:40
>>327
んじゃ別の言語のを公開してみ。

329:名無しさん@お腹いっぱい。
10/09/06 22:36:51
日本語ツール
ソース

「ウpレカス」

330:名無しさん@お腹いっぱい。
10/09/06 22:40:26
ミジンコ的には何で開発しようが適当にリドミ読んで理解できて楽に一気にダウンロードできりゃ問題ない

331:名無しさん@お腹いっぱい。
10/09/06 22:41:56
スレ的にはそういうスレだ

332:名無しさん@お腹いっぱい。
10/09/06 22:42:12
>>330
ミジンコどころか……


割れ神(ピラミッドの頂点=神)
      ↑
    放流厨←─┐
      ↑        │
┌→吸出し厨 ┐ウイルス厨
│          │
├→購入厨─┤
│          │
└─販売厨←┘
    ↓  ↑
    卸し厨
    ↓  ↑
    製造厨
    ↓  ↑
    開発厨(食われるだけの存在=ミジンコ)


333:名無しさん@お腹いっぱい。
10/09/06 22:53:31
実はperl使い以外はperlは過去の産物、寄って集って拡張した挙句に
ぐちょぐちょになって言語と呼ぶには恥ずかしい化け物に成り果て
「perlを書いて一人前」と勘違いして泥沼に嵌り顎まで漬かってなお
あがいている奴が哀れでならないと思っている。

334:名無しさん@お腹いっぱい。
10/09/06 22:59:12
perl使い叩きのスレはここですか?

335:名無しさん@お腹いっぱい。
10/09/07 08:40:23
ほとんどのヒトはその時に一番使いやすい言語でやればいいだけと思っているので
言語にいちいち文句言ってるやつが哀れでならないと思っている。

336:名無しさん@お腹いっぱい。
10/09/07 11:14:16
生み出されれば使うだけ
叩かない、使って落とせりゃおk
いちいち言語とか気にしてるのは残念な人

337:名無しさん@お腹いっぱい。
10/09/07 13:33:58
perlでやればパイプを一杯使わなくても文字の操作が一発でできる
しかしperlモジュールでダウンロードするよりcurlとかwgetでやった方がお手軽に各種設定ができる
今のehg.plの欠点は効率的な串の使い方が出来ないことなので後者が提案された

この辺が落とし所かと

338:名無しさん@お腹いっぱい。
10/09/07 18:37:25
公開されてるツールがperl版しかない。
スクリプト言語だから読めれば改造が楽。
一から作るより既存のツールいじったほうが楽。

故にperl版使用。

ただニワカperlユーザーだから大きくソース改変するほどの知識が…。

339:名無しさん@お腹いっぱい。
10/09/08 09:49:43
作者がwindowsだからperlだけで書いてるだけじゃね?
windowsでUNIX/LINUX環境整えるのはめどいし。
perlとかの言語だけならそのインタプリタ入れるだけで
間口がUNIX以外にも広がるじゃん

340:名無しさん@お腹いっぱい。
10/09/08 10:39:37
言語に優劣は無いがユーザーに優劣は存在する。


ダメ出ししかしないクズは氏ネ。

341:名無しさん@お腹いっぱい。
10/09/08 12:39:40
そういや最初のget.plもUNIXで動かすとディレクトリのパーミッションでこけてたな
ここってWinユーザー多いのかもな

342:名無しさん@お腹いっぱい。
10/09/08 17:30:00
そんなに串.txt読みに行かせるのって難しいの?
当時それができたplがあったけど、それうpっても参考にはならんか

343:名無しさん@お腹いっぱい。
10/09/08 18:32:57
文句言うなら使わないか、自分で何とかしろ。
慈善事業じゃねえんだ。

344:名無しさん@お腹いっぱい。
10/09/08 19:05:41
自分で何とかしてるけどこうしたらいいんじゃないかと提案しただけ

345:名無しさん@お腹いっぱい。
10/09/08 19:19:59
すれ違う想い

346:名無しさん@お腹いっぱい。
10/09/08 21:23:30
>342
うp希望。

347:名無しさん@お腹いっぱい。
10/09/09 22:19:49
このスレ怖い

348:名無しさん@お腹いっぱい。
10/09/09 23:31:29
ははは何言ってんだい
スレが怖いんじゃねえ
板が怖いんだ

349:名無しさん@お腹いっぱい。
10/09/09 23:33:05
頭痛が痛い

350:名無しさん@お腹いっぱい。
10/09/09 23:42:29
ま、まんじゅうなんて別に怖くなんかないんだからねっ!
だからさっさとまんじゅうもってきなさいよ!


351:名無しさん@お腹いっぱい。
10/09/10 00:19:13
ここらでひとつ、おまえがイタい。

352:名無しさん@お腹いっぱい。
10/09/10 09:44:26
>>342
>そんなに串.txt読みに行かせるのって難しいの?

epiphanyで在れば読める可能性は在るかも知れ無いですね…

353:名無しさん@お腹いっぱい。
10/09/10 11:01:53
ファイルアクセスは基本面倒。
既存ファイル?新規?追記?上書き?テキスト?バイナリー?
形式あってる?読み込みバッファのオーバーフロー大丈夫?
文字コードは?

難しいわけではないけど面倒。

354:名無しさん@お腹いっぱい。
10/09/10 12:09:55
シェルでやりゃいいじゃねえか
この板に来たのも何かの縁だしcygwinなりcoLinuxなり入れろよ

355:名無しさん@お腹いっぱい。
10/09/10 12:23:39
なにそれこわい

356:名無しさん@お腹いっぱい。
10/09/11 21:04:32
自分は今までスクリプト起動時にプロクシリストを読んで随時切り替えながら
処理結果からプロクシを採点して次に使う際の基準にしてたんだ。
でも複数を同時に起動したとき互いの採点が共有できないのが難点。
スクリプトも標準入力から複数のギャラリーを繰り返し入力できるものの
閉じたとき学習結果を保存せず毎回ゼロからスタートしちゃうのも難点。

んでここに触発されて今日'プロクシ選択サーバ'を書いたよ。スクリプトでね。
socket通信なのでサーバはどこにでも置ける。スクリプトは毎回サーバから
プロクシをチェックアウトし、htmlを読んだら結果と共にチェックイン。
サーバがチェック時間や処理結果から重み付けを更新して適宜ファイルに反映。
動的な追加削除もできるようにした。これで同じプロクシを頻繁に選んじゃう
こともないし状態も共有できる上に学習速度も速いだろうと期待。

リスト自体は前から別スクリプトでcybersyndromeを読み応答が良好でhentaiに
繋がって且つ弾かれないものを収集して作ってる。この収集だけで小一時間
かかるのが面倒で、作ったら一週間程継続使用してる。
ちなみに'chunked'なんてものがあるってのはそこで初めて知った。

だが断る。

357:名無しさん@お腹いっぱい。
10/09/11 21:18:06
そこまでエロにこだわる執念の恐ろしさを知った…
俺も5年くらい前まではそうだったかも試練けど、最近は丸くなったな思うよ。

358:名無しさん@お腹いっぱい。
10/09/11 21:31:06
うん、何かにつけて凄い凝り性なんだ。
極みまで達した日には飽きもするんだろうけど
少しも青二才から抜け出せた気がしないんだよね。

359:名無しさん@お腹いっぱい。
10/09/11 22:25:03
httpdの勉強になって良いよな。

360:名無しさん@お腹いっぱい。
10/09/11 22:33:25
んじゃあその熱意に応じて

普通のプロキシは良いものを選んでも気がつくと使えなくなっていることが多い
また速度との兼ね合いからある特定のプロキシに群がることが多い
その点、Torを使えば、ほぼ100%の確率で接続が有効で、潤沢にある中からランダムに割り当てられたプロキシが取得できる
規制されたり極度に遅い串に当たったら、その出口ノードを排除する設定にして再起動することでノードの引き直しができる

Torはデータディレクトリとポート割り当てさえ変えれば多重に起動できる
またTorポート一つにつきsocksからhttpに変換するためのソフトを一つ起動する必要がある

361:名無しさん@お腹いっぱい。
10/09/11 22:50:28
だがその勉強で収入が上がるかといえばそんなことはない

362:名無しさん@お腹いっぱい。
10/09/11 23:00:52
>>359
今回のサーバは別にhttpを使ってる訳ではないが、まあ画像をデータベース化して
ブラウザから検索閲覧できる自前のhttpサーバはhentaiとセットで使ってる。
さすがにスクリプトではないけど。
>>360
へぇ面白そうだね。P2Pってところは反射で気になるけど。
>>361
収入はさておき会議と納期と折衝とSPICEと金勘定でがんじがらめの仕事に比べたら
好き勝手できるここは天国だよ。明日への活力ってところか。

363:名無しさん@お腹いっぱい。
10/09/12 13:47:30
なんか臭くなってきたな

364:名無しさん@お腹いっぱい。
10/09/12 15:10:51
今時は分析と設計だけ日本でやって下流の工程は中国に投げちゃうからね。
「俺も書きてぇ」っていう欲求不満はこんな所でしか晴らせないよな。

365:名無しさん@お腹いっぱい。
10/09/12 15:42:11
串リストの入手が面倒であきらめ。

URLリンク(www.multiproxy.org)
ここのリストからいくつか適当に選んで"LANの設定"のプロクシサーバーにセットしてみたけど無効なのばっかりだった。

366:名無しさん@お腹いっぱい。
10/09/12 17:33:19
IEでOKボタンいっぱい押しながら試したりして大変だったね。
自分ならtelnetでHTTP送ってみるかな。

367:名無しさん@お腹いっぱい。
10/09/12 21:57:54
>>365
笑えよ。"updated: 11-Feb-2009" だってさ。

368:名無しさん@お腹いっぱい。
10/09/12 22:34:41
串なんてツールで使えるS判定のコピペるだけ
それをtxtにして読みに行かせれば・・・出来たわけだし

369:名無しさん@お腹いっぱい。
10/09/13 21:41:56
1.プロクシリストから1行読み込み
2."http://"付けて $ENV{HTTP_PROXY} にセット
3.$mech = WWW::Mechanize->new()
4.$mech->get() 成功!

5.リストから次のプロクシ読み込み
6."http://"付けて $ENV{HTTP_PROXY} にセット
7.$mech->get() 失敗!
8.エラーコードは200

HTTPステータスコード
>200 OK
>OK。リクエストは成功し、レスポンスとともに要求に応じた情報が返される。
ブラウザでページが正しく表示された場合は、ほとんどがこのステータスコードを返している。

370:369
10/09/13 21:45:34
途中で送っちゃったorz
6と7の間に$mech = WWW::Mechanize->new()入れ忘れてるし。

で、
9. 以後5~8を繰り返し

なんか初期化処理必要なのか?

371:369
10/09/13 21:54:42
orz
$@ を$!と書き間違えてた・・・

なんとかなりそう。
ただ元のソースいじり過ぎてスパゲティ状態(URLリストファイル対応、自動題名取得、エラーファイル再取得バッチ出力)
何処に追記すればいいのやらorz

372:名無しさん@お腹いっぱい。
10/09/13 22:46:22
いろいろ試行錯誤紆余曲折してるようだけど
proxyが a.b.c.d:p とするとポートpでa.b.c.dに接続して

GET URLリンク(exhentai.org) HTTP/1.1<cr><lf>
Host: a.b.d.d:p<cr><lf>
User-Agent: Mozilla/5.0<cr><lf>
Accept: text/html,*/*<cr><lf>
Accept-Encoding: gzip<cr><lf>
Connection: Close<cr><lf>
Cookie: ipb_member_id=1<cr><lf>
<cr><lf>

なり送れば済むんじゃないかい? Mechanizeは強力なんだろうけど
袋とじを開けようとしてチェンソーに振り回されているみたいだよ。
>>281は言いたかったと思う。

ついでに "RFC 2616" で検索したものを読んどいた方がいいと思う。
>>302も言いたかったと思う。

373:名無しさん@お腹いっぱい。
10/09/14 03:42:24
あまりにも大量すぎて画像の状態だと管理できなくなってきたのでtarで固めてcomixで読むことにした

374:名無しさん@お腹いっぱい。
10/09/14 09:57:20
1日に300以上あげられてるからなぁ

375:名無しさん@お腹いっぱい。
10/09/14 18:39:37
自分で固めたなら問題ないと思うけど、comixってパスワード付き書庫開くとX道連れにしない?
ctrl+alt+f1の画面でパスワード入力を受け付けるプロンプトが出てるみたいだけどパスワード入れてもだめ

376:名無しさん@お腹いっぱい。
10/09/14 20:12:34
>>375
うわ マジか
同人誌はzip配布の場所では取ってないから試したことなかった。気を付ける

最初はtar.gzかzipで固めてたんだけどふとtarでいいじゃんって思って試したら使えたので全部tarにしてしまった
もともと中身全部圧縮済み画像だからファイルサイズも大して変わらんし(当然だが)tarの方が展開速度が明らかに速い
似たような理由でWindowsだと無圧縮zipが使われてるらしいな

今までcomixってイマイチなソフトだなぁと思ってたんだがアーカイブ対応ビューワとしては及第点かな…

377:名無しさん@お腹いっぱい。
10/09/16 19:21:38
保守

378:名無しさん@お腹いっぱい。
10/09/18 20:23:34
Proxyテストプログラム
URLリンク(www1.axfc.net)

g.e-hentai.orgにアクセス出来るかテストするツール。

379:名無しさん@お腹いっぱい。
10/09/20 12:24:02
物色したギャラリーやページを待ち行列に追加する手作業が面倒だったんだけど
ブラウザの「リンクのURLをメールで送信」で自前のプログラムに渡せば楽チンって気が付いた。
Firefoxの拡張を自分で書ければ一番いいんだけど。

380:名無しさん@お腹いっぱい。
10/09/21 12:25:06
なかなかうまくスクレイピングできないなーと思ってぐぐったら
他の方々も苦労してらっしゃったのですね…

もう中身とかどうでもいいからいかに完璧にダウンロードできるかを極めたい。
今は普通にスクレイピングしながら509くらったら串きりかえしてるんだけど
すぐ串が足りなくなってしまう…

381:名無しさん@お腹いっぱい。
10/09/21 12:47:07
取得失敗対策もやって100%取れるようになったけど
一つだけハマったのはうpの段階で途切れたり壊れてるjpgがある

382:名無しさん@お腹いっぱい。
10/09/21 13:12:47
以前の串対応plが神過ぎたんだな

383:名無しさん@お腹いっぱい。
10/09/21 15:04:25
>>381
実際のダウンロードデータのサイズとContents-Lengthの比較はしてる?

384:名無しさん@お腹いっぱい。
10/09/21 15:48:21
>>383
してない
imagemagickの適当な処理に通してエラーが出たら三回まで再試行してる

385:名無しさん@お腹いっぱい。
10/09/21 17:23:07
途中で途切れるjpegは、重い画像サーバーに当たってるかもね。
レジュームリクエストするか長めのウェイトで必ず全データとれるよ。

386:名無しさん@お腹いっぱい。
10/09/21 18:04:32
多分ファイルが壊れてると思うけどなぁ
試行ごとに鯖が変わってるのも確かめたし?nl=1も試したが全部同じところで途切れてる
ついでにギャラリーのページでサムネイルもチェックしたが全く同じところで途切れてる

まぁそういうのは滅多にないから気にしないほうがいいか…
俺はconvertに通してstderrに何か出るようなら再取得するようにしてるけど
元から破損してる場合はContent-Lengthでチェックした方がちゃんと取れると思う

387:名無しさん@お腹いっぱい。
10/09/21 21:17:05
>287 と >378 を組み合わせて509出る度にプロクシ変えるよう改造した。
合計16時間ほどまわして1.15G(約3600ファイル)落ちた。
66ファイル 500:ERROR GETing 出てるけど。

388:名無しさん@お腹いっぱい。
10/09/21 21:31:37
66ファイルは取得ミス?
だとしたらちょっと多いな。500エラーだったら?nl=1につなぎ直せば回避できる気がする
速度的にはそんなもんが関の山だと思う
(串無しで画像に繋げばもっと速くなるがぶっちゃけ速くする必要もないし管理者にバレないという保証もないので)

389:名無しさん@お腹いっぱい。
10/09/21 22:05:26
速くなってありがたかったといえば無人稼動が無くなったこと位かな。

390:名無しさん@お腹いっぱい。
10/09/22 00:26:41
串通して落としてたら急に破損画像が連発。
元々壊れてたのか串が悪かったのか…。
画像DL時串無効に設定しなおして再挑戦。

391:名無しさん@お腹いっぱい。
10/09/22 00:34:41
たまに空文字返すPROXYはあるよね。
PROXYのせいなのか、あるいはhentaiが意図的にそう返しているのかは知らん。
あといちいち串と書くな恥ずかしい。

392:名無しさん@お腹いっぱい。
10/09/22 01:06:09
串でいいじゃん1文字だし

393:名無しさん@お腹いっぱい。
10/09/22 09:56:57
普通は串って書くよな
>>391が情弱すぎるだけ

394:名無しさん@お腹いっぱい。
10/09/22 14:51:50
なに通ぶってんだよw

395:名無しさん@お腹いっぱい。
10/09/22 17:09:29
素人の俺でも串って言うわ
2ちゃん住人ならほとんどが串って言うんじゃねーの

396:名無しさん@お腹いっぱい。
10/09/22 17:12:53
なんと言ってもいいけど○○って言わない奴は情弱って言うような人は頭が悪いなぁとは思う


397:名無しさん@お腹いっぱい。
10/09/22 18:13:31
ちがうちがうよ、見てるこっちが恥ずかしいって意味。
よくあるだろ、電車の中とかの物知り顔な中学生の会話。

398:名無しさん@お腹いっぱい。
10/09/22 18:20:17
くっしーさーん!
出てきてくださーい!

399:名無しさん@お腹いっぱい。
10/09/22 18:39:28
言わないからじゃなく、昔から使われてる名称を物知り顔で非難してるから叩かれてるんだよ。
もう少し読解力つけろ。

400:名無しさん@お腹いっぱい。
10/09/22 18:50:01
串でもproxyでもプロクシでもプロキシでもかまわんが
大文字でPROXYは解説書か環境変数以外で見ると違和感があるな。

401:名無しさん@お腹いっぱい。
10/09/22 18:52:48
通でも何でもないだろ
普通でもない
好きなようにしろよ
俺は一気にダウンロードが最終的に楽になりゃなんでもいいわ

402:名無しさん@お腹いっぱい。
10/09/22 18:55:14
「串」はアングラを気取った一部の連中が使いだしたもの。奴らは隠語を使うのが
格好いいと思ってた。
「串」は、一文字で済む、刺すという動詞と相性がいいので進化の勝者になった。
が、今更使うなよって感じだな。

若いおねーちゃんのファッションをババアが真似しだして更に10年経過した段階。
恥ずかしくて見てらん無い。

403:名無しさん@お腹いっぱい。
10/09/22 19:01:43
鯖とか垢とかもね

404:名無しさん@お腹いっぱい。
10/09/22 19:08:55
串教えてくださいと言って焼き鳥の串のアドレス貼られたのはいい思い出

405:名無しさん@お腹いっぱい。
10/09/22 21:19:00
>が、今更使うなよって感じだな。
独りよがりな意見だな。
その感覚を押しつけないでください。無視しててください。

406:名無しさん@お腹いっぱい。
10/09/22 21:21:15
ババア必死。ww

407:名無しさん@お腹いっぱい。
10/09/22 21:49:41
お前も必死www

408:名無しさん@お腹いっぱい。
10/09/22 21:58:55
正しいことを言った者が正義ではない
ツールを上げた者が正義なのだ

409:名無しさん@お腹いっぱい。
10/09/22 21:59:24
>>404
俺はプロキシ拾える場所教えてくれって言ったらプロ棋士一覧のサイト貼られたわw

410:名無しさん@お腹いっぱい。
10/09/22 22:32:40
どんだけ張り付いてんだか、ツールくれは技術的なこと以外の話になると今が出番とワラワラ沸いてくるな。
もう>>397は撤回するから好きに鯖でも串でも使ってくれ。膣内と書いてナカと読ませるのには慣れた。

411:名無しさん@お腹いっぱい。
10/09/23 00:04:31
ieの右クリックメニューで現在見ているwebページのURLをテキストファイルに追記するツール
URLリンク(www1.axfc.net)

Cドライブのルートに解凍→レジストリ実行で準備完了(ファイル消しちゃダメ)
詳しくはreadme.txtとhtmlソース(javaスクリプト)見て。

412:名無しさん@お腹いっぱい。
10/09/23 00:40:24
面白い試みだがここってUNIX板なんだよね

413:名無しさん@お腹いっぱい。
10/09/23 01:43:00
つられんなってw

414:名無しさん@お腹いっぱい。
10/09/24 21:02:53
プロキシ通したらデータ化けで数時間で止まるようになったorz
使った串が悪いんだろうけど。

415:名無しさん@お腹いっぱい。
10/09/24 21:11:15
網タイ穿いたボンレスハムババアが現れた。

416:名無しさん@お腹いっぱい。
10/09/24 21:58:51
どれだけ必死なのゆとりDQN。

417:名無しさん@お腹いっぱい。
10/09/24 23:15:58
ふむ、その趣味は無いが非常に興味深い事象に思えるな。参考までに画像を張りたまえ。
誤解の無いように言っとくが決してその手の趣味があるわけではないから勘繰るなよ。
いいから張りたまえ。早く!今すぐにィ!

418:名無しさん@お腹いっぱい。
10/09/25 08:27:11
URLリンク(erog3jigen.blog49.fc2.com)

419:名無しさん@お腹いっぱい。
10/09/25 14:12:12
jpegファイル破損検出用
URLリンク(blog.livedoor.jp)

420:名無しさん@お腹いっぱい。
10/09/27 00:37:09
串通さなきゃいけないような仕様はやめてほしい

421:名無しさん@お腹いっぱい。
10/09/27 06:45:16
そしたら鯖に負荷かかるだろうが馬鹿か
一枚づつシコシコと保存しろよ

422:名無しさん@お腹いっぱい。
10/09/28 00:15:52
いまひとつ歯車が噛み合っとらんけど、変に律儀なのは日本人の美徳だな。
たとえばGoogleの統計では全世界のe-hentaiの検索で日本からの検索なんて
グラフにもならん程少ない。自意識過剰気味。高楊枝っぽくって好きだけどな。


423:名無しさん@お腹いっぱい。
10/09/28 00:49:58
大量のプロキシからの同時接続で一瞬で1冊完成させるスクリプト組んでみた

424:名無しさん@お腹いっぱい。
10/09/28 01:58:07
>>423
高速で取っても読むのがどうせ追いつかなくなるだけだよ
あと物色する段階までは生IPで見てるだろうから向こうが本気になれば足がつく
以前プロキシ付きget.plの使いすぎでアク禁された俺が忠告しとく

425:名無しさん@お腹いっぱい。
10/09/28 11:32:33
一つで完結する面倒くさくないプロキシ付きget.plは必要だけどな
物色する段階で自重すりゃいいだけだし

426:名無しさん@お腹いっぱい。
10/09/28 18:24:45
まだ売ってるものは買えよ。

427:名無しさん@お腹いっぱい。
10/09/28 22:54:02
エロ漫画見たさに一晩中PC付けっぱなしにしてることに何の疑問も持たない奴は馬鹿

428:名無しさん@お腹いっぱい。
10/09/28 23:22:57
自鯖あるし。

429:名無しさん@お腹いっぱい。
10/09/28 23:25:18
uploader運営すれば勝手に集まる。

430:名無しさん@お腹いっぱい。
10/09/29 00:22:25
>>427
そこは別に
エロ漫画見たさにこんなスレにたどり着くことに比べれば屁でもないだろ

431:名無しさん@お腹いっぱい。
10/09/29 00:47:48
何の疑問もないw

432:名無しさん@お腹いっぱい。
10/09/29 10:10:32
>419
jpeginfo -c で十分だなぁ

433:名無しさん@お腹いっぱい。
10/09/29 18:27:02
>>287
これ使ってて500エラー時に?nl=1を足して再試行するには
どうしたらいいんだろうか?

434:名無しさん@お腹いっぱい。
10/09/29 18:53:10
>>419
俺は>>228

435:名無しさん@お腹いっぱい。
10/09/30 01:16:43
画像鯖のダウン放置なげえな

436:名無しさん@お腹いっぱい。
10/10/01 01:26:09
PNGの途中切れ判定関数作った

sub is_png
{
my $data = shift or die $!;

my $sig = substr( $$data, 0, 8 );
my $iend = substr( $$data, -8, 8 );

return
$sig ne "\x89\x50\x4E\x47\x0D\x0A\x1A\x0A" ? 0
: $iend ne "\x49\x45\x4E\x44\xAE\x42\x60\x82" ? 0
: 1 ;
}

437:名無しさん@お腹いっぱい。
10/10/01 10:39:30
>>436
GJ!

438:名無しさん@お腹いっぱい。
10/10/01 22:18:55
そこまでかたくなにContent-lengthを拒む姿勢には何かすがすがしいものを感じる訳が無い。

439:名無しさん@お腹いっぱい。
10/10/01 22:50:59
>>438
プロキシ経由の場合はプロキシ鯖のほうが勝手にContent-Lengthを書き換えるから、
切れていてもContent-Lengthと実ファイルのサイズは同じになる。

440:名無しさん@お腹いっぱい。
10/10/01 23:01:04
あぁそうなのか。画像は自IPで取ってるからそうとは知らなかった。
しかしそれはそれでどうなのよ。勝手にリサイズしたり減色したり
センサードするプロキシもありそうなもんだな。

441:名無しさん@お腹いっぱい。
10/10/01 23:29:22
勝手にエロに変換してくれるとか。

442:名無しさん@お腹いっぱい。
10/10/01 23:50:58
フィルタリングプロキシと勘違いしてんじゃねえか

443:名無しさん@お腹いっぱい。
10/10/02 09:33:10
プロキシはjpgとか返さないけどな

444:名無しさん@お腹いっぱい。
10/10/02 09:34:15
何言ってんだ返すよ

445:名無しさん@お腹いっぱい。
10/10/02 09:47:17
content-type見てた

446:名無しさん@お腹いっぱい。
10/10/02 21:31:04
ウチはハヤテが丁寧に保存してくれてるから苦労したことはないな

447:名無しさん@お腹いっぱい。
10/10/02 21:45:05
ハヤテてなソフトがあんの?
Winユーザだからしらん

448:名無しさん@お腹いっぱい。
10/10/02 22:36:20
>>447
専用執事がいるってことだよ
言わせんな恥ずかしい(////)

449:名無しさん@お腹いっぱい。
10/10/02 23:46:30
幽霊神父が勝手にDL用HDD追加してそうだな。

450:名無しさん@お腹いっぱい。
10/10/03 22:50:55
lofiがロリコン規制されてるんだが
ログインしても見れない

451:名無しさん@お腹いっぱい。
10/10/04 01:45:16
おまえらperlの最新版の定期報告忘れてね?
ちゃんとしてくれなきゃ困るんだけど

452:名無しさん@お腹いっぱい。
10/10/04 07:14:56
>>446
君みたいな美少女でもえっちな画像集めたりするんだね

453:名無しさん@お腹いっぱい。
10/10/04 22:27:30
ehg.pl勝手に改造

URLリンク(www1.axfc.net)

>>287からの更新内容
URLの代わりにURLリストファイル指定可能
保存フォルダ指定しないとタイトル名でフォルダ作成
オプション(/1)で1ファイルだけDL指定可能
保存フォルダ内にインターネットショートカット作成
DL失敗時 ?nl=1 オプション添付。それでもダメなら再取得用バッチファイル出力
ログ出力機能搭載。
グロ等の警告、ブック削除警告ページ対応。

Win環境で開発しており、UNIX環境では修正が必要(文字コード変換、再取得用スクリプト出力等)。
バグ報告、改善アドバイス等よろしく。

454:名無しさん@お腹いっぱい。
10/10/04 22:34:21
>>453
勉強させてもらいます

455:名無しさん@お腹いっぱい。
10/10/04 23:13:45
大体みんな作るもん似通ってくるんだな
俺もタイトルから自動でディレクトリ作る機能と取り逃し用の一ファイルのみDL機能はつけてる
あと後でタグ付ける用にギャラリーページの1ページのHTMLも全部保存してある

俺は漁ったものだけ取るから特殊なページの対策はしてないけど
あと最初にファイル名の最初にページ数を入れといてダウンロードが終わったらリネーム(0をつけて桁揃え)してる

456:名無しさん@お腹いっぱい。
10/10/05 00:12:59
$mech->res->filename
でファイル名が取得できるんだが、$PageNowで強制的に番号付きのファイル名にするのどうして?

457:名無しさん@お腹いっぱい。
10/10/05 00:24:40
>>456
単純に、いまどこのページまで取得したかが簡単に分かるから。
ついでに、フォルダ名で分けている同一名のファイルの重複を防ぐため。


458:名無しさん@お腹いっぱい。
10/10/05 00:24:55
CG集とか取ってみるとわかるよ

459:名無しさん@お腹いっぱい。
10/10/05 00:38:09
なるほど

460:名無しさん@お腹いっぱい。
10/10/05 00:47:30
トトンクス
でも串txt丸読みには手出さんね皆

461:名無しさん@お腹いっぱい。
10/10/05 00:48:46
>>460
鯖に負荷がかかるからね。
我々とE-HENTAIは共存関係にあるのだよ。

462:名無しさん@お腹いっぱい。
10/10/05 02:00:17
E-hentaiのlofiの方でShota,Loli入れても何にも検索できない。試しにロリ漫画の名前を入れたら出るには出るがThis gallery is currently unavailable.と表示されて見れない。どないせーちゅうねん

463:名無しさん@お腹いっぱい。
10/10/05 02:11:12
過去ログ読めばいいと思うよ

464:名無しさん@お腹いっぱい。
10/10/05 02:51:49
過去ログってどういう事?
ログインしたら見れるって奴か?ログインしたけど見れないぞ
昨日辺りから急に規制されたんだけど
でトップのニュース見たら「いくつかのサービスは少しの間利用できません」
みたいな事書いてあった、規制のことかな

465:名無しさん@お腹いっぱい。
10/10/05 02:55:46
loliconとかのタグを避けたくてlofiを使ってた人はexに移った

466:名無しさん@お腹いっぱい。
10/10/05 02:57:37
表のEHENはもはやロリコンは扱ってませんよ、っていうカモフラージュなんだろ

467:名無しさん@お腹いっぱい。
10/10/05 15:50:59
gifファイルもダウンロードする可能性があるのか・・・
is_gif関数も作るか・・・

468:名無しさん@お腹いっぱい。
10/10/05 16:29:30
gifイメージ途中切れ判定関数
完全なイメージなら常に1を示すが、不完全な場合は概ね0を示すが偶然1を示すこともある。
参考程度に。
sub is_gif
{
my $data = shift or die $!;

my $sig = substr( $$data, 0, 3 );
my $bt = substr( $$data, -2, 2 );

return
$sig ne "\x47\x49\x46" ? 0
: $bt ne "\x00\x3B" ? 0
: 1 ;
}


469:名無しさん@お腹いっぱい。
10/10/05 16:45:22
>>468
どうやってつかうのん?

470:名無しさん@お腹いっぱい。
10/10/05 16:51:00
>>469
文字列のリファレンスを渡してください

471:名無しさん@お腹いっぱい。
10/10/05 18:16:20
requireで読み込んだpmモジュールのグローバル変数と
plソース側のグローバル変数ってスコープ違うんだ。
やっぱ基本から勉強しないと駄目だな。

472:名無しさん@お腹いっぱい。
10/10/05 21:45:01
>>461
それじゃ今位の時間帯で1000枚/時、深夜なら2500枚/時を超える
スピードで走ってる俺は庶民の団欒を乱す珍走団扱いか。
乗ってるのはADSL8Mの原チャだが。

473:名無しさん@お腹いっぱい。
10/10/05 22:55:40
毎晩俺の部屋の前で吹かしてるのはお前か!!
夜はとっとと寝ろ!!

474:名無しさん@お腹いっぱい。
10/10/05 23:02:24
そしてどういうわけか、lofiで普通にロリ見れるように戻ってるな

475:名無しさん@お腹いっぱい。
10/10/05 23:07:46
とりあえずipb_member_idの有効期限を1年先位に変えておけば.

476:名無しさん@お腹いっぱい。
10/10/06 00:24:23
時速1000枚で3.5時間回したら一枚一秒で流し見してもチェックで約一時間かかるんだけど
そんなん必要なのかね

串でもパラレルダウンロードすれば普通に速度出るけど
みんな相手を怒らせるリスクを犯してまでやりたがらないだけだよ
今年になってせっかくボット相手のガードが緩んだのにまたガチガチに固められたら困るし

477:名無しさん@お腹いっぱい。
10/10/06 20:35:02
複数起動したスクリプトが独立して複数のタイトルを平行して落とすんではなく
複数のプロセスが協調して1個のタイトルに当たるんだねこれが。
それで300pのコミックも10分そこらで完了するってわけだ。
そして君と同じ時間をかけて沢山ダウンロードするんじゃなくて君と同じ量を
短時間でぱぱっと済ませるんだ。多分私のモノサシは君よりちょっと長い。

478:名無しさん@お腹いっぱい。
10/10/06 20:41:13
いやそのご自慢の速度を実現できるけど誰もやらないだけだよって話
ていうか自慢するほど大した技術でもないのはわかってると思うけど

479:名無しさん@お腹いっぱい。
10/10/06 20:45:13
>>477
だから、鯖に負荷がかかるでしょ
ここで晒してみんなが使ったらすぐに規制はいるでしょ
そしたらすぐに使えなくなるでしょ
って話

480:名無しさん@お腹いっぱい。
10/10/06 20:50:20
exの方のUU数だったら調査すれば誰が暴れてるかくらいすぐわかる
管理者側の厚意に甘えてることも知らずに完璧なプログラム組んだ気になってるんだろうな

481:名無しさん@お腹いっぱい。
10/10/06 21:06:14
・大量に取るなら速度を抑えろ
・高速で取るなら量を抑えろ

これさえ守ってくれてるならどうでもいい
もし100KB/sで24時間駆動とかやってるならクローラの限度超えてる

482:名無しさん@お腹いっぱい。
10/10/06 21:28:32
まぁ、共存関係なんだから餌場荒らしはご法度だぜ

483:名無しさん@お腹いっぱい。
10/10/06 21:29:07
うむ、ごくろう。

484:名無しさん@お腹いっぱい。
10/10/06 21:35:38
u

485:名無しさん@お腹いっぱい。
10/10/06 21:38:15
そもそも、そんなにして何を取るんだって話

486:名無しさん@お腹いっぱい。
10/10/06 21:44:13
物色しながら読もうと思った一個か二個を読みやすくするために落とすんでしょ。
そういう場合は落とすスピードが重要だと思う

487:名無しさん@お腹いっぱい。
10/10/06 21:44:41
いつものアスペの人だし実際規制されるまでは何言っても無駄だろ

488:名無しさん@お腹いっぱい。
10/10/06 22:27:41
おっ、そういや最近PerlおぼえたWindows君来ないけど元気かな。

489:名無しさん@お腹いっぱい。
10/10/06 23:02:11
エラー吐く→DL官僚と思ったら一枚抜けとかあったりする→メンドイ
ログ取ってこのアドのこの一枚抜けてたぜ、再度取りに逝くよとかやってくれる?

490:名無しさん@お腹いっぱい。
10/10/06 23:14:03
>489

>453
>DL失敗時 ?nl=1 オプション添付。それでもダメなら再取得用バッチファイル出力
>Win環境で開発しており、UNIX環境では修正が必要(文字コード変換、再取得用スクリプト出力等)。


491:名無しさん@お腹いっぱい。
10/10/06 23:58:30
いや俺はマジに心配してるんだよ。

492:名無しさん@お腹いっぱい。
10/10/08 18:49:32
>453 を適当にproxy対応させてみたけど500エラー多発で途中停止した。
リトライするようにしないと無理だな。

493:名無しさん@お腹いっぱい。
10/10/12 22:09:38
>>453 の物をベースに改造

URLリンク(www1.axfc.net)

[ 追加オプション ]

 "/on" オリジナルファイル名
 "/pn" ページ番号 + オリジナルファイル名 "形式:<pg-num>.<org-name>.???"
 "/pg" ページ番号

[ 修正 ]

 保存場所を「フルパス」指定できるように修正。


たぶんだいじょーぶだとおもう(´・ω・`)

494:453
10/10/12 23:24:36
>453 の方にバグあり。

URLリストの読み込み後、改行コード消してない。
AnalyzeUrl()関数がエラー復帰時、エラー処理で$IndexUrlを出力してるけどクリアされている。
($IndexUrlがNULLなら$IndexUrlを出力せよ orz)

>493 のソースで
93行と94行の間に
chomp($ListURL);

172行
($IndexUrl, $pageURL, $bookID, $pageNow) = AnalyzeUrl($IndexUrl);
↓ 修正
my $UrlTmp=$IndexUrl;
($IndexUrl, $pageURL, $bookID, $pageNow) = AnalyzeUrl($IndexUrl);

177行目
OutPutLog($ErrorLogName,"\n".GetTimeStr()."\nUrl Analyze Error\nURL : $IndexUrl\n")
↓ 修正
OutPutLog($ErrorLogName,"\n".GetTimeStr()."\nUrl Analyze Error\nURL : $UrlTmp\n");

181行目
OutPutLog($RegetBatFileName,"$ExePerlName $IndexUrl\n");
↓ 修正
OutPutLog($RegetBatFileName,"$ExePerlName $UrlTmp\n");

すまんかった。

495:名無しさん@お腹いっぱい。
10/10/13 13:58:49
全自動を目指してんのか。
おまえらのエロに対する情熱には頭が下がる。
俺はAutoPagerLiteとDownThemAll!の併用で我慢してるよ。
g.e-hentaiでは509がでないように気を付けてる。

496:名無しさん@お腹いっぱい。
10/10/13 14:15:41
>>495
おそらくところどころ手動でやってると思うんだけど
効率はどれくらい出てる?

497:493
10/10/13 18:55:49
>>494

お~
もつですもつです

時間とれたら修正版またあげるです(´・ω・`)

498:493
10/10/13 21:28:33
一つ忘れてた(´・ω・`)

追加オプション未指定時のファイル名は、「オリジナルファイル名」になります。

499:名無しさん@お腹いっぱい。
10/10/13 22:48:15
>>496
まず、APLを使って落としたいファイルの全ページを読み込む。(画像は読み込ませない方が良い)
次にDTA!で全ファイルを落とす。
全自動に比べれば、効率はあんまり良くないと思う。
読み込むページ数にもよるが、ページを余分に読み込まないようにAPL使用中はあまり席を離れられない。
また、回線速度によってはDTA!使用中は509に気を付けなきゃいけない。
DTA!に「ファイルを○個落とした後は、△秒停止する」みたいな機能があれば、509は気にしなくても良いんだけどな。

オリジナルファイルのことも考えると、g.e-hentaiやe-hentaiはアーカイブも利用すべきだ。

500:名無しさん@お腹いっぱい。
10/10/13 23:40:02
まぁぶっちゃけ何を指して『オリジナル』なの?って話もあるけどさ。

501:名無しさん@お腹いっぱい。
10/10/13 23:49:08
たしかに、オリジナルと言うよりは大きい画像だな。
どっちも欲しい俺みたいなのは、アーカイブだけじゃ足りないこともある。

502:名無しさん@お腹いっぱい。
10/10/13 23:59:44
こんなスクリプトもあったんだ。
URLリンク(www1.axfc.net)

503:名無しさん@お腹いっぱい。
10/10/14 00:42:48
>>502
そいつは過去の遺物なんで忘れてくれ
実質600行くらいあって保守点検がめどくなった
次のが150行、1/4になってずいぶんとラクになった


504:名無しさん@お腹いっぱい。
10/10/14 01:11:04
思いついた順にサークルとか作家で全作制覇とかやってるけどビューワの糞さを痛感する
Linux/UNIXだから糞なビューワしかないっていう問題じゃなくてWindowsの有名ビューワでも多分解決しない

結論から言うとe-hentaiにあった頃はタグや属性その他諸々で検索できたのに
ローカル環境に落とすと名前とディレクトリだけで探さざるを得なくて訳がわからなくなる

次はローカルにe-hentaiに似た環境のサーバを立てることが必要だな

505:名無しさん@お腹いっぱい。
10/10/14 01:19:18
あと大量に枚数があるCG集なんかはHFとかRSに上がってるアーカイブ化されたものより
e-hentaiに置いてあるやつの方が画質がいいことが結構ある
固めてあげられてる奴は大抵品質低めのjpgなんだがe-hentaiの方はPNGで大量に上がってる
どうせ自分の手で後でjpgにするけどな
実際上げたこと無いから知らんけどどうもアップロード容量で文句を言われることがあまりないようだ

506:名無しさん@お腹いっぱい。
10/10/14 12:59:41
>504
10年経っても xv を越えるビューワは出ていない

507:493
10/10/14 20:20:31
>>494
修正版あげてみた(´・ω・`)

URLリンク(www1.axfc.net)

508:名無しさん@お腹いっぱい。
10/10/14 22:53:35
ビュワーじゃね。

509:名無しさん@お腹いっぱい。
10/10/15 02:42:43
とりあえずダウンローダー作ってみる(WIN用)
自分用になー、明日には動くかな

510:名無しさん@お腹いっぱい。
10/10/15 13:58:53
なんとか画像URL取得までは成功した

511:名無しさん@お腹いっぱい。
10/10/15 16:51:46
画像の保存に成功しました。ありがとうございました。

512:名無しさん@お腹いっぱい。
10/10/19 16:58:02
昨日は何か重たかったなぁ
画像表示されないことがあったお

513:名無しさん@お腹いっぱい。
10/10/19 22:54:51
exに対応させたいがmechanizeに最初からクッキーセットするにはどうすればいいんだ
週末に調べるか

514:名無しさん@お腹いっぱい。
10/10/19 23:32:05
ここはついったーじゃない

515:名無しさん@お腹いっぱい。
10/10/20 07:20:37
便所の落書きらしいな。

516:493
10/10/20 21:46:12
追加&Bugfix ヽ('A`)ノ

URLリンク(www1.axfc.net)

リストファイル指定時にエラー落ちしてたー
リンクファイルの保存先が変わっちゃってたー
orz

あとは、保存先のベースとなるパスを指定できるようにしてみた。
(ソースの中)

517:513
10/10/20 23:57:49
自己解決。exに対応してダウンロード確認した。ehg作者たちに幸あれ

>>516
多謝

518:名無しさん@お腹いっぱい。
10/10/21 01:17:44
>>517
俺も弄ってみたけどうまいことDLしてくれない
弄った箇所教えてください

519:名無しさん@お腹いっぱい。
10/10/21 01:49:12
>>518
ふつうに上書きだけで落ちてくるが
むしろなにしたんだ?

520:名無しさん@お腹いっぱい。
10/10/21 01:57:42
クッキーなんていらんだろ
ヘッダにipb_member=1足すだけ

521:名無しさん@お腹いっぱい。
10/10/21 15:23:19
ん、対応したplまだ

522:名無しさん@お腹いっぱい。
10/10/21 22:00:10
mechをnewって1回だけでいい筈なのに、いろんなところでnewしてるのはどうかと
今は動くけど、newしたらcookieが引き継がれんし

523:名無しさん@お腹いっぱい。
10/10/21 23:03:45
頑張って修正して公開してくれ。

524:名無しさん@お腹いっぱい。
10/10/22 00:19:19
>>520も言ってるけどcookie要らなくね?
みんな律義に取ってるの?

525:名無しさん@お腹いっぱい。
10/10/22 06:43:11
だめだ
オレじゃうまく出来ないや

526:名無しさん@お腹いっぱい。
10/10/22 08:19:24
public.exe起動しても「u」「s」と文字打ち込めないんですが
その原因わかる方いませんか?

527:名無しさん@お腹いっぱい。
10/10/22 21:14:58
exに対応したplまだー

528:名無しさん@お腹いっぱい。
10/10/22 21:37:06
exってなに?

529:名無しさん@お腹いっぱい。
10/10/22 21:58:50
viのお供のラインエディタ

530:名無しさん@お腹いっぱい。
10/10/22 22:55:11
ググってみたがわからん
IEでcookieは受け入れてるらしいがパンダ画像状態だわ
ブラウザの右下にブロックのアイコンも無し

531:名無しさん@お腹いっぱい。
10/10/23 18:13:41
火狐でex見れた
>>516ではex落とせないが、どうすればいいん?
何か追加すればいいのん?



532:名無しさん@お腹いっぱい。
10/10/23 19:59:10
3girls_artist_request_blonde_hair_blush_bondage_chains_collar_group_inflation_lactation_milk_milking_milking_machine_nose_ring_pregnant_slave_source_request_tied_up_tube_tubes_women_livestock.jpg

533:名無しさん@お腹いっぱい。
10/10/23 20:29:19
>531
プログラムの勉強をする。

534:名無しさん@お腹いっぱい。
10/10/23 21:07:59
>>531
いくらまでなら出せる?

535:名無しさん@お腹いっぱい。
10/10/23 23:27:09
でも、お高いんでしょう?

536:名無しさん@お腹いっぱい。
10/10/24 08:57:06
ほとんどg.e-hentaiにあるやん
前のvs pandaにリンクされてたやつ全部をg.e-hentaiにurl置き換えて登録したら
exにしかないのは5つぐらいだったよ

537:名無しさん@お腹いっぱい。
10/10/24 12:53:15
あるサイトの画像ファイルのPathです。
image.php?id=xxxx&pgid=&gid=yyyy&page=0 というURLから生成されます。
gidはシリーズで共通、idが画像ファイル毎に異なり、.jpgのベースネームです。
(image.php?id=1150780268&pgid=&gid=yyyy&page=0 => 21/115/1150780268.jpg)
最初のディレクトリはどのようなルールで生成されているのでしょう?

21/115/1150780268.jpg
23/540/540671895.jpg
22/867/867991716.jpg
19/949/949033182.jpg
21/775/775175204.jpg
21/167/1671912903.jpg
21/154/154901774.jpg
22/389/389568609.jpg
13/818/818582288.jpg
22/720/720726657.jpg
20/741/741769030.jpg
14/203/2030113986.jpg
16/650/650797660.jpg
23/206/2065447369.jpg
19/134/1349176214.jpg
24/172/172010882.jpg
22/153/1538204157.jpg
15/426/426567663.jpg
19/634/634734732.jpg
19/752/752298919.jpg
20/247/24707894.jpg
20/177/1774313493.jpg
24/192/1920522675.jpg
18/188/1886902521.jpg

538:名無しさん@お腹いっぱい。
10/10/24 13:34:38
それはおおよそ幾つから幾つの間の値をとるの?

539:名無しさん@お腹いっぱい。
10/10/24 13:41:44
1から24まで順に調べた結果が>>537です。

540:名無しさん@お腹いっぱい。
10/10/24 13:45:56
つまり13未満は無いらしく25以上は不明ってことかな。

541:名無しさん@お腹いっぱい。
10/10/24 14:07:39
そうですね。同一シリーズが後5枚あったので調べてみると、↓です。

18/188/1886902521.jpg
22/774/774460437.jpg
20/907/907387922.jpg
21/232/232573196.jpg
21/204/204901220.jpg

とここまで書いて>>1を見たらありました。(imagefap) 前スレ見てます。

542:名無しさん@お腹いっぱい。
10/10/24 14:09:01
お前らdanbooruとか使ってないんか

543:名無しさん@お腹いっぱい。
10/10/24 14:24:44
>>542
danbooruめんどくさいし絵師目当ての収集ならpixivで十分だと思うんだけどね
退会しちゃった絵師は別として

544:名無しさん@お腹いっぱい。
10/10/24 14:30:49
そのページ見ると12~32で255ってのがポツンと居るね。

545:名無しさん@お腹いっぱい。
10/10/24 16:38:06
>>536
でもEX出してきたってことは、将来的にどうなるかってな感じだから
どちらにも対応しうるハイブリッドが生まれて欲しいというのは必然
乞食思考で言えば

546:名無しさん@お腹いっぱい。
10/10/24 19:50:40
乞食でも将来が気になるならいくらか寄付しといたら?

547:名無しさん@お腹いっぱい。
10/10/24 22:32:32
それじゃ乞食じゃなくなるじゃん

548:名無しさん@お腹いっぱい。
10/10/24 23:05:33
プログラム書こうが拾ってようがヘンタイ漁ってる時点で皆乞食。
乞食らしく明日のおかずの心配までするなってことだよ。

549:名無しさん@お腹いっぱい。
10/10/24 23:33:39
本買ってやれよ。作者泣いてるぞ。

550:名無しさん@お腹いっぱい。
10/10/25 07:18:02
おまいら github でやれ

551:名無しさん@お腹いっぱい。
10/10/25 07:45:40
エロ本と同じく匿名で決済できて購読期間に制限の無い電子書籍ならば購入する。

552:名無しさん@お腹いっぱい。
10/10/25 22:11:20
遠くの本屋まで出かけて買ったエロ本を抱えた帰り道の思い出。

553:名無しさん@お腹いっぱい。
10/10/25 22:27:03
乞食がどうなろうと関係ないわ

554:名無しさん@お腹いっぱい。
10/10/25 22:56:01
う~ん。ドライな乞食って格好イイ!
そういや最近PerlおぼえたWindows君来ないけど元気かな。

555:名無しさん@お腹いっぱい。
10/10/27 21:21:37
>>516
ネ申
ありがとう。

556:名無しさん@お腹いっぱい。
10/10/27 23:22:12
ex-hentaiには対応していない

557:名無しさん@お腹いっぱい。
10/10/29 19:22:52
さぁ今日も抜くか


558:名無しさん@お腹いっぱい。
10/10/29 20:56:05
ehg.plをしていたら途中から画像が「▲」の画像になってしまったのだが
何が原因がご存知の方がいれば教えていただきたい 

559:名無しさん@お腹いっぱい。
10/10/29 21:29:36
あのスクリプトがとってくる画像はかなり適当に決めてる
目的の画像を取ってくるか、それともナビゲータの▲を取ってくるかは
ちょっとした判定が必要


560:名無しさん@お腹いっぱい。
10/10/29 22:09:41
>558

509エラーが出るとそのアイコン画像を間違って拾ってくる。
同一IPでの時間あたりのアクセス量が既定値を超えるとそうなる。


561: ◆XqkHoMFLH5eY
10/11/02 00:22:29
ども493です。
せっかくなんでトリップ入れときます。

exやら串やら >>522 やら、いろいろしようと思ってソース眺めてたんですが、
そのままだといかんな~ってのが・・・

で、改修にしばらく掛かりそうです(´・ω・`)ハイ

exに関してこのスレ眺めたんですが、どーもよくわからん。。。
これって、レジストユーザー用なのかしら?
入り口(Indexページ?)が違うだけで中身は一緒なのかな?

562: ◆XqkHoMFLH5eY
10/11/02 00:36:15
とりあえず、

 「ex使わない 串使わない」人は、>>516 で大丈夫だと思います。

バグ報告はここへ
でわ (´・ω・`)ノシ

563:名無しさん@お腹いっぱい。
10/11/02 01:39:04
>>561
全体公開のg.e-hentaiは向こうの感覚で倫理的にアウトなタグ(ロリ・ショタ・獣姦・近親相姦)が付けられた作品を原則的に閲覧不可にしている
一方、会員限定公開のexではそれらが全て見られる

exはクッキーのある一部分でしか会員かどうかを判定していないので
そこさえ変えてしまえば会員でなくても利用できる

564:名無しさん@お腹いっぱい。
10/11/02 22:30:07
長いことかかったが>>253の云う通りってことかいな。

565:名無しさん@お腹いっぱい。
10/11/02 22:30:42
CGファイル破損チェックツール
URLリンク(www1.axfc.net)

サブフォルダ内のCGファイルを >419,436,468 の関数でチェックし、エラーファイル名(+サブフォルダ名)をログに出力。
注意 カレント、2階層以降のサブフォルダは検索しません。

ehg3.zip 同梱の net.pm を書き換えた物を使ってますが、
>516 でも修正した関数は使用していないので、上書きしても多分問題ありません。
(lib1.pm は変更なし)

ゴミデータの付着でエラー判定されることもあるので、エラーが出ても一度ビュワーで確認してください。

566:名無しさん@お腹いっぱい。
10/11/07 14:11:58
なんか間が空いて寂しいので場繋ぎのphpスクリプトをひとつ。
URLリンク(www1.axfc.net)
keyには>>1の年月日をスラッシュ付きで。

秋の夜長の手淫みは500行を越えちゃったけれど読み易さを心がけたつもり。
でも書いて出したら冷めちゃったんで何か突っ込まれても対応するモチベはない。
ま次のehg.plがリリースされるまでの余興つーことで。

567:名無しさん@お腹いっぱい。
10/11/07 19:08:53
途中からCGがDLできなかったんですけど途中のCGから再開する方法ってないです?

568:名無しさん@お腹いっぱい。
10/11/07 19:14:08
>>567
URLリストをいじれ
つーか他人のソース見てないけど画像を取りに行くプログラムを分離するのが楽

569:名無しさん@お腹いっぱい。
10/11/07 19:25:40
>>568
プログラムやソースを触ったことない俺には無理でした
おとなしくDLし直します

570:名無しさん@お腹いっぱい。
10/11/07 19:26:55
つ右クリック→名前を付けて画像を保存

571:名無しさん@お腹いっぱい。
10/11/07 19:30:37
>567
>284

572:名無しさん@お腹いっぱい。
10/11/07 22:16:22
>>567
再開はともかく簡単にギブアップさせないなら
(A)24行目で RETRY_GET_PAGE の値5をでかい値にしてみるとか、
(B)194行目のfsockopenの最後の引数30を60位にしてみるとかかな。
proxy使ってないのなら(B)だけどダイアルアップ接続ってこたぁないよね。

573:名無しさん@お腹いっぱい。
10/11/07 22:53:00
349行目の $result=RESULT_FAILURE; の前に $urlImage="";
入れないと509画像持って来るんじゃね?

574:名無しさん@お腹いっぱい。
10/11/07 23:57:06
欲望に掻き立てられてここにたどり着いたのだけれど、ど素人には無茶みたいです

コマンドプロントにehg3.plのっけてreadme.txtにあうURL文のせてるけど、
Can't locate lib1.pm in @INC (@INC contains: C:/Perl/site/lib C:/Perl/lib .) at
うんたらって出て駄目だ。




575:名無しさん@お腹いっぱい。
10/11/08 00:16:12
俺も完全など素人だけど
URLリンク(www.geocities.jp)

の新スクリプト編というのを読む

UrlList.txtにダウンロードしたいurlを羅列して保存

テキストファイルに下の文章を入れて○○○.batと
拡張子をbatに変えて保存

ehg3.pl UrlList.txt
pause

でそのbatファイルをダブルクリック

でやってる。ホントツール作ってくれた人には感謝やでぇ

あと>>556>>536を知っとく

576:名無しさん@お腹いっぱい。
10/11/08 19:16:08
怪しげなexeよかスクリプトの方が信頼できる分野だからなぁ……
仕込まれてないってのが分かるってのがスクリプトの利点
Janeでもいろいろやってたみたいだし


577: ◆XqkHoMFLH5eY
10/11/08 19:49:00
おじゃまします(´・ω・`)

一応 EX 以外の処理は一段落ついたです。
後はテストするだけな感じです。

もうね、中身いじりすぎて、しょうじき大丈夫か?ってかんじに・・・

週末までに上げられればいいかな(´・ω・`)


ノシ

578:名無しさん@お腹いっぱい。
10/11/08 22:50:19
コード見ても判らないのに実行しちゃったら同じぢゃん。

579:名無しさん@お腹いっぱい。
10/11/08 22:57:46
ソースがあれば、プログラミングできない奴でも調べれば何が書いてあるかわかるだろ。

580:名無しさん@お腹いっぱい。
10/11/08 23:54:43
>>575
できへんかった...

581:名無しさん@お腹いっぱい。
10/11/09 00:26:17
一月真面目に勉強すればできるって。

582:名無しさん@お腹いっぱい。
10/11/09 01:26:37
俺1時間でperl覚えたけど。

583:名無しさん@お腹いっぱい。
10/11/09 01:30:39
>>577
ありがとうありがとう でも今の段階で充分使えてるからそんな頑張らなくてもええんやで……

584:名無しさん@お腹いっぱい。
10/11/09 04:33:50
perl というひとつの単語を覚えるのに 1時間か?w

585:名無しさん@お腹いっぱい。
10/11/09 11:45:31
perlの言語仕様覚えるぐらいならそれぐらいだろ。

586:名無しさん@お腹いっぱい。
10/11/09 13:31:44
perl覚えるのに一ヶ月もかかるような頭の悪い奴はどうせ中卒ニートだろw

587:名無しさん@お腹いっぱい。
10/11/09 14:19:45
使いこなすのは別だけど
さらに perl の他人のコードを読むに至っては…

588:名無しさん@お腹いっぱい。
10/11/09 17:16:13
perlは省略文化だから、暗黙のルールみたいなのを完全に理解しようと思ったら
なかなか難しい言語だな。
言語仕様自体はシンプルだが、仕様の穴を利用したようなテクニックが慣用的に使われているから怖い。

589:名無しさん@お腹いっぱい。
10/11/09 17:20:53
最新版どこー

590:名無しさん@お腹いっぱい。
10/11/09 19:54:48
というかここはUNIX板だからperlくらいは常識かと思ってた


591:名無しさん@お腹いっぱい。
10/11/09 19:56:16
E-hentai関係で情弱もたくさんこのスレに来てるからな

592:522
10/11/09 21:07:06
言いだしっぺの法則でnew問題はnet.pmにほとんどの関数移して対応したわ
元作者のバージョンと一貫性がなくなるからうp控える
フォルダ名に?ampとか残る問題とかも修正中

593:名無しさん@お腹いっぱい。
10/11/09 23:05:50
別にいいじゃん。UNIX気取ったところで皆linuxだろ。

594:名無しさん@お腹いっぱい。
10/11/09 23:48:43
unixとは何をさしてunixと呼ぶのかw
まさかあの古臭いsystemⅤか?w
だったらlinuxを使っています、と言ったほうがよほど格上だわw

595:名無しさん@お腹いっぱい。
10/11/09 23:54:27
いっぴきつれた

596:名無しさん@お腹いっぱい。
10/11/09 23:59:42
ゴミウゼェ

597:名無しさん@お腹いっぱい。
10/11/10 00:06:06
正) ゴミウゼェw

598: ◆XqkHoMFLH5eY
10/11/10 17:26:25
どもです(´・ω・`)

昨日1日ブン回しつつバグ取りしてますた。
一応串の切替ができるようになったです。(タイムアウト、509時)
ただ、応答の変な串通すとエラーで止まるかもしれない・・・

>>592
うちは、net.pmの必要な奴をメインソースに持って来ちゃたよ。
だから元作者のものとだいぶ変わっちゃった(´・ω・`)
453さん、まだここにいるかしら(´・ω・`)
できたら転載許可ほしいな

>フォルダ名に?ampとか残る問題
これは気がつかなかったな。ちと調べるか・・・

599:名無しさん@お腹いっぱい。
10/11/10 21:03:47
>フォルダ名に?ampとか残る問題
「&」って言う文字がhtmlの中身ではこうなってるって話

特殊文字が入ったままのディレクトリ名を使うと後で端末上で操作するときに面倒になるから
俺は[]で囲まれた部分を作者名として前につけて()内の情報は全部捨てて
[^A-Za-z0-9 ]を全部削除してスペースをハイフンに変えてる

例えば「(C67) [DASHIGARA 100% (Minpei Ichigo)] Shiho-chan News Adult-Ban (To Heart)」だったら
DASHIGARA-100_Shiho-chan-News-Adult-Banってなってる

600:名無しさん@お腹いっぱい。
10/11/10 21:33:16
文字コード変換の問題だな。

601:名無しさん@お腹いっぱい。
10/11/10 21:58:20
ehg3.plの場合GetTitleName_eh関数の
>$UrlSouce=encode('cp932', decode_utf8($UrlSouce));
を何とか出来れば…。


602:522
10/11/10 23:06:16
タイトル抽出後にs/&amp;/&/とかやればいい。amp hellip #039 timesとかを実際に確認
2バイトコードの置換はエスケープ文字が混ざるかも知れないからuse encodingするか
ソースをutf8で記述するしかないだろう

603:名無しさん@お腹いっぱい。
10/11/11 10:10:47
その辺のはらんま1/2でバグった経験あるなw

604:名無しさん@お腹いっぱい。
10/11/11 17:46:12
ソースをutf8に変換して
>$UrlSouce=encode('cp932', decode_utf8($UrlSouce));
を削ればいいのかな?

605:名無しさん@お腹いっぱい。
10/11/11 22:51:36
置換するまでもなく特殊文字なんか全部消してもいいな
ファイル名で’とかゴミだし×はxで代用。Asciiならたぶん文字化けしない
以下参考
s/&times;/x/g
s/&amp;/&/g
s/&#[0-9]+;//g
s/&[a-zA-Z]+;//g

606:名無しさん@お腹いっぱい。
10/11/12 22:37:30
DelNouseCharでやっぱりバグる
'原'とか'ポ'とかが含まれてると文字化け

607:名無しさん@お腹いっぱい。
10/11/14 17:01:38
追いかけるのがめんどいから、おまいら github でやれよ。

608:名無しさん@お腹いっぱい。
10/11/14 18:36:54
ヤダ。

609:名無しさん@お腹いっぱい。
10/11/14 18:53:30
全く一から書いたりする人もいるってのにgithubでどうやって一元管理するんだよ

610:名無しさん@お腹いっぱい。
10/11/14 22:48:26
> 全く一から書いたりする人もいるってのにgithubでどうやって一元管理するんだよ

なんで一元管理しないといけないと思った?

611:名無しさん@お腹いっぱい。
10/11/14 22:55:57
Githubだけでやれよ って読んだのなら一元管理と言えなくもない。

612:名無しさん@お腹いっぱい。
10/11/14 23:06:47
じゃ>>607がプロジェクトリーダーな。要求分析して仕様提示してくれ。

613:名無しさん@お腹いっぱい。
10/11/14 23:26:47
普通小規模オプソ開発で要求分析とか仕様書作成とかやらないぞw
コード=仕様だからなw

SIer系のド底辺業務アプリ屋は失せろw

614:名無しさん@お腹いっぱい。
10/11/14 23:31:23
最初は高い目標を掲げていた会社が技術力の無さが露呈してきて
少しずつ業務アプリ開発の下請けになっていくところを何度も目にしてるから
業務アプリ開発=負け組のカスっていうイメージなんだよな・・・

615:名無しさん@お腹いっぱい。
10/11/15 00:12:21
r○pidsh○re とか m○ga○pload のたぐいの
サイトの自動ダウンロードツールってあるんだねー

このスレのトピック的な掲示板出入りしててめんどいなーと思って
なにげなくググったら tucan ってのがあって
しかも FreeBSD の ports にまでなってやがった…

ダウンロードの制限とかは乗り越えられないみたいだけど
どうでもいい手間をかけずにすむのはありがたい


616:名無しさん@お腹いっぱい。
10/11/15 08:41:17
captchaだけ人間に入力させてあとはDLまでおまかせーってのは
exploaderので作ったけど、captcha破りは漏れの能力では無理だったな・・

617:名無しさん@お腹いっぱい。
10/11/15 08:48:49
megaなら制限こえられるんじゃねーの?
今は知らんが、Fxのアドオンで無制限にDLできた気が

618:名無しさん@お腹いっぱい。
10/11/15 09:00:05
e-hen以外は、say-moveしかやってない

619:名無しさん@お腹いっぱい。
10/11/15 10:30:23
>616
>615 はなんか captcha 越えのライブラリ(Tesseract OCR engine)も
使ってくれるらしいくて何も考えずに
URL 放り込むだけであった…

確かに言われてみれば OCR 処理そのものだわな

フリーで しかも unix 環境でもこんなのあるんだねー
まあ元の作者はエロ目的ではない可能性高いけど多謝です



620:名無しさん@お腹いっぱい。
10/11/15 11:59:39
人力でもきついと言われてるrecaptchaをtesseractで突破するとかどんだけカスタマイズしたんだろう…
実際に適当に文字を傾けてゆがみ系のフィルタかけてから使ってみるとわかるけど素の状態だと正答率全然良くないよ

621:名無しさん@お腹いっぱい。
10/11/15 21:55:49
次なる挑戦はcaptcha攻略なのか


622:名無しさん@お腹いっぱい。
10/11/15 22:29:43
URLリンク(livedoor.2.blogimg.jp)

623:名無しさん@お腹いっぱい。
10/11/16 15:14:52
今まで普通に見れてたのに数日前から急にex見れなくなったんだけどなんでかしら

624:名無しさん@お腹いっぱい。
10/11/16 15:48:16
クッキーを消して、おまじないを最初からやってみるべし

625:名無しさん@お腹いっぱい。
10/11/17 19:20:55
クッキー消して般若心経唱えたんだがダメだわ
今までパンダでたことすらなかったのに

626:名無しさん@お腹いっぱい。
10/11/18 00:50:38
全裸になって般若心経唱えたらできたよ

627:名無しさん@お腹いっぱい。
10/11/18 23:44:02
俺ならパンダで抜くな。

628:名無しさん@お腹いっぱい。
10/11/19 17:43:24
>>627
もうこのスレの意味なくね?w

629:名無しさん@お腹いっぱい。
10/11/19 18:22:06
連番のパンダ画像/動画を一期にDLする

630:名無しさん@お腹いっぱい。
10/11/21 21:36:50
毎度途中経過をリポートする>>577とサリーちゃん&ビリー君は間を空けすぎだがスランプか?

631:名無しさん@お腹いっぱい。
10/11/21 22:12:06
tucan使ってみたけどRSもHFもエラー出て無理
tucaimononinaranに改名しろ

632:名無しさん@お腹いっぱい。
10/11/21 22:58:08
すくなくとも「RS:らぴっどしぇあ」のことなら
アカウント登録もなにもなしに使えたけどなー


633:名無しさん@お腹いっぱい。
10/11/22 00:03:13
>>632
そうか、俺はどう頑張っても使えなかった
HotFileはぐぐったらどうも動かんらしいことは確認できた
だがRapidShareで動かないのはそれらしきバグ報告は確認できなかった
もし、今回俺がやろうとしたファイルに固有な問題だとしたら拡張子絡みの低レベルなバグがあるのかも
(rar分割でよく見る.part1.rarをrarじゃなくて別の拡張子だと思ってしまうとか)

634:名無しさん@お腹いっぱい。
10/11/23 15:07:00
このスレのおかげで WWW::Mechanize の存在を知れたので,
手習いに E-Hentai からのDL用Perlスクリプトを書いてみました.
(一から書きましたが,オリジナル/他の作者様には感謝を)

ehgm.pl (EHG minus)
URLリンク(www1.axfc.net)

スクリプトの構造が単純になるようにしつつ,
レジューム,文字化け,ExHentai・lofiからのDL に対応しています.

プロキシの動的な変更はしませんが,
まったりとダウンロードする向きには良いかと思います.

一応 -h オプションで簡単なヘルプが出ます.
初期設定はWindows用ですが,Linux でも動作確認しています.

635:名無しさん@お腹いっぱい。
10/11/23 15:39:27
一から書いたわりには...

636:名無しさん@お腹いっぱい。
10/11/23 15:49:26
なんで変なサイトにsendしてんだ?

637:名無しさん@お腹いっぱい。
10/11/23 20:24:34
命名がperlっぽくないな。JavaとかC#な人で普段はスクリプト言語は使わないと見た。

638:名無しさん@お腹いっぱい。
10/11/23 20:35:50
まっさきにCが出てこない時点で普段UNIXは使ってないと見た。

639:名無しさん@お腹いっぱい。
10/11/23 21:25:53
どういうこと?CでもUNIX畑の命名法じゃないだろ

640:名無しさん@お腹いっぱい。
10/11/23 22:31:06
JavaやC#で書かれたドライバやカーネルはみたことないわ。
まぁ最近じゃご丁寧なパッケージをクリックして終わりだから
ソースに手を入れる機会は減ってるんでさもありなん。

641:名無しさん@お腹いっぱい。
10/11/24 04:52:14
C++ という可能性は?w

642:634
10/11/24 07:44:38
ご察しの通り基本Windows畑でC#な人です.
Perl は最近ワンライナーにしか使っていないので引っ張られてますね.

643:名無しさん@お腹いっぱい。
10/11/24 15:35:36
なあに俺もVCで前スレから張り付いてる

644:名無しさん@お腹いっぱい。
10/11/27 12:01:26
tucan で megaupload の plugin を丸ごとコピーして
s/めがあっぷろーど/めがぽるん/g すると
そのまま使えちゃうねー


あ、連番関係なかった… orz

645:名無しさん@お腹いっぱい。
10/11/27 18:20:53 BE:3068787277-2BP(3000)
exhentaiの一気にDLって今現在できるの?

646:名無しさん@お腹いっぱい。
10/11/27 18:53:11
>>645
上がってるehentaigerllyのスクリプトを少し改造するだけ……
だけど、とれるモンが殆ど同じだからだーれも改造してない


647:634
10/12/01 23:26:49
>>634 のE-Hentai, EX-Hentai, Lo-Fi からのダウンロードスクリプトを
URLリストとプロキシリストに対応させてみました.

プロキシを通すとダウンロードに失敗することが多いので,
ダウンロードしたファイルの完全性は一応検証しています.
URLリンク(www1.axfc.net)

ファイルの検証に関係して一つ.
JPEGではEOI(\xFF\xD9)の後に余分なデータがついている場合があるので,
先頭と末尾の2バイトだけを検証に用いるのだと誤検出の恐れがあります.
>>419, net.pm)
APPセグメントを除いて,マーカー以外の\xFFから始まるバイト列は
いったん\xFF\x00に置き換えられているので,APPセグメント以外に
EOIが存在しているかどうかを検証すれば誤検出・見逃しが減るはずです.

648:名無しさん@お腹いっぱい。
10/12/02 02:17:40
>>647
丁寧なスクリプトだな

649:名無しさん@お腹いっぱい。
10/12/03 14:03:46
>>647
感謝
便利なスクリプトだなあ
ところでなんでこのスレUNIX板にあるの?

650:名無しさん@お腹いっぱい。
10/12/03 14:36:16
ごめんなんかplファイルクリックしてもすぐ消えるんだが

651:名無しさん@お腹いっぱい。
10/12/03 15:10:19
コンニチワ
downthemallの使い方を調べてたらここにたどり着いたのですが
>>647はどう使うのでしょうか
リドミ読んでもわからなければ諦めるしかないですか?

652:名無しさん@お腹いっぱい。
10/12/03 15:27:06
えへへ*^^*

653:名無しさん@お腹いっぱい。
10/12/03 17:35:46
初歩的な質問で申し訳ありません。
public.exeを起動し、コマンドプロンプトの入力画面は表示されるんですが、入力が出来ません。ググってみたんですが、自分にはわかりませんでした。どなたか教えていただけませんか?お願いします。

654:名無しさん@お腹いっぱい。
10/12/03 17:36:26
>>653
コピペ

655:名無しさん@お腹いっぱい。
10/12/03 17:44:14
>>654
本当にわからないんです。初歩的ですみません。

656:名無しさん@お腹いっぱい。
10/12/03 17:46:25
>>655
だからコピペ

657:名無しさん@お腹いっぱい。
10/12/03 17:52:52
>>656
ctrl+vでやってもダメでした…。本当にわからないっす。

658:名無しさん@お腹いっぱい。
10/12/03 19:44:16
あの、コントは他所でやってください

659:名無しさん@お腹いっぱい。
10/12/03 21:23:23
釣りだろ

660:名無しさん@お腹いっぱい。
10/12/03 22:16:14
>>658>>659
どうしても入力を受け付けてくれなくて、ガチでわからなかったんですが…。
普通は出来るんですか…、やり方わからないんであきらめます。板汚しスマソ

661:名無しさん@お腹いっぱい。
10/12/03 22:28:39
「スマソ」なんて釣りの勘所がわかっとるな
「漏れ」があればもっとよかった

662:名無しさん@お腹いっぱい。
10/12/04 10:41:50
初歩的な質問で申し訳ないですが、
URLリンク(www1.axfc.net)
を使って画像をダウンロードしたのですが、
ehg.pl URLリンク(g.e-hentai.org) "dir000"
では150枚ほどしかできず、そこからダウンロードを試み
ehg.pl URLリンク(g.e-hentai.org) "dir000"
でやろうとしたらエラーがでてしまいました。
どのようにしたらいいでしょうか??


663:名無しさん@お腹いっぱい。
10/12/04 12:11:27
>>647
これに nl=1 処理させたいんだがなかなかうまくいかないなぁ
前のと見比べてるんだが…

664:名無しさん@お腹いっぱい。
10/12/04 12:48:51
どうやって使うか教えてくれ

665:名無しさん@お腹いっぱい。
10/12/04 12:59:12
変態に変化がなくなって久しいな。ちとつまんない。

666:名無しさん@お腹いっぱい。
10/12/04 18:15:42
>>662
helpに書いてあるだろよく読めよ


667:名無しさん@お腹いっぱい。
10/12/04 18:47:06
>>666
挙句に『自己解決しますた』と書かれるオチに10ルピー.

668:名無しさん@お腹いっぱい。
10/12/04 20:43:24
昨日あたりからこのスレに張り付いてるんだけど
使い方教えてくださいお願いします・・・ううっ・・・(チラッ

669:名無しさん@お腹いっぱい。
10/12/04 20:50:53
>>667
報告も無く消えるオチに20ルピー

670:名無しさん@お腹いっぱい。
10/12/04 20:53:12
*.plファイルをテキストエディタで開いて端から端まで読む。
以上。

671:名無しさん@お腹いっぱい。
10/12/04 20:58:56
>昨日あたりからこのスレに張り付いてるんだけど
このスレ全部読んで公開されてるツール全部試した方が早いよ。
逆にそれ出来ないやつは相手にされない。

672:名無しさん@お腹いっぱい。
10/12/05 00:36:50
そして zsh マスターへ(ん?)

673:名無しさん@お腹いっぱい。
10/12/05 01:47:52
zshの連番生成はお世話になってます

674:名無しさん@お腹いっぱい。
10/12/05 13:32:08
>>647でlo-fiから落とせないんだけど
e-henntaiと同じやり方じゃダメなん?

675:名無しさん@お腹いっぱい。
10/12/05 15:28:35
gとexよりは単純だけど、htmlソースの判定方法と一番大きい画像/3/を落とすような仕組みを
作らないといかんから同じやり方じゃいかんかもね。

676:名無しさん@お腹いっぱい。
10/12/06 21:11:02
>>647でexで使うと途中でNotFoundになるわ。追跡ミスってる模様
20ファイル前後でアウト。アドレスが間違ってるんだろうなあ

677:676
10/12/06 21:44:13
ehg3を改造したやつだとexの同じやつを普通にダウンロードできて失敗もない。509になる気配もない
ehgmは次のImageのアドレスまで取れてておちてきてないぽい

678:676
10/12/06 22:03:16
何度もすまん。同じアドレスだと全く同じ番号のファイルでNotFoundを吐いて終わるわ
単純なバグだろうな
Network Error: Error GETing URLリンク(***.***.***.***)
-1600-jpg/keystamp=****-****/022.jpg: Not Found

679:名無しさん@お腹いっぱい。
10/12/06 23:20:39
何でアドレス隠すの?それないとデバッグめんどくさいじゃん。

680:名無しさん@お腹いっぱい。
10/12/06 23:30:18
んもぅ、独占欲が強いんだからんっっ

681:名無しさん@お腹いっぱい。
10/12/07 00:39:32
だめよ、男どもに汚される前にあたしが筆おろししてあげるんだから
三下は引っ込んでなさい

682:634
10/12/07 00:48:01
>>676
具体的なアドレスが分からないので想像になりますが,
正しいURLが引けているにもかかわらずダウンロードに失敗するのは,
バグというよりも画像サーバーが落ちているためではないかと.
おそらくnlフラグを立てれば回避できるはずです.

ほとんどテストしていませんが,とりあえず以下の版で
ダウンロード失敗時にはnlフラグを立てるようにしてみました.
(433-434行目,444-448行目)
URLリンク(www1.axfc.net)

683:名無しさん@お腹いっぱい。
10/12/07 00:53:43
画質優先ならリンク変わるまで待ってた方がええような。

684:名無しさん@お腹いっぱい。
10/12/07 02:16:02
こんばんは、夜分遅くにすいません
ここで配布されているツールを素人が使射こなせますか?
私のレベルとしてはReadme.txtを読んでもペリ=とかげのろごしか思い浮かびません
こんな私ですが皆さんのように1日1000冊自動DLしたいんです

685:名無しさん@お腹いっぱい。
10/12/07 02:45:34
YES

686:うすしお ◆WQftK9uskc
10/12/07 03:06:42
ありがとうございます
その一言で幾分か希望が持てました
何かに詰まればまた来ようと思います
それと無気力気味の素人を不快に感じる方の為にトリップを付けました
私としてもツール製作者の意欲を削ぐのは本意ではありません
ehentaiとdownloderは共存関係と仰っていますが
今のところ私と共存関係にあるのはみなさんです
ですが完全な一方的なギブになると思いますがよろしくお願いいたします

687:名無しさん@お腹いっぱい。
10/12/07 03:14:23
質問は一週間に一回までとする。

688:名無しさん@お腹いっぱい。
10/12/07 08:31:02
どうでもいいが一方的なギブでいいのかwww
ありがたいぞww


689:名無しさん@お腹いっぱい。
10/12/07 08:41:05
1日に上がるのは、上げ直し洋物含めて350~600くらい。

690:うすしお ◆WQftK9uskc
10/12/07 15:55:04
>>687
一週間に一回なら答えて頂けるのですね
約束しましたよ

>>688
まちがいました…エヘヘ^^*
しかし、Perlの事をとても解り易く解説しているサイトをいくつか見つけたので
もしかしたら皆さんのお役にたてる日が来るかもしれません
目的もハッキリしていますし、かなり意欲が沸いてきました
やはりエロは偉大ですね

691:名無しさん@お腹いっぱい。
10/12/07 18:20:24
>>690
質問すれば必ず答えが返ってくるとかw
1000冊も仮にDLするとして、そんなに目通せる時間があるのか・・・羨ましいね

692:名無しさん@お腹いっぱい。
10/12/07 21:19:31
コテうぜえ

693:名無しさん@お腹いっぱい。
10/12/07 22:33:36
とりあえず通報しとくか。

694:名無しさん@お腹いっぱい。
10/12/07 22:34:26
>>689
以前は千とか2千冊とかいってなかったか?

695:名無しさん@お腹いっぱい。
10/12/07 22:57:00
ヘンタイは3年間見てるが手元に保存されてるのが4500タイトル39万頁。
大概がトリミング&レタッチ&リサイズされて元データよりはサイズが
小さくなってるけど100GB弱。改めて思うと俺って意外と暇だ。

696:名無しさん@お腹いっぱい。
10/12/07 23:01:10
>>694
コミケ後とか800くらいあったけど、
そもそも自動化出来たの5月あたりで、それ以降で1000冊の日は無かった。
サイズだと1日4G~8Gくらい。
ハッキリ言ってショタ洋物ホモは要らんし、フィルター実装なんて簡単だけど放置気味。
このスレのレス数チェックしてる方が多いかもしれん。

697:名無しさん@お腹いっぱい。
10/12/07 23:21:42
うひゃあ、もしかして新規分が毎日まるまる自動で落ちるようになってるの?

698:名無しさん@お腹いっぱい。
10/12/07 23:24:29
どういう廃人だよそれwww


699:名無しさん@お腹いっぱい。
10/12/07 23:29:54
だよね。
自分は目で見て手動で選んだギャラリーをダウンローダに送信してるけど
1000冊も選んでたら一日つぶれるわ。

700:名無しさん@お腹いっぱい。
10/12/08 00:15:40
過去にさかのぼるクローラーは作ってないので、
過去作品は1個1個手動で先頭リンク拾うことになるけど
自動化しちゃうと燃え尽きる。今はsay-moveでアニメと有野課長ですよ。
ローカルにSQLとか管理ページとかあるわけじゃないから、
e-hen本家で検索した方が、ローカルでファイル検索するより早かったりするし。
カテゴリとかキーも確保してないし。

701:名無しさん@お腹いっぱい。
10/12/08 00:36:44
結局のところその文面からは自動なのか手動なのかよく判らんね。

702:名無しさん@お腹いっぱい。
10/12/08 00:44:57
10分~30分の間隔でサイト先頭から数ページを定期検索するダウンロードマネージャーが走っていて
ダウンロードしていない作品を見つけると、1作品落として自滅するダウンローダーをShellExecuteします(すんませんWindowsです)
ダウンローダーの方は、1作品の先頭リンク渡せば後は最終ページまで落として自殺するexeで
それぞれのプロセスは、マネージャーが同時に管理してるプロキシリストの、評価の高いアドレス数十貰ってから起動するようにしました。

上げてすぐに消される作品もあるから、最長の30分の間で即行で消されたのは拾えてないです。
でも随分経ってから上がってくるパターンは結構拾えてるかも。

703:702
10/12/08 00:50:02
どっちでも一緒ですがShellExecuteでなく、非同期CreateProcessでした。

704:名無しさん@お腹いっぱい。
10/12/09 02:27:39
俺みたいな奴いるんだなぁ
自動化に凝ってた頃わざとリスト貯めといて一夜で10GBくらい一気に取ったけど
検索情報は消え失せるわ多すぎて読む気が全くしなくなるわで
虚脱感しか残らなかったという

705:名無しさん@お腹いっぱい。
10/12/09 12:52:56
> 虚脱感しか残らなかったという

ヌキすぎでつ…

706:名無しさん@お腹いっぱい。
10/12/09 20:43:31
>>682
修正ありがとです

707:名無しさん@お腹いっぱい。
10/12/10 14:50:05
>647 >682
どっちも、queue_listで始めるとqueue_listの1行目のURLが飛ばされてしまう
で、他行を開始、suceededで終わる エラーやリジュームもない

queue_listを1行だけにすると、何も起こらずに終わってしまう。
なので、queue_listの一行目は空白で改行するようにすると上手くいく
誰も言ってないんでウチだけだろうけど、一応報告です

708:名無しさん@お腹いっぱい。
10/12/10 22:19:46
>682の方は使ってないけど1行目をとばされたりなんかしないなぁ

709:634
10/12/12 22:54:09
>>707
環境によって動作が異なるということで,UnicodeのBOM絡みの問題が思い当たりました.
試しにWindows XPのメモ帳でQueueリストを作成してUTF-8で保存すると,
ファイル冒頭にBOMが付き1行目のURLが飛ばされてしまうことを確認しました.

getQueueListサブルーチン内の
$line =~ s/^\s*(.*)\s*$/$1/; # 行頭・行末のスペース/改行を削除
という行(>>682 なら683行目)の前に
$line =~ s/^\xEF\xBB\xBF//; # UTF-8のBOMを削除
を加えるとBOM付きのQueueリストでも上手くいきましたが,いかがです?

710:名無しさん@お腹いっぱい。
10/12/13 09:24:11
取得できなくなってなイカ?

711:名無しさん@お腹いっぱい。
10/12/13 14:33:59
>709
上手く行きました
対応ありがとうございます

712:名無しさん@お腹いっぱい。
10/12/13 16:24:01
This gallery is pining for the fjords.
You will be redirected to the front page momentarily.
exの一部でこれが返ってくる

713:名無しさん@お腹いっぱい。
10/12/13 17:42:49
>>710,712
サムネイルで1ページのアドレス整形できるから取れるよ

例 2010-12-13 04:02 - Artist - Geperu

インデックスページのソース見ると、サムネイル画像を表す↓の部分と
/94/43/9443764aa17b0a0a1ecd1abccc5b1c98b1fbce9d-492885-800-1066-jpg_l.jpg~- Artist - Geperu
リンク後のアドレス↓がわかる
URLリンク(exhentai.org)

上の2つから↓のアドレスを生成すればいい。
URLリンク(exhentai.org)

つまり、9443764aa17b0a0a1ecd1abccc5b1c98b1fbce9dの部分の上10桁と312979に
ハイフン1を足したリンクで見れる

714:名無しさん@お腹いっぱい。
10/12/13 18:14:13
サンキュー!見れた見れたよ!
つまりインデックスページだけ見れないようにされてるのか

715:名無しさん@お腹いっぱい。
10/12/13 22:47:44
しかし量が多くなると重複したのかどうかわからなくなる
URL履歴保存して被ったら排除&レジューム用に重複無視フラグを付けるわ

716:名無しさん@お腹いっぱい。
10/12/13 23:11:50
別に重複しててもよくね

717:名無しさん@お腹いっぱい。
10/12/13 23:58:39
URLリスト作った後、TextSorterってソフトで重複URL削除してる。

DL後、破損ファイル調べて別フォルダへ移動、その時に同じ題名(同名フォルダ)があれば上書き聞いてくるので内容確認する。
DL時にかぶるのは仕方ない。

718:名無しさん@お腹いっぱい。
10/12/14 17:39:41
exhentai.orgが対策されててぐぐってたらここにたどり着いた
おめぇらすげーな!ありがたく知識を吸収してくわ

719:名無しさん@お腹いっぱい。
10/12/14 17:51:59
ちょっとtesuto
/b7/12/b712c1b22a90d6ea95ba1c52712300e140b7c126-618002-1045-1513-jpg_l.jpg
URLリンク(exhentai.org)



URLリンク(exhentai.org)

720:名無しさん@お腹いっぱい。
10/12/14 18:03:18
いやここでテストせんでも

721:名無しさん@お腹いっぱい。
10/12/14 18:16:09
[test] 書きこみテスト 専用スレッド 3 [テスト]
スレリンク(unix板)

722:名無しさん@お腹いっぱい。
10/12/14 18:31:32
あ、あるんだごめんね
Tucanなんてダウンローダーもあるんだね!
今これ使うために仮想デスクトップにUbuntuインストールしてるところ
いやぁいい収穫だったよ
本当にありがとう

723:名無しさん@お腹いっぱい。
10/12/15 00:42:25
>709
URLリンク(exhentai.org)
URLリンク(exhentai.org)

↑indexが無いって言われる・・

724:名無しさん@お腹いっぱい。
10/12/15 11:17:30
Download start.
Index URL: URLリンク(exhentai.org)
Can't get index page from URLリンク(exhentai.org)
Download failed.

725:名無しさん@お腹いっぱい。
10/12/15 12:11:38
pining for the fjords.ってどういう意味なんだろう

726:名無しさん@お腹いっぱい。
10/12/15 16:27:43
「This gallery is pining for the fjords」を翻訳してみた

google→このギャラリーは、フィヨルドの追悼です。
excite→このギャラリーはフィヨルドに思い焦がれています。

意味わからん

727:名無しさん@お腹いっぱい。
10/12/15 16:40:52
URLリンク(www.urbandictionary.com)
ここ見る限りでは、死んでまっせってことかな

728:名無しさん@お腹いっぱい。
10/12/15 18:36:15
>>727
そこを翻訳すると死んでる扱いにしてるってことか…

しかしインデックスが見えないと不便だな

729:名無しさん@お腹いっぱい。
10/12/15 19:26:14
カテゴリーと日本語訳の作品名が拾えないね

730:名無しさん@お腹いっぱい。
10/12/15 21:19:19
シコシコと手動でやった方がいい

731:名無しさん@お腹いっぱい。
10/12/15 22:58:05
say-moveオワタ

732:名無しさん@お腹いっぱい。
10/12/16 05:44:37
警察動いたんだろうねおそらく

733:名無しさん@お腹いっぱい。
10/12/16 13:14:59
>>725-726
あのさぁ、ほんのちょっと前のレスも読めないの?文盲なの?

734:名無しさん@お腹いっぱい。
10/12/16 13:17:38
>>732
----
運営の継続が難しい状況になっておりますので、
大変遺憾ながら、
SayMove!を一旦閉鎖します。
当然ながら、他者から要請があった訳ではなく、
自主的な閉鎖となります。
----
って書いてあるだろ。
自主的な閉鎖なんだよ。

735:名無しさん@お腹いっぱい。
10/12/16 16:37:07
>>733
え?どのレスに>>725の意味や翻訳が書いてあるの?

736:名無しさん@お腹いっぱい。
10/12/16 16:47:15
>>723 >>725あたりは同一人物だろ
スレを探すことすらできないアホだからな
っていうか今更w


737:名無しさん@お腹いっぱい。
10/12/16 16:55:28
>>723は少し前のレスも読めないバカだと思うよ
でも>>725は意味を聞いてるのに>>733のちょっと前のレスも読めないの意味が理解できない
確かに>>713にはそれに対する対策が書かれてるがフィヨルド云々の説明が出たのは>>727だし

まぁ熱くなることでもないんですけどね

738:723
10/12/16 17:01:57
私は725は書いてません
で、>713は勿論読みましたが、ちょっと意味わからなかったのです。

URLリンク(exhentai.org)
だったら、
URLリンク(exhentai.org)
になるわけですが、これって1枚目の画像のURLですし、ehgmに読ませても
反応してくれないし・・?

739:名無しさん@お腹いっぱい。
10/12/16 17:06:11
LO拾うんなら他所で落としたほうが早いだろw

740:名無しさん@お腹いっぱい。
10/12/16 17:07:26
LOとか条例で規制されるw

741:723
10/12/16 17:21:40
>739
勿論ブツ自体はPDやアップローダで既にアレしていますw
shareにももう輸入されてるんじゃないでしょうか

742:名無しさん@お腹いっぱい。
10/12/16 18:18:37
>>713試したけど、You can not access a file directly without specifying a gallery. Please get the full URL for this image.
とか出て見れなくなってる


次ページ
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch