08/10/29 14:25:30 HpnRcegL0
Crawler.pl (←メイン)
./plugin (プラグインを入れるフォルダ)
みたいな構成にしてCrawler.plはソースを取得してプラグインに渡して
プラグインがソースをパース(解析)して画像URLをCrawler.plに返して
Crawler.plがDLするみたいな形にした方がすっきりしていいかもな
>>645
そこはクッションファイルがあるから面倒なんだよな。
/www\.dotup\.org\d+\.(?:bmp|gif|jpg|jpeg|png)\.html$で落とせるけど、
ファイルの末尾が.jpg.htmlになってるのをBerryがjpgだと誤認識して
htmlをjpgとしてDL→その上に本物のjpgをDLみたいになってきしょい。
後、今気付いたけどBerryは3ページ以上はリンク辿ってくれないぽいから
トップページにある画像しか集めてくれない。
2.html、3.htmlと個別に設定すればいいけど。