05/11/18 19:49:09
edなり perlなりで、ばっと<span class="articleheadline"~</P></span>あたり抜き出して、html2txtみたいな処理かけて、余計なの削るとか。
そういうことではない?
961:名無しさん@お腹いっぱい。
05/11/18 22:10:42
>>960
perl で $html =~ s!!!sig; を何度も繰り返すスクリプト書いて、なんとか読めるHTMLに加工しました。
今は mp3 を wget してます。
このサイト、mp3 は mp3 で命名規則皆無という腐りっぷりです。うへぇ。
ところで質問です。
ちょっと確認してみたところ GNU Wget 1.10.1 のデフォルトのリクエストは
GET /index.htm HTTP/1.0
User-Agent: Wget/1.10.1
Accept: */*
Host: localhost
Connection: Keep-Alive
という内容でした。で、プロトコルを HTTP/1.1 に切り替えるか、
または強制的に HTTP/1.1 と申請してリクエストすることはできますか?
962:名無しさん@お腹いっぱい。
05/11/18 23:45:53
curl使ってみるとか
963:名無しさん@お腹いっぱい。
05/11/19 05:30:52
>>961
どーせPerl使うんならHTML::TokeParserとかその辺のライブラリ使えばいいのに。
高速ではないけどそれなりに便利だよ。
964:名無しさん@お腹いっぱい。
05/11/28 22:50:25
次スレどうしますか?
965:名無しさん@お腹いっぱい。
05/11/29 09:40:42
次
ス
レ
頼
ま
な
い
966:名無しさん@お腹いっぱい。
05/11/29 16:31:03
頼みcom
967:名無しさん@お腹いっぱい。
05/11/29 18:27:16
>>977までは粘れると思われ。
968:名無しさん@お腹いっぱい。
05/11/29 22:52:17
>>980が立ててくれるってさ
969:名無しさん@お腹いっぱい。
05/11/30 15:53:56
>>980
今度のスレタイは↓こうしてくれ
「連番のH画像/動画を一気にダウンロードする」
970:名無しさん@お腹いっぱい。
05/11/30 17:39:06
これは言わない約束なのかもしれんが
「H」は外さないうわなにするやめろqあwせdrftgyふじこlp:[
971:名無しさん@お腹いっぱい。
05/11/30 18:26:42
じゃあ
連番のURIから一気にダウンロードする /2
でよろしかったでしょうか?
972:名無しさん@お腹いっぱい。
05/12/01 21:44:37
てか連番ている?
973:名無しさん@お腹いっぱい。
05/12/01 21:50:49
ネタ出つくしたみたいだし、
次スレなしでもいいかと。
974:名無しさん@お腹いっぱい。
05/12/03 16:03:25
最近動画落とすのにパスワードが必要だったりするので
自動化は無理そうだと思ったり思わなかったり
975:名無しさん@お腹いっぱい。
05/12/07 08:43:36
>>955詳 し く
976:名無しさん@お腹いっぱい。
05/12/13 14:55:32
次スレ
スレリンク(unix板)
977:FM
05/12/18 21:28:53
>>975
opera使えば右クリックが効くからURLがわかりますよ。
それで、
464.jpってURLリンク(comic110.464.jp)
以降がwgetですんなりDLできないのですがなんでかわかりますか?
URLリンク(comic104....)などは普通にできるけど、ドラゴンボールが取れない。
operaで直接url書けばみれるのですが,なんででしょうか?
あれ、この板ってもう別にうつってる?
978:名無しさん@お腹いっぱい。
05/12/19 01:02:57
>>952
ここまでスレが進んでるのにまとめにcurlが載ってないのは信じられない
979:名無しさん@お腹いっぱい。
05/12/21 03:21:09
>>977
レスありがとうございます
私はlunascapeというタブブラウザを使っていてそれで画像のurlを抜き取り
連続ダウンローダで連番のを落としてみたのですが見てみると画像情報がなくすべて見れないファイルでしたorz
jpegファイルなのに見れないんですよね。。
ちなみに私が試したのはドラ●もんでURLリンク(comic104)でしたができませんでした。。
噂によるとダウンロードできないようにしてるサーバーとかあるようです.....(´・ω・`)
980:名無しさん@お腹いっぱい。
05/12/21 09:33:01
どざ氏ね
981:名無しさん@お腹いっぱい。
05/12/21 15:31:35
>>979
やってみたけど、問題なくダインロード&表示できるよ。
>>979のスキルの問題
982:名無しさん@お腹いっぱい。
05/12/21 15:52:11
ダインロードってなんかかっこええな
983:名無しさん@お腹いっぱい。
05/12/22 01:54:40
スキルでなく、クンフーの問題
984:名無しさん@お腹いっぱい。
05/12/22 03:59:39
>>981
ホントですか・・・(゚Д゚)一体何が原因なんでしょうか・・・・
私もダウンロード自体はできてるのですがフォルダにダウンロードされた
画像ファイルを見てみると表示されませんorz ソフトやURLなどいろいろ確認しましたが。。orz
今は結局freemacroでダウソしてるんですが時間かかりまくりんぐ・・・orz
985:名無しさん@お腹いっぱい。
05/12/24 10:06:45
>>984
ヒント:連番ダウンローダはrefereを使ってくれない。
986:nyanko
05/12/24 12:10:46
>>985
wget でも普通に指定できるYO!
987:名無しさん@お腹いっぱい。
05/12/24 15:55:24
>>986
TU○ にもしかしている方?
>>984
なんか、ほんとにクンフーたりないねきみ。。。
988:名無しさん@お腹いっぱい。
05/12/24 16:45:08
ここがunix板だと気づいていないんじゃないのか。
989:名無しさん@お腹いっぱい。
05/12/24 17:20:08
来年の1月10日で5周年だな
990:名無しさん@お腹いっぱい。
05/12/24 19:12:34
今まで誰も出していないが,emacs 上でウェブブラウザ(w3m とか)を走らせて,
画像をダウソロードする手順をキーボードマクロで登録しておけば,
特に何も考えなくてもほとんどのサイトでダウソロードできます.
991:名無しさん@お腹いっぱい。
05/12/25 03:14:29
>>990
具体的に書かないのは宗教上の問題かなんか?
992:名無しさん@お腹いっぱい。
05/12/25 07:30:18
キーボードマクロの手順を具体的に書くの?w
993:名無しさん@お腹いっぱい。
05/12/25 13:32:48
インタラクティブってアホじゃありません?
994:名無しさん@お腹いっぱい。
05/12/26 03:13:07
おい、次スレが立ってるぞ
スレリンク(unix板)
995:名無しさん@お腹いっぱい。
05/12/26 10:26:56
(゚д゚)ウメー
996:名無しさん@お腹いっぱい。
05/12/26 10:28:39
(゚д゚)ウメー
997:名無しさん@お腹いっぱい。
05/12/26 10:30:27
(゚д゚)ウメー
998:名無しさん@お腹いっぱい。
05/12/26 11:00:26
まんこ
999:名無しさん@お腹いっぱい。
05/12/26 11:01:29
(゚д゚)ウメー
1000:名無しさん@お腹いっぱい。
05/12/26 11:02:34
(゚д゚)ウメー
1001:1001
Over 1000 Thread
このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。