02/01/18 17:12
俗に言う、インターネットの希望のページを自動巡回して
オフラインで見るオートパイロットソフトを作りたいの
ですが、何をしていいのやら、手がかりすら分かりません。
オンラインソフト使えば?といわれるでしょうか、後学の為
どうしても、どうしても、ど~しても自作で作りたいのです。
よきアドバイスを宜しくお願いします。
2:
02/01/18 17:14
ドシロウトの私ですが、後学の為、完成するまであげ続けます。
ちなみに言語はCがいいです。
というよりコンパイラはそれしかないです。
レベルは文法が少しわかる程度。
この程度でも、いっぱしのプログラムが出来るようになる事を
証明したいのです。
ほんとにほんとにアドバイスお願いします。
3:3
02/01/18 17:15
3
4:
02/01/18 17:16
まず、たしかどこかにソースコードを公開している
自動巡回ソフトがあった記憶があります。
どなたかよい情報をお待ちしています。
私も現在探しています。
5:3
02/01/18 17:17
このソース参考にすれば?
WWWC Ver 1.0.1 (2001/11/28)
URLリンク(www.nakka.com)
6:デフォルトの名無しさん
02/01/18 17:21
ふつー、wget
7:
02/01/18 17:22
>>5
有難う御座います。
本当に超ドシロウトなんて、早速ダウンしてみます。
8:デフォルトの名無しさん
02/01/18 17:24
>>6
禿同。度素人ならwgetの周りをサポートする
スクリプトでも書いたほうがいいんじゃないのか?
9:3
02/01/18 17:26
>>6、>>8
ソースあげてあげれば?
10:
02/01/18 17:29
>>6さん有難うございます。
wgetってこれでしょうか?でもUNIXですが・・・
WIN版ってあるんでしょうか?
やっぱりアプリ開発はUNIXのほうがやりやすい
んでしょうか?でもUNIXを走らせるパソコンがないんですよ。
URLリンク(www.vector.co.jp)
11:デフォルトの名無しさん
02/01/18 17:32
>>10
ほい。
URLリンク(space.tin.it)
あるいは Cygwin という Windowds 上で UNIX 環境を構築するソフトウェアもある。
URLリンク(sources.redhat.com)
wget と Perl を組み合わせれば半日くらいで作れると思うよ。
12:
02/01/18 17:35
>>11
有難うございます。
ちょっと忙しくなったので、少しだけ家を空けます。
>wget と Perl を組み合わせれば半日くらいで作れると思うよ。
私の場合、一年はかかると思います。
ほんと大昔にCの本を1冊読んだ程度のレベルです。
13:デフォルトの名無しさん
02/01/18 17:55
確かに C だけだと時間かかるかもね。
Windows だとライブラリ少ないし。
お勧めは、
C++ 覚えて BCC32 で IE コンポーネント使うか、
Delphi 覚えて Indy 使うか。
14:デフォルトの名無しさん
02/01/18 17:59
>ちなみに言語はCがいいです。
>というよりコンパイラはそれしかないです。
で、LSI-C試食版という罠。
15:デフォルトの名無しさん
02/01/18 18:07
>>1
適当に選んで読んでくれ。
これからはどの言語?
URLリンク(pc.2ch.net)
現在ある言語の中でどれが最高?
URLリンク(pc.2ch.net)
趣味でプログラムをするにはどの言語がいいかな?
URLリンク(pc.2ch.net)
実務に役立つプログラミング言語は?
URLリンク(pc.2ch.net)
16:デフォルトの名無しさん
02/01/18 18:10
つーか>>1よ。
固ハンかトリップを使ってくれ(藁
17:デフォルトの名無しさん
02/01/18 19:00
>>16
うむ。法則に反するからな(藁
18:デフォルトの名無しさん
02/01/19 04:27
あ、いいスレだ。参考にさせてください、過程を。
19:デフォルトの名無しさん
02/01/19 07:39
>>1
プログラム自体は参考にならんかもしれんが、スレの育て方として、
参考になるかも。
貴様ら!ブロック崩し作るので見てください
スレリンク(tech板)l50
20:1です
02/01/20 00:57
今日は何も出来なかったです。
とほほ・・・
21:デフォルトの名無しさん
02/01/20 01:42
>>1
GNU wget は、小規模なダウンロードなら問題ありませんが、
大規模ダウンロード (検索エンジン用ファイル収集)で使うと、
誤動作しまくりです。
とりあえず、プログラム作成することが目的であれば、
Active Perl をインストールして、
(1) LWP::UserAgent クラスで、HTMLファイルを取り寄せて、
(2) HTML::TreeBuilder クラスで、HTMLファイルをパース処理して
リンクを抽出
(3) 各リンクについて、(1)へループ処理
というのを書いては、いかがでしょうーか?
22:202.221.45.130
02/01/20 01:48
202.221.45.130
俺のIPアドレスだ、おめーらの技量じゃハックデきね~だろうけどw
23:デフォルトの名無しさん
02/01/20 02:08
>>22
やめろ、ケブ厨。
24:デフォルトの名無しさん
02/01/20 02:09
>>22
どうでもいいが、自動巡回とどう関係が?
25:デフォルトの名無しさん
02/01/20 02:14
マルチポストは気にしない
26:1です
02/01/20 22:43
今帰ってきました。
スレ立てたものの、まだ何もやってない(泣
必ずやるんで見捨てないでください。
といいつつ、やらなきゃいけないことが帰ってからも
沢山あるんで、一時間後ぐらいに戻ります。
27:デフォルトの名無しさん
02/01/20 22:46
おれperlでいいスクリプト見つけたんで、
それ改造して使ってる。有名になって露骨に制限されるの
嫌だから所在教えないけど。
やっぱこういうのはスクリプト系が便利だよ。
あと、ページによって各ツールには向き不向きがあるから、
おれは2,3種類組み合わせて使ってる。
28:1です
02/01/21 01:23
みなさん色々な情報有難うございます。
一時間でも勉強するつもりでしたが、雑用を済ませたら
こんな時間になってしまいました。
明日こそ必ず始めたいです。。。
もう寝ます。
29:デフォルトの名無しさん
02/01/21 01:38
Λ_Λ! / ̄ ̄ ̄ ̄ ̄ ̄ ̄
__( ;´Д`)__< ゆ、夢かっ…!
| 〃( つ つ | \_______
|\ ⌒⌒⌒⌒⌒⌒\
| \ \
\ |⌒⌒⌒⌒⌒⌒|
\ |______|
30:デフォルトの名無しさん
02/01/21 01:40
スマン誤爆(;´Д`)
31:デフォルトの名無しさん
02/01/21 01:44
話が微妙に繋がってないこともないような。
32:デフォルトの名無しさん
02/01/21 02:41
>>1 はダイヤルアッパー
33:デフォルトの名無しさん
02/01/22 03:58
>>32 ダイヤラーアップ
34:デフォルトの名無しさん
02/01/22 12:58
>>1は結局巡回ソフトつくらないに1000モナー
35:まちゅ ◆VcvMACHU
02/01/22 17:52
自動巡回系ソフトって思った以上にやることがめんどくさいよね。
HTMLを解析して再帰的にファイルを拾うところとか、
ローカルで閲覧できるようにファイルのパスを相対パスに書きかえるとか。
これを作れるようになったらかなりのスキルの持ち主になれるよ!
ただし、途中で投げると>>29になるがな。
36:デフォルトの名無しさん
02/01/22 23:41
| ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄|
| ageときますね |
|____________|
||
||_ ___
し\/´∀`;:::\
\ /::::::::::::|
| /.:::::|:::::::|
|/::::::::|::::::::|
37:デフォルトの名無しさん
02/01/22 23:42
∧_∧
( ´Д`)
/⌒ ヽ
/ / ノヽ _ー ̄_ ̄)', ・ ∴.' , .. ∧_∧ ∴.'.' , .
( /ヽ | ) --_- ― = ̄  ̄`:, .∴ ' ((( #)゚Д゚) .∴ '
\ / _, -'' ̄ = __―=', ・,' .r⌒> _/ / ・,' , ・,‘
( _~"" -- _-―  ̄=_ )":" .' | y'⌒ >>1⌒i .' . ’
| /,,, _―  ̄_=_ ` )),∴. ). | / ノ | ∴.'∴.'
| / / ―= _ ) ̄=_) _), ー' /´ヾ_ノ
( ) ) _ _ )= _) ,./ , ノ '
| | / = _) / / / , ・,‘
| | |. / / ,' , ・,‘
/ |\ \ / /| |
∠/  ̄ !、_/ / )
|_/
38:デフォルトの名無しさん
02/01/22 23:49
まちゅ、ってだれ?ム技板の空気固定?
39:デフォルトの名無しさん
02/01/23 00:49
>>37
なんてぇナニだ・・・。
40:21
02/01/23 01:03
このスレはもう終わってますか?
41:>>1
02/01/23 01:50
口だけか……
42:1
02/01/23 02:29
. ∩
∧_∧ | | / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
( ´,,,,,,`)// < 裸一貫から再建を目指す!!!
/ / \__________
/ /~| ゚ ゚ /
| | l |
\ ̄∪ ̄| ̄ ̄ | ̄ \
||\ | ㊚ | \
||\|| ̄| ̄|~| ̄| ̄ ̄||
|| || ̄| ̄|~| ̄| ̄ ̄||
.|| (_| |_). ||
43:デフォルトの名無しさん
02/01/24 03:00
ヽ(`Д´)ノ ボッキアゲ
44:R29
02/01/24 09:38
私も興味があったのですが、
1が作らないようなので、
勝手にPerlで始めてみました。
よかったらコメントください。
URLリンク(ice.prohosting.com)
45:とあるプログラマ
02/01/24 16:14
>>44
perl知らない。CかC++でかけないの?
46:デフォルトの名無しさん
02/01/24 16:22
C で HTTP 通信するサンプルみつけた
URLリンク(www.mars.dti.ne.jp)
47:デフォルトの名無しさん
02/01/25 02:49
>>35
「かなりのスキル」って事は無いな。
48:R29
02/01/25 04:32
>>45
Cでもいいですけれど、HTTPとかHTMLむけの手ごろな
ライブラリがあればやってみます。厳密な文法の
ない(あっても従っていない)テキストのパーサーを
作るのことにあまり興味がないので、このへんは
自分で書くのは面倒くさいです。タグがへんなHTMLでも
ブラウザーがちゃんと表示できるのはチェックをすごく
甘くしているか、適当にタグを補っているからだと思います。
49:デフォルトの名無しさん
02/01/25 05:18
IHTMLDocment2使っちゃえば解析の手間は省けるな。
50:デフォルトの名無しさん
02/01/25 09:02
>>46見ると、普通にWinSockで通信してるだけだなぁ・・・。
これ自体はなんの変哲も無いもんだけど、自動巡回プログラムとやらになると
「かなりのスキル」になるのかねぇ・・・?
51:デフォルトの名無しさん
02/01/25 12:59
>>48
libghttp libxml2
52:まちゅ ◆VcvMACHU
02/01/25 16:36
>>38
ム技板になんか書いたっけなあ?どっちにしても空気固定には間違いないよ。
>>47 >>50
いまの>>1からの状態からすればそれなりにスキルがつくよ、ってことでした。
おおげさすぎてすんません。
通信部分よりもパーサー部分はちょっと面倒なんじゃないかな。
53:R29
02/01/25 18:02
>>51
thanks、googleで見てみます。
>>52
よく考えたらHTML内には<>は出てこないので、<とか>とかになって
いるので、<>をトークンにサーチするだけで簡単にできますね。
それも<a>と<img>だけしか見ないので、構文解析と言えるほどの
物もないですし。
54:R29
02/01/25 18:07
&ltとか&gtとかと書きました。
Perlの勉強も兼ねているので、まずはPerl版を
完成させてみたいです。
55:デフォルトの名無しさん
02/01/25 19:57
昔作ったけど、ぶっちゃけた話、リンク生かしたままローカル保存するのはかなり難しいよ。
まともに見えるようにするだけでも A#HREF や IMG#SRC だけじゃ足りなくて
BODY#BACKGROUND, FRAME#SRC, BASE#HREF, LINK#HREF,
OBJECT#DATA, OBJECT#CODEBASE, EMBED#SRC, APPLET#CODEBASE,
APPLET#ARCHIVE, SCRIPT#SRC, META#(HTTP-EQUIV="Refresh" の時の CONENT の url 値)
なんかが必要だし、クリックで動かそうと思ったら AREA#HREF, FORM#ACTION なんかも
必要。JavaScript やスタイルシート中の URL はいじれないし、Cookie 実装しないと
取れないページがあったり、HTTP/0.9 で返してくる阿保 CGI があったり、https や
gopher とか抜かすページがあったり、URL の一部を全角で書いているパチンコ屋が
あったりとそりゃぁもう (以下略)
まぁそこまでページの完全性にこだわらなければ良いのかもしれない。IE にページ保存
機能があるから、もしかしたら VC++ でもそれを呼び出せるかもしれない。Proxy とか
考えなくても良くなるし。
56:デフォルトの名無しさん
02/01/26 23:15
>>55
baseタグって知ってる?
57:デフォルトの名無しさん
02/01/26 23:17
>>55 >>56
mhtmlアーカイブって知ってる?
58:55
02/01/27 00:20
>>56
<BASE> タグ使ってもネットに繋がってなければフレームや画像、抜けるじゃん。
何のために自動巡回すんのよ。
59:デフォルトの名無しさん
02/02/01 21:27
>>1出てこーーーーーーい!!!
age
60:名無しさん@そうだ選挙にいこう
02/02/02 00:08
あのー少しご質問よろしでしょうか?
結局、自動巡回ってリンクを辿る方向しかないのでしょうか?
Irvi○eでは構造的に取得してませんでしたっけ?
そこから抜き取るとリンクを辿る事は一切しなくても良いような気が・・・
上記ソフトは実際どのようにされてるのでしょうか?
誰かご存知ないでしょうか?
61:仕様書無しさん
02/02/02 00:44
age
62:
02/02/02 05:03
>>60
そのソフトの事は知らんが、普通に考えて、
リンクをたどらなければ、どういうソースがあるか分からないのでは?
ある決まったページの構造の規格があってと言うのなら、
リンクをたどらなくても分かるけど、そんな規格なんて聞いたこと無いし。
63:デフォルトの名無しさん
02/02/02 12:13
>>62 thx!!
と言う事はIrvi○e(Ir○aの後継版)もリンクを辿ってるのか・・・
FTPで「List」って命令があるからてっきりそれかと思ってたYo
やっぱりそうか。FF○TPでも参考にしようか・・・
64:デフォルトの名無しさん
02/02/02 13:10
FTPとHTTPの違いぐらい判っておけよ‥‥
65:デフォルトの名無しさん
02/02/04 10:36
99 名前:名無し募集中。。。 投稿日:02/02/04 10:32
プログラム板で、かちゅ~用閲覧時間規制ソフトを作ってもらうってのが
いいと思う。例えば、1日の閲覧時間30分以内に出来たりするソフト。
マジで誰か作って暮れ、頼む。
そうすれば、転送量が減るから運営側も助かると思うし。
66:デフォルトの名無しさん
02/02/04 10:37
>>65
kage に組み込めばいいんでないの。
単に他の2chブラウザに流れるか、
普通のブラウザに戻るかするだけだろうけど。
67:デフォルトの名無しさん
02/02/20 05:19
●━ ∩━━ ∩━●
// | |
// | |
| | //
| | ∧ ∧ // / ̄ ̄
| |( ゚Д゚)// < AGE!!
\ | \__
| |
| /
/ /
| /
∫| | |
| || |
| / | |
// | |
// | |
// | |
U U
68:デフォルトの名無しさん
02/03/14 08:48
age
69:1
02/03/26 03:19
┌─┐
|も.|
|う |
│来│
│ね│
│え .|
│よ .|
バカ ゴルァ │ !!.│
└─┤ プンプン
ヽ(`Д´)ノ ヽ(`Д´)ノ (`Д´)ノ ( `Д)
| ̄ ̄ ̄|─| ̄ ̄ ̄|─| ̄ ̄ ̄|─□( ヽ┐U
~ ~  ̄◎ ̄ . ̄◎ ̄  ̄◎ ̄ ◎->┘◎
ヽ(`Д´)ノ モウコネエヨ!!
( ) ウワァァン!!
/ ヽ
70:デフォルトの名無しさん
02/04/04 16:23
く  ̄i
〉 |
/ |
/\ / ノ
/_,,ィ、.\ | |
\ `ヽ,, -‐、 ,ノ |
\/ /⌒'' ー-' |
゚ 。 / /ー 、,,_ ノ
゜ ,f l∧_∧フ . /
/ ,,( __ ) >>1 /
,, - 、 / ヽ,,___,, 、__ノ
,-、/'l, \ノ / \,,__,,ノ ヒィー
ヽ,_,/ \ / ∨ ∨
ヽ,, ,ノ 。゚ ・
,,'' ̄ノ
_/ /
ヽ ノ
::::::::::::::::::::::::::::::::::::
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
71:デフォルトの名無しさん
02/04/05 09:17
URLリンク(isweb34.infoseek.co.jp)
72:デフォルトの名無しさん
02/04/12 20:06
∧||∧
( ⌒/
∪ / / ヽ>>33
/ ノ
∪∪
∧ ∧,~
( (⌒ ̄ `ヽ _
\ \ `ー'"´, -'⌒ヽ
/∠_,ノ _/_
/( ノ ヽ、_/´ \
、( 'ノ( く `ヽ、
/` \____>\___ノ
/ /__〉 `、__>
/  ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
なんてことを言うのだ貴様!!
73:デフォルトの名無しさん
02/04/12 20:49
このスレ、何度も答えが出てるのに、なぜか終わんないねぇ。
74:デフォルトの名無しさん
02/04/22 16:13
漏れら極悪非道のageブラザーズ!
今日もネタもないのにageてやるからな!
 ̄ ̄∨ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
∧_∧ ∧_∧ age
(・∀・∩)(∩・∀・) age
(つ 丿 ( ⊂) age
( ヽノ ヽ/ ) age
し(_) (_)J
75:_
02/04/22 21:08
ん~
俺はVBしか使えん房なのであんま口出しできないんですけど。
自動巡回っていうか、前VBでメールアドレス収集ソフト作ったんですよ(w
それだとめちゃくちゃ簡単だったです。(当たり前だけど)
あるページのソース見てまずはメアドを検出。
さらにリンク先のアドレスを全てどっかに代入
そのリンク先のページを順に開いて、、、
とあとは階層分同じ作業しました。
76:デフォルトの名無しさん
02/04/22 21:50
test
77:
02/04/23 00:32
78:1だけど何か?
02/05/08 09:25
/ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
| >>77通報しますた!
\
 ̄∨ ̄ ̄ ̄ ̄ ̄ ̄
∧_∧ / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
∧_∧ ( ´Д`) < 通報しますた!
( ´Д` ) /⌒ ⌒ヽ \____________
/, / /_/| へ \
(ぃ9 | (ぃ9 ./ / \ \.∧_∧ / ̄ ̄ ̄ ̄ ̄ ̄ ̄
/ /、 / ./ ヽ ( ´Д` )< 通報しますた!
/ ∧_二つ ( / ∪ , / \_______
/ / \ .\\ (ぃ9 |
/ \ \ .\\ / / ,、
/ /~\ \ > ) ) ./ ∧_二∃
/ / > ) / // ./  ̄ ̄ ヽ
/ ノ / / / / / ._/ /~ ̄ ̄/ /
/ / . / ./. / / / )⌒ _ ノ / ./ (゚д゚) < ツウホウシマスタ!
/ ./ ( ヽ、 ( ヽ ヽ | / ( ヽ、 ゚( )-
( _) \__つ \__つ).し \__つ ./ >
79:デフォルトの名無しさん
02/05/08 10:46
4ヶ月以上経ったけど、結局>>1はなんか作ったのか?
80:1
02/05/08 12:30
子供作りますた。
81:デフォルトの名無しさん
02/05/08 16:55
そいつはめでたい。1よ、おめでとう!
ところでどうやって作ったんだい?
全コード公開してほしいのだが。
82:++
02/05/23 00:30
/ | | |
| | | |
|ー | l ー- l
/⌒ヽ | | l l
l l | | | 0 |
| l | ー- | l⌒) - l
| -‐| | | | 丿 | /⌒ヽ
| | | | |ノ l | ヽ
l _! | !__,! ‐ 一 | l ヽ、
/⌒ヽ l ‐ \ |, ノ⌒) () l 〉-‐ l
l〉 )ヽ、 ヽノ (ノO (ノ (つ ヽ、 | ノ) |
/ 人 ヽ、 __ (⌒) __ ヽノ (ノ |
l ヽ、\, - '"-ゞ'-' )丿'"ゞ'-'ノ/ o l
ヽ ノ \,/ / (ノ () ヽ l
\ / ( ,-、 ,:‐、 (⌒ヽ |
ヽ、 / / l しノ |
ヽ、 / __,-'ニニニヽ l
ヽ、 ヾニ二ン" /
ヽ、 | /
ヽ l /
1は既にこのスレから逃亡したと見抜ける人でないと
(こすっていた手で発射された液体を受け止めるのは)難しい。
83:デフォルトの名無しさん
02/06/06 11:19
__,,,,_
/´  ̄`ヽ,
/ 〃 _,ァ---‐一ヘヽ
i /´ リ}
| 〉. -‐ '''ー {!
| | ‐ー くー |
ヤヽリ ´゚ ,r "_,,>、 ゚'}
ヽ_」 ト‐=‐ァ' !
ゝ i、 ` `二´' 丿
r|、` '' ー--‐f´
_/ | \ /|\_
/ ̄/ | /`又´\| |  ̄\
皇太子様がこのスレに興味を持ったようです。
84:デフォルトの名無しさん
02/07/01 08:33
>>81↓
「 ̄ ̄了
l h「¬丨
/ ̄ ̄\__,ト、Д/____ ハイハイどいてどいて!
/ / ̄Yi. / jテ、 f ̄ヨ
/ ./:::' / / /.i l iー―‐u' ̄
./ /ー'' / / / / l l
i' / l ヽ../ レ' l l
. / _/ \ !、 lヽ____」 l
. !、/ \. \ \l ト./
ト、__\/ト、/ト、 y l
l  ̄( )y ) /l i
l l Y''/ー' / .l l
!、 l l./ / l l
/ / l/ ,/ i' l
/_ ./l l`ー‐〈 ト.__」
L_``^yト._」、ー" `ヽ_」
`ー' `ヽ_」
85:デフォルトの名無しさん
02/07/02 00:18
>>84
sageてても見逃さない。
86:デフォルトの名無しさん
02/07/17 03:57
現実にあったらしょっぱいなぁオイ
87:デフォルトの名無しさん
02/08/05 07:15
88:デフォルトの名無しさん
02/08/11 20:35
ageるなカスども
89:デフォルトの名無しさん
02/08/11 20:37
>>82
かおにみえる
90:デフォルトの名無しさん
02/08/11 20:45
そりゃ顔だからなぁ
91:デフォルトの名無しさん
02/08/11 21:57
>89
あなた危険よ。
92:デフォルトの名無しさん
02/08/12 00:27
airWebのAir C じゃ駄目ですか?
通信関係(とHTML解析)のライブラリがそれなりに揃ったC言語です。
「オフラインで見る」部分は用意されているので、巡回部分だけ書けばおっけー。
93:デフォルトの名無しさん
02/08/12 10:55
| ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄|
| 笑う所ですよ!! |
|_________|
∧_∧ ||
( ´∀`)||
/ つ つ||
94:デフォルトの名無しさん
02/08/12 11:47
h
95:デフォルトの名無しさん
02/08/13 01:14
>>1
>> 75が一番の近道だよ。
96:デフォルトの名無しさん
02/08/13 03:11
URLリンク(2next.net)
97:デフォルトの名無しさん
02/08/13 03:26
URLリンク(2next.net)
98:デフォルトの名無しさん
02/09/28 03:00
ロッシのモミage
99:デフォルトの名無しさん
02/10/21 22:36
俺に聞け
100:デフォルトの名無しさん
02/10/21 22:47
つーか高速回線+googleあれば巡回ソフトなんていらないだろ。
101:_
02/11/05 07:46
age
102:デフォルトの名無しさん
02/11/05 08:06
ずいぶん懐かしいスレだな
103:デフォルトの名無しさん
02/11/16 03:16
URLリンク(2next.net)
104:デフォルトの名無しさん
02/11/26 07:16
URLリンク(www.kiso.tsukuba.ac.jp)
105:デフォルトの名無しさん
02/12/08 02:45
106:デフォルトの名無しさん
02/12/08 02:45
107:デフォルトの名無しさん
02/12/08 02:46
108:名無しさん
03/01/05 02:25
/ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄\
Λ_Λ | 君さぁ こんなスレッド立てるから |
( ´∀`)< 厨房って言われちゃうんだよ |
( ΛΛ つ >――――――――――‐<
( ゚Д゚) < おまえのことを必要としてる奴なんて |
/つつ | いないんだからさっさと回線切って首吊れ |
\____________________/
(-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ…
(∩∩) (∩∩) (∩∩)
(-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ…
(∩∩) (∩∩) (∩∩)
(-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ…
(∩∩) (∩∩) (∩∩)
109:IP記録実験
03/01/08 21:57
IP記録実験
スレリンク(accuse板)
1 名前:ひろゆき ◆3SHRUNYAXA @どうやら管理人 ★ 投稿日:03/01/08 17:13 ID:???
そんなわけで、qbサーバでIPの記録実験をはじめましたー。
27 名前:心得をよく読みましょう 投稿日:03/01/08 17:20 ID:yL/kYdMc
SETTING.TXT管轄でないということは全鯖導入を視野に、か?
38 名前:ひろゆき ◆3SHRUNYAXA 投稿日:03/01/08 17:22 ID:rLfxQ17l
>>27
鋭いです。
73 名前:ひろゆき ◆3SHRUNYAXA 投稿日:03/01/08 17:27 ID:rLfxQ17l
>ところで、IPが抜かれて何か今までと変わることってあるのでしょうか?
・今までより、サーバが重くなる。
・裁判所や警察からの照会があった場合にはIPを提出することがある。
110:デフォルトの名無しさん
03/01/09 01:34
>>442
無理な相談です。
111:デフォルトの名無しさん
03/01/09 02:23
コソーリ(・∀・)
112:デフォルトの名無しさん
03/01/09 03:08
半角、ハングル、ニュース実況、欠かせない板です。
113:デフォルトの名無しさん
03/01/09 03:55
メルマガきたけど、IPを保存したとことで何もかわないよ。
IPを保存することで書き込んだ人に
責任を擦り付けられるとでも思ってんのか?
関係無いぜ。
警察の捜査はしやすくなるかもしれんが、公開責任は依然ひろゆき。
いい加減理解しろや。
日本生命の時から言われてるぜ。
判決もこれに沿ったものだったしな。
日本生命
URLリンク(www.geocities.co.jp)
114:デフォルトの名無しさん
03/01/09 13:07
書き込みした当事者の責任が問われるようになる第二段階という感じですかね。
最終的にはスレ立てしたヤツと書き込みしたヤツが法廷に引っ張り出される、と。
115:デフォルトの名無しさん
03/01/09 17:54
======2==C==H======================================================
2ちゃんねるのお勧めな話題と
ネットでの面白い出来事を配送したいと思ってます。。。
===============================読者数: 138720人 発行日:2003/1/9
年末年始ボケがそろそろ収まり始めた今日このごろのひろゆきです。
そんなわけで、年末に予告したIP記録ですが実験を開始しています。
「2ちゃんねる20030107」
こんな感じで各掲示板の最下部に日付が入ってるんですが、
20030107以降になってるところはログ記録実験中ですー。
んじゃ!
────────────Age2ch─
■この書き込みは、Age2chを使って配信されています。
──────────────
Keep your thread alive !
スレリンク(software板)l50
──────────────
116:デフォルトの名無しさん
03/01/09 23:44
ダウソ住人としては肩身が狭くなっちゃうなー
117:デフォルトの名無しさん
03/01/10 08:41
これからは、心を入れ替えて良い子にします。
よろしくお願いします。
118:デフォルトの名無しさん
03/01/10 10:00
やったね。いただきました!
119:デフォルトの名無しさん
03/01/10 10:41
くっ、ぬかったわっ!
120:デフォルトの名無しさん
03/01/10 11:11
鯖移転してないの?真っ青なんですが。。。
121:デフォルトの名無しさん
03/01/10 11:57
>>283
裁判官があの腐ったヲチ板を見て擁護すると思うか?
もし思うなら一回病院行ったほうがいい。
感覚が麻痺している証拠だ。
122:デフォルトの名無しさん
03/01/10 12:26
>>760
クッキーとアクセスログの参照を有効にしる!
123:デフォルトの名無しさん
03/01/10 13:19
DHC宛てに、
御社がスポンサーをしているラジオ番組で
『2chの書き込みをあまり真に受けて騒ぐのもどうか…』
などというコメントが出されていましたが、
現在行われている損害賠償請求訴訟への影響などを考えても好ましくないと思われますが…
なんていうような内容の投書をするヤツが出そうな予感
124:デフォルトの名無しさん
03/01/10 15:39
お、IDカコイイ!
今日はいい一日になりそう
125:デフォルトの名無しさん
03/01/10 17:08
てすと
126:デフォルトの名無しさん
03/01/10 23:27
質の低い書き込みが減った2chはいらない
127:デフォルトの名無しさん
03/01/10 23:35
絶対にばれない方法で自分の悪口のスレッドを立てる
↓(2003年現在、あります、その方法)
スレッドのレスが1000いくまで待つ。
↓
晴れて告訴
↓
IPにより一人一人を訪ねる。(告訴)
↓
儲かって、うまぁ~、うま、うま、うまトマト!
128:デフォルトの名無しさん
03/01/11 00:52
そりゃ掲示板の価値は匿名なんて関係ないんだが、
なぜ世の中に腐るほどある掲示板と比べ
2chにここまで人が集まったか考えたら匿名だった部分が大きいんじゃないかな
129:デフォルトの名無しさん
03/01/11 00:59
これでラジオ板からクソを追放できるか?
130:デフォルトの名無しさん
03/01/11 10:24
111 名前:ひろゆき ◆3SHRUNYAXA [] 投稿日:03/01/08 17:33 ID:rLfxQ17l
>datの書いた内容とIPが対になってることを証明すんのもめんどくさいもんな。
そゆことです。
114 名前:心得をよく読みましょう[] 投稿日:03/01/08 17:34 ID:ZxrhkN5z
幼女をレイプします
119 名前:ひろゆき ◆3SHRUNYAXA [] 投稿日:03/01/08 17:35 ID:rLfxQ17l
携帯電話からご苦労様です。
139 名前: ◆FruitsMIpE [sage] 投稿日:03/01/08 17:38 ID:s/ESWpsO
「携帯から」とか公開しないでほすぃ。。
150 名前:ひろゆき ◆3SHRUNYAXA [] 投稿日:03/01/08 17:40 ID:rLfxQ17l
みたいなことを書いたらそうなりますです。さん
170 名前:ひろゆき ◆3SHRUNYAXA [] 投稿日:03/01/08 17:42 ID:rLfxQ17l
負荷が高そうなサーバにも入れて見ます。
217 名前:ひろゆき ◆3SHRUNYAXA [] 投稿日:03/01/08 17:49 ID:rLfxQ17l
一定期間でログは消しますです。
131:デフォルトの名無しさん
03/01/11 10:58
======2==C==H======================================================
2ちゃんねるのお勧めな話題と
ネットでの面白い出来事を配送したいと思ってます。。。
===============================読者数: 139038人 発行日:2003/1/10
なにやら、連日メルマガだしてるひろゆきです。
そんなわけで、ログ記録実験ですが、いちいちサーバ指定するのが面倒なので、
全部のサーバに入れてみました。
重くなって落ちたりしてもご愛嬌ってことで。。。
んじゃ!
────────────Age2ch─
■この書き込みは、Age2chを使って配信されています。
──────────────
Keep your thread alive !
スレリンク(software板)l50
──────────────
132:デフォルトの名無しさん
03/01/11 11:49
いずれ、別の匿名掲示板で公開して、2ちゃんで騒ぐ手法が定着するのでは?
133:デフォルトの名無しさん
03/01/11 12:25
運営陣に対する不信を前提にしたら,
そもそも「匿名」の肩書きなんて無意味じゃないか?
やっぱり具体的な議論は,
ログ公開のガイドラインが公表されてからだね……・。
134:デフォルトの名無しさん
03/01/11 13:25
249 名前:ひろゆき ◆3SHRUNYAXA [] 投稿日:03/01/08 17:52 ID:rLfxQ17l
>荒らしとか犯罪のためなの?
そす。
246 名前:心得をよく読みましょう[] 投稿日:03/01/08 17:52 ID:BH998yxV
>ひろゆき
俺のお気に入りのスレとか荒されてるんだがそういうのにも有効?
257 名前:ひろゆき ◆3SHRUNYAXA [] 投稿日:03/01/08 17:53 ID:rLfxQ17l
いずれは。
135:デフォルトの名無しさん
03/01/11 13:49
どこを縦読みするんだ?
136:デフォルトの名無しさん
03/01/11 16:36
すでに実験は終わってるから
137:デフォルトの名無しさん
03/01/11 16:44
11 名前:ひろゆき ◆3SHRUNYAXA 投稿日:03/01/08 17:16 ID:rLfxQ17l
全レスです。
138:デフォルトの名無しさん
03/01/12 00:48
記念牡蠣粉
139:デフォルトの名無しさん
03/01/12 00:58
質の低い=情報価値のない書き込みはいらん
というのがこの掲示板の管理者の方針
そういう書き込みが出来ない奴は来なければいい
ということなのではないか
140:デフォルトの名無しさん
03/01/12 03:39
すまん!2連かきになっちまった!俺はマンコとしかかけない小心者なんでメロンパンとは別だからな!!
141:デフォルトの名無しさん
03/01/12 03:39
ドピュッ!タラーリ
142:デフォルトの名無しさん
03/01/12 11:07
祭り開催中!!!
メンヘルと言ってた女が実はシャブ中だった!!!
スレリンク(tubo板)l50
143:デフォルトの名無しさん
03/01/12 11:08
ようするに上告しても今の制度では100%無駄。
144:デフォルトの名無しさん
03/01/12 21:35
イズピンさんを記録しないと違法なんすよ。
匿名性は、住人同士の会話なんかでは守られるです。
145:デフォルトの名無しさん
03/01/12 21:38
司法板関連スレより
スレリンク(shikaku板:292-302番)
146:デフォルトの名無しさん
03/01/12 21:50
まあ、固い事言うな。
147:デフォルトの名無しさん
03/01/12 21:52
まちゅ、ってだれ?ム技板の空気固定?
148:デフォルトの名無しさん
03/01/13 11:57
>どうしても、どうしても、ど~しても自作で作りたいのです。
>
>ドシロウトの私ですが、後学の為、完成するまであげ続けます。
>
>この程度でも、いっぱしのプログラムが出来るようになる事を
>証明したいのです。
で、>>1はドコニ行ったの?
149:山崎渉
03/01/13 18:29
(^^)
150:デフォルトの名無しさん
03/01/13 22:18
━━━━━━━━━━━━━━━━━
---【関係者は読んでおけ。話はそれからだ。】---
URLリンク(teri.2ch.net)
706 名前: 19@悲惨認定らしい 投稿日: 2001/05/07(月) 18:59 ID:???
2ch擁護論者も不用論者も、時間かけてでもこのスレ読むといいぞ。
ネット倫理の理解が格段に深まる。
★★日本生命事案に見る、掲示板の削除義務★★
URLリンク(cocoa.2ch.net)
2ch以外も含めて、俺が見たなかで最高のスレだ。
-----
これをまとめたらしいのが
URLリンク(www.geocities.co.jp)
裁判に勝った動物病院には、裁判の前に俺が電話で
↑のURLを教えてあげておいたのさ。
判決も↑の内容にある程度沿った内容だったしな。
━━━━━━━━━━━━━━━━━
151:山崎渉
03/01/15 17:53
(^^)
152:山崎渉
03/01/23 22:21
(^^)
153:デフォルトの名無しさん
03/02/16 01:18
↑mailto:xxxli
154:デフォルトの名無しさん
03/02/20 06:00
IP記録実験
スレリンク(accuse板)
1 名前:ひろゆき ◆3SHRUNYAXA @どうやら管理人 ★ 投稿日:03/01/08 17:13 ID:???
そんなわけで、qbサーバでIPの記録実験をはじめましたー。
27 名前:心得をよく読みましょう 投稿日:03/01/08 17:20 ID:yL/kYdMc
SETTING.TXT管轄でないということは全鯖導入を視野に、か?
38 名前:ひろゆき ◆3SHRUNYAXA 投稿日:03/01/08 17:22 ID:rLfxQ17l
>>27
鈍いです。
73 名前:ひろゆき ◆3SHRUNYAXA 投稿日:03/01/08 17:27 ID:rLfxQ17l
>ところで、IPが抜かれて何か今までと変わることってあるのでしょうか?
・今までより、サーバが重くなる。
・裁判所や警察からの照会があった場合にはIPを提出することがある。
155:デフォルトの名無しさん
03/04/02 06:44
>>1はもうプログラムに飽きてしまいましたとさ(代理人)
156:山崎渉
03/04/20 04:36
∧_∧
( ^^ )< ぬるぽ(^^)
157:デフォルトの名無しさん
03/05/01 06:59
age
158:デフォルトの名無しさん
03/05/05 18:30
ageb
159:デフォルトの名無しさん
03/05/18 17:28
ageg
160:山崎渉
03/05/28 12:58
∧_∧
ピュ.ー ( ^^ ) <これからも僕を応援して下さいね(^^)。
=〔~∪ ̄ ̄〕
= ◎―◎ 山崎渉
161:デフォルトの名無しさん
03/06/12 18:52
/ l___l \ ||i
| ● | | ● | |||i
| ヽ / | ||||i
\ ヽ/ / ||||i ガッ
/ \ |||||i
/ | ||||||i
| /\ / _ | |||||||i
ヽ_/ Y / / / ∧ ||||||||i
ヽ /__// ノ / 丶 ||||||||||i
ヽ .(_______ノ ヽ / 丶||||||||||i
/ / / ノ ノ 丶||||||ii ↓ >>156
/ / / / ノ ヽ
/ / / / < > /\ /"""ヾ
/ / / / ノ \ /::.::.____/:::::::ヽ、 /;:;;:::''' |
/ / / / | | |||||||||iヽ /::. ______.::::::::::::: __ヽ_ | .|
⊂__/ / / | ./ ||||||||||||||||||i\ ./ ::::::::/ __。\_ヽv // 。\ .| |
/ / ヽ_/ ||||||||||||||||||||||i ヽ // ̄ ̄√ ___丶  ̄ ̄\| | .|
/ / ||||||||||||||||||||||||||||iヽ ∨| ::::::::: / / tーーー|ヽ .::::: ::| | .|
/ ̄ ̄ ̄ ̄ ̄ ̄ 三三||||||||||||||||||||||||||||i ヽ | .:::::. ..: | |ヽ ..::::::| / .|
/ 三三|||||||||||||||||||||||i \ .| ::: | |ヽニ⊃| | ..::::::|ノ /
ヽ 三三||||||||||||ii \ | : | | |:::::T:: | !. ..::::/ /
162:デフォルトの名無しさん
03/06/15 11:54
>>155
漏れもとある巡回系ツール作ってるけど、
途中で処理が面倒くさくなったりするとめげそうになる。
しかし、もうすぐ完成だし諦めるわけには逝かない。
>>1よ、がむばれ。
163:デフォルトの名無しさん
03/07/11 01:20
保守age
164:山崎 渉
03/07/15 09:57
__∧_∧_
|( ^^ )| <寝るぽ(^^)
|\⌒⌒⌒\
\ |⌒⌒⌒~| 山崎渉
~ ̄ ̄ ̄ ̄
165:山崎 渉
03/08/02 02:57
(^^)
166:山崎 渉
03/08/15 18:07
(⌒V⌒)
│ ^ ^ │<これからも僕を応援して下さいね(^^)。
⊂| |つ
(_)(_) 山崎パン
167:デフォルトの名無しさん
03/09/04 18:39
age
168:デフォルトの名無しさん
03/09/07 14:54
よく分からんがperlのLWP::RobotUAはだめなんかい?
169:デフォルトの名無しさん
03/09/07 14:57
for文でぐるぐる回せば自動巡回簡単にできるだろ
170:デフォルトの名無しさん
03/09/07 15:05
LWP::RobotUAだと値いれるだけでグルグル巡回できそうな感じなんだけど
あんまり情報が出てこないってことは何か問題あるんかい?
まぁ俺はそこらへんのソフトで満足してるわけだが
171:デフォルトの名無しさん
03/09/07 15:17
indexページだけ取得なら簡単にできそうだが
奥深くまで根こそぎとるようなソフトだったら
嫌がられるかもな
172:デフォルトの名無しさん
03/09/07 15:59
お前らレベル低すぎるんだよ。
この板から出て行け。
こんな物が2日以内に作れない馬鹿は
プログラム技術語る資格なし。
173:デフォルトの名無しさん
03/09/07 16:29
( ´_ゝ`)
174:デフォルトの名無しさん
03/09/07 19:00
>>172
2日以内に作ってうpしてくれ。
ソースもよろしく。
175:デフォルトの名無しさん
03/09/07 19:19
いろいろ要望も出していいかい?
176:デフォルトの名無しさん
03/09/07 19:22
>>172
2日で作ってうpしろ
GUIもきちんとしたやつな
たぶん無理だろうな
177:デフォルトの名無しさん
03/09/07 20:31
Winnyは47氏一人で
仕事の合間に3日で作った
こういう人をかなりのスキルの持ち主と言う
178:デフォルトの名無しさん
03/09/07 20:37
めでたく172氏の誕生です。
記念カキコ
179:172
03/09/07 20:41
パッケージとして作ってもいいけど
報酬は払うんだろうな?
というかもうすでに自分用の作ってるんだが。
ソース公開でもいいけど只ではやらんぞ。
180:デフォルトの名無しさん
03/09/07 20:44
>>172
口座がわからん
181:172
03/09/07 20:50
>>180
まず見積もりしてやるから
お前のメールアドレス教えろ。
フリーメールは駄目だぞ。
本気で頼むならな。
182:デフォルトの名無しさん
03/09/07 20:53
( ´,_ゝ`)プッ
172必死で逃げてるなw
見苦しいw
183:デフォルトの名無しさん
03/09/07 20:57
>こんな物が2日以内に作れない馬鹿は
>プログラム技術語る資格なし。
>報酬は払うんだろうな?
どんな仕事してんだこいつ。
184:172
03/09/07 21:00
お前らこの程度の物も作れないくせにこんな所にいるんじゃねーよ。
話にならんよ。全く。
この板は技術を語る板であってお前らのようなクレクレ君は
ソフト板にでも行け。
185:デフォルトの名無しさん
03/09/07 21:18
商売する172もどっか行け。とりあえず消えろ。邪魔だから。
186:デフォルトの名無しさん
03/09/07 21:24
何もできない172氏の誕生です。
記念カキコ
187:デフォルトの名無しさん
03/09/07 21:52
>172
まずアプリの外観を見せろ
話はそれからだ
188:172
03/09/07 22:17
何がしたいかまず言え。
現状は只の自動巡回ダウンプログだ。
巷に出回ってる物とあんまり変わらんよ。
要求があれば何でも実装できるぞ。
何でもは言いすぎだけどな。
189:デフォルトの名無しさん
03/09/07 22:21
>>188
フリーソフトのGetHTMLWと差別化が図れる部分を説明していただきたい
190:!172
03/09/07 22:22
172ではないが自分で作ったヤツのキャプ揚げてもいいよ。
ソースは汚いし公開するつもりもないけど
191:デフォルトの名無しさん
03/09/07 22:26
172が本当に2日で作ったら、
文句いってたやつ出てけよ。
俺は172はできると思ってたよ。
がんばれ172
192:172
03/09/07 22:27
>フリーソフトのGetHTMLW
これ使ったことも聞いたこともないから分からんよ。
193:デフォルトの名無しさん
03/09/07 22:29
そうだな
じゃあwgetと差別化が図れる部分でいい
それ以外なら
>巷に出回ってる物とあんまり変わらんよ。
あなたのいう「巷に出回ってる物」の例を挙げていただきたい
194:172
03/09/07 22:35
wgetは改造しないと細かくHTML解析できないだろ。
只ダウンロードしていくだけ。
それに比べて俺のはいろんな事ことができるぞ。
一例を挙げるとHTMLのどの部分保存するとか、
どこからどこまで保存する、解析するとか
自由に設定できる。
195:デフォルトの名無しさん
03/09/07 23:02
>172
開発言語は?
196:172
03/09/07 23:24
C++
197:デフォルトの名無しさん
03/09/07 23:30
フラッシュのリンクに対応してくれ。
あとJAVAとJAVAスクリプトのリンクにも。
掲示板のログも差分で保存に。
198:172
03/09/07 23:42
スピード気にいないならいいぞ
何使うかは想像すれば分かると思うが。
199:デフォルトの名無しさん
03/09/07 23:52
>>172
まずキャプ画像を見せてください。
200:172
03/09/07 23:54
取引なんだからまずメルアドくらい教えろや。
誰も只でやるとは言ってないぞ。
201:デフォルトの名無しさん
03/09/08 00:00
何気なくキリ番取っちゃう人ってカッコイイなー。とか言ってみる。
202:デフォルトの名無しさん
03/09/08 00:01
>191
寝返ったな
203:デフォルトの名無しさん
03/09/08 00:07
なんだかんだ言って作ってる>>172に萌え
煽ってる口だけのやつらに萎え
204:デフォルトの名無しさん
03/09/08 00:09
>>172=>>203と思うのも無理はない。
>>172が情報小出しにするからいかんのではないかと、、、
205:デフォルトの名無しさん
03/09/08 00:38
>>204
情報の小出しはビジネスの基本
ただしクライアントの要求仕様の小出しはアフォ
206:デフォルトの名無しさん
03/09/09 18:48
>>172 :デフォルトの名無しさん :03/09/07 15:59
>お前らレベル低すぎるんだよ。
>この板から出て行け。
>こんな物が2日以内に作れない馬鹿は
>プログラム技術語る資格なし。
2日経ちました。
できましたか?
207:デフォルトの名無しさん
03/09/09 21:25
172の釣りにまんまとひっかかったな、おまいら !
208:デフォルトの名無しさん
03/09/09 21:50
>>207=>>172
見事釣られてしまいました。。
209:デフォルトの名無しさん
03/09/09 22:05
どうしても釣りにしたいようだな。
哀れな人間ども。
210:デフォルトの名無しさん
03/09/11 01:54
コレって古くからあって完成度も高いような気がするけどどなの?
URLリンク(www.gedanken.demon.co.uk)
211:デフォルトの名無しさん
03/09/11 01:54
あ、しまった
212:デフォルトの名無しさん
03/09/11 22:03
>>209
人間様に向かってその口の利き方はなんだ?
213:デフォルトの名無しさん
03/09/12 23:22
で、>>172はどこにいるんだろう。
214:172
03/09/14 14:56
やっぱり2日じゃ無理でした。
最初からそんなもの作るスキルもないのに、
えらそうな事言ってすみませんでした。
215:デフォルトの名無しさん
03/09/14 17:05
このスレは172になりきって謝るスレになりました
ではどうぞ↓
216:デフォルトの名無しさん
03/09/18 12:36
で、>>172は逃げたわけだが
217:デフォルトの名無しさん
03/09/18 19:54
スクリプトでhtmlをDLして正規表現で画像のURLも
取得してそれもDLして、絶対アドレスは相対に直して
とかするだけだろ。何が難しいんだ?
218:デフォルトの名無しさん
03/09/18 20:21
>>217
基本姿勢はそれでいいのだが、
あらゆる状況、例外処理を考えると、2日じゃ無理
219:デフォルトの名無しさん
03/09/19 04:04
>>217
例えば>>210のWWWOFFLEだと、Cのソースや設定ファイルやの合計が2MBほどの規模
220:デフォルトの名無しさん
03/09/19 13:08
>>219
ワードなら2MBくらいすぐうまるんだけどな。
221:デフォルトの名無しさん
03/09/19 14:33
キーワードを入力して、そのキーワードにあった新聞記事をWeb上から自動収集するプログラムを作りてーんだけどよー、おまいら、なにか激しいアイディア出してください。
222:221
03/09/19 14:35
言語はC、Perl、javaでおねがいしまつ。
223:デフォルトの名無しさん
03/09/19 15:03
>>221
アイデアで良いんだな?よし。それじゃあ
GoogleAPIで対象を絞り込んでPerlでDLだ。
224:デフォルトの名無しさん
03/09/19 15:25
>>221
まず対象とする新聞社のサイトを決める
出来れば各新聞のフォーマットが変わったときのために,
新聞社毎に解析ルーチンを作って
それらの解析ルーチンを呼び出すプログラムを作る
>>223
Googleじゃ反映が遅いし,解析する方法も分からないよね
225:221
03/09/19 15:31
>>223
アイディア、サンスクです。
でも、当方は検索するためのキーワードに誤りが含まれている場合でも、希望するニュースに近い記事を収集してーんだよ。
例えば
[イチロー、メジャーリーグ、地震、ファインプレー]
ってキーワードを入力した場合(誤ったキーワードは地震ね。)でも、
[イチローがメジャーリーグでファインプレーした記事]
を収集してーんだよ!!
おまいら、ビビッとくるアイディアだせやゴルァア!!
226:デフォルトの名無しさん
03/09/19 15:42
>>225
or検索した後で検索語の登場率で順位付けすればいいんじゃない?
227:221
03/09/19 15:58
>>226
>>or検索した後で検索語の登場率で順位付けすればいいんじゃない?
or検索した後で検索語の登場率で順位付け?
具体的にどうやんの?ヴァッカにもわかるようにご教授願いたい。。。
228:デフォルトの名無しさん
03/09/19 16:05
>>225
[阪神大震災で元気を失ったファンのためにファインプレーを見せたイチロー]
という記事を探したい時は、どうすんの?
229:221
03/09/19 16:18
>>228
>>[阪神大震災で元気を失ったファンのためにファインプレーを見せたイチロー]
>>という記事を探したい時は、どうすんの?
とりあえず、そのような特例は、か・ん・が・え・ん・な !!
230:221
03/09/19 17:01
>>228
229の訂正:
[阪神大震災で元気を失ったファンのためにファインプレーを見せたイチロー]
っていう記事も収集していいけど、大部分の記事は
[イチローがメジャーリーグでファインプレーした]
っていう記事にしたいんだYO!!
おまいらの、脳みそフル回転して、アイディアだしてくださいな。
231:デフォルトの名無しさん
03/09/19 20:28
そんな曖昧な仕様じゃねぇ・・・
232:デフォルトの名無しさん
03/09/19 21:49
自分で作れや馬鹿が
233:デフォルトの名無しさん
03/09/19 22:54
PageDownってソフトがソース公開してたけど、
今も公開してるか分からん。
234:デフォルトの名無しさん
03/09/20 17:27
良スレなのか、クソスレなのかは
>>172にかかっているとおもうのだが
235:デフォルトの名無しさん
03/09/20 19:50
>234
つまりクソスレ
236:デフォルトの名無しさん
03/09/21 01:25
>>221
てめーはそんなものを常時巡回させるつもりか。
…なんかイメージ的にだが、映画マトリックスに最初出てくる
ネオのコンピューターのイメージがわいた。
237:デフォルトの名無しさん
03/09/21 03:53
でも自動巡回ソフトもニュース収集スクリプトもすでにあるわけで、
なんかネットワーク使った今までにないおもしろいアイディアってないのかな。
238:デフォルトの名無しさん
03/09/21 08:32
>237
ソフトを起動すると自動的に他のコンピューターに自分をコピーして
複数のコンピューターで高速巡回できるってのはどう?
239:221
03/09/21 08:48
>>237
>>でも自動巡回ソフトもニュース収集スクリプトもすでにあるわけで、
当方は、音声認識結果をキーワードにしてニュース記事を収集したいのよ。
でも当然、検索時のキーワードには誤認識された語が含まれるわけで。。。
なにかイイアイディアないっすか?
240: ◆1CL6vYZ2rM
03/09/21 10:28
>>238
複数スレッド立てればいい
241:デフォルトの名無しさん
03/09/21 12:56
>>240
マルチスレッドは自分のマシンの限界以上には速くならない
242:デフォルトの名無しさん
03/09/21 14:08
>>172 :デフォルトの名無しさん :03/09/07 15:59
>お前らレベル低すぎるんだよ。
>この板から出て行け。
>こんな物が2日以内に作れない馬鹿は
>プログラム技術語る資格なし。
>>172さん
2週間経ちました。
できましたか?
243:デフォルトの名無しさん
03/09/22 00:39
>>240
糞スレ建てんなヴォケ
244:デフォルトの名無しさん
03/09/23 06:21
これもソース公開
URLリンク(www.ido.nu)
245: ◆1CL6vYZ2rM
03/09/23 20:38
>>243
スレッド立てすぎると遅くなるな
中には全く動かないように思えるスレッドも立つ
ってか2chのスレじゃねー
246:デフォルトの名無しさん
03/09/23 23:20
>>244がいいこと言った。
247:デフォルトの名無しさん
03/09/30 13:22
で、>>172は身を隠してるわけだが
248:デフォルトの名無しさん
03/09/30 15:01
172はレベルが低すぎるからこの板から出て行ったのでは
249:デフォルトの名無しさん
03/10/09 14:30
>>172は口だけだったか
250:デフォルトの名無しさん
03/10/17 02:29
∧_∧⊂=
=二三( ・∀) ゝ ヽ シャイニングウィザード!!
_,; ´⌒ ^⌒ ⌒_,,ノ
==/ トー´
/ 人 ハ ノ 二二二
ヽ_二ヽ ∠__、∧^/(/|_∧
―=ニ≡( 、 _ ̄ ̄) >;´Д)))
=二三ヽ \ `て ノ \(
\ ヽ / ノVV ̄ ⌒ヽ
=二三 !, |ヽ_) | ト )
i γヽ !,、´ ` ノ| ノ
彡 (_ ノーー`>>172i| |
彡 〃 トー-、_ /`ノ
| ノ | とノ
| / | トー´ヽ
(__) ヽ_人_ノ
251:172
03/10/19 18:25
もう172のネタはいいよ
252:デフォルトの名無しさん
03/10/24 11:25
自動巡回とは若干異なるのだが
たまにサイト内で「速報ニュース」なるものが
一行スクロールで出ていたりするよね?
あのニュースのソースは何処にあるの?
そしてどのようにしてそのソースを取得しているの?
通信社からの配信ストリーミング?もしそうだとしたら
そのストリーミングをローカルディスクにうまく取り込めないのかなぁ
253:デフォルトの名無しさん
03/10/24 11:33
251のつづき
で、うまく取り込む時にperlやらの正規表現で
>221氏のしたいことが実現できるような気がするのだが…
つまり新聞社や通信社からのニュースソースを情報の更新・信頼度が良質だと
仮定した上でそれを常時「流しておいて(一行スクロールみたいに)」その流れ
の中で検索をかければ良いのではないだろうか?過去の記事にしても
各新聞社サイトにアーカイブが存在するのでこれを利用すれば良い
254:デフォルトの名無しさん
03/10/24 11:33
>>253
s/251/252
スマソ
255:デフォルトの名無しさん
03/10/28 20:25
(ε゚д゚)зアゲテモイイデスカ?
イイデスヨε(゚д゚з)
(ε゚д゚)зアリガトウゴザイマス
ウパーーε(゚д゚з)
256:デフォルトの名無しさん
03/11/08 00:46
>>172 :デフォルトの名無しさん :03/09/07 15:59
>お前らレベル低すぎるんだよ。
>この板から出て行け。
>こんな物が2日以内に作れない馬鹿は
>プログラム技術語る資格なし。
>>172さん
2ヶ月経ちました。
できましたか?
257:デフォルトの名無しさん
03/11/18 02:45
揚げてみるか。。。
258:デフォルトの名無しさん
03/12/04 21:18
age
259:デフォルトの名無しさん
04/01/27 01:11
>>1
言い逃げかよっ ( ゚ 3゚)≡@ ペッ!!
260:デフォルトの名無しさん
04/01/29 19:30
>>1
| ∧_∧∴/⌒\ /⌒\マラマラマラマラマラマラマラマラマラマラマラマラマラマラマラマラ
|(゚∀゚(#;・.( ; 三 ,,))マラマラマラマラマラマラマラマラマラマラマラマラマラマラマラマラ
| 、つ つ: ヽ ( / ミマラマラマラマラマラマラマラマラマラマラマラマラマラマラマラマラ
| ヽ0--0 キ .メ ./ マラマラマラマラマラマラマラマラマラマラマラマラマラマラマラマラ
| 乂____ノ マラマラマラ -‐、 マラマラマラマラマラマラマラマラマラマラマラマラ
| / ̄.| | | `‐-------´ / マラマラマラマラマラマラマラマラ
| (─┘ |__| ____ ヽマラマラマラマラマラマラマラマラ
| `ー─┬┬─ ´マラマラマラ丶-‐´マラマラマラマラマラマラマラマラ
| .━┷┷━マラマラマラマラマラマラマラマラマラマラマラマラマラマラマラマラ
| ∧_∧ WWWWWWW
| (゚Д゚ ,,) Σ Σ
| .と ⊂ゝ Σ マルァ Σ
| < ( ヽ Σ Σ
| (_,(__) WWWWWWW
261:デフォルトの名無しさん
04/03/29 12:30
復旧age
262:デフォルトの名無しさん
04/05/31 12:31
a
263:デフォルトの名無しさん
04/06/07 03:07
ここの1漏れのドッペルゲンガーみたいだ。
Cと巡回、腕がないところまでまで被ってやがる ('A`)
264:デフォルトの名無しさん
04/06/07 12:52
>>263
ではお前が後を継げ。
265:デフォルトの名無しさん
04/06/10 05:55
ノニ,ニ,ニi
,ゝ-〔ヅ,ニニニi
(.(~/´ ̄`ヽ
| || __.|
| || |㌍㌢||
| || |㌔㌧||
| || |( ゚Д゚) < 深夜に浮上します
匚;|_(ノ_____|つ◎、
.!-!|_i_i_i_i_i_|
.|;| しiノ
シュゴゴゴ・・・ | i|
,;:"⌒ ⌒゙;,.
.,(,,,,'''' ;;;;,,),.
.,;(''' ,;:,,, ;;;;;; ,,),..
266:デフォルトの名無しさん
04/06/10 12:35
指定したURLをダウンロードしないでIEコンポーネント
のブラウザーで串を変えながらただ巡回するソフト作って。
中国の鯖借りているんだけどアクセス数が少ないと垢
削除されてしまうので誰かよろしく
1000円くらいならシェアでもok
267:デフォルトの名無しさん
04/07/31 21:20
#include <stdio.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <netinet/in.h>
int main(int argc, char *argv[])
{
int fd;
struct sockaddr_in addr;
if ((fd = socket(PF_INET, SOCK_STREAM, 0)) < 0) {
perror("ソケット生成失敗");
exit(1);
}
bzero((void *)&addr, sizeof(addr));
addr.sin_family = PF_INET;
addr.sin_port = htons(80);
addr.sin_addr.s_addr = inet_addr(argv[1]);
if (connect(fd, (struct sockaddr *)&addr, sizeof(addr)) < 0) {
perror("接続失敗");
exit(1);
}
printf("接続できました");
close(fd);
return 0;
}
繋がったぁぁぁぁ!!
>>1じゃないけど。
268:デフォルトの名無しさん
04/08/12 02:45
age
269:デフォルトの名無しさん
04/09/22 03:15:12
釣りなのはわかってるんだが
270:デフォルトの名無しさん
04/11/01 23:59:59
俺が1の後を継ぎます
271: 【だん吉】 【1773円】
05/01/01 08:52:06
あげ
272:Delフサギコ ◆A6VzDeLphI
05/01/06 00:55:27
∫,,,,,,,,,∧,,∧ こばんわ。
⊂,,,,,,,,,つ,,゚Д゚ミつ
この手のソフトって、
どれをお手本に考えておけばいいのかな?
Permanサーファー?
GetHTMLWや
regu035dや
webget
はかなり使ってみたんだが
どれもUI的にはなんとはなしにイマイチで
設定も面倒で、自分でも使いにくいし
人にお勧めするのもちょと微妙。
それぞれの使い勝手などで
使いにくいところ、使いやすいところを
吟味していく作業がかなり必要なんじゃないかと
思うんだけど....
それとも、こういう感じのソフトを求めているのではないのかな?
273:宿題だすから力貸し手とうお願い
05/02/02 05:58:44
2番煎じな(藁
2ch1ゲッター。
ニュース系板やお好み板の2までを自動収集する。
perl wget diff gerp あたりで頑張ったんだがあぼーん
したんで優秀なお前ら等力貸し手
LWPでリンク拾うときスレリンク先一覧を取る
~m/<a href=\"(http:.*?)\"/g
↓
URIを
スレリンク(tech板)
↓
スレリンク(tech板:-2番)
こう-2にしたいんだが
でwgetしてとかこの出力を書き出して
diffしてからgerpしてしてwgetとか考えたんだが
うまくいかん。あと、-O 2ch.htmlとかしてもindexない
なんかスマートにカコ良く仕上げたいんだが。
web錆すは使ってるんだがそれでいいだろ
終了としないでくれるとありがたいす。
274:1
05/03/10 07:52:42
イヤー、まだまだ時間がかかりそうです。
275:デフォルトの名無しさん
皇紀2665/04/01(金) 00:30:58
あげ
276:デフォルトの名無しさん
05/06/29 21:47:46
誕生日age
277:デフォルトの名無しさん
05/07/05 01:14:17
サゲ
278:デフォルトの名無しさん
05/07/06 18:40:25
wsh でつくるのが簡単だな
279:デフォルトの名無しさん
05/09/27 02:13:28
元気ですかーーーっ!!
漏れら極悪非道のagoブラザーズ!
今日もネタもないのにagoてやるからな!ンムフフ
 ̄ ̄∨ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
__ __
/ ,,,..,ヽ、 / ,,,..,ヽ、
/ シ 、 _ジ . / シ 、 _ジ
ミぃ ´.Jソ ミぃ ´.Jソ ago
/.、´ー(∩∩ .、´ー( ago
(つ\ _ノ ( \⊂) ago
( ヽノ ヽ/ ) ago
し(_) (_)J
280:デフォルトの名無しさん
05/10/27 14:17:04
保
281:デフォルトの名無しさん
05/11/12 14:02:34
保
282:デフォルトの名無しさん
05/11/26 03:08:43
保
283:デフォルトの名無しさん
05/12/19 04:26:36
ポ
284:デフォルトの名無しさん
06/01/06 23:32:30
保
285:デフォルトの名無しさん
06/02/24 16:45:03
保
286:デフォルトの名無しさん
06/03/25 00:28:22
いわゆるクローラだよね。
クロールして集めて来た結果をMySQLとかにぶち込んでみると、何か出来そうに思う。
簡単な所ではRSSリーダ?
287:デフォルトの名無しさん
06/05/14 20:58:32
1は何処行った?
288:デフォルトの名無しさん
06/05/14 23:41:03
さっき見かけた時にはもう寝てたよ。
289:デフォルトの名無しさん
06/07/02 11:41:50
290:デフォルトの名無しさん
06/09/11 18:44:21
172はどこいった?
291:デフォルトの名無しさん
06/09/16 08:31:39
>>244 ノシ
292:デフォルトの名無しさん
06/09/25 16:32:59
永続的にバックで走りつづけるクローラを普通に作ったら重すぎるので
なにがしかの見地を得ようとここを見てみたが、その方面の活動は存在しないのね。
293:デフォルトの名無しさん
06/10/01 14:23:50
他板に、さりげなく同意しにいこうぜ
スレリンク(entrance板)
どう見てもラウンジの仕業です本当にありがとうございました
294:デフォルトの名無しさん
06/10/01 14:23:53
もうこうなったら・・・同意するしかない!!!!
スレリンク(cheerleading板)l50
どう見ても清純なチアリーダーの仕業です。本当にありがとうございました。
295:デフォルトの名無しさん
06/10/01 14:23:55
さりげなく同意しに行こうぜwwwwwwwwwwwwwww
スレリンク(news4vip板)l50
どう見てもVIPの仕業です本当にありがとうございました
296:デフォルトの名無しさん
06/10/01 14:23:55
他板に、さりげなく同意しにいこうぜ
スレリンク(entrance板)
297:デフォルトの名無しさん
06/10/01 14:24:00
他板に、さりげなく同意しにいこうぜ
スレリンク(entrance板)
どう見てもラウンジの仕業です本当にありがとうございました
298:デフォルトの名無しさん
06/10/01 14:24:01
他板に、さりげなく同意しにいこうぜ
スレリンク(entrance板)
どう見てもラウンジの仕業です本当にありがとうございました
299:デフォルトの名無しさん
06/10/01 14:24:06
もうこうなったら・・・同意するしかない!!!!
スレリンク(cheerleading板)l50
どう見ても清純なチアリーダーの仕業です。本当にありがとうございました。
300:デフォルトの名無しさん
06/10/01 14:24:06
もうこうなったら・・・同意するしかない!!!!
スレリンク(cheerleading板)l50
どう見ても清純なチアリーダーの仕業です。本当にありがとうございました。
301:デフォルトの名無しさん
06/10/01 14:24:07
他板に、さりげなく同意しにいこうぜ
スレリンク(entrance板)
どう見てもラウンジの仕業です本当にありがとうございました
302:デフォルトの名無しさん
06/10/01 14:24:07
他板に、さりげなく同意しにいこうぜ
スレリンク(entrance板)
どう見てもラウンジの仕業です本当にありがとうございました
303:デフォルトの名無しさん
06/10/01 14:24:07
他板に、さりげなく同意しにいこうぜ
スレリンク(entrance板)
どう見てもラウンジの仕業です本当にありがとうございました
304:デフォルトの名無しさん
06/10/01 14:24:14
さりげなく同意しに行こうぜwwwwwwwwwwwwwww
スレリンク(news4vip板)l50
どう見てもVIPの仕業です。本当にありがとうございました
820 :以下、名無しにかわりましてVIPがお送りします :2006/10/01(日) 14:21:05.63 ID:9TxrA6pl0
↓これを貼りまくろうぜ
他板に、さりげなく同意しにいこうぜ
スレリンク(entrance板)
どう見てもラウンジの仕業です本当にありがとうございました
305:デフォルトの名無しさん
06/10/01 14:24:15
それについては同意ヌルポ
306:デフォルトの名無しさん
06/10/01 14:24:15
他板に、さりげなく同意しにいこうぜ
スレリンク(entrance板)
どう見てもラウンジの仕業です本当にありがとうございました
307:デフォルトの名無しさん
06/10/01 14:24:20
科学の力で他板に同意しに行く
スレリンク(bake板)l50
化学板の仕業でした。ごめんね。
308:デフォルトの名無しさん
06/10/01 14:24:22
これを貼りまくれ!
他板に、さりげなく同意しにいこうぜ
スレリンク(entrance板)
どう見てもラウンジの仕業です本当にありがとうございました
309:デフォルトの名無しさん
06/10/01 14:24:26
他板に、さりげなく同意しにいこうぜ
スレリンク(entrance板)
どう見てもラウンジの仕業です本当にありがとうございました
310:デフォルトの名無しさん
06/10/01 14:24:35
他板に、さりげなく同意しにいこうぜ
スレリンク(entrance板)
どう見てもラウンジの仕業です本当にありがとうございました
311:デフォルトの名無しさん
06/10/01 14:24:38
これを貼りまくれ!
他板に、さりげなく同意しにいこうぜ
スレリンク(entrance板)
どう見てもラウンジの仕業です本当にありがとうございました
312:デフォルトの名無しさん
06/10/01 14:24:38
もうこうなったら・・・同意するしかない!!!!
スレリンク(cheerleading板)l50
どう見ても清純なチアリーダーの仕業です。本当にありがとうございました。
313:デフォルトの名無しさん
06/10/01 14:24:47
科学の力で他板に同意しに行く
スレリンク(bake板)l50
化学板の仕業でした。ごめんね。
314:デフォルトの名無しさん
06/10/01 14:24:50
同意
315:デフォルトの名無しさん
06/10/01 14:25:01
他板に、さりげなく同意しにいこうぜ
スレリンク(entrance板)
どう見てもラウンジの仕業です本当にありがとうございました
316:デフォルトの名無しさん
06/10/01 14:25:06
他板に、さりげなく同意しにいこうぜ
スレリンク(entrance板)
どう見てもラウンジの仕業です本当にありがとうございました
317:デフォルトの名無しさん
06/10/01 14:25:05
♪プ・リ・キュ・ア♪
| スパスパスパーク
| Splash☆Star~♪
| ∧∧ ∧∧ クルクルミラクル
| ヾ(゚∀゚)ノ ≡ (゚∀゚ )Splash☆Star~♪
| ( ) ≡ ~( ~)
| /< < ≡ ノ ノ
./ フタリハフタリハ プリキュア~♪
∧∧∧∧
(゚∀゚≡゚∀゚)
(∩∩)
318:デフォルトの名無しさん
06/10/01 14:26:17
他板に、さりげなく同意しにいこうぜ
スレリンク(entrance板)
どう見てもラウンジの仕業です本当にありがとうございました
319:デフォルトの名無しさん
06/10/01 14:27:13
他板に、さりげなく同意しにいこうぜ
スレリンク(entrance板)
どう見てもラウンジの仕業です本当にありがとうございました
320:デフォルトの名無しさん
06/10/01 14:45:23
以上、ユダとラウンコの馬鹿どもの仕業でした
m n _∩ ∩_ n m
⊂二⌒ __) /\___/ヽ ( _⌒二⊃
\ \ /'''''' '''''':::::::\ / /
\ \ |(●), 、(●)、.:| / /
\ \| ,,ノ(、_, )ヽ、,, .::::|/ /
\ .| ´トェェェイ` .:::::::| / それが、ラウンコ精神
\\ |,r-r-| .:::::// URLリンク(etc3.2ch.net)
\`ー`ニニ´‐―´/
/ ・ ・ /
321:デフォルトの名無しさん
06/10/01 14:50:14
すいませんでした。
議論を再開してください。
322:デフォルトの名無しさん
06/10/08 00:06:55
C#でIEコンポーネント使って巡回ソフトじゃないんだけど
MSDNのHTML化ソフトを作りました。
1時間くらいあれば誰でも作れる程度のものですけど。
ブラウザに表示したものを取り込むので巡回ソフトには
まったく不向きですけど、表示したページからリンクされているページを
リストするようなことは簡単に出来ました。
こういうちょっとした小物を作るのにはC#って便利だと思いました。
僕の場合は、ヘルプファイルをIEにコンバートさせる必要があったので
表示させたものを取り込むという方法を取りましたが、
WEBページを取り込むだけならその必要もないので、
C#でごく簡単に実用的な巡回ソフトが作れると思います。
参考まで。
323:デフォルトの名無しさん
06/10/08 00:42:03
C
M
1
ブ
ま
り
こ
僕
表
W
C
参
324:デフォルトの名無しさん
06/10/15 20:53:19
自動巡回ソフト作成にチャレンジしているが
C#のAxWebBrowserとWebBrowserの違いが
未だに分からない漏れ…
AxWebBrowserは追加しないと使えない奴で、
WebBrowserはC#2005から標準で付いているやつって
解釈でよろしいのですか?
似てるけど若干違うみたいなので、
MSDNのサンプルが動かなかったりするのが
初心者にはワケワカメで困ります。
325:デフォルトの名無しさん
06/11/18 00:21:18
ほしゅ
326:デフォルトの名無しさん
06/11/20 07:16:25
関連してると思うのでリンクはっておきます
非RSSな何か。その2
スレリンク(software板)
327:デフォルトの名無しさん
06/12/09 21:05:23
自動巡回もここまで来たNe!
近日公開だってさ。
自動懸賞サイト巡回&自動応募ソフト
゚Д゚)またウマウマか!
※URLは張れないからYahoo検索で。
328:デフォルトの名無しさん
06/12/10 11:04:31
C++なんて使いにくくて嫌だ。
329:デフォルトの名無しさん
06/12/11 22:13:13
キタ━━━(゚∀゚)━━━ !!
330:デフォルトの名無しさん
06/12/11 22:43:32
( ´ρ`) ウマウマ
331:デフォルトの名無しさん
06/12/12 05:16:35
このスレまだあったんだ・・・
332:デフォルトの名無しさん
06/12/12 14:27:48
完成はいつ?
333:デフォルトの名無しさん
06/12/14 03:19:11
ベクターに出てるね。うまうま
URLリンク(www.vector.co.jp)
334:デフォルトの名無しさん
06/12/15 10:34:29
Linux で Web スパイダーをビルドする
URLリンク(www-06.ibm.com)
335:デフォルトの名無しさん
07/01/22 13:44:26
このスレも長いね
336:デフォルトの名無しさん
07/01/22 18:21:36
自動巡回で板内の一番古いスレを探してくるプログラムはありますか?
337:デフォルトの名無しさん
07/01/23 23:54:51
sinceでソートすればいいんじゃないの
338:デフォルトの名無しさん
07/02/11 09:11:33
あるサイトにカスタマイズしたブッコ抜きツールを作っていたら、
そのサイトが閉鎖しちゃった(泣)
339:デフォルトの名無しさん
07/02/15 05:59:22
sage
340:デフォルトの名無しさん
07/04/26 00:23:56
∧_∧
( ´ー`)
/´,mn `ヽ
〈 (_n ̄)ィ 〉
ヽ_(y';、,!,/ ノ
メキメキメキ |ヽ、__/〈
/| !, ヽ
〈 | |`ヽ、 `i,
ヽ/ ノ i ,〉
ノ ,./ヽ | |
/^ヽ_/ ヽ、 ) i ,!
し/´ ∧_∧/⌒'i ( ヽ、
ゝ (.;´Д`),ノi ノ ←>>1
/ ノ ,r-っ (ノヽ,,>
〈_ ̄ ̄ メ ))
 ̄ ̄`ヽ`つ て バンバン
)/V Vヽ(
341:デフォルトの名無しさん
07/06/23 12:09:26
sage
342:デフォルトの名無しさん
07/06/24 09:18:31
自動巡回のリンク抽出の方法について書きます。
簡単な方法としてTidyLibを使う方法があります。
1.TidyLibを使ってHTMLをXHTMLに変換します。
2.XHTMLをSAXを使ってXMLとして処理していきます。
3.Aタグが来たときにVectorなどにリンクを追加していきます。
この時、タグ内の文字列を解析するとリンク先の内容をある程度吟味することができます。
この方法は正規表現を駆使するより高速で簡単です。
343:デフォルトの名無しさん
07/08/16 09:57:29
age
344:デフォルトの名無しさん
07/08/17 00:58:23
,.ィ , - 、._ 、
. ,イ/ l/  ̄ ̄`ヽ!__
ト/ |' { `ヽ. ,ヘ
N│ ヽ. ` ヽ /ヽ / ∨
N.ヽ.ヽ、 , } l\/ `′
. ヽヽ.\ ,.ィイハ | _| 俺は今とんでもない事に
ヾニー __ _ -=_彡ソノ u_\ヽ、 | \ 気付いた ソフトバンク
.  ゙̄r=<‐モミ、ニr;==ェ;ュ<_ゞ-=7´ヽ > 並べ替えると ,馬糞と糞
. l  ̄リーh ` ー‐‐' l‐''´冫)'./ ∠__ ソフトバンクモバイルを並べ替えると,
゙iー- イ'__ ヽ、..___ノ トr‐' / 踏ん張ると糞も倍
l `___,.、 u ./│ /_これは偶然の一致か?
. ヽ. }z‐r--| / ト, | ,、 何者かの陰謀では ないのか?
>、`ー-- ' ./ / |ヽ l/ ヽ
345:デフォルトの名無しさん
07/09/17 02:03:05
SA5000
346:デフォルトの名無しさん
08/01/11 12:09:58
age
347:デフォルトの名無しさん
08/06/06 21:21:32
VMAX
348:デフォルトの名無しさん
08/06/11 14:31:59
(やりたい事によっては良いエサを吊るした方が…ゴメン)
349:デフォルトの名無しさん
08/07/26 09:30:59
age
350:デフォルトの名無しさん
09/01/31 20:56:05
7年前のスレなのか
351:マイク ◆gZ6OoOjBU6
09/02/05 07:22:27
俺も最近クローラ作って自動解析やらせたいと思っていた。
352:デフォルトの名無しさん
09/04/19 14:56:02
ダメ
353:デフォルトの名無しさん
09/05/30 01:06:11
UNNKOBURIBURI
354:デフォルトの名無しさん
09/10/05 04:14:53
>>1さん負けないで
355:デフォルトの名無しさん
09/12/11 10:34:32
このスレまだあるのかよw
356:一 五明 ◆l4DKXvv9Lw
10/01/03 12:17:16
このスレ立った時点でさえ02年かよ。
未だに使ってはいるんだけどねINCM。