07/01/22 18:21:36
自動巡回で板内の一番古いスレを探してくるプログラムはありますか?
337:デフォルトの名無しさん
07/01/23 23:54:51
sinceでソートすればいいんじゃないの
338:デフォルトの名無しさん
07/02/11 09:11:33
あるサイトにカスタマイズしたブッコ抜きツールを作っていたら、
そのサイトが閉鎖しちゃった(泣)
339:デフォルトの名無しさん
07/02/15 05:59:22
sage
340:デフォルトの名無しさん
07/04/26 00:23:56
∧_∧
( ´ー`)
/´,mn `ヽ
〈 (_n ̄)ィ 〉
ヽ_(y';、,!,/ ノ
メキメキメキ |ヽ、__/〈
/| !, ヽ
〈 | |`ヽ、 `i,
ヽ/ ノ i ,〉
ノ ,./ヽ | |
/^ヽ_/ ヽ、 ) i ,!
し/´ ∧_∧/⌒'i ( ヽ、
ゝ (.;´Д`),ノi ノ ←>>1
/ ノ ,r-っ (ノヽ,,>
〈_ ̄ ̄ メ ))
 ̄ ̄`ヽ`つ て バンバン
)/V Vヽ(
341:デフォルトの名無しさん
07/06/23 12:09:26
sage
342:デフォルトの名無しさん
07/06/24 09:18:31
自動巡回のリンク抽出の方法について書きます。
簡単な方法としてTidyLibを使う方法があります。
1.TidyLibを使ってHTMLをXHTMLに変換します。
2.XHTMLをSAXを使ってXMLとして処理していきます。
3.Aタグが来たときにVectorなどにリンクを追加していきます。
この時、タグ内の文字列を解析するとリンク先の内容をある程度吟味することができます。
この方法は正規表現を駆使するより高速で簡単です。
343:デフォルトの名無しさん
07/08/16 09:57:29
age
344:デフォルトの名無しさん
07/08/17 00:58:23
,.ィ , - 、._ 、
. ,イ/ l/  ̄ ̄`ヽ!__
ト/ |' { `ヽ. ,ヘ
N│ ヽ. ` ヽ /ヽ / ∨
N.ヽ.ヽ、 , } l\/ `′
. ヽヽ.\ ,.ィイハ | _| 俺は今とんでもない事に
ヾニー __ _ -=_彡ソノ u_\ヽ、 | \ 気付いた ソフトバンク
.  ゙̄r=<‐モミ、ニr;==ェ;ュ<_ゞ-=7´ヽ > 並べ替えると ,馬糞と糞
. l  ̄リーh ` ー‐‐' l‐''´冫)'./ ∠__ ソフトバンクモバイルを並べ替えると,
゙iー- イ'__ ヽ、..___ノ トr‐' / 踏ん張ると糞も倍
l `___,.、 u ./│ /_これは偶然の一致か?
. ヽ. }z‐r--| / ト, | ,、 何者かの陰謀では ないのか?
>、`ー-- ' ./ / |ヽ l/ ヽ
345:デフォルトの名無しさん
07/09/17 02:03:05
SA5000
346:デフォルトの名無しさん
08/01/11 12:09:58
age
347:デフォルトの名無しさん
08/06/06 21:21:32
VMAX
348:デフォルトの名無しさん
08/06/11 14:31:59
(やりたい事によっては良いエサを吊るした方が…ゴメン)
349:デフォルトの名無しさん
08/07/26 09:30:59
age
350:デフォルトの名無しさん
09/01/31 20:56:05
7年前のスレなのか
351:マイク ◆gZ6OoOjBU6
09/02/05 07:22:27
俺も最近クローラ作って自動解析やらせたいと思っていた。
352:デフォルトの名無しさん
09/04/19 14:56:02
ダメ
353:デフォルトの名無しさん
09/05/30 01:06:11
UNNKOBURIBURI
354:デフォルトの名無しさん
09/10/05 04:14:53
>>1さん負けないで
355:デフォルトの名無しさん
09/12/11 10:34:32
このスレまだあるのかよw
356:一 五明 ◆l4DKXvv9Lw
10/01/03 12:17:16
このスレ立った時点でさえ02年かよ。
未だに使ってはいるんだけどねINCM。