08/05/22 18:02:44
>>380
Erlangの勉強を始めたばかりの者です。 とてもいいページですね。
早速勉強がてら、リンク切れ検出をErlangで書いてみようとしました。
HTTP getまではすぐ書けたものの、レスポンスデータから例えば
URLリンク(erlangworld.web.fc2.com)
という文字を抜きだすところで方法を模索中。
まだ文字データの扱いをよく理解していないのですが、参考になる情報を
ご存知の方が教えて頂けると有難いです。
全体の方針は、
・URLリンク(erlangworld.web.fc2.com)
以外で始まるurlについては1次リンクのみチェックする。
(他サイト内のリンク切れまで深追いすると切りが無いので)
・URLリンク(erlangworld.web.fc2.com)で始まるurl文字列を記憶しておいて
2回目に現れた同一urlから先はチェックしない。
参考にさせて頂いたurl:
URLリンク(blog.mikage.to)