【RSS】 Yahoo! Pipes 【スクレイピング】at ESITE
【RSS】 Yahoo! Pipes 【スクレイピング】 - 暇つぶし2ch792:名無しさん@お腹いっぱい。
12/04/24 15:46:06.96
何が変わったん?

793:名無しさん@お腹いっぱい。
12/04/24 16:14:58.33
xpathわかってればこっちのほうがずっと使いやすいと思う
Emit items as string使うとFetch Pageぽくなる
HTMLの構造がはっきりしてるならas string使わずに抜き出す方が便利かもしれないけど
たとえば<p>1<span>2</span>3</p>みたいな構造のときに1が消えるのは注意だな

794:名無しさん@お腹いっぱい。
12/04/25 02:13:30.77
pipesでrss作ってpublishもしてるのに、yahoo pipesの検索でひっかからないのはなんか設定おかしいの?
3週かんくらい前に作って、もちろん普通に使えてる

795:名無しさん@お腹いっぱい。
12/04/25 07:47:30.97
Fetch Pageは6月末で使えなくなるんだって
それまでにXPATH Fetch Pageに書き換えろと
メインでたくさん使ってると大変だな

796:名無しさん@お腹いっぱい。
12/04/25 09:02:08.55
>>795
工エエェェ(´д`)ェェエエ工
マジかそれ
なんか泣きそうだ

797:名無しさん@お腹いっぱい。
12/04/25 10:29:50.46
誰か6月までに解説記事書いて

798:名無しさん@お腹いっぱい。
12/04/25 19:08:08.74
//bodyでregexとloop-tokenizerをつなげたsubpipeつくれば
一応旧fetch pageみたいなのもできるけど
xpath覚えた方がいいんじゃないか

799:名無しさん@お腹いっぱい。
12/04/26 15:38:03.84
xpathはよくわからないんだよなー
勉強できるところないかな?

800:名無しさん@お腹いっぱい。
12/04/26 15:42:43.65
というかxpath自体が何なのかよく理解できない。

801:名無しさん@お腹いっぱい。
12/04/26 20:13:23.37
pipes歴一週間にXpathなんたらなんてきついお
URLリンク(pipes.yahoo.com)

802:名無しさん@お腹いっぱい。
12/04/28 05:13:49.95
yql使うためにxpathは覚えたいと思っていたから、ちょうどいい機会だと思うことにした

803:名無しさん@お腹いっぱい。
12/04/28 21:38:10.35
GWがxpath化修正で飛ぶ\(^o^)/

804:名無しさん@お腹いっぱい。
12/04/29 05:14:27.94
大体修正終わった。
ただfetch pageだとリダイレクトされてるページも取り込めたけど、
xpathだと追えないみたいで困ってる。


805:名無しさん@お腹いっぱい。
12/04/29 08:45:32.49
xPathに限らず、リダイレクトに遭遇したときはマジで困る

806:名無しさん@お腹いっぱい。
12/05/01 07:43:45.99
ううむ

807:名無しさん@お腹いっぱい。
12/05/06 16:38:17.24
Pipesで取得したRSSフィードに元ページのファビコンを表示させる方法はありますか?

808:名無しさん@お腹いっぱい。
12/05/06 23:48:26.62
とりあえずここからがんばるメモ
URLリンク(ejohn.org)
Goal CSS 3 XPath
All Elements * //*
All P Elements p //p
All Child Elements p > * //p/*
Element By ID #foo //*[@id='foo']
Element By Class .foo //*[contains(@class,'foo')] 1
Element With Attribute *[title] //*[@title]
First Child of All P p > *:first-child //p/*[0]
All P with an A child Not possible //p[a]
Next Element p + * //p/following-sibling::*[0]

809:名無しさん@お腹いっぱい。
12/05/07 00:34:38.03
いかん全然理解できない

多分一度わかれば今までよりずっと簡単なんだろうけど

810:名無しさん@お腹いっぱい。
12/05/09 04:59:51.16
XPathモジュール、idがclassみたいに複数使われてしまってる(不正な)ページだと
同一idのエレメントは何が何でも最初の1つしか取ってきてくれないっぽい。

まいった…。

811:名無しさん@お腹いっぱい。
12/05/12 07:31:57.96
Loopモジュール 2つまでしか使えなくなってない?

812:名無しさん@お腹いっぱい。
12/05/12 13:33:31.65
えっそれってどうするの


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch