秀丸エディタスレ Part21at SOFTWARE
秀丸エディタスレ Part21 - 暇つぶし2ch661:名無しさん@お腹いっぱい。
08/04/06 20:32:40 TUC5Jaw20
こんばんは>>833です みなさんお騒がして申し訳ないです
簡単に言えば過去のデータ整理。タイトル一覧表作りかな。一番近いのは下記のような感じです
先ほどヤフーのトップ画面のソースを見るで1520行あたりに今日のトップニューストピック6として
<あ ハーフ="f/topics/top/6/*-URLリンク(dailynews.yahoo.co.jp)">金本 2000本安打にあと1安打</a>
このような部分がありました。金本選手があと1本で偉業達成の記事です
IEで見ると1512行目に改行があってその次の改行は1530行付近です
1行の中にに何個も あ ハーフ があります
こういう感じの過去記事のスクラップ(ここでは例としてヤフートップニュースになった阪神選手の過去記事ソースとします)がたくさんあります
この過去記事からタイトルとヤフーに何年何月何時ごろトップニュースになったのかデータとして残したいんです
この例ではタイトル部分だけでいいですが社会現象といえるくらいの話題は特集が組まれます
特集が組まれた場合は特集の部分も抜き出す
抽出した部分の下に「ヤフー 年月日日時 TOP記事 トピック6 データ」と掲載元のデータを記載する
(年月日はファイル取得した日時をファイル名にしてあるのでそれでわかります)
その下に予備欄を作り「金本選手2008年○月○日2000本安打達成おめでとう!」と私が入力できるようにしておく
同じように次の記事のデータを同じフォーマットでその下に記載する
今、ヤフーのソースを見ればわかりますがトピーク6は1行の真ん中あたりです
金本選手の記事はトピック3の時もありますし2の時もある
データはあるんだけどデータの抜き出しと整理が出来ないんです
この例ではkeyの連続はないですがDIVをkeyにする時は</div>が1行に何個もある時もあるようです
タグって始まりと終わりだけなのかと思っていたのですが
何故か1行に何個も何個も<div>~</div>がある場合もあります
それと特集がある場合が殆どです(1記事で2箇所を抜くってことです)
ファイルによっては1ファイルに20記事くらいあるので抜き出したい箇所は40箇所以上になります
ん~わかりやすい例えじゃないですがこんな感じかな。




次ページ
続きを表示
1を表示
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch