12/06/21 02:28:07.82
質問です。
大量にデータがあるファイル内の[開始文字列]と[終了文字列範囲内]の文字を抽出するにはどうしたらいいのでしょうか。
分かりやすく例えますと、htmlファイル内の
検索範囲開始文字列:http
から
検索範囲終了文字列:.html
までをファイルに追記書き出しすると言うほうが分かりやすいでしょうか。
通常のhtmlファイル内には複数のURLがあるので、
私が指定している方法ですと、htmlファイル内のURLが
指定ファイルに列挙される形になります。
結果のファイルサンプルです。
----------result.txt----------
URLリンク(hogehoge.com)
URLリンク(hogehoge.com)
URLリンク(hogehoge.com)
URLリンク(hogehoge.co.jp)
URLリンク(hogehoge.co.jp)
URLリンク(hogehoge.co.jp)
------------------------------
外部コマンドラインツールを利用してもOKです。