【保存・記録】ウェブアーカイブ総合 Page.01at INTERNET
【保存・記録】ウェブアーカイブ総合 Page.01 - 暇つぶし2ch2:192.168.0.774
19/04/06 21:44:40.44 ToHayX3A0.net
いちおつ

3:192.168.0.774
19/04/06 22:53:39.40 khb0d4nX0.net
>>1 乙です

4:192.168.0.774
19/04/06 22:57:35.43 C58mCeVw0.net
なんか、良く解ってない奴がスレ立てた感がもりもり

5:192.168.0.774
19/04/06 23:08:18.32 W+Cd7+OG0.net
随分ふんわりとした否定だな

6:192.168.0.774
19/04/07 00:26:33.03 8q7+ly+v0.net
スレ立てする時に5chの使い方と日本語以外に解ってなきゃいけないことがあるなんて初めて聞いた

7:192.168.0.774
19/04/07 06:32:56.08 rvx0PlzU0.net
サービスの使い方、お知らせなど
日経トレンディネットは3月31日に更新終了、日経クロストレンドへ統合します
URLリンク(trendy.nikkeibp.co.jp)
2019年03月01日
既存の「日経トレンディネット」の記事は、4月以降、順次閲覧ができなくなり、6月30日にはすべての記事の閲覧ができなくなります(一部は「日経クロストレンド」で閲覧可能です)。
長い間のご利用、ありがとうございました。

8:192.168.0.774
19/04/07 06:55:45.40 rvx0PlzU0.net
2019年8月15日(木) niconareサービス終了について
URLリンク(blog.nicovideo.jp)
4月11日(木) 投稿者向けのデータダウンロード機能の提供
投稿者の方がご自身の投稿いただいたスライドや、
スライドについたコメントをダウンロードできる機能を提供いたします。
この機能はniconareのサービス終了日までご利用いただくことができます。
7月18日(木) スライドの投稿、およびコメント投稿機能の提供終了
これ以降はスライドの視聴および、
投稿済みスライド情報の編集のみ行うことができます。

9:192.168.0.774
19/04/07 06:58:08.86 rvx0PlzU0.net
今後、はてなグラフ、ポケットはてななど、複数のサービスの提供を終了する予定です
URLリンク(hatena.g.hatena.ne.jp)
終了予定
はてなグラフ ( URLリンク(graph.hatena.ne.jp)<) )
はてな検索 ( URLリンク(search.hatena.ne.jp)<) )
ポケットはてな ( URLリンク(mobile.hatena.ne.jp)<) )
はてなメッセージAPI ( URLリンク(developer.hatena.ne.jp) )
はてなポイント送信機能

10:192.168.0.774
19/04/07 07:11:15.82 4ZacPRRJ0.net
最近は本当にサービス終了多いな・・・

11:192.168.0.774
19/04/07 07:32:13.57 rvx0PlzU0.net
URLリンク(www.cabling-ol.net)
ケーブルダイレクトおよびケーブリングオンラインの各Webサイトの閉鎖日時が決まりましたのでお知らせいたします。  
ケーブルダイレクトおよびケーブリングオンラインの各Webサイトは、2019年5月31日(金曜日)の午後12時をもって閉鎖することとさせていただきますので、お知らせいたします。

12:192.168.0.774
19/04/07 07:37:42.65 rvx0PlzU0.net
Adobe Flashのサポート終了まであと2年。消えゆくFlashゲームを保存する「Flashpoint」の登録作品がリリースから1年で1万タイトルを超える
URLリンク(news.denfaminicogamer.jp)
歴史の中に消えようとするデジタルコンテンツを収集し保存するボランティア団体「Archive Team」に所属するBen Latimore氏が、終焉の危機にひんしているFlashゲームを収集し、誰もがプレイできるプラットフォーム「Flashpoint」を公開してから1年が経つ。

13:192.168.0.774
19/04/07 07:40:18.59 rvx0PlzU0.net
パブー閉店に伴うブクログからのお知らせ
URLリンク(info.booklog.jp)
【パブー・サービス終了までのスケジュール】
2019年6月30日(日) パブー新規作品の作成・公開の停止、プロ版サービス終了、新規会員登録停止
2019年9月30日(月) パブー閉店(商品販売の終了)
2019年10月1日(火)ブクログでのパブー検索終了
2019年11月30日(土) パブー側のログイン機能の停止
2019年12月1日(日)ブクログ本棚のパブー発行書籍の書影の非表示化

14:192.168.0.774
19/04/07 07:48:48.33 kQbvec6m0.net
>>10
儲からないからね

15:192.168.0.774
19/04/07 09:57:35.03 4ZacPRRJ0.net
とりあえずニコナレ1ページ保存してみたけどやっぱ動的?なサイトだとそう簡単には動いてくれないな
URLリンク(web.archive.org)
専門的な知識無いからわかんないや
>>14
情報集めといて一気に消滅させるのやめてほしいわ・・・
結局どのサイトも最終的には消えて無くなるんだろうけどさ

16:192.168.0.774
19/04/07 10:38:53.84 8q7+ly+v0.net
【魚拓】とか【Internet Archive】とかスレタイに付けないと検索にひっかからなさそうな気がするわ
立て直した方が良いんじゃないの?

17:192.168.0.774
19/04/07 10:55:17.23 rvx0PlzU0.net
Janne Da Arc オフィシャルファンクラブ「マドモアゼルなあなた達」会員の皆様へ
Janne Da Arc解散に伴うファンクラブ解体のお知らせ
URLリンク(fanclub.janne.co.jp)

18:192.168.0.774
19/04/07 11:20:57.88 rvx0PlzU0.net
【サイト閉鎖のお知らせ】睡眠情報メディア・フミナーズ
URLリンク(fuminners.jp)
睡眠情報メディア・フミナーズは、2019年3月末日をもって全ての記事の更新をストップし、準備が整い次第、サイトを閉鎖することとなりました。

19:192.168.0.774
19/04/07 12:11:36.84 ddJkY//e0.net
おまんこ

20:192.168.0.774
19/04/07 13:56:52.92 PI3RUhLx0.net
【意図しないデータ消失事故にアーカイブが活かされた事例】
・2019年3月18日
2003年にサービスを開始して以来、2億人以上のユーザー数を誇っていた米音楽系SNS「Myspace」が、
過去12年間に投稿された写真、動画、音声の全てのファイルをサーバー移行失敗により消失したと発表。
これにより1400万組のアーティストによる5000万以上も楽曲が損失したこととなり、世界各地では亡くなった友人や家族との思い出が消えてしまったなどという悲痛の声があがった。

・2019年4月1日
インターネット・アーカイブが「MySpaceが消失した音楽ファイルのうち、約50万曲が匿名の学術グループによって提供された」と発表し、そのファイルを公開した。
喪失した音楽ファイル全体の1%にも満たない曲数ではあるが、復旧したデータ量は1.3TBにも及ぶ。
今後の第三者によるデータ提供に注目が集まっている。

Myspaceの喪失データのうち約50万件の音楽ファイルが学術グループにより復活
URLリンク(gigazine.net)

21:192.168.0.774
19/04/07 14:30:36.57 rvx0PlzU0.net
2019.02.26 サービス終了のお知らせ
URLリンク(www.mapfan.net)
平素は「MapFan.net」をご愛顧頂きまして、誠にありがとうございます。
「MapFan.net」は、2020年3月31日をもちましてサービス終了させて頂きます。
ユーザーの皆様には大変ご迷惑をおかけ致しますが、何卒ご理解賜りますようお願い申し上げます。
サービス終了に伴い、2019年2月26日時点で「通常版」*1をご利用中のユーザー様につきましては、有効期限を2020年3月31日まで延長させて頂きました。
サービス終了までご利用頂けますので、継続利用手続きの必要はございません。
なお、新規購入につきましては、サービス終了する1年前の2019年3月31日をもちまして、お手続きを停止致しました。
また、「MapFan.net」は終了致しますが、今後は、MapFanプレミアム会員向けサービス *2の中で、パソコン用地図ソフトをご利用いただけるよう準備しております(2019年度中予定)。

22:192.168.0.774
19/04/07 14:38:15.11 rvx0PlzU0.net
全サービス終了のお知らせ | DNSを自由に簡単に。Dozens(ダズンズ)
URLリンク(dozens.jp)
サービス終了までのスケジュール
・2019年3月1日(金)
新規会員登録・有料プランへのアップグレード受付終了
・2019年9月30日(月)
コントロールパネル・APIの停止
・2019年10月31日(木)
DNSサーバーの停止・サービスの完全終了

23:192.168.0.774
19/04/07 17:43:24.63 FMiv5iU/0.net
>>16
同意する

24:192.168.0.774
19/04/07 18:13:55.69 PI3RUhLx0.net
色々なサイトの情報が集まってきているからwikiとかがあった方がいいかもね

25:192.168.0.774
19/04/07 20:26:45.76 8q7+ly+v0.net
【Internet Archive】ウェブアーカイブ総合 Page.01【ウェブ魚拓】
のスレタイで立て直すけどいい?

26:192.168.0.774
19/04/07 20:39:47.53 R6TrddMD0.net
【魚拓】ウェブアーカイブ総合 Page.01【Internet Archive】
こっちのほうが見やすいかも

27:192.168.0.774
19/04/07 20:41:13.58 8q7+ly+v0.net
>>26
そっちの方がいいね

28:192.168.0.774
19/04/07 21:03:08.45 5OnOP9Lv0.net
テンプレのURL中のカンマも何とかしろよ
要らんものにも付いてるし、大文字を使うだけで回避できるのもある

29:192.168.0.774
19/04/07 21:21:30.37 PI3RUhLx0.net
archive.today は https じゃなくて httpだぞ

30:192.168.0.774
19/04/07 21:22:54.38 PI3RUhLx0.net
これでも回避できるかな
URLリンク(archive%2efo)
URLリンク(archive%2eis)
URLリンク(archive%2etoday)

31:192.168.0.774
19/04/07 21:47:48.30 8q7+ly+v0.net
これでいいかな
ウェブアーカイブ関連の話題を総合的に扱うスレです。
情報交換し合って貴重なインターネット遺産を後世に残しましょう。
Internet ArchiveなどのWebサービスだけでなく、wget・HTTrack・Heritrix等のツールやソフト、自作クローラの話題もOKです。
・関連リンク(Rock54回避のためピリオドをカンマに変更)
Wayback Machine
URLリンク(archive.org)
archive is
URLリンク(archive%2eis)
ウェブ魚拓
URLリンク(megalodon.jp)
Archive Team
URLリンク(archiveteam.org)
・関連スレ
Internet Archive総合 (web.archive.org) #2
スレリンク(esite板)
ウェブ魚拓 Part3
スレリンク(esite板)
【和塩】geocitiesスレ10【ジオシティーズ】
スレリンク(hosting板)
【ヤフー】Yahoo!ブログ【アーカイブ】
スレリンク(blog板)
・ジオシティーズでの失敗から学んだアーカイブにあたっての注意事項
1. 早めに行動しましょう
2. まずは既存のプロジェクトや遺産を探しましょう
3. 単独ではなく組織的に動きましょう
4. 呼びかけや情報共有を積極的に行いましょう

32:192.168.0.774
19/04/07 21:55:01.17 PI3RUhLx0.net
(Rock54回避のためピリオドをカンマに変更)が消えてないよ

33:192.168.0.774
19/04/07 22:01:00.95 8q7+ly+v0.net
【魚拓】ウェブアーカイブ総合 Page.01【Internet Archive】
ウェブアーカイブ関連の話題を総合的に扱うスレです。
情報交換し合って貴重なインターネット遺産を後世に残しましょう。
Internet ArchiveなどのWebサービスだけでなく、wget・HTTrack・Heritrix等のツールやソフト、自作クローラの話題もOKです。
・関連リンク
Wayback Machine
URLリンク(archive.org)
archive is
URLリンク(archive%2eis)
ウェブ魚拓
URLリンク(megalodon.jp)
Archive Team
URLリンク(archiveteam.org)
・関連スレ
Internet Archive総合 (web.archive.org) #2
スレリンク(esite板)
ウェブ魚拓 Part3
スレリンク(esite板)
【和塩】geocitiesスレ10【ジオシティーズ】
スレリンク(hosting板)
【ヤフー】Yahoo!ブログ【アーカイブ】
スレリンク(blog板)
・ジオシティーズでの失敗から学んだアーカイブにあたっての注意事項
1. 早めに行動しましょう
2. まずは既存のプロジェクトや遺産を探しましょう
3. 単独ではなく組織的に動きましょう
4. 呼びかけや情報共有を積極的に行いましょう

34:192.168.0.774
19/04/07 22:15:14.47 5OnOP9Lv0.net
URLリンク(Archive.is)

35:192.168.0.774
19/04/07 22:22:56.39 8q7+ly+v0.net
>>33-34でスレ立てるけど良いよね?

36:192.168.0.774
19/04/07 22:37:00.78 PI3RUhLx0.net
テンプレ3つと比較したら圧倒的に認知されてないけど一応この2つのアーカイブサイトもある
WebCite
URLリンク(www.webcitation.org)
Archive.st
URLリンク(archive.st)

37:192.168.0.774
19/04/07 23:14:50.73 8q7+ly+v0.net
>>36
これも追加しておくわ

38:192.168.0.774
19/04/08 00:10:23.59 csp1RLRO0.net
これ以上意見なさそうなんで立て直してくる

39:192.168.0.774
19/04/08 00:16:32.72 csp1RLRO0.net
本文はこれにする
ただスレタイの文字数制限に引っ掛かってしまったんでどこか削らないと駄目だな
ウェブアーカイブ関連の話題を総合的に扱うスレです。
情報交換し合って貴重なインターネット遺産を後世に残しましょう。
Internet ArchiveなどのWebサービスだけでなく、wget・HTTrack・Heritrix等のツールやソフト、自作クローラの話題もOKです。
・関連リンク
Wayback Machine
URLリンク(archive.org)
archive is
URLリンク(Archive.is)
ウェブ魚拓
URLリンク(megalodon.jp)
WebCite
URLリンク(www.webcitation.org)
Archive.st
URLリンク(archive.st)<)
・関連スレ
Internet Archive総合 (web.archive.org) #2
スレリンク(esite板)
ウェブ魚拓 Part3
スレリンク(esite板)
【和塩】geocitiesスレ10【ジオシティーズ】
スレリンク(hosting板)
【ヤフー】Yahoo!ブログ【アーカイブ】
スレリンク(blog板)
・ジオシティーズでの失敗から学んだアーカイブにあたっての注意事項
1. 早めに行動しましょう
2. まずは既存のプロジェクトや遺産を探しましょう
3. 単独ではなく組織的に動きましょう
4. 呼びかけや情報共有を積極的に行いましょう

40:192.168.0.774
19/04/08 00:34:32.72 kFS6Xl/I0.net
ジオシティーズ消える前に立てないあほ

41:192.168.0.774
19/04/08 00:43:05.43 csp1RLRO0.net
>>40
ジオシティーズスレでのアーカイブ活動の振り返りから生まれたスレらしいのでそれはそう
スレタイだけど、これならインターネット板の制限に収まるはず これで良いよね
ウェブアーカイブ総合【Internet Archive・魚拓】#1

42:192.168.0.774
19/04/08 00:45:54.81 HokS2hQ10.net
archive.st はいらんでしょ

43:192.168.0.774
19/04/08 00:50:15.61 HokS2hQ10.net
【魚拓】ウェブアーカイブ総合1【Internet Archive】
スレタイこれでもいける

44:192.168.0.774
19/04/08 00:54:42.68 csp1RLRO0.net
>>43
この板のスレタイ制限は48バイトなんだが、それは50バイトだからオーバーしてしまう

45:192.168.0.774
19/04/08 01:04:44.88 csp1RLRO0.net
>>42
あっても良いんじゃない

46:192.168.0.774
19/04/08 02:17:39.24 Lv11LAhu0.net
パート数増える事考えると少し余裕もたせたいね

47:192.168.0.774
19/04/08 04:47:52.01 Lv11LAhu0.net
魚拓諦めてIAだけのほうがいいのかな
【InternetArchive】ウェブアーカイブ総合 Page.1
いっそ文字数制限の緩和を申請してみるのもいいかもしれない

48:192.168.0.774
19/04/08 06:12:04.28 1L4c/w+i0.net
>>24
あー、そうだな。
誰かにウィキ作ってほしい。

49:192.168.0.774
19/04/08 08:07:46.10 1ZNe+OlH0.net
wikiはみんなで作るものだぞ

50:192.168.0.774
19/04/08 09:29:10.99 kuGZ5jM70.net
共同編集サイトで有名なのってwiki以外だとgoogleドキュメントくらいか
他に候補ある?

51:192.168.0.774
19/04/08 09:37:42.02 csp1RLRO0.net
>>47
文字数制限緩和の申請は賛成だけど、どれくらい待たされるか分からん(そもそも許可されないかも)し、とりあえず>>48のスレタイで立てるよ

52:192.168.0.774
19/04/08 09:38:41.30 csp1RLRO0.net
>>48じゃなくて>>41だった

53:192.168.0.774
19/04/08 09:41:17.79 kuGZ5jM70.net
【ウェブ魚拓】インターネットアーカイブ総合 #1
一つの案として。

54:192.168.0.774
19/04/08 09:44:44.34 Lv11LAhu0.net
立て直す前にwiki作っとかない?
どうせならもうテンプレに突っ込んどいちゃったほうがいいと思うんだけど

55:192.168.0.774
19/04/08 13:23:24.39 Gn50FMSd0.net
>>49
最初の設定は誰かが単独で行うだろ。

56:192.168.0.774
19/04/08 13:23:40.54 Gn50FMSd0.net
>>54
同意

57:192.168.0.774
19/04/08 13:25:37.41 Gn50FMSd0.net
>>1
> Archive Team
> URLリンク(archiveteam.org)

これは知らなかった。

58:192.168.0.774
19/04/08 13:54:47.88 csp1RLRO0.net
>>53
Internet Archiveのスレと間違われそう
誰かwikiの管理をできる時間がある人がいたらwiki作成宜しく
自分は管理者業務とか無理だわ

59:192.168.0.774
19/04/08 14:42:32.50 kuGZ5jM70.net
どこか既存のwikiに専用のページを作るっていう方法もある
アーカイブ関係のwikiがすでにあればそういうところがいいんだけど

60:192.168.0.774
19/04/08 17:21:50.82 7Gb6dlTw0.net
一分に一件ずつ保存しても一日1440頁しか保存できない。

61:192.168.0.774
19/04/08 18:46:46.19 csp1RLRO0.net
これで立てようとしたけどホスト規制に引っ掛かってしまったので誰か頼んだ
タイトル:ウェブアーカイブ総合【Internet Archive・魚拓】#1
内容:
ウェブアーカイブ関連の話題を総合的に扱うスレです。
情報交換し合って貴重なインターネット遺産を後世に残しましょう。
Internet ArchiveなどのWebサービスだけでなく、wget・HTTrack・Heritrix等のツールやソフト、自作クローラの話題もOKです。
・関連リンク
Wayback Machine
URLリンク(archive.org)
archive is
URLリンク(Archive.is)
ウェブ魚拓
URLリンク(megalodon.jp)
WebCite
URLリンク(www.webcitation.org)
Archive.st
URLリンク(archive.st)<)
・関連スレ
Internet Archive総合 (web.archive.org) #2
スレリンク(esite板)
ウェブ魚拓 Part3
スレリンク(esite板)
【和塩】geocitiesスレ10【ジオシティーズ】
スレリンク(hosting板)
【ヤフー】Yahoo!ブログ【アーカイブ】
スレリンク(blog板)
・ジオシティーズの件から学んだアーカイブにあたっての注意事項
1. 早めに行動しましょう
2. まずは既存のプロジェクトや遺産を探しましょう
3. 単独ではなく組織的に動きましょう
4. 呼びかけや情報共有を積極的に行いましょう
・旧スレ
URLリンク(mevius.2ch.sc)

62:192.168.0.774
19/04/08 20:23:02.60 IXy1N+9U0.net
正直そんなに慌てて次スレ建てなくてもいい
このスレでwikiの作成や話し合いを十分にやってから立てればいい

63:192.168.0.774
19/04/08 21:41:07.95 csp1RLRO0.net
それもそうか
Wiki作るって言っても無計画にやったら瓦解するだろうし、具体的に何を書く(書いていい)Wikiなのか決めとかないと

64:192.168.0.774
19/04/08 23:09:47.96 73UxGWOW0.net
規律と理念、主要なアーカイブサイトのアーカイブリクエスト方法と見方、主要なツールの使い方、アーカイブに便利なソフトウェア一覧、関連リンク集、サービス終了が告知されている中で保存に公益性がありそうなサイト一覧、将来的に保存が必要になりそうなサイト一覧
とか?
多少ArchiveTeamに倣ったほうがよさそう

65:192.168.0.774
19/04/09 00:37:25.02 qC7dF5bK0.net
他力本願で技術力が足りない人が多すぎるから、人を集めることも重要だな

66:192.168.0.774
19/04/09 01:27:21.91 vAsLhlqU0.net
【12日まで】500円を貰える春のばらまきキャンペーン開催中です     
① スマホのApp Storeから「プリン(pring)」をインストールする  
② 会員登録を済ませる    
③ 下図の通りに進む    
URLリンク(pbs.twimg.com) 
④ コードを登録 [5gAYSz]  
    
これで五百円を貰えます  
スマホでセブンATMからお金を下ろせたり便利なアプリですので是非お試し下さい。   

67:192.168.0.774
19/04/09 02:14:18.12 Xrq4p9iW0.net
結局wikiはどこに作るんだ
atwikiかwikiwiki辺りか?

68:192.168.0.774
19/04/09 06:11:46.94 bDBZAOBP0.net
>>67
その二択なのか?

69:192.168.0.774
19/04/09 07:35:20.06 aX1j4Hrw0.net
MediaWiki 一択でしょ

70:192.168.0.774
19/04/09 07:42:31.88 aX1j4Hrw0.net
>>64
というか ArchiveTeam の日本語版を作ったほうがいいな
向こうが全てにおいて優れているから自分達で1から始める理由がない
日本支部的な感じで翻訳から始めよう

71:192.168.0.774
19/04/09 10:44:41.80 47CWuxog0.net
そのまま日本語化は無理だろうね、法律違うし
アーカイブをまとめてtorrentで配布とかそもそもサイトをアーカイブして勝手に公開することとか
禁止しないといけないこと、解釈を変えないといけないこと色々あるでしょう

72:192.168.0.774
19/04/09 12:18:20.83 j/bARIBT0.net
Torrent配布は日本では完全に無理だな
Archive Teamはインターネットアーカイブをデータを提供しているらしいから、それに倣った方がいい

73:192.168.0.774
19/04/09 17:30:25.36 ilhSCREf0.net
そういえば少し前にググルマップがゼンリン切ったけど、ゼンリンが提供してた部分以外で何か独自の消失したものってあった?

74:192.168.0.774
19/04/09 20:25:46.98 R0ew9YH30.net
このスレってパソコン初心者感がすごいな
このまま進んでも上手くいかないだろうな、というのが見てて分かる

75:192.168.0.774
19/04/09 20:40:23.16 TX2XtJeD0.net
随分ふんわりとした否定だな

76:192.168.0.774
19/04/09 21:42:02.72 j/bARIBT0.net
初心者っぽいポイントを挙げてみろよ
出来ないならそれは単にイチャモン付けてるだけだぞ

77:192.168.0.774
19/04/09 21:51:39.41 j/bARIBT0.net
×初心者っぽいポイント
○上手くいかないであろう根拠
逆に聞くが>>74はどうやったら上手くいくと思うよ?

78:192.168.0.774
19/04/09 22:06:36.56 Ybc45mGn0.net
適当に作ったブックマークレット各種
google cache化
javascript:{window.open('URLリンク(webcache.googleusercontent.com)'+escape(window.location.href.replace(/^https?:\/\//,''))+'');eval();}
保存 WayBackMachine (web.archive.org)
javascript:{window.open('URLリンク(web.archive.org)'+escape(window.location.href.replace(/^https?:\/\//,'')).replace('http://','')+'');eval();}
WayBackMachine最新
javascript:{window.open('URLリンク(web.archive.org)'+escape(window.location.href.replace(/^https?:\/\//,'')).replace('http://','')+'&type=replay');eval();}
GeoLog化
javascript:{window.open('URLリンク(thaliana.mydns.jp)'+escape(window.location.href.replace(/^https?:\/\//,'')).replace('http://','')+'');eval();}

79:192.168.0.774
19/04/09 22:34:51.34 Ybc45mGn0.net
適当に作ったブックマークレット各種(2)
Save to Archive.today
javascript:void(open('URLリンク(archive.today)'+encodeURIComponent(document.location)))
Web魚拓化
javascript:{window.open('URLリンク(gyo.tc)'+escape(window.location.href.replace(/^https?:\/\//,''))+'');eval();}

80:192.168.0.774
19/04/09 23:12:16.41 thZOPaUB0.net
グッジョブ

81:192.168.0.774
19/04/10 14:33:20.20 0KzfqGnC0.net
>>78
google cacheをWayBackMachineに保存するときに保存のブックマークレット使うと失敗しますね。
最新の方で開いてから「Save this url in the Wayback Machine」をクリックで成功。
一度失敗してしまった場合はgoogle cacheのURLの後ろに「&hl=ja」等をつけてから最新で開いて「Save This URL」。

82:192.168.0.774
19/04/10 15:33:03.08 y92qvzSP0.net
>>1
INTERNATIONAL INTERNET PRESERVATION CONSORTIUM - IIPC
URLリンク(netpreserve.org)

83:192.168.0.774
19/04/10 18:38:04.28 kmjY19lr0.net
>>78
Internet Archiveスレから引用
スレリンク(internet板:78番)-79
/save/ を知ってて /web/2/ を知らないとは。
あと保存の際に http:// や https:// を無条件に外すのも考え物。
HTTP から HTTPS へリダイレクトするサイトだと、そのリダイレクトも
保存回数に計上されてしまう。

84:192.168.0.774
19/04/10 22:12:15.15 5UKQiW/z0.net
/web/2/ってのは/web/*/の勘違いかタイポなんだろうな
/web/*/使えばもっと簡潔に書けると思うよ

85:192.168.0.774
19/04/10 22:14:34.68 Qi/9tnuY0.net
/web/*/だと一覧に飛んで/web/2/だと最新のに飛ぶんでないの

86:192.168.0.774
19/04/10 23:12:54.50 0KzfqGnC0.net
保存 WayBackMachine (web.archive.org)
javascript:{window.open('URLリンク(web.archive.org)'+escape(window.location.href+''));eval();}
WayBackMachine最新
javascript:{window.open('URLリンク(web.archive.org)'+escape(window.location.href+''));eval();}

87:192.168.0.774
19/04/11 00:46:30.73 2s+xSUEt0.net
/web/URLでも最新に飛べるけどな

88:192.168.0.774
19/04/11 10:08:33.22 NcP8kiVw0.net
このスレ見つけらんねえよ
魚拓,archive,waybackとかスレタイに含まれてなきゃ

89:192.168.0.774
19/04/11 10:41:01.74 zpHmesQE0.net
上の方で話してたけどスレタイの文字数制限厳し目だからウェブアーカイブ総合の横にInternetArchiveと魚拓入れただけでカツカツになっちゃうんだよね
板設定変更依頼スレッド見ると簡単には設定変更してくれないようだしなんか削らないと
いっそ魚拓・InternetArchive総合にすりゃいいのか?

90:192.168.0.774
19/04/11 11:12:44.61 JiNXg/cV0.net
良スレだな。応援してるわ
日本のサイトもサービス終了対策しないと空白になってしまうので
管理人が全員生きてて引っ越し出来るとも限らんし、消された情報が将来誰かに必要・不要なんて分からんのよね
日本の法律から、終了するサイトは丸ごと個人のローカルへ保存する方法が有ると良いな
分散バックアップにもなると思う

91:192.168.0.774
19/04/11 11:26:31.44 3yDWyDnm0.net
>>89
タイトル案
【魚拓】ウェブアーカイブ1【Internet Archive】
【魚拓】ウェブアーカイブ1【InternetArchive】
【魚拓】ウェブアーカイブ1【IA】
【魚拓】ウェブアーカイブ1【Internet Archive】
【魚拓】アーカイブ1【Internet Archive】
【魚拓】Web archiving1【Internet Archive】
魚拓:ウェブアーカイブ1:Internet Archive
ウェブアーカイブ1【Wayback Machine,魚拓】
ウェブアーカイブ1【Internet Archive,魚拓】
ウェブアーカイブ1【魚拓】
ウェブアーカイブ1&#128514;InternetArchive魚拓
ウェブアーカイブInternetArchive魚拓1
archive 1【魚拓】
魚拓 1

92:192.168.0.774
19/04/11 12:00:59.64 aWNM129m0.net
魚拓やWayback Machine以外のツールも扱うよ、ってことで「総合」は付けておきたい

93:192.168.0.774
19/04/11 12:04:19.18 aWNM129m0.net
>>91
追加
ウェブアーカイブ総合【Internet Archive・魚拓】#1
【ウェブ魚拓】インターネットアーカイブ総合 #1
>>1にリンクがあるウェブ魚拓スレやIA専用スレと間違われないようなスレタイが望ましい

94:192.168.0.774
19/04/11 12:18:42.95 zpHmesQE0.net
となるとやっぱりウェブアーカイブ総合は外せないか?
魚拓、InternetArchiveの他にウェブページを保存したい人が調べそうな単語ってあるんかな
収集、保存、保管、ダウンロード、キャプチャ、スクラップ
うーん・・・

95:192.168.0.774
19/04/11 12:26:06.26 D+Yqkgbv0.net
魚拓もウェブ魚拓って完全にスレタイに含めないと話にならない

96:192.168.0.774
19/04/11 13:18:54.90 aWNM129m0.net
ウェブ魚拓は固有名詞としても使うだろ
URLリンク(info.5ch.net)魚拓
このサイトでも「魚拓」とだけ紹介してるし、何よりスレタイ制限の48バイトって結構カツカツだし、魚拓だけで良いんじゃないかな

97:192.168.0.774
19/04/11 13:20:20.32 aWNM129m0.net
>>96
×魚拓だけで良いんじゃないかな
○「ウェブ魚拓」と完全にスレタイに含める必要は無いんじゃないかな

98:192.168.0.774
19/04/11 13:59:00.00 D+Yqkgbv0.net
そんなにこだわってないならIAは略していいってことになるけどそうはならないのと同じ
ウェブ魚拓とスレタイに含めないと立てる意味がない

99:192.168.0.774
19/04/11 14:44:54.16 zpHmesQE0.net
【ウェブ魚拓】ウェブアーカイブ総合 Page.1【InternetArchive】
sjisで60バイト
ウェブ魚拓をweb魚拓にすれば57バイト
ウェブアーカ�


100:Cブもwebアーカイブにすれば54バイト 64バイトまで引き上げてもらえば全部入る 【ウェブ魚拓】を抜けば48バイトに収まる とりあえずウェブ魚拓抜いて立て直して申請通ったら次のスレからウェブ魚拓も入れるのがいいんじゃないか なぜIAじゃなくてウェブ魚拓を抜くのかについてはGoogleの検索トレンドを参考にした https://i.imgur.com/cNx29z9.png



101:192.168.0.774
19/04/11 15:23:27.94 rHrFPNjW0.net
大抵「Archive」でスレタイ検索するなあ自分は

102:192.168.0.774
19/04/11 16:54:04.85 aWNM129m0.net
「ウェブ魚拓」と「魚拓」のどちらでも、Googleなら上手いこと検索に引っ掛かってくれそうではある
Bingは知らん

103:192.168.0.774
19/04/11 18:36:21.34 3yDWyDnm0.net
「魚拓」 でも引っかかるから「ウェブ」は要らないね
URLリンク(www.google.com)
というか普通にスレあった
URLリンク(mevius.2ch.sc)
>>92
「ウェブアーカイブ」だけで全てを説明できてるから「総合」も要らないと思う
Internet Archive, Wayback Machine, archive.is, 魚拓, ArchiveTeam は全部「ウェブアーカイブ」で説明できる 👀
Rock54: Caution(BBR-MD5:1322b9cf791dd10729e510ca36a73322)


104:192.168.0.774
19/04/11 18:59:21.43 zpHmesQE0.net
ウェブアーカイブ(に関するものを)総合(したスレッド)
ていうかそれ総合格闘技とか格闘技で空手やら柔道やら説明できるから総合いらないじゃんって言ってるようなもんでしょ
総合とわざわざ表記することによって一つではなく全体であることを暗に示してるんだよ

105:192.168.0.774
19/04/11 19:37:27.64 3yDWyDnm0.net
いや、どっちかというと「空手 part1」でも十分なのに「空手総合 part1」 にしてる感じ
ウェブアーカイブの技術としては1つにまとまるから総合しなくてもいい
「ウェブアーカイブサービス総合」なら自然だね
文字列制限があるなら省いても問題ない

106:192.168.0.774
19/04/11 19:55:40.33 3yDWyDnm0.net
今気づいたけど「ウェブアーカイブ」が何を指すかの認識の違いだね
① ウェブアーカイブ → アーカイブのサービス (digital archive or archive site)
② ウェブアーカイブ → アーカイブ技術 (web archive or web archiving)
アーカイブ技術という意味で使っても良いかと思う

107:192.168.0.774
19/04/11 23:09:34.96 L2Qvrxob0.net
>>78-79
window.open()の後ろにeval()付けたり、void()の引数にしたり、
未定義値を返したいだけなのに方法がバラバラ。
同じ人が作ったにしては変な話だな。

108:192.168.0.774
19/04/12 00:06:00.46 dU8Shh4A0.net
公式が公開しているものをコピペしたのも含まれてるのかな

109:192.168.0.774
19/04/12 03:12:04.19 IEOgrIFJ0.net
todayは公式のやつだったかも。てへぺろッ

110:192.168.0.774
19/04/12 07:27:14.62 SClfSpUI0.net
67 名前:192.168.0.774
投稿日:2019/04/09(火) 02:14:18.12 ID:Xrq4p9iW0
結局wikiはどこに作るんだ
atwikiかwikiwiki辺りか?

69 名前:192.168.0.774
投稿日:2019/04/09(火) 07:35:20.06 ID:aX1j4Hrw0
MediaWiki 一択でしょ

まずここから考えよう

111:192.168.0.774
19/04/12 07:30:12.18 SClfSpUI0.net
シーサーブログのシーサーウィキというのもあるらしいが。

112:192.168.0.774
19/04/12 07:35:28.30 SClfSpUI0.net
Wiki3(うぃきさん)
URLリンク(twitter.com)
(deleted an unsolicited ad)

113:192.168.0.774
19/04/12 07:36:46.55 SClfSpUI0.net
Seesaa Wiki(シーサーウィキ)とはシーサー
株式会社が運営するレンタルウィキサービスである。
@wiki(あっとうぃき、atwiki)とは、和歌山県の有限会社アット
フリークスが提供するレンタルウィキ。2ちゃんねる掲示板のパート
スレッド(パートスレ)まとめに用いられることが多い。
(以上ウィキペディアより)

114:192.168.0.774
19/04/12 12:28:44.53 xJcFOgmj0.net
MediaWikiはきちんとしたシステムが作れるのはメリットだけど管理が面倒
Pukiwikiはどうだろう
URLリンク(pukiwiki.osdn.jp)

115:192.168.0.774
19/04/12 16:01:45.26 U3RvVBMo0.net
ミクシィもSNSはお荷物事業だからそろそろたたむ準備してそうだな

116:192.168.0.774
19/04/12 16:32:28.92 zTEegk2Q0.net
相変わらずパソコン初心者感が満載
おかげさまで、パクりの寄せ集めを「作った」と詐称しても
その不自然さに気付けないという
>>113
この流れだと、セットアップ済みのレンタルWikiの方が無難だと思うよ

117:192.168.0.774
19/04/12 17:13:46.28 OzOD5/Ux0.net
高圧的に的確な指示出しててワロタ

118:192.168.0.774
19/04/12 19:41:50.36 ntUyAAnO0.net
2年ちょっと前に無くなったniftyの@homeで2TB前後なのか…
URLリンク(internet.watch.impress.co.jp)

119:192.168.0.774
19/04/12 19:44:52.10 IEOgrIFJ0.net
初心者とかどうでも良い。使えさえすれば。

120:192.168.0.774
19/04/12 19:48:37.42 3kWgI93v0.net
今必要なのは初心者じゃないけどな

121:192.168.0.774
19/04/12 23:04:13.37 6eRxenyu0.net
使えりゃ何でも良いから不自然だろうが気にしないけどな
使ってて問題がありゃ自分で作り直すまでだ

122:192.168.0.774
19/04/12 23:06:32.84 6eRxenyu0.net
>>115
>セットアップ済みのレンタルWikiの方が無難
確かにな、一からサーバ立てて設定しなきゃいけないWikiだと結局グダりそうだ
そうなるとポピュラーなatwikiあたりかな

123:192.168.0.774
19/04/13 04:31:44.74 PBKRoLHf0.net
ShoutWiki なら無料で MediaWiki 使えるね
とりあえず有能な人が来るまではこれでいいでしょ

124:192.168.0.774
19/04/13 05:50:27.39 oa76VPkq0.net
>>122
それで異存はない。

125:192.168.0.774
19/04/13 10:15:26.73 ybhQs0Es0.net
そしてwikiサービス終了するんですね分かります

126:192.168.0.774
19/04/13 14:37:20.47 BP9fC9wY0.net
終了したらどこか別のところへ移転すれば良い

127:192.168.0.774
19/04/13 17:53:03.37 BP9fC9wY0.net
>>104
「総合」を付けることを発案した者です
単に「ウェブアーカイブ」というとIAやArchive.is等のウェブサービスを使うことを連想している人が多かったようなので、
ウェブアーカイブはそれだけじゃないよ、wget等のツールや自作ソフトを使うのも立派なウェブアーカイブなんだよ、ということを強調したかった
そして、IA専用スレやウェブ魚拓スレで扱われないウェブアーカイブ技術関連の話題の受け皿にしたかった
>>105の言う通り認識にズレがあるみたいだね

128:192.168.0.774
19/04/13 19:36:41.35 LxikEBfR0.net
>>126
126名無しさん@お腹いっぱい。2019/04/06(土) 09:24:43.110
インターネット遺産のアーカイブ系総合スレみたいなところってどこ?
そういうところは5chに無いのかな
総合ってはじめに使い出したのは俺なんだけどな

129:192.168.0.774
19/04/13 20:07:13.70 HJ17KfG20.net
>>127
すまん、ここのスレタイを考えたのは自分だったので思い違いをしてた

130:192.168.0.774
19/04/13 20:07:54.32 HJ17KfG20.net
ID:BP9fC9wY0です

131:192.168.0.774
19/04/14 01:04:52.71 CM5+hhVJ0.net
日本だとウェブアーカイブは著作権侵害(犯罪)になるからこのスレ危ないよね?
逮捕されたくないので消えます

132:192.168.0.774
19/04/14 01:25:36.52 nTd5PtnI0.net
実際その辺は心配ではある
弁護士に聞いてもやめとけで終わりそう
個人でDLしての私的利用ならアリなのかな
とりあえずツール中心の紹介にとどめておくべきかもね

133:192.168.0.774
19/04/14 02:56:48.93 v+D0MDAi0.net
まだ親告罪だから訴えられなければセーフ

134:192.168.0.774
19/04/14 03:08:40.08 v+D0MDAi0.net
ちゃんと説明すると、非親告罪化された著作物は金銭的な利益が絡むものに限られてるので、
大体のウェブアーカイブの場合問答無用で捕まることはないはず(多分)
あと著作権法に抵触するのはウェブアーカイブを無断で公開した場合のみであって、
各個人でサイトを保存して私的に取っておくこと自体は違法でもなんでもない
Archive Team経由でInternet Archiveにデータを寄付してしまえば日本の法律では手が出せないはず

135:192.168.0.774
19/04/14 03:17:25.65 SqtAvvkZ0.net
ウェブ魚拓の運営も捕まってないよね

136:192.168.0.774
19/04/14 03:26:04.24 qw07bbn30.net
削除依頼無視でもしない限りは大丈夫なんじゃないの
アーカイブしたサイトに違法なコンテンツがあったらどうなるかわからんけど

137:192.168.0.774
19/04/14 03:44:40.89 v+D0MDAi0.net
>>134
そうなんだよね
パッと見完全にアウトなサービスだけどちゃんと続いてるってことは、上手くやれば訴訟を起こされるようなことにはならないってことだし
それにあそこの運営は企業だから、事業の一つにもなりうるってことでもある

138:192.168.0.774
19/04/15 03:23:24.42 zgYzoRmr0.net
Shoutwikiでサイト立てるのは誰がやる?
暇だったら自分がやってたんだが正直管理業務とかやってる余裕がない

139:192.168.0.774
19/04/15 22:12:08.31 k4EioB070.net
いっそ最初はwikiじゃなくて各々が個人サイトとかブログで情報まとめたりしてそれらのサイトをリスト化すればいいんじゃないか

140:192.168.0.774
19/04/15 22:26:55.43 +QZpIriz0.net
>>138
全員が個人サイトやらブログやらを持っている訳じゃないし、持ってても手間がかかって面倒だって人間もいるだろう
各々が直接情報を書き込んで行く方が手間がかからない
そうなると、きちんとした体制さえ構築できるのならWikiが一番良い

141:192.168.0.774
19/04/15 22:40:37.04 k4EioB070.net
それはわかってるけどwikiを管理する技術と時間がある人いるのかって話なんすわ・・・

142:192.168.0.774
19/04/15 23:09:48.42 OIWksCm90.net
wikiが必要なほどの量の情報が集まるのかが疑問
アーカイブに関することと言っても


143:ツールの使い方を翻訳するくらいしかできないだろう 本格的なアーカイブ作業をするのならArchiveTeamに入るべき 日本支部を作るにしても結局はArchiveTeam本部の力が必要 日本のサイトは英語圏から見逃されやすいから日本人の注目を集めることでArchiveTeamに貢献することもできるかもしれない ただし本当に技術がある人は既に英語圏のコミュニティに参加しているからどれほど効果があるかは分からない



144:192.168.0.774
19/04/15 23:10:03.44 +QZpIriz0.net
それは確かになぁ
正直>>115がやれば良いんじゃないかという感じがする

145:192.168.0.774
19/04/15 23:17:05.99 +QZpIriz0.net
ArchiveTeamって多くの日本人は入りづらい所があると思うんだ
だからArchiveTeam本部と一般の日本人ネットユーザーの架け橋になるような組織はあって損はないと思う
ArchiveTeamのサイトにはアーカイブについての知見がまとめられているから、MediaWikiなんて大仰なものが必要かは疑問ではあるけど、
彼らの知見を翻訳して日本人向けに公開する場所はそれなりに有意義じゃないだろうか

146:192.168.0.774
19/04/15 23:19:08.03 d2BbUiX90.net
とりあえず最初はgoogleドキュメントみたいな手軽なところでやってみれば

147:192.168.0.774
19/04/15 23:20:08.99 +QZpIriz0.net
日本でウェブアーカイブというと既存のウェブサービスを利用するイメージが強いからね
英語コミュニティで活動する日本人エンジニアはある程度いるが、そうした人の中でもウェブアーカイブについて詳しい人はそんなにいないと思うよ

148:192.168.0.774
19/04/17 12:15:06.93 KC94xqUc0.net
英語コミュニティで活動する日本人エンジニアで、ウェブアーカイブについて詳しい人は結構いると思うが
ウェブアーカイブに関する活動に多くのリソースを使おうと考える人は非常に少ないだろうね

149:192.168.0.774
19/04/17 13:25:55.62 pBKnwE2u0.net
ウェブアーカイブ専門の日本人は、国内コミュニティ・英語コミュニティ問わずかなり少ない
機械学習用のデータ収集やWebサービスの構築などの目的で、クローラを動かしてスクレイピングすることはエンジニアの間でかなり一般的になってきた感じがある
(ウェブアーカイブについての知識があるエンジニアにはこういう事をやってる人が多い)
でもそれは「データ収集手段としての保存」であって、ウェブアーカイブという「目的としての保存」を専門にしている人はほんの一握りよ

150:192.168.0.774
19/04/18 20:54:33.70 231mhavm0.net
Webスクレイピングは仕事になるけどWebアーカイブは仕事にならんものな
専門家が少ないのも道理

151:192.168.0.774
19/04/19 12:33:49.48 Sck2kHkT0.net
結局サイトはどうするよ
Googleドキュメントはお手軽だけど検索エンジンで見つからないし、Wikiサービスがいいと思う
Wikiの選択肢はatwikiかShoutWikiになるのかな

152:192.168.0.774
19/04/20 01:32:08.39 nlnJtIGb0.net
完全に人が消えてるな
>>74の予言が順調に実現して来てて笑う

153:192.168.0.774
19/04/20 02:38:53.71 EOflkhQE0.net
ネット上のデータを残し続けることに皆そこまで意義感じてないんじゃね

154:192.168.0.774
19/04/20 03:32:20.14 j74qt4l90.net
全部のリンクたどると凄い数になる。
数が多いと絞り込むのも大変だし、応答なしになるし、全部処理するということ自体出来るのか?と不安になるくらい次から次へとアドレスが出てくる。
過去に処理したやつ除外すれば…と思ったがかえって遅くなった。
あとURLが一部壊れてしまうのも原因不明。

155:192.168.0.774
19/04/20 10:06:44.64 uNdtbvPn0.net
あまりにも膨大で途方もないから
大抵の人は投げてしまうのさ

156:192.168.0.774
19/04/20 17:20:29.58 nlnJtIGb0.net
>>152
何のツール使ってんの?

157:192.168.0.774
19/04/21 03:12:31.96 BVyeUYoM0.net
昔に比べてネット人口が増えたけど、PCユーザー自体は減ってるんじゃ無いかと…

158:192.168.0.774
19/04/21 16:10:39.88 HZbpua5K0.net
増えてますよ

159:192.168.0.774
19/04/21 16:34:58.79 +zJhJQgi0.net
法人向けは売れてるだろうけど一般家庭はスマホばっかりでPC減ってるでしょ

160:192.168.0.774
19/04/24 03:14:37.20 KjJLD36j0.net
>>151
これって割と深刻なことじゃね?

161:192.168.0.774
19/04/24 04:15:47.92 015wg1cT0.net
旗を揚げられる人間がいないだけなんじゃないかとも思うけどね
知識とやる気が揃ってなきゃできねぇ
俺は白旗なら掲げられるぞ

162:192.168.0.774
19/04/25 00:55:31.95 keVKSV/80.net
旗掲げたいけど今年いっぱいは時間が取れねぇ

163:あめ
19/04/29 05:15:38.68 qYOC6Fj20.net
何をそんなに困ってるのかわからない
後は WebRecoder + ipwb を簡単にできたらおっけーじゃないの?

164:192.168.0.774
19/04/30 02:07:11.84 4bCzSUvm0.net
>>161
ログを読もう
端的に言うとやらなきゃいけない事が多い割に率先して出来る人間がいない

165:192.168.0.774
19/04/30 16:16:38.40 4bCzSUvm0.net
>>161
それだけでおっけーじゃないから皆こうやって話し合ってるのよ

166:192.168.0.774
19/05/03 12:31:09.57 /o+BXXwL0.net
テラバイトを溜めこむ、デジタルゴミ屋敷に棲むデータホーダーたち
URLリンク(www.gizmodo.jp)
断捨離にコンマリ。
そんなテクニックを使いでもしなければ、人は一度手にいれたものは、どうにも手放したくない
生き物のよう。
形ある物は必ず壊れる、諸行無常の響きはインターネットの世界でも鳴りわたっているようです。
わたしはハードディスクはかならずひとつ外付けを使ってデータをローカルと外付けの2回ずつ
保存しているんですよね。いまはそれはNASに変わりましたが、以前はDVDに焼いて保存したり、
FTPを使ったり、クラウドが台頭するようになってからはクラウドも多用していますが、どうも
クラウドもソーシャルメディアも永遠の存在ではなさそう。
今回は米Gizmodoで組んでいる「ゴミ」特集のひとつを翻訳しました。外部ジャーナリストのSteven
Melendezの書き下ろしです。ちょっと長いですが考えさられる内容。ぜひ、じっくりとご覧ください。

167:192.168.0.774
19/05/03 12:57:09.31 rDYW7khY0.net
gizmodoが世間からどういう評価を受けてるかわかった上でそれ貼ってるの?

168:192.168.0.774
19/05/03 17:24:56.15 AncjvUWJ0.net
腐れTwitter.5chまとめサイトよりマシ程度

169:192.168.0.774
19/05/03 17:39:06.81 s/8yyqZn0.net
どちらかというと >>164 はアーカイブに対してポジティブな記事だよ
ちょっと煽り気味の釣りタイトルだけどちゃんとアーカイビストの偉業を紹介してる
素直に褒めたくない意地悪さがにじみ出てるけどね

170:192.168.0.774
19/05/04 00:44:21.71 I7t6q7HU0.net
大量のアーカイブを管理するには個人だと限界があるわな
団体を作って分担作業し、出来ることならInternet Archiveのように社会的信用を得ないといけない

171:192.168.0.774
19/05/04 09:00:26.72 bL2u5kxf0.net
動画は円盤保存
画像と文字は印刷保存

172:あめ
19/05/05 05:55:19.34 YysNkSBx0.net
>>162
実はスレがたったときから居て1から読んでるんだよなぁ
記事少し作るだけでここまで悩む不思議
>>74 の未来を変えるために降臨したのに

173:192.168.0.774
19/05/05 15:45:48.96 fUOQo4az0.net
>>170
ならあんたが未来を変えてくれ

174:192.168.0.774
19/05/05 15:49:26.42 fUOQo4az0.net
そもそもIPFSで本当に良いのかって話になったまま議論が止まってたはず
そこからArchive Team Japan的なものを作ろうじゃないかって話になって、そんなものに貢献できる日本人はもう本家に行ってるだろって話になって、
日本人でウェブアーカイブやってる人自体少数だよねって話になって、結局グダグダになって現在に至る

175:192.168.0.774
19/05/06 19:41:21.46 6bTK53bC0.net
まず5ch自体オワコンだから人が集まるはずないよな

176:192.168.0.774
19/05/07 16:01:29.67 nOGBK00T0.net
それ
5chで集められる人数なんてたかが知れてるから、外部サイト作ってTwitterとかで広めないとキツい
優秀なエンジニアはTwitterにかなり集ってるし、関心を持ってもらえれば良いんだが

177:py
19/05/14 19:06:58.64 cP8wStLG0.net
URLリンク(u1.getuploader.com)
web2IAWBM.dms ver0.000.007 WayBackMachineに保存 (web.archive.org) 2019/05/14
web2IAWBM.dmsはIrvineとDorothy2を使ってInternet Archive WayBack Machineに自動登録(保存)するためのスクリプトです。
自動で全てのリンクをたどって保存してくれるはずです。
web2IAWBM.dmsは素人が作った物なので至らない点も多々ありますが、
一応使える水準になったと思われるので公開します。
無料のウィルススキャンはしましたが、念のためもう一度スキャンされることをお勧めします。
同梱のDorothy2(の一部)は別の方が作った物です。
■ Irvine初回起動前に必ず jwordフォルダを削除してください。■
動作試験環境:windows10pro Irvine1.3.1

178:192.168.0.774
19/05/15 02:01:39.76 kfIYGIBa0.net
>>175
Internet Archiveスレでも情報共有しとけ
手動Save Pages Now以外の方法を知らない人達ばかりだから相当喜ばれるぞ

179:192.168.0.774
19/05/16 17:03:10.13 /p1LTvuX0.net
ヤフー「Yahoo!コンテンツディスカバリー」サービスの終了を発表
URLリンク(media-innovation.jp)
【解約と配信停止のスケジュール】
6月中旬頃 解約通知書の発送開始予定
9月2日 コンテンツ修正相談受付終了
9月6日 コンテンツ修正相談の結果問合せ終了
9月13日 入稿時審査受付終了・タグ発行・掲載面ブロック等の配信設定業務受付終了
9月20日 入稿時審査の問合せ終了
9月30日 Yahoo!コンテンツディスカバリー 配信停止(順次)
11月29日まで Yahoo!コンテンツディスカバリー 管理ツール等の最終停止(順次)

180:192.168.0.774
19/05/18 21:20:44.41 thTbnaVW0.net
Yahooブログアーカイブ活動スレより引用
0031 Trackback(774) 2019/05/18 14:30:36
yahooブログは「記事がありません」のページで404を返すのだが、web2IAWBM.dmsが404のページを解析できなくてリンクをたどれていない可能性がある。
ブラウザでは普通にリンクをたどれる。
ID:l5DCkLS9

181:192.168.0.774
19/05/21 16:36:54.75 nRmqsex+0.net
サイトごとにやってると分かるけど、途中で止まってることがよくあるから、
終わったらブラウザで確認した方が良い。

182:192.168.0.774
19/05/23 11:34:52.72 LNdDY8yz0.net
Archiveteam (Google 翻訳)
URLリンク(translate.google.co.jp)

183:192.168.0.774
19/05/26 10:51:40.72 oi3wUViY0.net
Index of /
URLリンク(infoseek_rip.g.ribbon.to)

184:192.168.0.774
19/05/26 11:04:21.99 oi3wUViY0.net
>>78
GeoLog Project
URLリンク(geolog.mydns.jp)
> お知らせ
>
> 2019/05/12 16:30
> ・URLを変更しました。リンク切れ等の不具合がもしあればご連絡ください。
> まだ旧ドメイン名が残っている部分がありますが、こちらは順次修正します。
> ・GeoCities URL収集 URLリンク(geo.98nx.jp) 様にてアーカイブされたデータを順次統合中です。
>
> 2019/05/08 23:50
> ・近日中に、以下のとおりURLを変更します。
> 旧URL:URLリンク(thaliana.mydns.jp)
> 新URL:URLリンク(geolog.mydns.jp)
> 移転後も、旧URLはリダイレクトとして残す予定です。

185:192.168.0.774
19/05/26 16:31:09.43 LgR2vTtS0.net
>>1
>>3
>>5
>>6
死ね無能基地外

186:192.168.0.774
19/05/28 23:18:36.54 6dDxcHOe0.net
中学生かな?
まだ夏休みには早いと思うんだけど

187:192.168.0.774
19/05/29 00:22:00.05 LYQto7Hh0.net
毎日が日曜日

188:192.168.0.774
19/05/29 02:16:14.09 rgaJjZzR0.net
ん、IA調子悪いのか?

189:192.168.0.774
19/05/29 03:41:38.21 rgaJjZzR0.net
涼しいからスクリプト走らせようと思ったのに

190:192.168.0.774
19/06/07 03:14:38.91 EZciTwz+0.net
サーバーエラー出てる間のは保存されてないのに緑のチェックマークで成功扱いになるから注意して

191:192.168.0.774
19/06/09 15:40:45.70 S0wca8Kg0.net
メーリングリストの老舗「freeml」終了 22年の歴史に幕
URLリンク(www.itmedia.co.jp)

192:192.168.0.774
19/06/12 05:55:56.93 DnPdDFAp0.net
ニュース記事は2ページ目以降が保存されていないことが多いよな。
魚拓も、1ページ目を保存しただけでは、2ページ目以降は保存されないよな?
パッと見保存されているように見える

193:192.168.0.774
19/06/13 02:01:24.77 DBW1u0DS0.net
Webcite、何故かアクセスできない

194:192.168.0.774
19/06/13 02:43:36.27 Fctk1dcQ0.net
>>191
あぁまたか、あそこは良く DNS から消える。
でもサーバはしっかり生きてるんだな、これが。

195:192.168.0.774
19/06/17 14:43:18.30 Xz9V42zC0.net
GASにアーカイヴ作業させられないかな
10分おきに起動

196:192.168.0.774
19/06/18 15:34:14.81 MI2+ZpWl0.net
ニュース記事みたらSave Pageするのが習慣になってきた。

197:192.168.0.774
19/06/19 17:32:14.54 iJXbWhxE0.net
>>193
できそうな気もするがどうなんだろう

198:192.168.0.774
19/06/21 09:20:23.40 poW6yzCt0.net
同一のIPからの連続取得は制限されています。
同一のIPから24時間に60回以上の取得は出来ません。
URLリンク(i.imgur.com)

199:192.168.0.774
19/06/21 14:13:34.55 9K2NkZ870.net
一日に間隔をあけて数回アーカイブするくらいなら何とかなるのでは
誰か試して見てくれ

200:192.168.0.774
19/06/22 15:09:24.70 S8tpOgcn0.net
ArchiveBoxというものを見つけた
自前のマシンでウェブアーカイブをするためのオープンソースソフトウェアだって
URLリンク(archivebox.io)

201:192.168.0.774
19/06/22 15:19:39.24 S8tpOgcn0.net
>>198
基本的にCUIで操作するものなので注意
自分でリンクを辿るのではなく、アーカイブするURLのリストを読み込ませる方式らしい
HTMLやWARCはもちろん、画像やPDFでの出力にも対応してるのが便利そう

202:192.168.0.774
19/06/23 20:49:35.28 27h915gg0.net
[Jav


203:aScript] Wayback Machine Script - Pastebin.com https://pastebin.com/ZxryGY8F Automatically save the page you visited (or all links you can see) to "Wayback Machine". 試していないので使えるかどうかはわからない



204:192.168.0.774
19/06/25 23:07:44.50 5uQFWJVA0.net
IAが昼過ぎからずっとメンテ

205:192.168.0.774
19/06/26 22:53:23.97 Qb0QQC6K0.net
配布終了したフリーソフトの保管庫も欲しい

206:192.168.0.774
19/06/28 15:19:25.28 JC6hqmSv0.net
getASFstreamも実行ファイルがIAから削除されてるな。

207:192.168.0.774
19/06/28 15:22:44.92 JC6hqmSv0.net
getASFstreamはVectorのが生きてたからまだ平気か。

208:192.168.0.774
19/07/03 17:10:46.83 0BbpBYkz0.net
ルートラボ2020年3月末終了
URLリンク(www.itmedia.co.jp)
これはWayback Machineでも保存できないので同じようなサービスにデータを
移行したもの以外のデータは消え去ることとなる。
これからこのようにアーカイブできないデータは増えていく一方だろう。

209:192.168.0.774
19/07/06 04:08:11.16 6FkUH5GE0.net
アーカイブできないデータの筆頭がオンラインゲーム・ブラウザゲーム・ソーシャルゲームだよねえ

210:192.168.0.774
19/07/06 14:21:01.48 GinQGT8r0.net
昔流行ったフラッシュはアドレス直打ちSavePageNowで保存できたけどゲームは分からん。

211:192.168.0.774
19/07/10 09:08:38.60 /L/aFHKF0.net
goo blogの「株式日記と経済展望」がいつの間にか見れなくなってる
IA見ると2019年1月7日の記事の最後にしばらく休みますと書かれている
URLリンク(web.archive.org)

212:192.168.0.774
19/07/10 16:20:17.46 fnXJF4Pm0.net
Wayback Machineやたら重いんだけど
時間帯によるもの?

213:192.168.0.774
19/07/11 07:59:17.31 7Pk3v1uW0.net
スクリプト走らせてる人が70人近くいるはずだし重くなっても不思議は無い。
保存されているかを確認するために実際に開いて確認してから保存している。
同じページを何度も確認していたなんてこともあると思う。

214:192.168.0.774
19/07/13 00:39:32.34 Y10L19C40.net
ここの住人にYahooブログをアーカイブしてほしい

215:192.168.0.774
19/07/13 13:20:12.05 LEU3bec70.net
異様に書き込み減ったし多分みんな保存してる。
個別にURL指定してくれれば優先する。

216:192.168.0.774
19/07/16 11:16:16.55 hXIS632N0.net
ジオシティーズの時のようにURal収集フォームみたいなのがあれば便利なんだけどな

217:192.168.0.774
19/07/16 11:17:07.12 hXIS632N0.net
タイプミス
URLな

218:192.168.0.774
19/07/17 12:47:13.54 8BflpvwW0.net
質問です。
Wayback Machineを使って、見たかったサイトは見つかったのですが、画像はありませんでした。
その画像を見つけることはもうできないのでしょうか?

219:192.168.0.774
19/07/21 06:02:59.22 PLd/1lFQ0.net
GASは程度にもよるが増やしすぎるとすぐこうなる。思ったより使えない。
> サービスで 1 日に使用しているコンピュータ時間が長すぎます

220:192.168.0.774
19/07/25 09:40:55.79 1TUd1BHY0.net
>>215
諦めた方が早いかと思われ

221:215
19/07/28 17:53:01.59 2hYx5uH+0.net
>>217
そうなんですか、残念ですがありがとうございます

222:192.168.0.774
19/07/29 23:47:11.38 0ZDdCLv30.net
URLリンク(i.imgur.com)

223:192.168.0.774
19/07/30 03:06:48.87 w+bM/0cg0.net
ロリコンはネトウヨ
女叩きしてるのはBBA
DQNも何方かと言えばネトウヨ色が強い
5chとネット上で、金魚の糞を巻き散らかしてるのはコイツら

224:192.168.0.774
19/07/30 18:42:36.22 rAPLQn650.net
改憲なんてしてもアメリカが作った自作自演の戦争に巻き込まれて戦争犯罪に加担するだけじゃん。
愛国者なら9条改正には反対しないと。どこの国も上層部は裏で繋がっている、つまり中国韓国ロシアはアメリカと通じていて、本当の敵はアメリカの中にいる。
敵国条項は残っているんだから日本がちょっとでも怪しい動きしたらロシア中国韓国アメリカから攻撃されて今度こそ日本無くなるぞ。
そして、緊急事態条項は独裁完成法。
独裁完成したら安倍晋三が死ぬまで安倍政権が続くぞ。

225:192.168.0.774
19/08/06 03:38:43.37 AvYpPa1T0.net
ヤプログ! サービス終了のお知らせ
URLリンク(yaplog.jp)

226:192.168.0.774
19/08/16 10:44:48.49 c/w5mu590.net
>>175のやつ最近のログ見たら保存されてないのに保存済みと表示されて保存してないURLある事に気付いた。
IA側が仕様変更したのか?

227:192.168.0.774
19/08/16 10:48:02.20 c/w5mu590.net
>>223
Show Allでは確かにキャプチャーがあるのに、それを開くとHrm.で表示できない。

228:192.168.0.774
19/08/17 23:15:30.53 Z4rWSf4u0.net
閉鎖がアナウンスされてるサービスについては、
Wikipediaから参考文献などとしてリンクを貼られているサイト、Twitterでシェアされているサイトを優先してアーカイブした方がいい
ジオシティーズの時もこの方式が取られてたと思う
Yahooブログのアーカイブを考えてる人がいたら参考にしてくれ

229:192.168.0.774
19/08/18 05:20:36.47 zB3uGj7T0.net
>>222
アドブロックが普及しすぎて、ブログサービスはどこも儲かっていないらしい。

230:192.168.0.774
19/08/18 22:44:14.13 lH1BP5oP0.net
最近はアンチアドブロックとかもあるよね

231:192.168.0.774
19/08/18 23:41:17.08 m6no0JBr0.net
>>226
スマートフォンだと余り普及して無いけど、
スマートフォンでブログやる人って少ないのかな…

232:192.168.0.774
19/08/21 04:09:45.48 x9gIR2Do0.net
URLリンク(shibuya-game.com)
諸般の事情により、SHIBUYA GAMEは2019年9月20日をもちまして更新を停止し、2019年末をもって閉鎖します。

233:192.168.0.774
19/08/21 14:50:30.18 b3NNDeZP0.net
>>229
URLリンク(shibuya-game.com)
このURLを起点に全記事のURLを抜き取ってInternet Archiveなり何なりに投げればいいな
作業する余裕のある人あと1か月でよろしく

234:192.168.0.774
19/08/21 14:54:06.94 b3NNDeZP0.net
>>230
今のところ1768個の記事があるらしい

235:192.168.0.774
19/08/22 23:08:10.94 c46PChaz0.net
水谷修のサイト保存してくれた人いるのか

236:192.168.0.774
19/09/14 14:16:10.61 Xphq9GAC0.net
情報が古くても需要がありそうなのは
小説・漫画・映画のレビュー・考察サイト
ゲーム関係のサイト(攻略サイト・レビューサイトなど)
Web小説
あたりか

237:192.168.0.774
19/09/15 22:34:40.70 6+5CjbXu0.net
興味あるので保守

238:215
19/09/20 05:31:59.01 QM3MI5eR0.net
アーカイブしたいサイトがある時、どうやって保存するの?
Winなら巡集みたいなソフト使ってやるの? Macではターミナル?

239:192.168.0.774
19/09/23 03:23:58.52 TCqq29480.net
ニコ生アラートのバイナリ保存されていない…残念

240:192.168.0.774
19/09/23 03:47:25.00 TCqq29480.net
>>235 >>175



242:215
19/09/23 05:25:08.76 2+4wj0ye0.net
>>237
Windowsしか書いてないけど、macで行ける?

243:192.168.0.774
19/09/23 08:45:19.53 TCqq29480.net
Macはもってないので分からない。
>>175のやつWindowsでも機能していない可能性がある。保存されたって出てるけど実際は保存されていないとか。

244:192.168.0.774
19/09/25 18:16:46.74 TR/fy2AH0.net
サービス終了に関するご報告
URLリンク(www.rich.co.jp)
>この度、2015年よりサービスを続けてまいりましたメディア「ヘルスケア大学」について、当社事業領域の整理に伴い社内リソースを別領域に集中させることに決定し、2019年9月30日にサービスを終了することとなりました。

245:192.168.0.774
19/09/27 23:51:14.06 4H4+28EN0.net
ワイ「古い車買ったろ。整備は大変そうやけど、ネットには先人の知恵がいっぱいや」
1 :名無しさん@おーぷん:19/09/27(金)23:31:11 ID:2JG主 ×
ジオシティーズ「ん?」
ディオン「んん?」
ニフティー「んんん?」
2:名無しさん@おーぷん:19/09/27(金)23:31:38 ID:2JG主 ×
先人の知恵、消える
3:名無しさん@おーぷん:19/09/27(金)23:31:46 ID:6EZ ×
しゃーない
5:名無しさん@おーぷん:19/09/27(金)23:32:30 ID:cUL ×
悲しいなぁ…

246:192.168.0.774
19/09/28 08:08:34.63 bq44L+WV0.net
各アーカイブサービスの検索機能が優秀なら良いんだけどな
保存してもそれを探し出せないなら死蔵と変わらんな

247:192.168.0.774
19/09/29 01:09:52.47 q9QXqdnD0.net
無料ソフトウェアのサイトは保存されてても実行ファイルを含むzipファイルは保存されていません。
可能な限り保存します。

248:192.168.0.774
19/09/29 01:34:12.78 T/2cpgi20.net
>>242
単にアーカイブしたファイルの中身に対して検索を行えるかどうかの話。
それを優秀などという語でしか表現できない貧弱なボキャブラリー。

249:192.168.0.774
19/09/29 02:04:44.22 q9QXqdnD0.net
Googleとかで「 site:web.archive.org」を付けて検索するのが現実的かと。

250:192.168.0.774
19/09/29 11:02:46.70 IeSWqng50.net
wikiうんぬんの話が出ているので、いくつか使ったことがあるから書いておくけど
atwiki SeesaaWiki FC2wiki などはそれぞれ記法が独特でバックアップが取れない
atwikiは特に仕様がころころ変わる上に不具合発生率も高くて、書き込みだけに集中できないし
アカウントを削除してもサーバーからデーターが完全削除されないみたい
pukiwiki/pukiwiki plusベースのところはdumpデーターは取得できるけど
運営が個人だったり個人で会社を作ってやっているところはその人がどうにかなると連絡が取れなくなる
それでもサーバーやドメインが維持されいるとサービスは利用できるけど
ある日突然使えなくなることがある

251:192.168.0.774
19/09/29 12:20:42.26 T/2cpgi20.net
コンテンツ制作側としてのバックアップの話をここでやってどーするの。

252:192.168.0.774
19/09/29 12:33:23.11 IeSWqng50.net
個人サイトで無料/有料に関わらず共用サーバーを使っている場合
サーバー管理会社によってサーバーのスペック変更が行われると
サービスが終了していなくてもサイトが閲覧不可になることがあるよね
PHP5.3までしか対応していないものを使ってサイト運営をしているのに
サーバー側がPHP7.2にしちゃったとか
サーバーを丸ごと交換してデフォルトがUTF-8になったのに
サイトのほうでcharsetを指定していないとか
DBのバージョンが上がってデーターが呼び出せなくなった
等の理由で、閲覧が困難になるケース
閲覧しに行って真っ白だったり文字化けしていたりするのはこの辺の理由

253:192.168.0.774
19/09/29 12:56:37.11 T/2cpgi20.net
なんだ、新手のスレ埋め立てかw

254:192.168.0.774
19/09/29 1


255:3:09:54.41 ID:T/2cpgi20.net



256:192.168.0.774
19/09/29 17:04:53.57 q9QXqdnD0.net
このスレで使うwikiが消滅する場合の対策の話じゃないの。

257:192.168.0.774
19/09/29 22:23:17.96 n8nVup7e0.net
>>244
人の揚げ足取る暇があったらアーカイブしろ

258:242=252
19/09/29 22:32:55.86 n8nVup7e0.net
だいたいページ内容の走査だけで検索機能実装しても優秀とは到底言えないからな
検索エンジンサービスのようにページランク等を考慮して初めて、優秀というかようやく使いものになる
アーカイブサービスのように膨大な数のページを検索しなきゃいけない場合は、そういったアルゴリズムの必要性がさらに高まる
こういう話をいちいちするのが面倒だから話を全部ひっくるめて「優秀」の一語で表現した
これで満足か?

259:192.168.0.774
19/09/29 22:36:12.79 n8nVup7e0.net
ページランクは固有名詞に近いからランキングアルゴリズムと言うべきだったかもしれない

260:192.168.0.774
19/09/29 22:40:09.36 n8nVup7e0.net
クソリプが跋扈するツイッターや人口の多い他の5ch板ならまだしも、
このご時世にこんな専門板で、横からいきなり会話してる訳でもない相手からレスが飛んでくるとは思わなかった
随分面食らったわ

261:192.168.0.774
19/09/29 22:48:43.54 T/2cpgi20.net
Wiki立てる話自体が消えたと思ってたw

262:192.168.0.774
19/09/30 11:04:24.16 MZVGPwZn0.net
>>256
また話が出るかもしれないから一応書いておいただけ
atwiki上のサイトで差分が見れないところがあったから
archive.orgで探してみたけど
archive.orgのbotをatwikが蹴っているみたいで最近はエラーページが保存されちゃってる
意図的にそのページを残したい人がarchive.orgのアカウントを作って残す場合は別として
消えちゃったページを後からarchive.orgで探すのは難しくなっていると思うよ
クローリングの期間がだいぶ開いている
これはGoogleのキャッシュもそうだと思う
サイトを運営している人がGoogleのアカウントを取得して
Google Search Consoleからクローリングのリクエストを出して当然ってなってきているみたい

263:192.168.0.774
19/09/30 15:43:12.38 yT22Xmkr0.net
>>245
実際に検索してみると分かるけど、その方法だと引っかからないアーカイブが結構あるんだよな
Googleのクローリングが追いついてないんだと思うけど

264:192.168.0.774
19/09/30 17:16:29.06 yT22Xmkr0.net
【ヤフー】Yahoo!ブログ【アーカイブ】
スレリンク(blog板)/
74 Trackback(774) 2019/09/30(月) 17:07:59.58ID:th5gp/Yr
Internet ArchiveでYahooブログを保存すると遷移スクリプトが発火する話なんだけど、
web.archive.org/save のページから「Save outlinks」にチェックを入れて保存すると
どうもYahooのトップページに遷移されずにアーカイブできるみたいだ
さっき偶然発見して何回か試したけど今のところ全て上手く保存されてる

265:192.168.0.774
19/10/08 01:13:45.16 MXp0IOeT0.net
Twitter埋め込みが一切保存されない問題

266:215
19/10/08 08:01:40.33 GswYVQiV0.net
>>260
アメリカの図書�


267:ルにいけよ



268:192.168.0.774
19/10/08 14:30:06.60 fXMCPs+v0.net
アメリカの図書館はもうTwitterの全保存やめたんじゃなかったか

269:192.168.0.774
19/10/18 01:06:58 F6Bah8760.net
当時の「魔法のiらんど」上で作られたサイトは現在ではほとんど残っていない。
WebArchiveでも表層しか掘れないサイトばかりである。
当時の掲示板でのやりとり等はもちろん、かのクレリアさんが自サイトに書き記していた構築解説ですらも現在は散逸してしまった。

270:192.168.0.774
19/10/25 10:22:59.94 ZZgmHhFq0.net
手動で一ページずつやってもToo Many Requestsになって捗らないな。
Wayback Machineは金払うから一気に取得かアップロードさえて欲しい。

271:192.168.0.774
19/11/03 20:32:03.04 I05N5XH+0.net
もしかしたらしたらば掲示板やばいかもしれんな

272:192.168.0.774
19/11/03 22:05:54.91 IGp2y1Ub0.net
>>265
理由は?

273:192.168.0.774
19/11/04 01:30:31.73 d2EYioZ60.net
>>264
有料取得依頼みたいなんなかったっけ
最近Archive Today重いのは俺だけかい?
すぐNetwork Errorになる

274:192.168.0.774
19/11/04 07:36:42.44 1kde+9Me0.net
したらば掲示板が丸一日メンテナンスしてたみたいですな。

275:192.168.0.774
19/11/05 18:04:06.02 P7AeCNyG0.net
>>258
そういや最近グーグルってサイト作成者がクロール要求しないと
なかなかクロールしてくれないってどっかの記事で読んだような気がする。
↓こういうのをテキストエディタで作ってからIrvineの「URLを展開して貼り付け」をすると全頁まとめて登録できる。画像一覧とかも同様
URLリンク(blogs.yahoo.co.jp)最後のページ番号]
例のスクリプトの登録漏れをある程度減らせると思う。

276:192.168.0.774
19/11/10 04:30:49.20 gZ07cm7t0.net
誰かここに載ってるサイトだけでも保全してくれ
yahoo!ブログ使用サイト - DoldoWorkz
URLリンク(moondoldo.com)

277:192.168.0.774
19/11/10 19:44:29.07 OJOj/1ou0.net
何故自分でやらないのか

278:192.168.0.774
19/11/10 22:43:10.93 Qg+FaNtt0.net
ジオシティーズの時もそうだったが、特定サービスのアーカイブって何だかんだ言ってかなりの時間と労力を必要とするんだよ
自分でやりたいのは山々だが、そこに労力を注ぎ込める余裕がない
なのでアーカイブをやっている人が多少は集まっているであろうここに投げた

279:270=272
19/11/10 22:45:26.50 Qg+FaNtt0.net
>>270のサイトの作者と自分は何にも関係ないことは一応断っておく

280:192.168.0.774
19/11/11 09:12:05.10 DmcMWPY20.net
Yahooブログにアーカイブすべき物なんてあるのか?

281:192.168.0.774
19/11/11 10:42:59.86 HD2VAMf80.net
単なる日常記録も多いけど、そこらのジオシティーズよりも濃い情報が詰まってるものも多いよ
自分が知ってる範囲だと、今は消えた街並みの記録や京都のマイナーな神社の訪問記、イギリスでの聖人信仰の研究サイト、ゲーム業界の裏話やゲーム攻略などがあるよ
自分が知ってる範囲のブログだけはいくつかWayback Machineに突っ込んだが、他にも有益な情報がたくさん眠ってると思うよ
Yahooブログなんて消えても誰も困らないだろうと思ってる人が結構いるみたいだが、とんでもない偏見だよ

282:GeoLog Project
19/11/11 20:36:22.34 kHI2SrFf0.net
>>270
試しにhttrackに突っ込んだら画像のリンクが取れず、
調べたら元のHTMLにはないリンクを後から生成して突っ込んでますね。。。
動的サイト嫌いです。。。

283:192.168.0.774
19/11/11 23:27:18.77 HD2VAMf80.net
動的サイトのWebアーカイブ用クローリングとなるとHeritrix(Internet Archiveが使ってるクローラ)の出番ですね
実績もあるし高性能で拡張性もそれなりにあるものの、マシンの要求スペックが比較的高めなのが難点か

284:192.168.0.774
19/11/14 17:49:41.79 zR5VNa+N0.net
Heritrixの最低動作スペック自体はそこまで高くないよ
ただ、リッチなコンテンツを含むページをアーカイブしようとするとメモリを食うことがある
あと基本的にLinux環境しかサポートしていないので、人によっては手が出しにくいかもしれない

285:GeoLog Project
19/11/15 00:48:08.16 jfECE9r+0.net
Windows でも動くには動きますね
しかしやたら遅い・・・

286:192.168.0.774
19/11/17 22:45:04.48 n+VdMpHA0.net
メモリ持て余してるけどストレージが足りない
ArchiveTeamWarrior的なのがあれば参加するんだけど

287:192.168.0.774
19/11/19 15:35:27.56 WcaVo5T50.net
ArchiveTeamに常駐してる人がここにいれば捗るんだが

288:192.168.0.774
19/11/22 05:16:46 8zBYuW1S0.net
むしろ元のHTMLの方には正しいリンク先URLがあるんじゃないの。
それで画像取得できないだろうか

289:GeoLog Project
19/11/22 20:15:18.83 fS5sbz5I0.net
>>282
拡大すると大きめの画像のあるページってどこかありますか?

290:192.168.0.774
19/11/24 23:10:35.97 Sj5SnpvV0.net
>>283
「拡大すると大きめの画像のある」って言うのがどういう意味かよく分からないので、もう少し詳しく説明をお願いしたい

291:215
19/11/25 05:25:36 U4MdffN+0.net
>>284
ライトボックスとかじゃない?

292:GeoLog Project
19/11/25 20:34:05.84 KvWZhxVE0.net
>>284
言葉足らずですみません
Yahoo!ブログは画像をクリックすると別ページに飛んで元の大きい画像が見られるらしいのですが、
ページのimgタグに書いてある画像より、元画像の方が大きい例があるかどうかを気にしました
>>282 の「元のHTML」に元画像へのリンクがあるのか確認したかったので

293:192.168.0.774
19/11/27 13:24:37 +cJOWs3G0.net
Twitter、休眠アカウント削除へ 対象アカウントに12月11日までにログインするよう警告
URLリンク(www.itmedia.co.jp)

これ亡くなった著名人などのアカウントも容赦なく削除するらしいから、期限までに出来る限りアーカイブしておきたいところ
Twitterで #休眠アカウント削除 がトレンド入りしてるから、アカウントが消えるのが嘆かれてる故人のアカウントはこれでかなり拾えると思う

294:215
19/11/27 18:54:59.39 y0cHyaRo0.net
>>287
やり方おせーてくれたら手伝えるけど

295:192.168.0.774
19/11/27 19:47:11.55 +cJOWs3G0.net
ArchiveTeamが動き出したな
URLリンク(twitter.com)
(deleted an unsolicited ad)

296:192.168.0.774
19/11/27 21:52:41.92 +cJOWs3G0.net
>>288
とりあえず一番手っ取り早い方法は、>>289のツイートに貼られてるリンク先の入力フォームから、
保存して欲しいアカウントのIDを入力して送ること
もしかしたら他にも誰かが保存プロジェクトをやってるかもしれないから要調査だな

297:192.168.0.774
19/11/30 02:24:56 mj1OwWx+0.net
minori official web


298: site http://www.minori.ph/ このサイト、キャプチャできない



299:192.168.0.774
19/11/30 04:08:01.49 IS98dA580.net
>>291
海外からのアクセスに対し 403 Forbidden エラーを返すよう
設定されているみたいですから、Internet Archive や Archive.is では
無理でしょうね。
さらにそのエラーページは他サイトへの遷移スクリプトが
埋め込んであるので、フツーの人はエラー扱いされていることすら
気付けないでしょう。
当該エラーページの HTML ソースを貼っておきます。
URLリンク(pastebin.com)

300:215
19/11/30 05:13:24.84 Yk7eFuvo0.net
>>290
DLだけ、自分でってことはできないの?

301:192.168.0.774
19/11/30 10:31:13.20 b+Bfz/GQ0.net
>>293
自分のPC中にアーカイブをローカルで保存することは出来ないかってこと?
Heritrixなど動的サイトを処理できるクローラを使えば問題なく出来る、出来るけどアーカイブは死蔵してたら意味が無いからね
自分だけで閲覧する用に保存しておくこともありうるけどそれはアーカイブとは言えない
ArchiveTeamが収集したファイルはWayback Machineに登録されるようになってるので、そういう意味では安全

302:192.168.0.774
19/12/02 04:15:35.70 Z+Zveon+0.net
最近のToday
URLリンク(i.imgur.com)

303:192.168.0.774
19/12/03 03:09:24.37 zKh+7e4i0.net
Current Running Warrior Project: Yahoo! Groups

304:192.168.0.774
19/12/03 03:21:33.26 W45k6bBP0.net
Yahoo GroupsはYahooブログとは全くの別サービスだから早とちりすんなよ

305:192.168.0.774
19/12/03 03:23:09.41 W45k6bBP0.net
これのことだよ
URLリンク(japanese.engadget.com)

306:192.168.0.774
19/12/04 17:38:24.46 OvwZOsOX0.net
本日のToday
URLリンク(i.imgur.com)

307:192.168.0.774
19/12/06 00:57:47 QIt7pou20.net
300

308:192.168.0.774
19/12/14 23:22:02.29 AA4HPrSj0.net
Ci-en移行に伴うDLsite blogサービス提供終了予定のお知らせ
URLリンク(home-info.dlsite.com)

309:192.168.0.774
19/12/15 18:24:18.14 r3L4BzMu0.net
Yahooブログ今日までか

310:192.168.0.774
19/12/16 16:10:29.42 RltCXRJ+0.net
ほとんど何もできなかった

311:192.168.0.774
19/12/16 19:43:00.36 oxia7Ong0.net
少しは頑張れよ

312:192.168.0.774
19/12/16 22:27:54.54 P9Fjib/40.net
人いねえもの
呼び掛けが不十分だとこうなってしまう

313:192.168.0.774
19/12/17 00:52:29.58 SWkI+H1w0.net
>>272 >>294
リンク構造維持できて程々の容量に収まるなら分割rarやzipに纏めてもらってもいい。
今は低速スマホしか使う余裕無くなったから巡集やWeboxみたいな取り込みアプリで一括アーカイブ化するのも無理だし
読売の縮刷版CD/DVDなんかは1年分で12万もするし

314:192.168.0.774
19/12/17 04:05:12 FbEfAMeJ0.net
スマホ(笑

315:192.168.0.774
19/12/17 23:19:41.41 ZjrTQ21f0.net
ネットサービス企業は、スマホからの収益がメインやから、
PCだけに成ったら大倒産時代や

316:192.168.0.774
19/12/18 01:13:33 7iAMrhRQ0.net
色々と話がとっ散らかって来たな
>>306からして何が言いたいのか今一つ要領を得ない

317:192.168.0.774
19/12/19 20:23:09.25 s5RLoz8q0.net
もうyaplogに行ってる

318:192.168.0.774
19/12/19 22:41:03.12 yyGOrfnZ0.net
yaplogって1月でサービス終了するらしいけど
URLリンク(nlab.itmedia.co.jp)

319:192.168.0.774
19/12/19 23:36:07.17 P9Gt+F0u0.net
geocitiesのアーカイブサイトは複数ある様だけどYahoo!ブログも�


320:Lる?



321:192.168.0.774
19/12/20 01:21:34.83 W2QHpneb0.net
>>312
Yahooブログスレの方にも載ってないから今のところないんじゃないかな

322:192.168.0.774
19/12/28 07:55:33.34 GiJFu1gz0.net
Archive.TodayはグーグルやBingのキャッシュを保存した場合でも原本URLを認識できるのが素晴らしい。

323:
19/12/29 21:46:36.02 3C6Rg8sC0.net
archive.todayのTwitterの魚拓がモバイル版にならなくなった?
アカウントは新UI、ツイートは旧PC用UI

324:
19/12/30 13:29:31.10 dXRB6Vq/0.net
>>315
それどころかアカウントの魚拓がかなり下の方までスクロールされた状態で保存されるようになった
つまり1回の魚拓でかなりたくさんのツイートが保存されるようになった
いいね

325:192.168.0.774
19/12/30 23:49:45.17 Sts0O97Y0.net
>>314
検索で出ないことあるからやっぱ微妙だった

326:192.168.0.774
19/12/31 18:45:45.57 eDEktBsz0.net
Webサイトの保存ってみんなどうやってしてるの?
このスレにすでに書いてたらすまん

327:192.168.0.774
20/01/02 07:10:20.03 5F6LDkXn0.net
ローカル保存&魚拓

328:192.168.0.774
20/01/02 10:39:14.28 ucP82yGj0.net
魚拓ってのは
URLリンク(megalodon.jp)
でローカル保存ってのはchromeなんかにあるオフラインで読む系機能であってる?

329:192.168.0.774
20/01/03 19:36:03.17 c4MpYdMH0.net
それであってる

330:192.168.0.774
20/01/04 18:01:40.04 G3xvEvXn0.net
激重で読み込めない…

331:192.168.0.774
20/01/04 20:37:51.83 YBh70eiZ0.net
Scheduled Maintenance
The Internet Archive's sites are offline for scheduled maintenance and upgrades.
Please check our twitter feed @internetarchive for updates.
Sorry for the inconvenience.

332:192.168.0.774
20/01/05 21:23:51.28 JtWpXhr50.net
Yaplog取ってたらこんなの出てた
URLリンク(web.archive.org)

333:192.168.0.774
20/01/06 15:29:48.32 HEWxGNJX0.net
>>321
ありがとう

334:192.168.0.774
20/01/09 07:45:46.22 0Jucozb10.net
4年以上未ログインの Yahoo! JAPAN ID、2020年2月から順次利用停止へ
URLリンク(japanese.engadget.com)
これひょっとしてYahooボックスで公開されてるファイルとかもごっそり消えちゃうんじゃ・・・
と思ったけどほとんど見かけないから影響あんまり無いかな

335:192.168.0.774
20/01/09 21:40:15.88 y/kpjRu/0.net
Yahooボックスってサービス終了して無かったのか…

336:192.168.0.774
20/01/18 22:33:46.55 Mw+axOW50.net
魔法のiらんどは2020年春に大リニューアルします! - 魔法のiらんど URLリンク(maho.jp)
オワタ

337:192.168.0.774
20/01/19 04:35:51.86 qrJ0vAPo0.net
やったぜ

338:192.168.0.774
20/01/19 06:21:23 c42zUqjI0.net
>>328

魔法のiらんど はまだ存在しているのかw

339:192.168.0.774
20/01/24 17:33:52.87 TbU4PUEj0.net
URLリンク(archive.org)
ここに
URLリンク(ishidate.my.coocan.jp)
の、「Visual C++の勉強部屋」は保存できてるようなんだけど
「Visual Studio Community 2017でPythonを始める」が
トップだけあって他のリンクが上手く保存が出来てないようなんだけど
残す方法ありますか?始めてやろうとしてるので変な残し方をしたら気まずい・・・

340:192.168.0.774
20/01/24 17:40:24.75 TbU4PUEj0.net
あれ?慌てただけで反映されてなかっただけかな?
URLリンク(ishidate.my.coocan.jp)
上から2個目まではアーカイブされてました、すみません
一個ずつセーブしていくのかな?2個目はやってないはずなんだけど
トップページをセーブすると、自動で全部の保存処理をしてくれてるのだろうか?

341:192.168.0.774
20/01/24 19:35:46 DGrUFhpx0.net
>>331-332
すみません、反映するまで時間が掛かってただけのようです
順調に保存が進みました

342:192.168.0.774
20/01/30 04:23:53 DpjoWFqw0.net
上の保存出来たと思ったら何も変わってなかった
もう訳が解らん、個人的にローカルへ残す事にします・・・

343:192.168.0.774
20/01/30 09:17:01 QEGy6HlG0.net
最近財政難を表明してからInternet Archiveはやけに不安定だからなあ
Internet Archiveのシステムはページをクロールする部分とクロールしたページを表示する部分に分かれてるんだけど、最近は後者の部分がやけに不安定だったりする
閲覧できてないだけで実は保存できてたりすることもあるけど、不安ならオフラインコピーや他のアーカイブサイトを使うといい

344:192.168.0.774
20/01/30 09:18:37 QEGy6HlG0.net
まあ財政難表明する以前からちょくちょく不安定になることはあったんだけど、最近は不安定になる頻度がやたら高くなってきてる
保存されるアーカイブの量にリソースが追いついてないらしい

345:GeoLog Project
20/02/10 00:45:52.91 QUFKIIvC0.net
魔法のiらんど のURL収集を始めることにしました
知っているURLがあれば追加してください
URLリンク(geolog.mydns.jp)

346:192.168.0.774
20/02/10 15:13:07.48 GaTPIR040.net
Geocitiesのときはいくつかブックマークから追加したけどiらんどはなかったよ・・・

347:192.168.0.774
20/02/17 12:57:14.40 JLl8Pqxs0.net
Wayback Machine ツイッターが簡単に登録できなくなったね
try againになる

348:192.168.0.774
20/02/21 08:24:33 SqQJO7aU0.net
ウェブ魚拓にロボット扱いされるようになった。
手動でやってるのに。
URLリンク(i.imgur.com)

349:192.168.0.774
20/02/21 08:42:25.85 SqQJO7aU0.net
と思ったらReCaptcha導入でgyo.tc/urlまでもが廃止されたのかよ。
ReCaptchaの画面に飛ばしてくれればいいだけなのに。
タイトル画像詐欺になってるがな。

350:192.168.0.774
20/02/21 08:50:19.65 SqQJO7aU0.net
右下のリキャプチャマーク表示されてから5秒数えてから押せばいけるっぽい?

351:192.168.0.774
20/02/25 14:42:33.24 RVV1cF750.net
URLリンク(web.archive.org)
ここ一週間くらい調子悪いね?
保存できたと思って翌日くらいに見ようとしたら消えてて見られなくなってる

352:192.168.0.774
20/02/25 23:55:53.96 jlsY//Cy0.net
Internet Archiveはアーカイブ実行用クローラ(Heritrix)と
保存したアーカイブの専用ビューワ(Wayback)を組み合わせて動いてるんで、
保存したアーカイブがサーバ不調で一時的に見られなくなってても、
アーカイブさえきちんと出来てればそのうち問題なく見られるようになる

353:192.168.0.774
20/02/27 12:58:06.64 mwbfDK4S0.net
>>344
本当ですね!
さっき見てみたら復旧されたようでちゃんと保存できてました!

354:192.168.0.774
20/02/29 11:53:24.69 zPIV21fz0.net
アーカイヴトゥデイがGoogleキャッシュだけでなくBingキャッシュも原本と関連付けてくれれば神なんだが。

355:215
20/03/20 19:04:44 JhAw491V0.net
大住:僕は父親が来て、探偵ファイルをやめるべき理由を膨大に書き連ね
「これ以上やるなら親子関係を考えざるを得ない」と結んだ手紙を置いていきました。

wwwwwwwww

356:192.168.0.774
20/03/24 15:24:23.68 y1vf31FW0.net
Mが九つ…これはリッジレーサーのあの曲ですねぇ…間違い無い

357:192.168.0.774
20/03/29 00:39:38.40 fQaeQ4aI0.net
【リマインド】 魔法のiらんど
2020年 3/31 リニューアルに伴いホームページ機能終了
アーカイブの必要がある場合は早急に対応を。
URLリンク(maho.jp)

358:192.168.0.774
20/04/11 13:13:02 wGeDLnxf0.net
削除されたなろう小説や Wayback Machineでも見れないサイトを見たいなあ

359:192.168.0.774
20/04/12 03:38:35.21 9mojHch+0.net
レビューサイトや攻略サイトはどんなに古くても価値があると思う

360:192.168.0.774
20/04/17 16:09:58.55 jHjl/hvx0.net
Todayにリキャプチャ付いた。かわりに画像単体のキャプチャができるようになっていた。


次ページ
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch