23/11/21 07:23:34.80 QN4SUfby0.net
ウェブアーカイブ関連の話題を総合的に扱うスレです。
情報交換し合って貴重なインターネット遺産を後世に残しましょう。
Internet ArchiveなどのWebサービスだけでなく、wget・HTTrack・Heritrix等のツールやソフト、自作クローラの話題もOKです。
・関連リンク(Rock54回避のためピリオドをカンマに変更)
Wayback Machine
URLリンク(archive,org)
archive,today
URLリンク(archive,fo)
ウェブ魚拓
URLリンク(megalodon,jp)
Archive Team
URLリンク(archiveteam.org)
・関連スレ
Internet Archive総合 (web,archive,org) #2
スレリンク(esite板)
ウェブ魚拓 Part3
スレリンク(esite板)
【和塩】geocitiesスレ10【ジオシティーズ】
スレリンク(hosting板)
【ヤフー】Yahoo!ブログ【アーカイブ】
スレリンク(blog板)
・ジオシティーズでの失敗から学んだアーカイブにあたっての注意事項
1. 早めに行動しましょう
2. まずは既存のプロジェクトや遺産を探しましょう
3. 単独ではなく組織的に動きましょう
4. 呼びかけや情報共有を積極的に行いましょう
2:998
23/11/22 11:01:01.11 QZxCudHS0.net
勝手に次スレ立てたなら、前スレのURLぐらい貼れよ
スレリンク(internet板)
3:998
23/11/22 11:13:01.57 QZxCudHS0.net
>>1の関連リンクや関連スレのリンク先の状況確認もしてなさそうだし
4:998
23/11/22 11:30:01.04 QZxCudHS0.net
前スレで、残り書き込めれるレス数が少ないのに悪口で埋めるのかよ。阿保らしい
5:192.168.0.774
23/11/22 12:17:26.13 DuzB/ozg0.net
>>2
うるせえよ死ねゴミ
6:192.168.0.774
23/11/22 12:58:35.19 gLGwnryk0.net
次スレどうする云々は早めに議論始めないと大抵こうなるんだよね。
5CH自体、人減ったからそういうのを仕切れる人も減った。
7:192.168.0.774
23/11/22 13:08:04.66 R+bORu+V0.net
>>3
リンク先の確認はしてる
文句言う前にお前こそ確認しろ
8:192.168.0.774
23/11/22 20:45:03.42 RBjZhLtj0.net
例のスレを私物化してるというかひたすら日記帳にしてた句読点空改行マンは正直叩かれても仕方ないかと
9:192.168.0.774
23/11/23 16:21:52.04 M5PJ+4vU0.net
次スレ立ったんだし別になんでも良いでしょ
仮にこのスレの次スレが立つなら>>950が立てれば良いさ
テンプレは使い回しして
10:192.168.0.774
23/11/29 19:55:45.97 Bv4X1MKX0.net
今さらだがtok2の無料プラン6月に死んでたのね
11:192.168.0.774
23/11/29 20:05:03.99 hfZzT9ef0.net
長期で見たらどのアーカイバが飛ぶかわからない砂上の楼閣感がある
12:192.168.0.774
23/11/30 15:45:33.23 CeXtDLxF0.net
信用度で言ったら
インターネットアーカイブ>>>>>>>>>today>その他
って感じだしな
特に運営元が分からない奴はいつ飛んでもおかしくない
13:192.168.0.774
23/12/01 20:55:06.14 /RlTQaSn0.net
.orgで連続で弾かれた内部的な仕様変更だろうか
"Not Found
The requested URL was not found on the server. If you entered the URL manually please check your spelling and try again."
14:192.168.0.774
23/12/01 21:02:28.18 /RlTQaSn0.net
Windows版FireFox、Chrome、BraveとSafariで同じ症状
15:192.168.0.774
23/12/01 23:14:24.37 WQmdyjUL0.net
IAのスレでもその話題出てるけどIAの不具合ぽい
16:192.168.0.774
23/12/06 10:23:22.54 9VVxiS460.net
archive.is
日本時間今朝10時7分にサーバ証明書期限切れ、更新されてない
17:192.168.0.774
23/12/12 19:22:42.21 hW2qVqPj0.net
archive todayで気軽にアーカイブ化できるようなショートカットとかないですか?
18:192.168.0.774
23/12/13 12:39:45.28 pBChJXnH0.net
公式にブックマークレットあったはずだけど使えなくなったのか?
19:192.168.0.774
23/12/18 14:32:47.54 rr5iksGZ0.net
ブックマークレット見当たらないんだけどどこにある?
20:192.168.0.774
23/12/18 22:09:24.58 VHkEpDN70.net
>>19
確かにそんなものがあったなぁ。
URLリンク(web.archive.org)
archive.today で定期的にアーカイブさせるスクリプトを動かしていたことがあるけど、
ブックマークレットが行っていたような「保存したい URL を付けて送信するだけ」という方法が
何年か前に受け付けられなくなり、URLリンク(archive.is) のトップページでトークン (submitid) を
得ることを要求するようになった。
ブックマークレットが掲載されなくなったのはその頃。
21:192.168.0.774
23/12/18 23:02:56.83 SRfhFfWq0.net
今も一応第三者が作ってGithubに上げてるブックマークレットならちゃんと今見てるページのワンポチ魚拓取得出来るよ
トップページ一回経由するやつ
22:192.168.0.774
23/12/19 14:10:59.19 be8ZnnnO0.net
>>21
ま?探してくるわ
23:192.168.0.774
23/12/28 15:22:56.59 aVvZh5OJ0.net
archive.today
今朝、運良く取得できたけど、welcome to nginx病・・・
しかも一度出ると再アクセスしても接続がタイムアウトして繋がらなくなる・・・
回避方法あったら教えて
24:192.168.0.774
23/12/28 15:53:07.15 eQrjkTct0.net
>>23
見た感じ archive.today の応答がかなり悪くなってるみたいだけど
archive.is とか archive.md とか archive.li とか、リダイレクトの生じない名前なら
サクサク返って来るんだよね
25:192.168.0.774
23/12/29 16:14:00.57 mcUEm1710.net
今日もarchive.todayでWelcome to nginx!になって取得できない・・・
取得するコツってないの?
26:192.168.0.774
23/12/29 16:24:41.89 56/eqjqc0.net
>>25
あるよw
27:192.168.0.774
23/12/29 16:30:00.41 QoMdPNgl0.net
>>5
お前みたいな人はボランティアとかに向いていないから、ここのスレとかに来ない方が良いんだけどな。
>>8
ここ匿名なのに、「日記帳にしてた人」と「指摘した人」同じに見える能力があるんだな。すげえな。
もし有事があっても朝鮮人の所為にするなよ。
28:192.168.0.774
23/12/29 16:44:03.51 QoMdPNgl0.net
>>7
関連スレの「#2」の部分は直さなかったのかw #5なのに
29:192.168.0.774
23/12/29 16:53:00.74 QoMdPNgl0.net
まあ、>>5 >7 >8はもう居ないだろうけど。
30:192.168.0.774
23/12/29 21:39:19.78 BeXMuX5W0.net
スレを日記帳にしてた連投句読点おじさん帰ってきちゃったじゃん…
31:192.168.0.774
24/01/02 12:32:26.24 W/dfs4mD0.net
質問です
このサイトをそのままの形で落としたいのですが
URLリンク(goodsmileshop.com)
HTTrackでやったら、商品ページまで落とせず終わったり商品の画像が表示されません
そこでwgetで
wget -m -p -E -k -np をつけてやってみました。コマンドはよく分かりませんがネットでサイトそのまま再現
で検索したらこのコマンドを使えと記載がありました
まだ終わってませんがindexを覗いてみたら、カテゴリページを延々とダウンロードしてるようで
商品ページはまだで、途中ですがやっぱり画像が表示されてません
またいつまで経っても終わりません
画像が表示されないのは、表示方法にjavascriptとかを使っているからなんでしょうか
放置してダウンロードが終了すれば、きちんと表示されるんでしょうか
32:192.168.0.774
24/01/02 16:22:32.88 lNtBlc7t0.net
>>31
スレタイ
❌ ローカルアーカイブ総合
⭕ ウェブアーカイブ総合
33:192.168.0.774
24/01/02 19:16:28.75 W/dfs4mD0.net
wget・HTTrack・Heritrix等のツールやソフト、自作クローラの話題もOKです。
って書かれてたんで来ちゃいました。すみません
wgetの使い方に詳しい方がいる板ってどのあたりなんでしょうかね
34:192.168.0.774
24/01/09 19:48:58.47 p24Ans9E0.net
最近インターネットアーカイブで見れる閉鎖サイトを丸々コピーしてる攻略サイトが増えてるわ
代表的なのはこれ
URLリンク(xneo.jp)
URLリンク(kouryaku7.com)
35:192.168.0.774
24/01/22 15:30:21.91 YHuj1Ww20.net
スラド終了のお知らせ
URLリンク(srad.jp)
36:192.168.0.774
24/01/22 15:33:31.38 BqifyO/10.net
スラドの保存を依頼しに来たが、既に書かれてた
1月いっぱいで閉鎖との事なので、技術を持ってる方がいたらWayback Machineへの保存をお願いします
37:192.168.0.774
24/02/01 03:41:51.12 uruf4q6/0.net
>>31
亀レスだけど、落とそうとしてるファイルが多すぎる&サイトにJavaScriptが使われてる、の両方では
でかいサイトをwgetでまともにクロールするなら1週間くらい置いといた方がいい
あと最近のサイトは大概JavaScriptを多用してるから、Heritrixを使った方が楽かもしれん
参考にしたというのは多分このサイトだな
URLリンク(tex2e.github.io)
あと>>32は間違ってる、ローカルアーカイブもれっきとしたWebアーカイブの一種だよ
>>1にもちゃんとwgetも含むと書いてあるし
38:192.168.0.774
24/02/04 23:33:32.14 wTdVULUN0.net
採択
39:192.168.0.774
24/02/20 12:53:52.46 cyS+ObVG0.net
『OKMusic』サービス終了のお知らせ
URLリンク(okmusic.jp)
<終了までのスケジュール>
・2024年3月31日(日)午後11時59分
記事更新を終了
・2024年4月1日(月)午前11時59分
会員機能の提供を終了
※以降会員登録、ログインできません
・2024年5月以降(予定)
サイトの公開を終了
※終了日時に関しては、このページにて改めて告知させていただきます
40:192.168.0.774
24/02/25 02:04:04.75 cjUiDYTX0.net
自作ツールの話だけど、DLしたデータを保存するファイル形式って何かいいのある?
例えば URLリンク(example.com) とかのURLを保存する時、
リクエストしたURL、レスポンスヘッダー、日時等のメタデータ、もちろんレスポンス本文 を保存したい。
もちろんレスポンス本文はバイナリの場合もある。
wgetだとローカルに example.com フォルダの中に blogフォルダの中に article_mode=view&page=10 というファイルを作る(半角の?はファイル名で使えないので置換される)
みたいなのがベタだと思うけど、それだとまずURL文字列の情報が失われてるし、レスポンスヘッダも消えてる。
それに1URLが1ファイルに保存されるから1サイトまるごとだとファイル数が多すぎて取り回しがしにくくなる。
warcファイルでいいやと思ったけど、一般的にはマイナーでエコシステムが力不足な事があるし
じゃあsqlteに自分でテーブルやカラムを作ってやればいいけど独自規格は後々困りそうだし…。
どうすればいいんすかね。
41:192.168.0.774
24/02/25 15:52:11.05 6fhfw2DW0.net
warcで良いだろ
今後どれだけ時を経てもエコシステムが充足することはないから考慮する必要もない
42:192.168.0.774
24/02/25 19:29:29.32 cjUiDYTX0.net
うーん、それもそうか…
43:192.168.0.774
24/02/26 21:52:37.14 badvTVSb0.net
warcは腐ってもISO規格で標準化されてて、マイナーな業界とはいえ世界中の専門機関で使われてる訳だしな
下手に自作するよりはずっと良い
44:192.168.0.774
24/02/26 21:58:07.39 badvTVSb0.net
エコシステムが不足してるなら自分が貢献できるよう頑張ろう、位のガッツがあった方が良いよ(実際に貢献できるかは別として)
何しろマイナーな技術分野で先駆者が少ないから、それくらいの意気込みがないと現実的にやっていられない
45:192.168.0.774
24/02/27 00:51:18.39 o1ZUbZhQ0.net
流行ると後から来たお客様にオワコンにされる流れ多すぎるのが悪い
先駆者利益も大きなお客様に乗っ取られた後の利益と比べたらリスクとリターン見合ってないし
46:192.168.0.774
24/02/27 12:09:56.51 ncN5iY7H0.net
オープンソースかつアーカイブ界隈でそれ気にする必要ある?
47:192.168.0.774
24/03/12 13:39:21.51 DaYLFx9E0.net
どなたかArchiveTeamに連絡お願いします
>> このたび、ODN「ホームページサービス」につきましては、ご利用者の減少に伴い、2023年6月30日(金)に新規受付を終了し、
>> 2024年3月31日(日)をもちましてサービスを終了させていただくこととなりましたので、ご案内申し上げます。
URLリンク(www.odn.ne.jp)
48:192.168.0.774
24/03/12 14:00:43.70 kcrHEzLE0.net
個人サイトなんだけど、todayが消してくれないのどうにかならんかな。
49:192.168.0.774
24/03/12 14:24:31.31 XJRNS97w0.net
>>48
残されて困るようなものを公開したお前が悪い
50:192.168.0.774
24/03/12 20:00:28.00 rAwzeJQ40.net
長期的には.orgや.todayが潰される可能性も
51:192.168.0.774
24/03/12 21:27:17.34 XJRNS97w0.net
.org は無いと思うが .today はわからんな
52:192.168.0.774
24/03/14 17:05:30.27 4OkU93Wi0.net
.todayが重宝されてる一番の理由って日本語どころか.todayが運営してる国の言葉で正式な削除依頼を出しても突っぱねられて消えない事だからなあ
それこそ生半可な弁護士雇っても無理で某春○ちゃんの後任弁護士が英語と現地法律ガチった結果ようやく削除依頼が通ったみたいな記事書いてた気がする
53:192.168.0.774
24/03/14 21:27:55.19 iPr/ZwFh0.net
スクリプト爆撃対策できない5ch自体もそろそろやばそうだ
54:192.168.0.774
24/03/27 10:00:12.13 VvChnD9t0.net
過去の悪行をアーカイブされてる変態新聞がAI児ポに絡めてアーカイバを悪に仕立てる構図
55:192.168.0.774
24/03/27 10:47:01.22 /iyhPo8d0.net
archive.is
Loading.
↓
Not Found (yet?)
All site
56:192.168.0.774
24/03/27 16:16:54.74 VvChnD9t0.net
.todayで俺もなった
57:192.168.0.774
24/04/02 01:43:49.44 1ckoJKH40.net
2024/4/1、長年Google検索トップに鎮座していた
【文字数カウント】がODNホームページサービス終了に伴い消滅
SNSでは突然の別れに惜しむ声が絶えない
このツールは2002年から存在していた模様
URLリンク(i.imgur.com)
URLリンク(www1.odn.ne.jp)
【文字数カウント】サイト閉鎖 ユーザー「一番使いやすかった」「ありがとうございました」
URLリンク(www.itmedia.co.jp)
58:192.168.0.774
24/04/17 05:00:01.19 LoOXS4eE0.net
archive.is can no longer save Twitter from around April.
example:
URLリンク(twitter.com)
(deleted an unsolicited ad)
59:58
24/04/17 05:44:01.19 LoOXS4eE0.net
Last saved example:
URLリンク(archive.is) ( URLリンク(twitter.com) )
(deleted an unsolicited ad)
60:192.168.0.774
24/04/18 16:23:26.26 31KqVUKw0.net
.todayでXの保存ができなくなったか
ユーザーごとに魚拓を検索できたから重宝してたんだが
61:192.168.0.774
24/04/19 04:12:56.08 f+QDn1hh0.net
画像とかクリックして別タブで開かずそのページでポップアップみたいな感じで開くやつは
archive.org、arhive.isどちらでもアーカイブとってもクリックにその箇所が反応しないな
62:192.168.0.774
24/04/19 04:29:19.53 Cp941s2b0.net
>>61
archive.org の場合はサイト次第
63:192.168.0.774
24/04/19 18:52:53.74 f+QDn1hh0.net
>>62
そうなの
MEN'S NON-NOのサイトだが画像をクリックすると、それとともに取材相手への質問が表示されるやつ
先にアーカイブとられてたやつは画像が表示されてなかったから改めてアーカイブしたら
画像表示自体はしたがクリックに無反応
64:192.168.0.774
24/05/21 04:10:22.18 DF8dIwsI0.net
10年前のWebページの38%が消失─Pew Research Center調べ
URLリンク(www.itmedia.co.jp)
10年前のWebページの38%が消失 お前らの黒歴史も消えてるか? [156193805]
スレリンク(news板)
65:192.168.0.774
24/07/19 09:07:24.27 i35vHi650.net
Sage
66:192.168.0.774
24/07/19 09:07:54.89 i35vHi650.net
され
67:192.168.0.774
24/07/23 06:21:08.52 AJUrRvmc0.net
vectorのホームページサービス終了
数々の古のフリーソフトの公式が発掘限界点の向こう側へ
68:192.168.0.774
24/07/23 23:34:22.60 pbqcCg1q0.net
既にじゃなくて年末までか。アーカイブするしかない
《 【Webサービス】個人ホームページの歴史がまたひとつ……Vector、ホームページサービスを12月20日に終了【やじうまWatch】
スレリンク(bizplus板) 》
69:192.168.0.774
24/08/01 18:20:00.66 uP7HLm9x0.net
どなたかお願いします
「アキバ総研」終了へ 22年の歴史に幕 記事は閲覧不能に - ITmedia NEWS
URLリンク(www.itmedia.co.jp)
70:192.168.0.774
24/08/13 23:42:47.60 kQKQkOMh0.net
すでに消えていたけど
URLリンク(www.galstown.ne.jp)
WaybackMachineで見る限り、消滅の予告は無かったから、ドメインとかレン鯖の期限切れかもしれない
71:192.168.0.774
24/08/14 07:08:42.42 kxlIVPRz0.net
2023/12/01 更新期限を過ぎたか何かによりドメイン廃止
2024/05/31 一時凍結期間終了
URLリンク(whois-history.whoisxmlapi.com)
URLリンク(o.5ch.net)
72:192.168.0.774
24/08/20 19:19:05.46 zsZWoPkr0.net
なんだろうとTwitter見に行くもそれらしい緊急状況は無し
Temporarily Offline
Internet Archive services are temporarily offline.
Please check our Twitter feed for the latest information.
We apologize for the inconvenience.
73:192.168.0.774
24/08/23 23:31:59.23 MmaR55x80.net
「牛」と呼ばれてるアーカイブサイトってどこだと思います?
探してるんだけど判らぬ……
74:192.168.0.774
24/08/24 00:45:46.66 099fHmdK0.net
ソフトウェア配布サイトの事なら Tucows なんだろうけどな・・・
ちなみに同社は当該事業を終了、コンテンツは Internet Archive へ移されてる。
URLリンク(www.tucows.com)
75:192.168.0.774
24/08/26 02:21:11.31 B7Mket0T0.net
大手4社の資料保存活動とは? キーマンたちが現状を報告した「ゲーム開発過去資料の保存の最前線を語ろう!」レポート[CEDEC 2024]
URLリンク(www.4gamer.net)
76:192.168.0.774
24/08/27 11:11:58.32 ZJNuTxHU0.net
最近のサイトデザインでは折り畳みメニュー表示が増えてて実際に.orgと.todayの2つで試してみないと分からなかったりする
77:192.168.0.774
24/09/05 13:55:10.35 8y13Nyfk0.net
ニューヨーク 4日 ロイター] - 米連邦控訴裁判所は、非営利団体インターネット・アーカイブが著作権保護された作品を違法にスキャンし、許可なく無料でオンライン上に公開していると訴えた大手書籍出版社4社の訴えを支持した。
マンハッタンにある連邦第2巡回区控訴裁判所は、アシェット・ブック・グループ(LAGA.PA)(新規タブ)、ハーパーコリンズ・パブリッシャーズ(NWSA.O)(新規タブ)、ジョン・ワイリー&サンズ(WLY.N)(新規タブ)、ペンギン・ランダムハウス(BTGGg.F)(新規タブ)の4社に対し、アーカイブによる書籍全体の 「大規模な 」コピーと配布は 「公正な利用 」には当たらないとの見解を示した。
78:192.168.0.774
24/09/26 11:01:42.41 vq+iPi2JB
Internet Archive総合 (web.archive.org) #5
スレリンク(esite板)
冗長
スレリンク(esite板)
79:192.168.0.774
24/10/05 23:37:38.68 sir44IIK0.net
ぷららのホームページサービスが来年の4月1日で終了するみたい
URLリンク(www.docomo.ne.jp)
80:192.168.0.774
24/10/08 02:12:46.98 bySj2odM0.net
無料か無料に近い形で提供されるホームページサービスは遠からず全部消えるのかなぁ
81:192.168.0.774
24/10/09 21:54:07.89 pVxYkPnH0.net
Tor、I2P、Freenetみたいな中央サーバーを持たない、
真に匿名なネットワークでサイト運営すれば消えない
どのくらい消えないかっていうとシンプルに犯罪サイトや、
いわゆる巨悪のリーク情報なんかも永遠に残ってて、
必死こいてノイズ情報流して、せめて見つけにくくしようとしてるレベル
82:192.168.0.774
24/10/10 08:25:31.73 O0Wa5OT40.net
Internet Archiveがハッキング被害、3,100万人分の個人情報流出
現在はDDoS攻撃を受けている模様
Internet Archive hacked, data breach impacts 31 million users
URLリンク(www.bleepingcomputer.com)
83:192.168.0.774
24/10/10 11:25:28.61 mRA5njFO0.net
始まりがあるものには、すべて終わりがある
84:192.168.0.774
24/10/11 10:59:00.08 +0ZVN28A0.net
努力次第で終わりは遅延できる
85:192.168.0.774
24/10/11 14:43:21.46 4/k0xNoP0.net
Googleというビッグブラザーのキャッシュ代替になったことで標的にされやすくなったんだよ
86:192.168.0.774
24/10/19 01:14:25.80 yNdJY+Db0.net
>>81
匿名ネットでも情報は消えまくってるので消えないは幻想
結局のところ保存しておくインセンティブが無いので消える
価値のある情報は残るけどそれはクリアネットでも同じ
(現在のところ)価値が無い情報をどう保存させるかが問題
87:192.168.0.774
24/10/19 18:29:44.21 7gZrEMne0.net
>>86
価値が無い情報も保存される仕組みを悪用して、
価値がある情報を悪意で埋めるのが荒らしの手口なんだけどなw
88:192.168.0.774
24/10/20 01:29:10.31 YC/XYbnS0.net
IPFSだ、IPFSしかない
89:192.168.0.774
24/10/20 17:28:03.78 jErutBf90.net
よく勘違いされるけどIPFSってアーカイブには向いて無いよ
あれこそ価値のある情報は残って価値がない情報は消えるシステムだよ
90:あめ
24/10/20 19:38:03.16 vNuKrZxb0.net
それはそう、arweaveみたいなものではない
でも同じデータは誰が提供しても同じURLになるとか、httpよりはずっといい
歴史に残らなかったものまですべて保存は現状のハードウェアでは無理だろうし、歴史に残ったものは全部残るで十分に及第点かなぁ
91:192.168.0.774
24/10/23 01:58:39.75 TBBqAAjr0.net
分散型はとりあえず業界の標準が決まってくれないとより良いものが出るたびにデータを投げ捨てることになりかねないな
92:192.168.0.774
24/10/23 13:52:50.47 TBBqAAjr0.net
分散型ストレージのautonomiは10月29日に一般公開予定
URLリンク(docs.autonomi.com)
Webサイトの公開はできるっぽいけど他の分散型プロジェクトと同様に閲覧のためにクライアントを動かさないといけないので手間
この手のプロジェクトのいいところはサイト制作者が自分で保存されることを選ぶから他者のアーカイブ行為による著作権侵害の心配がないところだね
93:192.168.0.774
24/10/23 14:44:11.43 p8DuKr1h0.net
>>92
このプロジェクト初めて聞いたけど書いてある事が理想的過ぎて疑ってしまうな
特に1回限りの料金で永続保存のところ、Arweaveはストレージ料金が低下し続ける仮設を根拠にしてるが(これはこれでどうかと思うが)
autonomiはどういう理屈なんだろ
というかこの手のプロジェクトって何で1回限りの料金にこだわるんだろうか
分散ストレージで安いなら普通に月額でも払うが
94:192.168.0.774
24/10/23 14:56:52.25 TBBqAAjr0.net
>>93
そうなんだよね、なんか良さげな理想並べてるけど「そんなんうまくいくのかぁ〜?」というのが正直なところ
ノードがオンライン状態でデータを保持し続ければ報酬が生成されるらしいけど、そのインセンティブを無視してノードを削除したらどうなるのか?というのがわからない
1回限りが重要なのはアップロード者が管理放棄してもデータが残るようにじゃない?
あと一応言っておくとautonomiは今年頭まではMaidsafeという名前だったけど開発18年目を迎えてリブランドしたプロジェクト
開発長過ぎるんだよなProject Xanaduほどじゃないけども
8年ぐらい前から見ててようやくローンチ迎えそうだから期待してるんだけどどうなるかなぁ・・・
95:192.168.0.774
24/10/28 05:32:04.83 yhg3dtvQ0.net
ベクターHPが12月20日で終了
96:192.168.0.774
24/11/14 11:40:47.87 e5vP7i/90.net
mangazも閉鎖で絶版本が無間地獄に帰るね
97:192.168.0.774
24/12/01 22:45:19.04 tuRpdWYB0.net
>>79
訂正 サービス終了は来年3月31日だった
98:192.168.0.774
24/12/27 13:26:37.17 fYcmXIUr0.net
goo IDが2017年以降ログインなしで削除
ブログが消されるかどうかは知らん
99:192.168.0.774
24/12/28 10:08:50.49 xIi08uhi0.net
>>98
ID削除のソース
URLリンク(login.mail.goo.ne.jp)
ブログ削除のソース
URLリンク(blog.goo.ne.jp)
10年代前半で更新止まったブログは全削除されそうだな
100:192.168.0.774
24/12/30 13:37:58.45 mp0Tkkna0.net
削除するぞメール来たってえきねっと退会スパムみたいなもんかと思って放置されるだろうな
101:192.168.0.774
25/01/17 00:03:32.08 0d/D0Jtj0.net
ニコニコ春画29日終了
102:192.168.0.774
25/02/08 19:45:26.63 wXhKO+uW0.net
最近は魚拓回避意図か知らんがクリックしないと表示されない系が増えてきてるけどこれ録れないよね?
coinloan.tech
103:192.168.0.774
25/02/22 00:01:37.07 1+yNfjxb0.net
【オウム真理教問題デジタルアーカイブ】
— 記憶の風化を防ぎ、次世代に記憶を継承するオウム真理教問題デジタルアーカイブサイトです。
URLリンク(www.moj.go.jp)
104:192.168.0.774
25/02/26 17:48:15.08 zrJmYLce0.net
「熱量と情報量が凄まじい個人サイトよ、いずこに…」 2000年代にたくさんあった個人ブログ、テキストサイトが消えた理由
URLリンク(news.careerconnection.jp)
105:192.168.0.774
25/03/03 18:32:56.97 l3vle4lQ0.net
Internet Archive総合 (web.archive.org) #6
URLリンク(mevius.2ch.sc)
106:192.168.0.774
25/03/04 14:13:18.85 pZipXde+0.net
「ぷらら」の個人向けホームページが3月末に終了 古参ネットユーザー「歴史が消えていく」 - ITmedia NEWS
URLリンク(www.itmedia.co.jp)
107:192.168.0.774
25/03/10 03:58:04.00 AUECZsGf0.net
Internet Archive総合 (web.archive.org) #6
URLリンク(mevius.2ch.sc)
108:192.168.0.774
25/03/16 07:33:18.12 kKDe6Rv/0.net
OSCHINA、スラドと OSDN の受け入れ先募集を打ち切ってサービス終了へ
URLリンク(srad.jp)
スラド、継続不能になった模様
109:192.168.0.774
25/03/31 15:37:25.63 Y56lREV80.net
このスレでよく名前が挙がるArchive Teamについて
ArchiveTeam Warriorでウェブアーカイブ活動に貢献しよう - Project Fx 2.0
(ドメイン名の規制回避に失敗したのでX (Twitter)の短縮リンクを貼る。カッコは消してくれ)
URLリンク(t[.]co)
ArchiveTeam Warriorで知識を守る - The Great Underground Home Page
URLリンク(clavis.info)
110:192.168.0.774
25/04/01 03:44:11.98 3bUxAbnt0.net
ss-blogは何故かまだ生きてるな
不可視化の処理が完了するまでタイムラグがあるのか?
111:192.168.0.774
25/04/04 09:30:39.65 Ap+qSSew0.net
>>104
「熱量と情報量が凄まじい個人サイトよ、いずこに…」 2000年代にたくさんあった個人ブログ、テキストサイトが消えた理由 [851834166]
スレリンク(poverty板)
112:192.168.0.774
25/04/04 22:16:45.45 d/O8B0Nf0.net
URLリンク(www.fc2web.com)
>FC2WEB は 2025年6月30日 (月) をもって、
サービスを終了とさせていただくこととなりました。
悪名高き?FC2ホームページとは別物で
今後はFC2ホームページに統合らしい
無料なので放置されたまま消滅するサイトも多いか
113:192.168.0.774
25/04/07 11:32:10.86 rkOq5lFK0.net
Pocketとかの代替でkarakeep(Hoarder)というのを使ってて見つけたんだけど、
Webページを単一のHTMLにしてくれるmonolithというのがなかなか良い
URLリンク(github.com)
ローカル保存におすすめ
114:192.168.0.774
25/04/07 22:58:04.30 G0iokGQw0.net
こんなのあったのか
115:192.168.0.774
25/04/12 02:39:17.31 xmRuIA6s0.net
「みんなFC2WEBばっかり目が行ってるけど、実際は55 STREET、Easter、Finito Web、URLリンク(OJIJI.net)<)、URLリンク(k-free.net)<)、K-Serverも2025年6月30日に終わることになっている。 注意するんだ。」
URLリンク(x.com)
116:192.168.0.774
25/04/15 02:45:02.64 5qeSSvyR0.net
WARC で保存できる Webrecorder もいいぞ
URLリンク(chromewebstore.google.com)
117:192.168.0.774
25/04/19 10:37:20.38 em1R2zGM0.net
「ゲームのアーカイブ」をテーマに研究者、保存団体、社長などが一堂に会すシンポジウムが開催。ヨーロッパの博物館はゲーセンの雰囲気を再現、マイナー作品を移植するには“ドサクサに紛れてコッソリ入れ込む”─など気になるトピック多数
URLリンク(news.denfaminicogamer.jp)
118:192.168.0.774
25/05/06 15:07:47.60 K61FRbpu0.net
archive.todayが最近不調な件
・先月中ごろから一部のサイトが取得できない
・数日前から「Not Found (yet?)」が多い
119:192.168.0.774
25/05/07 06:37:54.86 6n/1y+tk0.net
Not Found (yet?)はarchive.today本体が調子悪い時も取得先が調子悪い時もarchive.todayが取得先から弾かれてるだけの時も出るから本体に濡れ衣着せてしまいがちではある
特にXのセンシティブ設定されてる画像ポスト&アカウント自体が強制センシティブ設定食らってる人のポストは今のarchive.todayの仕様だとNot Found (yet?)にほぼ全部なるから、
あれ?と思ったらghost archive等の別の魚拓サイトを毎回試すようにしてる
120:192.168.0.774
25/05/07 10:41:30.46 BeikZYi90.net
Googleキャッシュの廃止以来、国内大学のレポジトリに多く上がってるPDF論文がHTML形式でアーカイブ出来なくなり悔しい…。
121:192.168.0.774
25/05/07 11:04:11.83 R8dy5vO80.net
>>118-119
Xの魚拓取ってると場合によっては(yet?)が出まくってarchive.todayがまた死にかけてる!となりがちだなw
あと保存してる最中にちょうどアカウント主が鍵かけちゃって(yet?)のページがお出しされる悲しいパターン
122:192.168.0.774
25/05/21 19:36:28.43 gBGNftSt0.net
117だが、前者の原因はIAスレ(6スレ目)のとある書き込みにあった
道理で取得できないわけか
IAだけでは心もとなくて使ってたのに、まさかそういう上限があったとは・・・
Ghostarchive、そこもそういう仕様でなければ良いが、果たして・・・
123:192.168.0.774
25/06/07 08:49:11.47 aN87fLV/0.net
URLリンク(www.maple.town)
こんなサイトを発見
1986年からある電子掲示板のほぼ全てのログが保管されてる貴重なサイト
IDとパスワードで保護されている為archive.orgにはほとんどアーカイブされていない
しかしIDもパスワードもトップページに書かれてるので
target_username=<XXX>
target_password=<YYY>
でアーカイブ可能
今のうちにアーカイブしておこう
124:192.168.0.774
25/06/07 13:52:53.08 S9o9v/wR0.net
>>123
手を抜いて capture_outlinks=on も追加してしまうと、outlinks として飛んだ先では
target_username も target_password も使用されないのは盲点だった
せめて同じドメインなら認証情報も使い回してくれよw
125:192.168.0.774
25/06/09 05:38:35.19 g/YpZEvX0.net
UAの設定なんかも外部リンクには適用されないんだよな(´・ω・`)
ただcapture_allとかskip_first_archiveなんかは適用されたり
おかしなところがいくつかあったので一応
URLリンク(www.maple.town) ここはリストとレス番に若干ズレがあれどちゃんと見れる
URLリンク(www.maple.town) ここは前ページに遡れないなと思ったら
どうやら古いレスは消える板らしい URLリンク(www.maple.town)
でも連番でレス自体は見れるようです
126:192.168.0.774
25/06/19 18:59:11.21 lJyJlJ5s0.net
Ghostarchive、今朝から取得できてんだかできてないんだか
検索では取得できてることになってるが、それを見ようとすると
「An unexpected error occured: QuotaExceededError」
archive.today同様上限(同じドメインは5000件まで。Ghostarchiveではもっと少ないようだ)に引っかかったのか、それともたまたま・・・
IAだけでは心もとなくて複数のアーカイブサイトで取得するようにしてるが、結局IAしか勝たんてか
127:192.168.0.774
25/06/19 19:34:49.02 lJyJlJ5s0.net
訂正
archive.todayでは上限5000件までだが、もしGhostarchiveで上限があるとしたら(5000件も取得してないゆえに)それより少ないことに
128:192.168.0.774
25/06/29 18:30:52.23 V9QrwJqA0.net
125-126の件、別のブラウザで試したら取得できた
上限の問題ではないのならarchive.todayより増しなんだろうが、惜しむらくは検索が200件までしか表示されないのとブラウザによっては安定しないところか
ちなみにarchive.todayの検索はたしか3000件、IAの検索は10000件
129:192.168.0.774
25/08/17 15:49:16.40 EQLJjoS80.net
Sage
130:192.168.0.774
25/08/17 15:49:24.24 EQLJjoS80.net
Sag
131:192.168.0.774
25/08/18 21:12:47.94 ilmx9LNo0.net
閉鎖の続くブログはオワコンなのか 惜しむ声、でも保存議論は進まず:朝日新聞
URLリンク(www.asahi.com)