【保存・記録】ウェブアーカイブ総合 Page.02at INTERNET
【保存・記録】ウェブアーカイブ総合 Page.02 - 暇つぶし2ch111:192.168.0.774
25/04/04 09:30:39.65 Ap+qSSew0.net
>>104
「熱量と情報量が凄まじい個人サイトよ、いずこに…」 2000年代にたくさんあった個人ブログ、テキストサイトが消えた理由 [851834166]
スレリンク(poverty板)

112:192.168.0.774
25/04/04 22:16:45.45 d/O8B0Nf0.net
URLリンク(www.fc2web.com)
>FC2WEB は 2025年6月30日 (月) をもって、
サービスを終了とさせていただくこととなりました。

悪名高き?FC2ホームページとは別物で
今後はFC2ホームページに統合らしい
無料なので放置されたまま消滅するサイトも多いか

113:192.168.0.774
25/04/07 11:32:10.86 rkOq5lFK0.net
Pocketとかの代替でkarakeep(Hoarder)というのを使ってて見つけたんだけど、
Webページを単一のHTMLにしてくれるmonolithというのがなかなか良い
URLリンク(github.com)
ローカル保存におすすめ

114:192.168.0.774
25/04/07 22:58:04.30 G0iokGQw0.net
こんなのあったのか

115:192.168.0.774
25/04/12 02:39:17.31 xmRuIA6s0.net
「みんなFC2WEBばっかり目が行ってるけど、実際は55 STREET、Easter、Finito Web、URLリンク(OJIJI.net)<)URLリンク(k-free.net)<)、K-Serverも2025年6月30日に終わることになっている。 注意するんだ。」
URLリンク(x.com)

116:192.168.0.774
25/04/15 02:45:02.64 5qeSSvyR0.net
WARC で保存できる Webrecorder もいいぞ
URLリンク(chromewebstore.google.com)

117:192.168.0.774
25/04/19 10:37:20.38 em1R2zGM0.net
「ゲームのアーカイブ」をテーマに研究者、保存団体、社長などが一堂に会すシンポジウムが開催。ヨーロッパの博物館はゲーセンの雰囲気を再現、マイナー作品を移植するには“ドサクサに紛れてコッソリ入れ込む”─など気になるトピック多数
URLリンク(news.denfaminicogamer.jp)

118:192.168.0.774
25/05/06 15:07:47.60 K61FRbpu0.net
archive.todayが最近不調な件
・先月中ごろから一部のサイトが取得できない
・数日前から「Not Found (yet?)」が多い

119:192.168.0.774
25/05/07 06:37:54.86 6n/1y+tk0.net
Not Found (yet?)はarchive.today本体が調子悪い時も取得先が調子悪い時もarchive.todayが取得先から弾かれてるだけの時も出るから本体に濡れ衣着せてしまいがちではある
特にXのセンシティブ設定されてる画像ポスト&アカウント自体が強制センシティブ設定食らってる人のポストは今のarchive.todayの仕様だとNot Found (yet?)にほぼ全部なるから、
あれ?と思ったらghost archive等の別の魚拓サイトを毎回試すようにしてる

120:192.168.0.774
25/05/07 10:41:30.46 BeikZYi90.net
Googleキャッシュの廃止以来、国内大学のレポジトリに多く上がってるPDF論文がHTML形式でアーカイブ出来なくなり悔しい…。
 

121:192.168.0.774
25/05/07 11:04:11.83 R8dy5vO80.net
>>118-119
Xの魚拓取ってると場合によっては(yet?)が出まくってarchive.todayがまた死にかけてる!となりがちだなw
あと保存してる最中にちょうどアカウント主が鍵かけちゃって(yet?)のページがお出しされる悲しいパターン

122:192.168.0.774
25/05/21 19:36:28.43 gBGNftSt0.net
117だが、前者の原因はIAスレ(6スレ目)のとある書き込みにあった
道理で取得できないわけか
IAだけでは心もとなくて使ってたのに、まさかそういう上限があったとは・・・

Ghostarchive、そこもそういう仕様でなければ良いが、果たして・・・

123:192.168.0.774
25/06/07 08:49:11.47 aN87fLV/0.net
URLリンク(www.maple.town)
こんなサイトを発見
1986年からある電子掲示板のほぼ全てのログが保管されてる貴重なサイト
IDとパスワードで保護されている為archive.orgにはほとんどアーカイブされていない
しかしIDもパスワードもトップページに書かれてるので
target_username=<XXX>
target_password=<YYY>
でアーカイブ可能
今のうちにアーカイブしておこう

124:192.168.0.774
25/06/07 13:52:53.08 S9o9v/wR0.net
>>123
手を抜いて capture_outlinks=on も追加してしまうと、outlinks として飛んだ先では
target_username も target_password も使用されないのは盲点だった
せめて同じドメインなら認証情報も使い回してくれよw

125:192.168.0.774
25/06/09 05:38:35.19 g/YpZEvX0.net
UAの設定なんかも外部リンクには適用されないんだよな(´・ω・`)
ただcapture_allとかskip_first_archiveなんかは適用されたり

おかしなところがいくつかあったので一応
URLリンク(www.maple.town) ここはリストとレス番に若干ズレがあれどちゃんと見れる
URLリンク(www.maple.town) ここは前ページに遡れないなと思ったら
どうやら古いレスは消える板らしい URLリンク(www.maple.town)
でも連番でレス自体は見れるようです

126:192.168.0.774
25/06/19 18:59:11.21 lJyJlJ5s0.net
Ghostarchive、今朝から取得できてんだかできてないんだか
検索では取得できてることになってるが、それを見ようとすると
「An unexpected error occured: QuotaExceededError」
archive.today同様上限(同じドメインは5000件まで。Ghostarchiveではもっと少ないようだ)に引っかかったのか、それともたまたま・・・
IAだけでは心もとなくて複数のアーカイブサイトで取得するようにしてるが、結局IAしか勝たんてか

127:192.168.0.774
25/06/19 19:34:49.02 lJyJlJ5s0.net
訂正
archive.todayでは上限5000件までだが、もしGhostarchiveで上限があるとしたら(5000件も取得してないゆえに)それより少ないことに

128:192.168.0.774
25/06/29 18:30:52.23 V9QrwJqA0.net
125-126の件、別のブラウザで試したら取得できた
上限の問題ではないのならarchive.todayより増しなんだろうが、惜しむらくは検索が200件までしか表示されないのとブラウザによっては安定しないところか
ちなみにarchive.todayの検索はたしか3000件、IAの検索は10000件

129:192.168.0.774
25/08/17 15:49:16.40 EQLJjoS80.net
Sage

130:192.168.0.774
25/08/17 15:49:24.24 EQLJjoS80.net
Sag

131:192.168.0.774
25/08/18 21:12:47.94 ilmx9LNo0.net
閉鎖の続くブログはオワコンなのか 惜しむ声、でも保存議論は進まず:朝日新聞
URLリンク(www.asahi.com)


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch