【保存・記録】ウェブアーカイブ総合 Page.01at INTERNET
【保存・記録】ウェブアーカイブ総合 Page.01 - 暇つぶし2ch78:192.168.0.774
19/04/09 22:06:36.56 Ybc45mGn0.net
適当に作ったブックマークレット各種
google cache化
javascript:{window.open('URLリンク(webcache.googleusercontent.com)'+escape(window.location.href.replace(/^https?:\/\//,''))+'');eval();}
保存 WayBackMachine (web.archive.org)
javascript:{window.open('URLリンク(web.archive.org)'+escape(window.location.href.replace(/^https?:\/\//,'')).replace('http://','')+'');eval();}
WayBackMachine最新
javascript:{window.open('URLリンク(web.archive.org)'+escape(window.location.href.replace(/^https?:\/\//,'')).replace('http://','')+'&type=replay');eval();}
GeoLog化
javascript:{window.open('URLリンク(thaliana.mydns.jp)'+escape(window.location.href.replace(/^https?:\/\//,'')).replace('http://','')+'');eval();}

79:192.168.0.774
19/04/09 22:34:51.34 Ybc45mGn0.net
適当に作ったブックマークレット各種(2)
Save to Archive.today
javascript:void(open('URLリンク(archive.today)'+encodeURIComponent(document.location)))
Web魚拓化
javascript:{window.open('URLリンク(gyo.tc)'+escape(window.location.href.replace(/^https?:\/\//,''))+'');eval();}

80:192.168.0.774
19/04/09 23:12:16.41 thZOPaUB0.net
グッジョブ

81:192.168.0.774
19/04/10 14:33:20.20 0KzfqGnC0.net
>>78
google cacheをWayBackMachineに保存するときに保存のブックマークレット使うと失敗しますね。
最新の方で開いてから「Save this url in the Wayback Machine」をクリックで成功。
一度失敗してしまった場合はgoogle cacheのURLの後ろに「&hl=ja」等をつけてから最新で開いて「Save This URL」。

82:192.168.0.774
19/04/10 15:33:03.08 y92qvzSP0.net
>>1
INTERNATIONAL INTERNET PRESERVATION CONSORTIUM - IIPC
URLリンク(netpreserve.org)

83:192.168.0.774
19/04/10 18:38:04.28 kmjY19lr0.net
>>78
Internet Archiveスレから引用
スレリンク(internet板:78番)-79
/save/ を知ってて /web/2/ を知らないとは。
あと保存の際に http:// や https:// を無条件に外すのも考え物。
HTTP から HTTPS へリダイレクトするサイトだと、そのリダイレクトも
保存回数に計上されてしまう。

84:192.168.0.774
19/04/10 22:12:15.15 5UKQiW/z0.net
/web/2/ってのは/web/*/の勘違いかタイポなんだろうな
/web/*/使えばもっと簡潔に書けると思うよ

85:192.168.0.774
19/04/10 22:14:34.68 Qi/9tnuY0.net
/web/*/だと一覧に飛んで/web/2/だと最新のに飛ぶんでないの

86:192.168.0.774
19/04/10 23:12:54.50 0KzfqGnC0.net
保存 WayBackMachine (web.archive.org)
javascript:{window.open('URLリンク(web.archive.org)'+escape(window.location.href+''));eval();}
WayBackMachine最新
javascript:{window.open('URLリンク(web.archive.org)'+escape(window.location.href+''));eval();}

87:192.168.0.774
19/04/11 00:46:30.73 2s+xSUEt0.net
/web/URLでも最新に飛べるけどな

88:192.168.0.774
19/04/11 10:08:33.22 NcP8kiVw0.net
このスレ見つけらんねえよ
魚拓,archive,waybackとかスレタイに含まれてなきゃ

89:192.168.0.774
19/04/11 10:41:01.74 zpHmesQE0.net
上の方で話してたけどスレタイの文字数制限厳し目だからウェブアーカイブ総合の横にInternetArchiveと魚拓入れただけでカツカツになっちゃうんだよね
板設定変更依頼スレッド見ると簡単には設定変更してくれないようだしなんか削らないと
いっそ魚拓・InternetArchive総合にすりゃいいのか?

90:192.168.0.774
19/04/11 11:12:44.61 JiNXg/cV0.net
良スレだな。応援してるわ
日本のサイトもサービス終了対策しないと空白になってしまうので
管理人が全員生きてて引っ越し出来るとも限らんし、消された情報が将来誰かに必要・不要なんて分からんのよね
日本の法律から、終了するサイトは丸ごと個人のローカルへ保存する方法が有ると良いな
分散バックアップにもなると思う

91:192.168.0.774
19/04/11 11:26:31.44 3yDWyDnm0.net
>>89
タイトル案
【魚拓】ウェブアーカイブ1【Internet Archive】
【魚拓】ウェブアーカイブ1【InternetArchive】
【魚拓】ウェブアーカイブ1【IA】
【魚拓】ウェブアーカイブ1【Internet Archive】
【魚拓】アーカイブ1【Internet Archive】
【魚拓】Web archiving1【Internet Archive】
魚拓:ウェブアーカイブ1:Internet Archive
ウェブアーカイブ1【Wayback Machine,魚拓】
ウェブアーカイブ1【Internet Archive,魚拓】
ウェブアーカイブ1【魚拓】
ウェブアーカイブ1😂InternetArchive魚拓
ウェブアーカイブInternetArchive魚拓1
archive 1【魚拓】
魚拓 1

92:192.168.0.774
19/04/11 12:00:59.64 aWNM129m0.net
魚拓やWayback Machine以外のツールも扱うよ、ってことで「総合」は付けておきたい

93:192.168.0.774
19/04/11 12:04:19.18 aWNM129m0.net
>>91
追加
ウェブアーカイブ総合【Internet Archive・魚拓】#1
【ウェブ魚拓】インターネットアーカイブ総合 #1
>>1にリンクがあるウェブ魚拓スレやIA専用スレと間違われないようなスレタイが望ましい

94:192.168.0.774
19/04/11 12:18:42.95 zpHmesQE0.net
となるとやっぱりウェブアーカイブ総合は外せないか?
魚拓、InternetArchiveの他にウェブページを保存したい人が調べそうな単語ってあるんかな
収集、保存、保管、ダウンロード、キャプチャ、スクラップ
うーん・・・

95:192.168.0.774
19/04/11 12:26:06.26 D+Yqkgbv0.net
魚拓もウェブ魚拓って完全にスレタイに含めないと話にならない

96:192.168.0.774
19/04/11 13:18:54.90 aWNM129m0.net
ウェブ魚拓は固有名詞としても使うだろ
URLリンク(info.5ch.net)魚拓
このサイトでも「魚拓」とだけ紹介してるし、何よりスレタイ制限の48バイトって結構カツカツだし、魚拓だけで良いんじゃないかな

97:192.168.0.774
19/04/11 13:20:20.32 aWNM129m0.net
>>96
×魚拓だけで良いんじゃないかな
○「ウェブ魚拓」と完全にスレタイに含める必要は無いんじゃないかな

98:192.168.0.774
19/04/11 13:59:00.00 D+Yqkgbv0.net
そんなにこだわってないならIAは略していいってことになるけどそうはならないのと同じ
ウェブ魚拓とスレタイに含めないと立てる意味がない

99:192.168.0.774
19/04/11 14:44:54.16 zpHmesQE0.net
【ウェブ魚拓】ウェブアーカイブ総合 Page.1【InternetArchive】
sjisで60バイト
ウェブ魚拓をweb魚拓にすれば57バイト
ウェブアーカ�


100:Cブもwebアーカイブにすれば54バイト 64バイトまで引き上げてもらえば全部入る 【ウェブ魚拓】を抜けば48バイトに収まる とりあえずウェブ魚拓抜いて立て直して申請通ったら次のスレからウェブ魚拓も入れるのがいいんじゃないか なぜIAじゃなくてウェブ魚拓を抜くのかについてはGoogleの検索トレンドを参考にした https://i.imgur.com/cNx29z9.png



101:192.168.0.774
19/04/11 15:23:27.94 rHrFPNjW0.net
大抵「Archive」でスレタイ検索するなあ自分は

102:192.168.0.774
19/04/11 16:54:04.85 aWNM129m0.net
「ウェブ魚拓」と「魚拓」のどちらでも、Googleなら上手いこと検索に引っ掛かってくれそうではある
Bingは知らん

103:192.168.0.774
19/04/11 18:36:21.34 3yDWyDnm0.net
「魚拓」 でも引っかかるから「ウェブ」は要らないね
URLリンク(www.google.com)
というか普通にスレあった
URLリンク(mevius.2ch.sc)
>>92
「ウェブアーカイブ」だけで全てを説明できてるから「総合」も要らないと思う
Internet Archive, Wayback Machine, archive.is, 魚拓, ArchiveTeam は全部「ウェブアーカイブ」で説明できる 👀
Rock54: Caution(BBR-MD5:1322b9cf791dd10729e510ca36a73322)


104:192.168.0.774
19/04/11 18:59:21.43 zpHmesQE0.net
ウェブアーカイブ(に関するものを)総合(したスレッド)
ていうかそれ総合格闘技とか格闘技で空手やら柔道やら説明できるから総合いらないじゃんって言ってるようなもんでしょ
総合とわざわざ表記することによって一つではなく全体であることを暗に示してるんだよ

105:192.168.0.774
19/04/11 19:37:27.64 3yDWyDnm0.net
いや、どっちかというと「空手 part1」でも十分なのに「空手総合 part1」 にしてる感じ
ウェブアーカイブの技術としては1つにまとまるから総合しなくてもいい
「ウェブアーカイブサービス総合」なら自然だね
文字列制限があるなら省いても問題ない

106:192.168.0.774
19/04/11 19:55:40.33 3yDWyDnm0.net
今気づいたけど「ウェブアーカイブ」が何を指すかの認識の違いだね
① ウェブアーカイブ → アーカイブのサービス (digital archive or archive site)
② ウェブアーカイブ → アーカイブ技術 (web archive or web archiving)
アーカイブ技術という意味で使っても良いかと思う

107:192.168.0.774
19/04/11 23:09:34.96 L2Qvrxob0.net
>>78-79
window.open()の後ろにeval()付けたり、void()の引数にしたり、
未定義値を返したいだけなのに方法がバラバラ。
同じ人が作ったにしては変な話だな。

108:192.168.0.774
19/04/12 00:06:00.46 dU8Shh4A0.net
公式が公開しているものをコピペしたのも含まれてるのかな

109:192.168.0.774
19/04/12 03:12:04.19 IEOgrIFJ0.net
todayは公式のやつだったかも。てへぺろッ

110:192.168.0.774
19/04/12 07:27:14.62 SClfSpUI0.net
67 名前:192.168.0.774
投稿日:2019/04/09(火) 02:14:18.12 ID:Xrq4p9iW0
結局wikiはどこに作るんだ
atwikiかwikiwiki辺りか?

69 名前:192.168.0.774
投稿日:2019/04/09(火) 07:35:20.06 ID:aX1j4Hrw0
MediaWiki 一択でしょ

まずここから考えよう

111:192.168.0.774
19/04/12 07:30:12.18 SClfSpUI0.net
シーサーブログのシーサーウィキというのもあるらしいが。

112:192.168.0.774
19/04/12 07:35:28.30 SClfSpUI0.net
Wiki3(うぃきさん)
URLリンク(twitter.com)
(deleted an unsolicited ad)

113:192.168.0.774
19/04/12 07:36:46.55 SClfSpUI0.net
Seesaa Wiki(シーサーウィキ)とはシーサー
株式会社が運営するレンタルウィキサービスである。
@wiki(あっとうぃき、atwiki)とは、和歌山県の有限会社アット
フリークスが提供するレンタルウィキ。2ちゃんねる掲示板のパート
スレッド(パートスレ)まとめに用いられることが多い。
(以上ウィキペディアより)

114:192.168.0.774
19/04/12 12:28:44.53 xJcFOgmj0.net
MediaWikiはきちんとしたシステムが作れるのはメリットだけど管理が面倒
Pukiwikiはどうだろう
URLリンク(pukiwiki.osdn.jp)

115:192.168.0.774
19/04/12 16:01:45.26 U3RvVBMo0.net
ミクシィもSNSはお荷物事業だからそろそろたたむ準備してそうだな

116:192.168.0.774
19/04/12 16:32:28.92 zTEegk2Q0.net
相変わらずパソコン初心者感が満載
おかげさまで、パクりの寄せ集めを「作った」と詐称しても
その不自然さに気付けないという
>>113
この流れだと、セットアップ済みのレンタルWikiの方が無難だと思うよ

117:192.168.0.774
19/04/12 17:13:46.28 OzOD5/Ux0.net
高圧的に的確な指示出しててワロタ

118:192.168.0.774
19/04/12 19:41:50.36 ntUyAAnO0.net
2年ちょっと前に無くなったniftyの@homeで2TB前後なのか…
URLリンク(internet.watch.impress.co.jp)

119:192.168.0.774
19/04/12 19:44:52.10 IEOgrIFJ0.net
初心者とかどうでも良い。使えさえすれば。

120:192.168.0.774
19/04/12 19:48:37.42 3kWgI93v0.net
今必要なのは初心者じゃないけどな

121:192.168.0.774
19/04/12 23:04:13.37 6eRxenyu0.net
使えりゃ何でも良いから不自然だろうが気にしないけどな
使ってて問題がありゃ自分で作り直すまでだ

122:192.168.0.774
19/04/12 23:06:32.84 6eRxenyu0.net
>>115
>セットアップ済みのレンタルWikiの方が無難
確かにな、一からサーバ立てて設定しなきゃいけないWikiだと結局グダりそうだ
そうなるとポピュラーなatwikiあたりかな

123:192.168.0.774
19/04/13 04:31:44.74 PBKRoLHf0.net
ShoutWiki なら無料で MediaWiki 使えるね
とりあえず有能な人が来るまではこれでいいでしょ

124:192.168.0.774
19/04/13 05:50:27.39 oa76VPkq0.net
>>122
それで異存はない。

125:192.168.0.774
19/04/13 10:15:26.73 ybhQs0Es0.net
そしてwikiサービス終了するんですね分かります

126:192.168.0.774
19/04/13 14:37:20.47 BP9fC9wY0.net
終了したらどこか別のところへ移転すれば良い

127:192.168.0.774
19/04/13 17:53:03.37 BP9fC9wY0.net
>>104
「総合」を付けることを発案した者です
単に「ウェブアーカイブ」というとIAやArchive.is等のウェブサービスを使うことを連想している人が多かったようなので、
ウェブアーカイブはそれだけじゃないよ、wget等のツールや自作ソフトを使うのも立派なウェブアーカイブなんだよ、ということを強調したかった
そして、IA専用スレやウェブ魚拓スレで扱われないウェブアーカイブ技術関連の話題の受け皿にしたかった
>>105の言う通り認識にズレがあるみたいだね

128:192.168.0.774
19/04/13 19:36:41.35 LxikEBfR0.net
>>126
126名無しさん@お腹いっぱい。2019/04/06(土) 09:24:43.110
インターネット遺産のアーカイブ系総合スレみたいなところってどこ?
そういうところは5chに無いのかな
総合ってはじめに使い出したのは俺なんだけどな

129:192.168.0.774
19/04/13 20:07:13.70 HJ17KfG20.net
>>127
すまん、ここのスレタイを考えたのは自分だったので思い違いをしてた

130:192.168.0.774
19/04/13 20:07:54.32 HJ17KfG20.net
ID:BP9fC9wY0です

131:192.168.0.774
19/04/14 01:04:52.71 CM5+hhVJ0.net
日本だとウェブアーカイブは著作権侵害(犯罪)になるからこのスレ危ないよね?
逮捕されたくないので消えます

132:192.168.0.774
19/04/14 01:25:36.52 nTd5PtnI0.net
実際その辺は心配ではある
弁護士に聞いてもやめとけで終わりそう
個人でDLしての私的利用ならアリなのかな
とりあえずツール中心の紹介にとどめておくべきかもね

133:192.168.0.774
19/04/14 02:56:48.93 v+D0MDAi0.net
まだ親告罪だから訴えられなければセーフ

134:192.168.0.774
19/04/14 03:08:40.08 v+D0MDAi0.net
ちゃんと説明すると、非親告罪化された著作物は金銭的な利益が絡むものに限られてるので、
大体のウェブアーカイブの場合問答無用で捕まることはないはず(多分)
あと著作権法に抵触するのはウェブアーカイブを無断で公開した場合のみであって、
各個人でサイトを保存して私的に取っておくこと自体は違法でもなんでもない
Archive Team経由でInternet Archiveにデータを寄付してしまえば日本の法律では手が出せないはず

135:192.168.0.774
19/04/14 03:17:25.65 SqtAvvkZ0.net
ウェブ魚拓の運営も捕まってないよね

136:192.168.0.774
19/04/14 03:26:04.24 qw07bbn30.net
削除依頼無視でもしない限りは大丈夫なんじゃないの
アーカイブしたサイトに違法なコンテンツがあったらどうなるかわからんけど

137:192.168.0.774
19/04/14 03:44:40.89 v+D0MDAi0.net
>>134
そうなんだよね
パッと見完全にアウトなサービスだけどちゃんと続いてるってことは、上手くやれば訴訟を起こされるようなことにはならないってことだし
それにあそこの運営は企業だから、事業の一つにもなりうるってことでもある

138:192.168.0.774
19/04/15 03:23:24.42 zgYzoRmr0.net
Shoutwikiでサイト立てるのは誰がやる?
暇だったら自分がやってたんだが正直管理業務とかやってる余裕がない

139:192.168.0.774
19/04/15 22:12:08.31 k4EioB070.net
いっそ最初はwikiじゃなくて各々が個人サイトとかブログで情報まとめたりしてそれらのサイトをリスト化すればいいんじゃないか

140:192.168.0.774
19/04/15 22:26:55.43 +QZpIriz0.net
>>138
全員が個人サイトやらブログやらを持っている訳じゃないし、持ってても手間がかかって面倒だって人間もいるだろう
各々が直接情報を書き込んで行く方が手間がかからない
そうなると、きちんとした体制さえ構築できるのならWikiが一番良い

141:192.168.0.774
19/04/15 22:40:37.04 k4EioB070.net
それはわかってるけどwikiを管理する技術と時間がある人いるのかって話なんすわ・・・

142:192.168.0.774
19/04/15 23:09:48.42 OIWksCm90.net
wikiが必要なほどの量の情報が集まるのかが疑問
アーカイブに関することと言っても


143:ツールの使い方を翻訳するくらいしかできないだろう 本格的なアーカイブ作業をするのならArchiveTeamに入るべき 日本支部を作るにしても結局はArchiveTeam本部の力が必要 日本のサイトは英語圏から見逃されやすいから日本人の注目を集めることでArchiveTeamに貢献することもできるかもしれない ただし本当に技術がある人は既に英語圏のコミュニティに参加しているからどれほど効果があるかは分からない



144:192.168.0.774
19/04/15 23:10:03.44 +QZpIriz0.net
それは確かになぁ
正直>>115がやれば良いんじゃないかという感じがする

145:192.168.0.774
19/04/15 23:17:05.99 +QZpIriz0.net
ArchiveTeamって多くの日本人は入りづらい所があると思うんだ
だからArchiveTeam本部と一般の日本人ネットユーザーの架け橋になるような組織はあって損はないと思う
ArchiveTeamのサイトにはアーカイブについての知見がまとめられているから、MediaWikiなんて大仰なものが必要かは疑問ではあるけど、
彼らの知見を翻訳して日本人向けに公開する場所はそれなりに有意義じゃないだろうか

146:192.168.0.774
19/04/15 23:19:08.03 d2BbUiX90.net
とりあえず最初はgoogleドキュメントみたいな手軽なところでやってみれば

147:192.168.0.774
19/04/15 23:20:08.99 +QZpIriz0.net
日本でウェブアーカイブというと既存のウェブサービスを利用するイメージが強いからね
英語コミュニティで活動する日本人エンジニアはある程度いるが、そうした人の中でもウェブアーカイブについて詳しい人はそんなにいないと思うよ

148:192.168.0.774
19/04/17 12:15:06.93 KC94xqUc0.net
英語コミュニティで活動する日本人エンジニアで、ウェブアーカイブについて詳しい人は結構いると思うが
ウェブアーカイブに関する活動に多くのリソースを使おうと考える人は非常に少ないだろうね

149:192.168.0.774
19/04/17 13:25:55.62 pBKnwE2u0.net
ウェブアーカイブ専門の日本人は、国内コミュニティ・英語コミュニティ問わずかなり少ない
機械学習用のデータ収集やWebサービスの構築などの目的で、クローラを動かしてスクレイピングすることはエンジニアの間でかなり一般的になってきた感じがある
(ウェブアーカイブについての知識があるエンジニアにはこういう事をやってる人が多い)
でもそれは「データ収集手段としての保存」であって、ウェブアーカイブという「目的としての保存」を専門にしている人はほんの一握りよ

150:192.168.0.774
19/04/18 20:54:33.70 231mhavm0.net
Webスクレイピングは仕事になるけどWebアーカイブは仕事にならんものな
専門家が少ないのも道理

151:192.168.0.774
19/04/19 12:33:49.48 Sck2kHkT0.net
結局サイトはどうするよ
Googleドキュメントはお手軽だけど検索エンジンで見つからないし、Wikiサービスがいいと思う
Wikiの選択肢はatwikiかShoutWikiになるのかな

152:192.168.0.774
19/04/20 01:32:08.39 nlnJtIGb0.net
完全に人が消えてるな
>>74の予言が順調に実現して来てて笑う

153:192.168.0.774
19/04/20 02:38:53.71 EOflkhQE0.net
ネット上のデータを残し続けることに皆そこまで意義感じてないんじゃね

154:192.168.0.774
19/04/20 03:32:20.14 j74qt4l90.net
全部のリンクたどると凄い数になる。
数が多いと絞り込むのも大変だし、応答なしになるし、全部処理するということ自体出来るのか?と不安になるくらい次から次へとアドレスが出てくる。
過去に処理したやつ除外すれば…と思ったがかえって遅くなった。
あとURLが一部壊れてしまうのも原因不明。

155:192.168.0.774
19/04/20 10:06:44.64 uNdtbvPn0.net
あまりにも膨大で途方もないから
大抵の人は投げてしまうのさ

156:192.168.0.774
19/04/20 17:20:29.58 nlnJtIGb0.net
>>152
何のツール使ってんの?

157:192.168.0.774
19/04/21 03:12:31.96 BVyeUYoM0.net
昔に比べてネット人口が増えたけど、PCユーザー自体は減ってるんじゃ無いかと…

158:192.168.0.774
19/04/21 16:10:39.88 HZbpua5K0.net
増えてますよ

159:192.168.0.774
19/04/21 16:34:58.79 +zJhJQgi0.net
法人向けは売れてるだろうけど一般家庭はスマホばっかりでPC減ってるでしょ

160:192.168.0.774
19/04/24 03:14:37.20 KjJLD36j0.net
>>151
これって割と深刻なことじゃね?

161:192.168.0.774
19/04/24 04:15:47.92 015wg1cT0.net
旗を揚げられる人間がいないだけなんじゃないかとも思うけどね
知識とやる気が揃ってなきゃできねぇ
俺は白旗なら掲げられるぞ

162:192.168.0.774
19/04/25 00:55:31.95 keVKSV/80.net
旗掲げたいけど今年いっぱいは時間が取れねぇ

163:あめ
19/04/29 05:15:38.68 qYOC6Fj20.net
何をそんなに困ってるのかわからない
後は WebRecoder + ipwb を簡単にできたらおっけーじゃないの?

164:192.168.0.774
19/04/30 02:07:11.84 4bCzSUvm0.net
>>161
ログを読もう
端的に言うとやらなきゃいけない事が多い割に率先して出来る人間がいない

165:192.168.0.774
19/04/30 16:16:38.40 4bCzSUvm0.net
>>161
それだけでおっけーじゃないから皆こうやって話し合ってるのよ

166:192.168.0.774
19/05/03 12:31:09.57 /o+BXXwL0.net
テラバイトを溜めこむ、デジタルゴミ屋敷に棲むデータホーダーたち
URLリンク(www.gizmodo.jp)
断捨離にコンマリ。
そんなテクニックを使いでもしなければ、人は一度手にいれたものは、どうにも手放したくない
生き物のよう。
形ある物は必ず壊れる、諸行無常の響きはインターネットの世界でも鳴りわたっているようです。
わたしはハードディスクはかならずひとつ外付けを使ってデータをローカルと外付けの2回ずつ
保存しているんですよね。いまはそれはNASに変わりましたが、以前はDVDに焼いて保存したり、
FTPを使ったり、クラウドが台頭するようになってからはクラウドも多用していますが、どうも
クラウドもソーシャルメディアも永遠の存在ではなさそう。
今回は米Gizmodoで組んでいる「ゴミ」特集のひとつを翻訳しました。外部ジャーナリストのSteven
Melendezの書き下ろしです。ちょっと長いですが考えさられる内容。ぜひ、じっくりとご覧ください。

167:192.168.0.774
19/05/03 12:57:09.31 rDYW7khY0.net
gizmodoが世間からどういう評価を受けてるかわかった上でそれ貼ってるの?

168:192.168.0.774
19/05/03 17:24:56.15 AncjvUWJ0.net
腐れTwitter.5chまとめサイトよりマシ程度

169:192.168.0.774
19/05/03 17:39:06.81 s/8yyqZn0.net
どちらかというと >>164 はアーカイブに対してポジティブな記事だよ
ちょっと煽り気味の釣りタイトルだけどちゃんとアーカイビストの偉業を紹介してる
素直に褒めたくない意地悪さがにじみ出てるけどね

170:192.168.0.774
19/05/04 00:44:21.71 I7t6q7HU0.net
大量のアーカイブを管理するには個人だと限界があるわな
団体を作って分担作業し、出来ることならInternet Archiveのように社会的信用を得ないといけない

171:192.168.0.774
19/05/04 09:00:26.72 bL2u5kxf0.net
動画は円盤保存
画像と文字は印刷保存

172:あめ
19/05/05 05:55:19.34 YysNkSBx0.net
>>162
実はスレがたったときから居て1から読んでるんだよなぁ
記事少し作るだけでここまで悩む不思議
>>74 の未来を変えるために降臨したのに

173:192.168.0.774
19/05/05 15:45:48.96 fUOQo4az0.net
>>170
ならあんたが未来を変えてくれ

174:192.168.0.774
19/05/05 15:49:26.42 fUOQo4az0.net
そもそもIPFSで本当に良いのかって話になったまま議論が止まってたはず
そこからArchive Team Japan的なものを作ろうじゃないかって話になって、そんなものに貢献できる日本人はもう本家に行ってるだろって話になって、
日本人でウェブアーカイブやってる人自体少数だよねって話になって、結局グダグダになって現在に至る

175:192.168.0.774
19/05/06 19:41:21.46 6bTK53bC0.net
まず5ch自体オワコンだから人が集まるはずないよな

176:192.168.0.774
19/05/07 16:01:29.67 nOGBK00T0.net
それ
5chで集められる人数なんてたかが知れてるから、外部サイト作ってTwitterとかで広めないとキツい
優秀なエンジニアはTwitterにかなり集ってるし、関心を持ってもらえれば良いんだが

177:py
19/05/14 19:06:58.64 cP8wStLG0.net
URLリンク(u1.getuploader.com)
web2IAWBM.dms ver0.000.007 WayBackMachineに保存 (web.archive.org) 2019/05/14
web2IAWBM.dmsはIrvineとDorothy2を使ってInternet Archive WayBack Machineに自動登録(保存)するためのスクリプトです。
自動で全てのリンクをたどって保存してくれるはずです。
web2IAWBM.dmsは素人が作った物なので至らない点も多々ありますが、
一応使える水準になったと思われるので公開します。
無料のウィルススキャンはしましたが、念のためもう一度スキャンされることをお勧めします。
同梱のDorothy2(の一部)は別の方が作った物です。
■ Irvine初回起動前に必ず jwordフォルダを削除してください。■
動作試験環境:windows10pro Irvine1.3.1

178:192.168.0.774
19/05/15 02:01:39.76 kfIYGIBa0.net
>>175
Internet Archiveスレでも情報共有しとけ
手動Save Pages Now以外の方法を知らない人達ばかりだから相当喜ばれるぞ

179:192.168.0.774
19/05/16 17:03:10.13 /p1LTvuX0.net
ヤフー「Yahoo!コンテンツディスカバリー」サービスの終了を発表
URLリンク(media-innovation.jp)
【解約と配信停止のスケジュール】
6月中旬頃 解約通知書の発送開始予定
9月2日 コンテンツ修正相談受付終了
9月6日 コンテンツ修正相談の結果問合せ終了
9月13日 入稿時審査受付終了・タグ発行・掲載面ブロック等の配信設定業務受付終了
9月20日 入稿時審査の問合せ終了
9月30日 Yahoo!コンテンツディスカバリー 配信停止(順次)
11月29日まで Yahoo!コンテンツディスカバリー 管理ツール等の最終停止(順次)

180:192.168.0.774
19/05/18 21:20:44.41 thTbnaVW0.net
Yahooブログアーカイブ活動スレより引用
0031 Trackback(774) 2019/05/18 14:30:36
yahooブログは「記事がありません」のページで404を返すのだが、web2IAWBM.dmsが404のページを解析できなくてリンクをたどれていない可能性がある。
ブラウザでは普通にリンクをたどれる。
ID:l5DCkLS9

181:192.168.0.774
19/05/21 16:36:54.75 nRmqsex+0.net
サイトごとにやってると分かるけど、途中で止まってることがよくあるから、
終わったらブラウザで確認した方が良い。

182:192.168.0.774
19/05/23 11:34:52.72 LNdDY8yz0.net
Archiveteam (Google 翻訳)
URLリンク(translate.google.co.jp)

183:192.168.0.774
19/05/26 10:51:40.72 oi3wUViY0.net
Index of /
URLリンク(infoseek_rip.g.ribbon.to)

184:192.168.0.774
19/05/26 11:04:21.99 oi3wUViY0.net
>>78
GeoLog Project
URLリンク(geolog.mydns.jp)
> お知らせ
>
> 2019/05/12 16:30
> ・URLを変更しました。リンク切れ等の不具合がもしあればご連絡ください。
> まだ旧ドメイン名が残っている部分がありますが、こちらは順次修正します。
> ・GeoCities URL収集 URLリンク(geo.98nx.jp) 様にてアーカイブされたデータを順次統合中です。
>
> 2019/05/08 23:50
> ・近日中に、以下のとおりURLを変更します。
> 旧URL:URLリンク(thaliana.mydns.jp)
> 新URL:URLリンク(geolog.mydns.jp)
> 移転後も、旧URLはリダイレクトとして残す予定です。

185:192.168.0.774
19/05/26 16:31:09.43 LgR2vTtS0.net
>>1
>>3
>>5
>>6
死ね無能基地外

186:192.168.0.774
19/05/28 23:18:36.54 6dDxcHOe0.net
中学生かな?
まだ夏休みには早いと思うんだけど

187:192.168.0.774
19/05/29 00:22:00.05 LYQto7Hh0.net
毎日が日曜日

188:192.168.0.774
19/05/29 02:16:14.09 rgaJjZzR0.net
ん、IA調子悪いのか?

189:192.168.0.774
19/05/29 03:41:38.21 rgaJjZzR0.net
涼しいからスクリプト走らせようと思ったのに

190:192.168.0.774
19/06/07 03:14:38.91 EZciTwz+0.net
サーバーエラー出てる間のは保存されてないのに緑のチェックマークで成功扱いになるから注意して

191:192.168.0.774
19/06/09 15:40:45.70 S0wca8Kg0.net
メーリングリストの老舗「freeml」終了 22年の歴史に幕
URLリンク(www.itmedia.co.jp)

192:192.168.0.774
19/06/12 05:55:56.93 DnPdDFAp0.net
ニュース記事は2ページ目以降が保存されていないことが多いよな。
魚拓も、1ページ目を保存しただけでは、2ページ目以降は保存されないよな?
パッと見保存されているように見える

193:192.168.0.774
19/06/13 02:01:24.77 DBW1u0DS0.net
Webcite、何故かアクセスできない

194:192.168.0.774
19/06/13 02:43:36.27 Fctk1dcQ0.net
>>191
あぁまたか、あそこは良く DNS から消える。
でもサーバはしっかり生きてるんだな、これが。

195:192.168.0.774
19/06/17 14:43:18.30 Xz9V42zC0.net
GASにアーカイヴ作業させられないかな
10分おきに起動

196:192.168.0.774
19/06/18 15:34:14.81 MI2+ZpWl0.net
ニュース記事みたらSave Pageするのが習慣になってきた。

197:192.168.0.774
19/06/19 17:32:14.54 iJXbWhxE0.net
>>193
できそうな気もするがどうなんだろう

198:192.168.0.774
19/06/21 09:20:23.40 poW6yzCt0.net
同一のIPからの連続取得は制限されています。
同一のIPから24時間に60回以上の取得は出来ません。
URLリンク(i.imgur.com)

199:192.168.0.774
19/06/21 14:13:34.55 9K2NkZ870.net
一日に間隔をあけて数回アーカイブするくらいなら何とかなるのでは
誰か試して見てくれ

200:192.168.0.774
19/06/22 15:09:24.70 S8tpOgcn0.net
ArchiveBoxというものを見つけた
自前のマシンでウェブアーカイブをするためのオープンソースソフトウェアだって
URLリンク(archivebox.io)

201:192.168.0.774
19/06/22 15:19:39.24 S8tpOgcn0.net
>>198
基本的にCUIで操作するものなので注意
自分でリンクを辿るのではなく、アーカイブするURLのリストを読み込ませる方式らしい
HTMLやWARCはもちろん、画像やPDFでの出力にも対応してるのが便利そう

202:192.168.0.774
19/06/23 20:49:35.28 27h915gg0.net
[Jav


203:aScript] Wayback Machine Script - Pastebin.com https://pastebin.com/ZxryGY8F Automatically save the page you visited (or all links you can see) to "Wayback Machine". 試していないので使えるかどうかはわからない



204:192.168.0.774
19/06/25 23:07:44.50 5uQFWJVA0.net
IAが昼過ぎからずっとメンテ

205:192.168.0.774
19/06/26 22:53:23.97 Qb0QQC6K0.net
配布終了したフリーソフトの保管庫も欲しい

206:192.168.0.774
19/06/28 15:19:25.28 JC6hqmSv0.net
getASFstreamも実行ファイルがIAから削除されてるな。

207:192.168.0.774
19/06/28 15:22:44.92 JC6hqmSv0.net
getASFstreamはVectorのが生きてたからまだ平気か。

208:192.168.0.774
19/07/03 17:10:46.83 0BbpBYkz0.net
ルートラボ2020年3月末終了
URLリンク(www.itmedia.co.jp)
これはWayback Machineでも保存できないので同じようなサービスにデータを
移行したもの以外のデータは消え去ることとなる。
これからこのようにアーカイブできないデータは増えていく一方だろう。

209:192.168.0.774
19/07/06 04:08:11.16 6FkUH5GE0.net
アーカイブできないデータの筆頭がオンラインゲーム・ブラウザゲーム・ソーシャルゲームだよねえ

210:192.168.0.774
19/07/06 14:21:01.48 GinQGT8r0.net
昔流行ったフラッシュはアドレス直打ちSavePageNowで保存できたけどゲームは分からん。

211:192.168.0.774
19/07/10 09:08:38.60 /L/aFHKF0.net
goo blogの「株式日記と経済展望」がいつの間にか見れなくなってる
IA見ると2019年1月7日の記事の最後にしばらく休みますと書かれている
URLリンク(web.archive.org)

212:192.168.0.774
19/07/10 16:20:17.46 fnXJF4Pm0.net
Wayback Machineやたら重いんだけど
時間帯によるもの?

213:192.168.0.774
19/07/11 07:59:17.31 7Pk3v1uW0.net
スクリプト走らせてる人が70人近くいるはずだし重くなっても不思議は無い。
保存されているかを確認するために実際に開いて確認してから保存している。
同じページを何度も確認していたなんてこともあると思う。

214:192.168.0.774
19/07/13 00:39:32.34 Y10L19C40.net
ここの住人にYahooブログをアーカイブしてほしい

215:192.168.0.774
19/07/13 13:20:12.05 LEU3bec70.net
異様に書き込み減ったし多分みんな保存してる。
個別にURL指定してくれれば優先する。

216:192.168.0.774
19/07/16 11:16:16.55 hXIS632N0.net
ジオシティーズの時のようにURal収集フォームみたいなのがあれば便利なんだけどな

217:192.168.0.774
19/07/16 11:17:07.12 hXIS632N0.net
タイプミス
URLな

218:192.168.0.774
19/07/17 12:47:13.54 8BflpvwW0.net
質問です。
Wayback Machineを使って、見たかったサイトは見つかったのですが、画像はありませんでした。
その画像を見つけることはもうできないのでしょうか?

219:192.168.0.774
19/07/21 06:02:59.22 PLd/1lFQ0.net
GASは程度にもよるが増やしすぎるとすぐこうなる。思ったより使えない。
> サービスで 1 日に使用しているコンピュータ時間が長すぎます

220:192.168.0.774
19/07/25 09:40:55.79 1TUd1BHY0.net
>>215
諦めた方が早いかと思われ

221:215
19/07/28 17:53:01.59 2hYx5uH+0.net
>>217
そうなんですか、残念ですがありがとうございます

222:192.168.0.774
19/07/29 23:47:11.38 0ZDdCLv30.net
URLリンク(i.imgur.com)

223:192.168.0.774
19/07/30 03:06:48.87 w+bM/0cg0.net
ロリコンはネトウヨ
女叩きしてるのはBBA
DQNも何方かと言えばネトウヨ色が強い
5chとネット上で、金魚の糞を巻き散らかしてるのはコイツら

224:192.168.0.774
19/07/30 18:42:36.22 rAPLQn650.net
改憲なんてしてもアメリカが作った自作自演の戦争に巻き込まれて戦争犯罪に加担するだけじゃん。
愛国者なら9条改正には反対しないと。どこの国も上層部は裏で繋がっている、つまり中国韓国ロシアはアメリカと通じていて、本当の敵はアメリカの中にいる。
敵国条項は残っているんだから日本がちょっとでも怪しい動きしたらロシア中国韓国アメリカから攻撃されて今度こそ日本無くなるぞ。
そして、緊急事態条項は独裁完成法。
独裁完成したら安倍晋三が死ぬまで安倍政権が続くぞ。

225:192.168.0.774
19/08/06 03:38:43.37 AvYpPa1T0.net
ヤプログ! サービス終了のお知らせ
URLリンク(yaplog.jp)

226:192.168.0.774
19/08/16 10:44:48.49 c/w5mu590.net
>>175のやつ最近のログ見たら保存されてないのに保存済みと表示されて保存してないURLある事に気付いた。
IA側が仕様変更したのか?

227:192.168.0.774
19/08/16 10:48:02.20 c/w5mu590.net
>>223
Show Allでは確かにキャプチャーがあるのに、それを開くとHrm.で表示できない。

228:192.168.0.774
19/08/17 23:15:30.53 Z4rWSf4u0.net
閉鎖がアナウンスされてるサービスについては、
Wikipediaから参考文献などとしてリンクを貼られているサイト、Twitterでシェアされているサイトを優先してアーカイブした方がいい
ジオシティーズの時もこの方式が取られてたと思う
Yahooブログのアーカイブを考えてる人がいたら参考にしてくれ

229:192.168.0.774
19/08/18 05:20:36.47 zB3uGj7T0.net
>>222
アドブロックが普及しすぎて、ブログサービスはどこも儲かっていないらしい。

230:192.168.0.774
19/08/18 22:44:14.13 lH1BP5oP0.net
最近はアンチアドブロックとかもあるよね

231:192.168.0.774
19/08/18 23:41:17.08 m6no0JBr0.net
>>226
スマートフォンだと余り普及して無いけど、
スマートフォンでブログやる人って少ないのかな…

232:192.168.0.774
19/08/21 04:09:45.48 x9gIR2Do0.net
URLリンク(shibuya-game.com)
諸般の事情により、SHIBUYA GAMEは2019年9月20日をもちまして更新を停止し、2019年末をもって閉鎖します。

233:192.168.0.774
19/08/21 14:50:30.18 b3NNDeZP0.net
>>229
URLリンク(shibuya-game.com)
このURLを起点に全記事のURLを抜き取ってInternet Archiveなり何なりに投げればいいな
作業する余裕のある人あと1か月でよろしく

234:192.168.0.774
19/08/21 14:54:06.94 b3NNDeZP0.net
>>230
今のところ1768個の記事があるらしい

235:192.168.0.774
19/08/22 23:08:10.94 c46PChaz0.net
水谷修のサイト保存してくれた人いるのか

236:192.168.0.774
19/09/14 14:16:10.61 Xphq9GAC0.net
情報が古くても需要がありそうなのは
小説・漫画・映画のレビュー・考察サイト
ゲーム関係のサイト(攻略サイト・レビューサイトなど)
Web小説
あたりか

237:192.168.0.774
19/09/15 22:34:40.70 6+5CjbXu0.net
興味あるので保守

238:215
19/09/20 05:31:59.01 QM3MI5eR0.net
アーカイブしたいサイトがある時、どうやって保存するの?
Winなら巡集みたいなソフト使ってやるの? Macではターミナル?

239:192.168.0.774
19/09/23 03:23:58.52 TCqq29480.net
ニコ生アラートのバイナリ保存されていない…残念

240:192.168.0.774
19/09/23 03:47:25.00 TCqq29480.net
>>235 >>175



242:215
19/09/23 05:25:08.76 2+4wj0ye0.net
>>237
Windowsしか書いてないけど、macで行ける?

243:192.168.0.774
19/09/23 08:45:19.53 TCqq29480.net
Macはもってないので分からない。
>>175のやつWindowsでも機能していない可能性がある。保存されたって出てるけど実際は保存されていないとか。

244:192.168.0.774
19/09/25 18:16:46.74 TR/fy2AH0.net
サービス終了に関するご報告
URLリンク(www.rich.co.jp)
>この度、2015年よりサービスを続けてまいりましたメディア「ヘルスケア大学」について、当社事業領域の整理に伴い社内リソースを別領域に集中させることに決定し、2019年9月30日にサービスを終了することとなりました。

245:192.168.0.774
19/09/27 23:51:14.06 4H4+28EN0.net
ワイ「古い車買ったろ。整備は大変そうやけど、ネットには先人の知恵がいっぱいや」
1 :名無しさん@おーぷん:19/09/27(金)23:31:11 ID:2JG主 ×
ジオシティーズ「ん?」
ディオン「んん?」
ニフティー「んんん?」
2:名無しさん@おーぷん:19/09/27(金)23:31:38 ID:2JG主 ×
先人の知恵、消える
3:名無しさん@おーぷん:19/09/27(金)23:31:46 ID:6EZ ×
しゃーない
5:名無しさん@おーぷん:19/09/27(金)23:32:30 ID:cUL ×
悲しいなぁ…

246:192.168.0.774
19/09/28 08:08:34.63 bq44L+WV0.net
各アーカイブサービスの検索機能が優秀なら良いんだけどな
保存してもそれを探し出せないなら死蔵と変わらんな

247:192.168.0.774
19/09/29 01:09:52.47 q9QXqdnD0.net
無料ソフトウェアのサイトは保存されてても実行ファイルを含むzipファイルは保存されていません。
可能な限り保存します。

248:192.168.0.774
19/09/29 01:34:12.78 T/2cpgi20.net
>>242
単にアーカイブしたファイルの中身に対して検索を行えるかどうかの話。
それを優秀などという語でしか表現できない貧弱なボキャブラリー。

249:192.168.0.774
19/09/29 02:04:44.22 q9QXqdnD0.net
Googleとかで「 site:web.archive.org」を付けて検索するのが現実的かと。

250:192.168.0.774
19/09/29 11:02:46.70 IeSWqng50.net
wikiうんぬんの話が出ているので、いくつか使ったことがあるから書いておくけど
atwiki SeesaaWiki FC2wiki などはそれぞれ記法が独特でバックアップが取れない
atwikiは特に仕様がころころ変わる上に不具合発生率も高くて、書き込みだけに集中できないし
アカウントを削除してもサーバーからデーターが完全削除されないみたい
pukiwiki/pukiwiki plusベースのところはdumpデーターは取得できるけど
運営が個人だったり個人で会社を作ってやっているところはその人がどうにかなると連絡が取れなくなる
それでもサーバーやドメインが維持されいるとサービスは利用できるけど
ある日突然使えなくなることがある

251:192.168.0.774
19/09/29 12:20:42.26 T/2cpgi20.net
コンテンツ制作側としてのバックアップの話をここでやってどーするの。

252:192.168.0.774
19/09/29 12:33:23.11 IeSWqng50.net
個人サイトで無料/有料に関わらず共用サーバーを使っている場合
サーバー管理会社によってサーバーのスペック変更が行われると
サービスが終了していなくてもサイトが閲覧不可になることがあるよね
PHP5.3までしか対応していないものを使ってサイト運営をしているのに
サーバー側がPHP7.2にしちゃったとか
サーバーを丸ごと交換してデフォルトがUTF-8になったのに
サイトのほうでcharsetを指定していないとか
DBのバージョンが上がってデーターが呼び出せなくなった
等の理由で、閲覧が困難になるケース
閲覧しに行って真っ白だったり文字化けしていたりするのはこの辺の理由

253:192.168.0.774
19/09/29 12:56:37.11 T/2cpgi20.net
なんだ、新手のスレ埋め立てかw

254:192.168.0.774
19/09/29 1


255:3:09:54.41 ID:T/2cpgi20.net



256:192.168.0.774
19/09/29 17:04:53.57 q9QXqdnD0.net
このスレで使うwikiが消滅する場合の対策の話じゃないの。

257:192.168.0.774
19/09/29 22:23:17.96 n8nVup7e0.net
>>244
人の揚げ足取る暇があったらアーカイブしろ

258:242=252
19/09/29 22:32:55.86 n8nVup7e0.net
だいたいページ内容の走査だけで検索機能実装しても優秀とは到底言えないからな
検索エンジンサービスのようにページランク等を考慮して初めて、優秀というかようやく使いものになる
アーカイブサービスのように膨大な数のページを検索しなきゃいけない場合は、そういったアルゴリズムの必要性がさらに高まる
こういう話をいちいちするのが面倒だから話を全部ひっくるめて「優秀」の一語で表現した
これで満足か?

259:192.168.0.774
19/09/29 22:36:12.79 n8nVup7e0.net
ページランクは固有名詞に近いからランキングアルゴリズムと言うべきだったかもしれない

260:192.168.0.774
19/09/29 22:40:09.36 n8nVup7e0.net
クソリプが跋扈するツイッターや人口の多い他の5ch板ならまだしも、
このご時世にこんな専門板で、横からいきなり会話してる訳でもない相手からレスが飛んでくるとは思わなかった
随分面食らったわ

261:192.168.0.774
19/09/29 22:48:43.54 T/2cpgi20.net
Wiki立てる話自体が消えたと思ってたw

262:192.168.0.774
19/09/30 11:04:24.16 MZVGPwZn0.net
>>256
また話が出るかもしれないから一応書いておいただけ
atwiki上のサイトで差分が見れないところがあったから
archive.orgで探してみたけど
archive.orgのbotをatwikが蹴っているみたいで最近はエラーページが保存されちゃってる
意図的にそのページを残したい人がarchive.orgのアカウントを作って残す場合は別として
消えちゃったページを後からarchive.orgで探すのは難しくなっていると思うよ
クローリングの期間がだいぶ開いている
これはGoogleのキャッシュもそうだと思う
サイトを運営している人がGoogleのアカウントを取得して
Google Search Consoleからクローリングのリクエストを出して当然ってなってきているみたい

263:192.168.0.774
19/09/30 15:43:12.38 yT22Xmkr0.net
>>245
実際に検索してみると分かるけど、その方法だと引っかからないアーカイブが結構あるんだよな
Googleのクローリングが追いついてないんだと思うけど

264:192.168.0.774
19/09/30 17:16:29.06 yT22Xmkr0.net
【ヤフー】Yahoo!ブログ【アーカイブ】
スレリンク(blog板)/
74 Trackback(774) 2019/09/30(月) 17:07:59.58ID:th5gp/Yr
Internet ArchiveでYahooブログを保存すると遷移スクリプトが発火する話なんだけど、
web.archive.org/save のページから「Save outlinks」にチェックを入れて保存すると
どうもYahooのトップページに遷移されずにアーカイブできるみたいだ
さっき偶然発見して何回か試したけど今のところ全て上手く保存されてる

265:192.168.0.774
19/10/08 01:13:45.16 MXp0IOeT0.net
Twitter埋め込みが一切保存されない問題

266:215
19/10/08 08:01:40.33 GswYVQiV0.net
>>260
アメリカの図書�


267:ルにいけよ



268:192.168.0.774
19/10/08 14:30:06.60 fXMCPs+v0.net
アメリカの図書館はもうTwitterの全保存やめたんじゃなかったか

269:192.168.0.774
19/10/18 01:06:58 F6Bah8760.net
当時の「魔法のiらんど」上で作られたサイトは現在ではほとんど残っていない。
WebArchiveでも表層しか掘れないサイトばかりである。
当時の掲示板でのやりとり等はもちろん、かのクレリアさんが自サイトに書き記していた構築解説ですらも現在は散逸してしまった。

270:192.168.0.774
19/10/25 10:22:59.94 ZZgmHhFq0.net
手動で一ページずつやってもToo Many Requestsになって捗らないな。
Wayback Machineは金払うから一気に取得かアップロードさえて欲しい。

271:192.168.0.774
19/11/03 20:32:03.04 I05N5XH+0.net
もしかしたらしたらば掲示板やばいかもしれんな

272:192.168.0.774
19/11/03 22:05:54.91 IGp2y1Ub0.net
>>265
理由は?

273:192.168.0.774
19/11/04 01:30:31.73 d2EYioZ60.net
>>264
有料取得依頼みたいなんなかったっけ
最近Archive Today重いのは俺だけかい?
すぐNetwork Errorになる

274:192.168.0.774
19/11/04 07:36:42.44 1kde+9Me0.net
したらば掲示板が丸一日メンテナンスしてたみたいですな。

275:192.168.0.774
19/11/05 18:04:06.02 P7AeCNyG0.net
>>258
そういや最近グーグルってサイト作成者がクロール要求しないと
なかなかクロールしてくれないってどっかの記事で読んだような気がする。
↓こういうのをテキストエディタで作ってからIrvineの「URLを展開して貼り付け」をすると全頁まとめて登録できる。画像一覧とかも同様
URLリンク(blogs.yahoo.co.jp)最後のページ番号]
例のスクリプトの登録漏れをある程度減らせると思う。

276:192.168.0.774
19/11/10 04:30:49.20 gZ07cm7t0.net
誰かここに載ってるサイトだけでも保全してくれ
yahoo!ブログ使用サイト - DoldoWorkz
URLリンク(moondoldo.com)

277:192.168.0.774
19/11/10 19:44:29.07 OJOj/1ou0.net
何故自分でやらないのか

278:192.168.0.774
19/11/10 22:43:10.93 Qg+FaNtt0.net
ジオシティーズの時もそうだったが、特定サービスのアーカイブって何だかんだ言ってかなりの時間と労力を必要とするんだよ
自分でやりたいのは山々だが、そこに労力を注ぎ込める余裕がない
なのでアーカイブをやっている人が多少は集まっているであろうここに投げた

279:270=272
19/11/10 22:45:26.50 Qg+FaNtt0.net
>>270のサイトの作者と自分は何にも関係ないことは一応断っておく

280:192.168.0.774
19/11/11 09:12:05.10 DmcMWPY20.net
Yahooブログにアーカイブすべき物なんてあるのか?

281:192.168.0.774
19/11/11 10:42:59.86 HD2VAMf80.net
単なる日常記録も多いけど、そこらのジオシティーズよりも濃い情報が詰まってるものも多いよ
自分が知ってる範囲だと、今は消えた街並みの記録や京都のマイナーな神社の訪問記、イギリスでの聖人信仰の研究サイト、ゲーム業界の裏話やゲーム攻略などがあるよ
自分が知ってる範囲のブログだけはいくつかWayback Machineに突っ込んだが、他にも有益な情報がたくさん眠ってると思うよ
Yahooブログなんて消えても誰も困らないだろうと思ってる人が結構いるみたいだが、とんでもない偏見だよ

282:GeoLog Project
19/11/11 20:36:22.34 kHI2SrFf0.net
>>270
試しにhttrackに突っ込んだら画像のリンクが取れず、
調べたら元のHTMLにはないリンクを後から生成して突っ込んでますね。。。
動的サイト嫌いです。。。

283:192.168.0.774
19/11/11 23:27:18.77 HD2VAMf80.net
動的サイトのWebアーカイブ用クローリングとなるとHeritrix(Internet Archiveが使ってるクローラ)の出番ですね
実績もあるし高性能で拡張性もそれなりにあるものの、マシンの要求スペックが比較的高めなのが難点か

284:192.168.0.774
19/11/14 17:49:41.79 zR5VNa+N0.net
Heritrixの最低動作スペック自体はそこまで高くないよ
ただ、リッチなコンテンツを含むページをアーカイブしようとするとメモリを食うことがある
あと基本的にLinux環境しかサポートしていないので、人によっては手が出しにくいかもしれない

285:GeoLog Project
19/11/15 00:48:08.16 jfECE9r+0.net
Windows でも動くには動きますね
しかしやたら遅い・・・

286:192.168.0.774
19/11/17 22:45:04.48 n+VdMpHA0.net
メモリ持て余してるけどストレージが足りない
ArchiveTeamWarrior的なのがあれば参加するんだけど

287:192.168.0.774
19/11/19 15:35:27.56 WcaVo5T50.net
ArchiveTeamに常駐してる人がここにいれば捗るんだが

288:192.168.0.774
19/11/22 05:16:46 8zBYuW1S0.net
むしろ元のHTMLの方には正しいリンク先URLがあるんじゃないの。
それで画像取得できないだろうか

289:GeoLog Project
19/11/22 20:15:18.83 fS5sbz5I0.net
>>282
拡大すると大きめの画像のあるページってどこかありますか?

290:192.168.0.774
19/11/24 23:10:35.97 Sj5SnpvV0.net
>>283
「拡大すると大きめの画像のある」って言うのがどういう意味かよく分からないので、もう少し詳しく説明をお願いしたい

291:215
19/11/25 05:25:36 U4MdffN+0.net
>>284
ライトボックスとかじゃない?

292:GeoLog Project
19/11/25 20:34:05.84 KvWZhxVE0.net
>>284
言葉足らずですみません
Yahoo!ブログは画像をクリックすると別ページに飛んで元の大きい画像が見られるらしいのですが、
ページのimgタグに書いてある画像より、元画像の方が大きい例があるかどうかを気にしました
>>282 の「元のHTML」に元画像へのリンクがあるのか確認したかったので

293:192.168.0.774
19/11/27 13:24:37 +cJOWs3G0.net
Twitter、休眠アカウント削除へ 対象アカウントに12月11日までにログインするよう警告
URLリンク(www.itmedia.co.jp)

これ亡くなった著名人などのアカウントも容赦なく削除するらしいから、期限までに出来る限りアーカイブしておきたいところ
Twitterで #休眠アカウント削除 がトレンド入りしてるから、アカウントが消えるのが嘆かれてる故人のアカウントはこれでかなり拾えると思う

294:215
19/11/27 18:54:59.39 y0cHyaRo0.net
>>287
やり方おせーてくれたら手伝えるけど

295:192.168.0.774
19/11/27 19:47:11.55 +cJOWs3G0.net
ArchiveTeamが動き出したな
URLリンク(twitter.com)
(deleted an unsolicited ad)

296:192.168.0.774
19/11/27 21:52:41.92 +cJOWs3G0.net
>>288
とりあえず一番手っ取り早い方法は、>>289のツイートに貼られてるリンク先の入力フォームから、
保存して欲しいアカウントのIDを入力して送ること
もしかしたら他にも誰かが保存プロジェクトをやってるかもしれないから要調査だな

297:192.168.0.774
19/11/30 02:24:56 mj1OwWx+0.net
minori official web


298: site http://www.minori.ph/ このサイト、キャプチャできない



299:192.168.0.774
19/11/30 04:08:01.49 IS98dA580.net
>>291
海外からのアクセスに対し 403 Forbidden エラーを返すよう
設定されているみたいですから、Internet Archive や Archive.is では
無理でしょうね。
さらにそのエラーページは他サイトへの遷移スクリプトが
埋め込んであるので、フツーの人はエラー扱いされていることすら
気付けないでしょう。
当該エラーページの HTML ソースを貼っておきます。
URLリンク(pastebin.com)

300:215
19/11/30 05:13:24.84 Yk7eFuvo0.net
>>290
DLだけ、自分でってことはできないの?

301:192.168.0.774
19/11/30 10:31:13.20 b+Bfz/GQ0.net
>>293
自分のPC中にアーカイブをローカルで保存することは出来ないかってこと?
Heritrixなど動的サイトを処理できるクローラを使えば問題なく出来る、出来るけどアーカイブは死蔵してたら意味が無いからね
自分だけで閲覧する用に保存しておくこともありうるけどそれはアーカイブとは言えない
ArchiveTeamが収集したファイルはWayback Machineに登録されるようになってるので、そういう意味では安全

302:192.168.0.774
19/12/02 04:15:35.70 Z+Zveon+0.net
最近のToday
URLリンク(i.imgur.com)

303:192.168.0.774
19/12/03 03:09:24.37 zKh+7e4i0.net
Current Running Warrior Project: Yahoo! Groups

304:192.168.0.774
19/12/03 03:21:33.26 W45k6bBP0.net
Yahoo GroupsはYahooブログとは全くの別サービスだから早とちりすんなよ

305:192.168.0.774
19/12/03 03:23:09.41 W45k6bBP0.net
これのことだよ
URLリンク(japanese.engadget.com)

306:192.168.0.774
19/12/04 17:38:24.46 OvwZOsOX0.net
本日のToday
URLリンク(i.imgur.com)

307:192.168.0.774
19/12/06 00:57:47 QIt7pou20.net
300

308:192.168.0.774
19/12/14 23:22:02.29 AA4HPrSj0.net
Ci-en移行に伴うDLsite blogサービス提供終了予定のお知らせ
URLリンク(home-info.dlsite.com)

309:192.168.0.774
19/12/15 18:24:18.14 r3L4BzMu0.net
Yahooブログ今日までか

310:192.168.0.774
19/12/16 16:10:29.42 RltCXRJ+0.net
ほとんど何もできなかった

311:192.168.0.774
19/12/16 19:43:00.36 oxia7Ong0.net
少しは頑張れよ

312:192.168.0.774
19/12/16 22:27:54.54 P9Fjib/40.net
人いねえもの
呼び掛けが不十分だとこうなってしまう

313:192.168.0.774
19/12/17 00:52:29.58 SWkI+H1w0.net
>>272 >>294
リンク構造維持できて程々の容量に収まるなら分割rarやzipに纏めてもらってもいい。
今は低速スマホしか使う余裕無くなったから巡集やWeboxみたいな取り込みアプリで一括アーカイブ化するのも無理だし
読売の縮刷版CD/DVDなんかは1年分で12万もするし

314:192.168.0.774
19/12/17 04:05:12 FbEfAMeJ0.net
スマホ(笑

315:192.168.0.774
19/12/17 23:19:41.41 ZjrTQ21f0.net
ネットサービス企業は、スマホからの収益がメインやから、
PCだけに成ったら大倒産時代や

316:192.168.0.774
19/12/18 01:13:33 7iAMrhRQ0.net
色々と話がとっ散らかって来たな
>>306からして何が言いたいのか今一つ要領を得ない

317:192.168.0.774
19/12/19 20:23:09.25 s5RLoz8q0.net
もうyaplogに行ってる

318:192.168.0.774
19/12/19 22:41:03.12 yyGOrfnZ0.net
yaplogって1月でサービス終了するらしいけど
URLリンク(nlab.itmedia.co.jp)

319:192.168.0.774
19/12/19 23:36:07.17 P9Gt+F0u0.net
geocitiesのアーカイブサイトは複数ある様だけどYahoo!ブログも�


320:Lる?



321:192.168.0.774
19/12/20 01:21:34.83 W2QHpneb0.net
>>312
Yahooブログスレの方にも載ってないから今のところないんじゃないかな

322:192.168.0.774
19/12/28 07:55:33.34 GiJFu1gz0.net
Archive.TodayはグーグルやBingのキャッシュを保存した場合でも原本URLを認識できるのが素晴らしい。

323:
19/12/29 21:46:36.02 3C6Rg8sC0.net
archive.todayのTwitterの魚拓がモバイル版にならなくなった?
アカウントは新UI、ツイートは旧PC用UI

324:
19/12/30 13:29:31.10 dXRB6Vq/0.net
>>315
それどころかアカウントの魚拓がかなり下の方までスクロールされた状態で保存されるようになった
つまり1回の魚拓でかなりたくさんのツイートが保存されるようになった
いいね

325:192.168.0.774
19/12/30 23:49:45.17 Sts0O97Y0.net
>>314
検索で出ないことあるからやっぱ微妙だった

326:192.168.0.774
19/12/31 18:45:45.57 eDEktBsz0.net
Webサイトの保存ってみんなどうやってしてるの?
このスレにすでに書いてたらすまん

327:192.168.0.774
20/01/02 07:10:20.03 5F6LDkXn0.net
ローカル保存&魚拓

328:192.168.0.774
20/01/02 10:39:14.28 ucP82yGj0.net
魚拓ってのは
URLリンク(megalodon.jp)
でローカル保存ってのはchromeなんかにあるオフラインで読む系機能であってる?

329:192.168.0.774
20/01/03 19:36:03.17 c4MpYdMH0.net
それであってる

330:192.168.0.774
20/01/04 18:01:40.04 G3xvEvXn0.net
激重で読み込めない…

331:192.168.0.774
20/01/04 20:37:51.83 YBh70eiZ0.net
Scheduled Maintenance
The Internet Archive's sites are offline for scheduled maintenance and upgrades.
Please check our twitter feed @internetarchive for updates.
Sorry for the inconvenience.

332:192.168.0.774
20/01/05 21:23:51.28 JtWpXhr50.net
Yaplog取ってたらこんなの出てた
URLリンク(web.archive.org)

333:192.168.0.774
20/01/06 15:29:48.32 HEWxGNJX0.net
>>321
ありがとう

334:192.168.0.774
20/01/09 07:45:46.22 0Jucozb10.net
4年以上未ログインの Yahoo! JAPAN ID、2020年2月から順次利用停止へ
URLリンク(japanese.engadget.com)
これひょっとしてYahooボックスで公開されてるファイルとかもごっそり消えちゃうんじゃ・・・
と思ったけどほとんど見かけないから影響あんまり無いかな

335:192.168.0.774
20/01/09 21:40:15.88 y/kpjRu/0.net
Yahooボックスってサービス終了して無かったのか…

336:192.168.0.774
20/01/18 22:33:46.55 Mw+axOW50.net
魔法のiらんどは2020年春に大リニューアルします! - 魔法のiらんど URLリンク(maho.jp)
オワタ

337:192.168.0.774
20/01/19 04:35:51.86 qrJ0vAPo0.net
やったぜ

338:192.168.0.774
20/01/19 06:21:23 c42zUqjI0.net
>>328

魔法のiらんど はまだ存在しているのかw

339:192.168.0.774
20/01/24 17:33:52.87 TbU4PUEj0.net
URLリンク(archive.org)
ここに
URLリンク(ishidate.my.coocan.jp)
の、「Visual C++の勉強部屋」は保存できてるようなんだけど
「Visual Studio Community 2017でPythonを始める」が
トップだけあって他のリンクが上手く保存が出来てないようなんだけど
残す方法ありますか?始めてやろうとしてるので変な残し方をしたら気まずい・・・

340:192.168.0.774
20/01/24 17:40:24.75 TbU4PUEj0.net
あれ?慌てただけで反映されてなかっただけかな?
URLリンク(ishidate.my.coocan.jp)
上から2個目まではアーカイブされてました、すみません
一個ずつセーブしていくのかな?2個目はやってないはずなんだけど
トップページをセーブすると、自動で全部の保存処理をしてくれてるのだろうか?

341:192.168.0.774
20/01/24 19:35:46 DGrUFhpx0.net
>>331-332
すみません、反映するまで時間が掛かってただけのようです
順調に保存が進みました

342:192.168.0.774
20/01/30 04:23:53 DpjoWFqw0.net
上の保存出来たと思ったら何も変わってなかった
もう訳が解らん、個人的にローカルへ残す事にします・・・

343:192.168.0.774
20/01/30 09:17:01 QEGy6HlG0.net
最近財政難を表明してからInternet Archiveはやけに不安定だからなあ
Internet Archiveのシステムはページをクロールする部分とクロールしたページを表示する部分に分かれてるんだけど、最近は後者の部分がやけに不安定だったりする
閲覧できてないだけで実は保存できてたりすることもあるけど、不安ならオフラインコピーや他のアーカイブサイトを使うといい

344:192.168.0.774
20/01/30 09:18:37 QEGy6HlG0.net
まあ財政難表明する以前からちょくちょく不安定になることはあったんだけど、最近は不安定になる頻度がやたら高くなってきてる
保存されるアーカイブの量にリソースが追いついてないらしい

345:GeoLog Project
20/02/10 00:45:52.91 QUFKIIvC0.net
魔法のiらんど のURL収集を始めることにしました
知っているURLがあれば追加してください
URLリンク(geolog.mydns.jp)

346:192.168.0.774
20/02/10 15:13:07.48 GaTPIR040.net
Geocitiesのときはいくつかブックマークから追加したけどiらんどはなかったよ・・・

347:192.168.0.774
20/02/17 12:57:14.40 JLl8Pqxs0.net
Wayback Machine ツイッターが簡単に登録できなくなったね
try againになる

348:192.168.0.774
20/02/21 08:24:33 SqQJO7aU0.net
ウェブ魚拓にロボット扱いされるようになった。
手動でやってるのに。
URLリンク(i.imgur.com)

349:192.168.0.774
20/02/21 08:42:25.85 SqQJO7aU0.net
と思ったらReCaptcha導入でgyo.tc/urlまでもが廃止されたのかよ。
ReCaptchaの画面に飛ばしてくれればいいだけなのに。
タイトル画像詐欺になってるがな。

350:192.168.0.774
20/02/21 08:50:19.65 SqQJO7aU0.net
右下のリキャプチャマーク表示されてから5秒数えてから押せばいけるっぽい?

351:192.168.0.774
20/02/25 14:42:33.24 RVV1cF750.net
URLリンク(web.archive.org)
ここ一週間くらい調子悪いね?
保存できたと思って翌日くらいに見ようとしたら消えてて見られなくなってる

352:192.168.0.774
20/02/25 23:55:53.96 jlsY//Cy0.net
Internet Archiveはアーカイブ実行用クローラ(Heritrix)と
保存したアーカイブの専用ビューワ(Wayback)を組み合わせて動いてるんで、
保存したアーカイブがサーバ不調で一時的に見られなくなってても、
アーカイブさえきちんと出来てればそのうち問題なく見られるようになる

353:192.168.0.774
20/02/27 12:58:06.64 mwbfDK4S0.net
>>344
本当ですね!
さっき見てみたら復旧されたようでちゃんと保存できてました!

354:192.168.0.774
20/02/29 11:53:24.69 zPIV21fz0.net
アーカイヴトゥデイがGoogleキャッシュだけでなくBingキャッシュも原本と関連付けてくれれば神なんだが。

355:215
20/03/20 19:04:44 JhAw491V0.net
大住:僕は父親が来て、探偵ファイルをやめるべき理由を膨大に書き連ね
「これ以上やるなら親子関係を考えざるを得ない」と結んだ手紙を置いていきました。

wwwwwwwww

356:192.168.0.774
20/03/24 15:24:23.68 y1vf31FW0.net
Mが九つ…これはリッジレーサーのあの曲ですねぇ…間違い無い

357:192.168.0.774
20/03/29 00:39:38.40 fQaeQ4aI0.net
【リマインド】 魔法のiらんど
2020年 3/31 リニューアルに伴いホームページ機能終了
アーカイブの必要がある場合は早急に対応を。
URLリンク(maho.jp)

358:192.168.0.774
20/04/11 13:13:02 wGeDLnxf0.net
削除されたなろう小説や Wayback Machineでも見れないサイトを見たいなあ

359:192.168.0.774
20/04/12 03:38:35.21 9mojHch+0.net
レビューサイトや攻略サイトはどんなに古くても価値があると思う

360:192.168.0.774
20/04/17 16:09:58.55 jHjl/hvx0.net
Todayにリキャプチャ付いた。かわりに画像単体のキャプチャができるようになっていた。

361:192.168.0.774
20/04/17 17:07:42.90 hEp8fbMZ0.net
archive.today (archive.is)
URLがいくつもあるわけだが
archive.today
archive.is
archive.li
archive.fo
archive.vn
archive.md
archive.ph
ひとつがサーバーダウンしている時には
他のURLも使えないのかどうか。

362:192.168.0.774
20/04/17 19:43:09.88 DEdL3XQ50.net
>>353
名前を色々と増やし始めたのはこれが発端。
スレリンク(esite板:587番)-590
ドメイン名乗っ取り攻撃に対する冗長性確保が目的。
何れかの名前が乗っ取られても他の名前で利用できるようにしてあるだけで、
> ひとつがサーバーダウンしている時には
> 他のURLも使え
~るといった 20 年前みたいな事は意図していないはず。
URLリンク(o.5ch.net)

363:192.168.0.774
20/05/10 10:41:36 qgpD+Q890.net
「DLsite blog」サービス終了予定のお知らせ【5/28(木) 13:59まで】
URLリンク(home-info.dlsite.com)
月末ではなく28日昼まで

364:192.168.0.774
20/05/10 18:31:31.05 0BWUOz3X0.net
>>355
> 「DLsite blog」
そんなブログサービスがあるということを今はじめて知った

365:192.168.0.774
20/05/13 22:57:43 +6V16oE90.net
>>351
そう簡単に常識が変わるわけではないジャンルだしな

366:192.168.0.774
20/05/21 20:23:00.43 tw1fIQhk0.net
ニッチなニーズかもしれませんがスクリプトを公開しました。
Wayback Machine でURL検索をした際、最古または最新のページに自動で飛びます。
URLリンク(greasyfork.org)

367:192.168.0.774
20/05/25 18:40:03 DqvUJCjh0.net
2020年6月30日
連合型SNS『マストドン』 日本2位,3位のインスタンスが閉鎖
・msdtn.jp (登録20万人, 5500万トゥート)
・mastodon.cloud (利用者数6万人, 340万トゥート)

SNS『mstdn.jp』、誹謗中傷への対応の事務負担増に耐えられないと判断して6月30日で閉鎖へ
URLリンク(news.yahoo.co.jp)

運営引き継ぎも募集しているらしい
URLリンク(mstdn.jp)

368:192.168.0.774
20/06/12 19:07:45.35 Ex7ysahg0.net
コレで問題無しかな?
>>359
終了予定だった国内最大級のマストドンインスタンス「mstdn.jp」、サービス譲渡し継続
URLリンク(nlab.itmedia.co.jp)

369:192.168.0.774
20/06/12 20:04:22.23 kaj5j2rY0.net
>>360
外資は儲からないと判断するとすぐ撤退する傾向が強いからなあ。不安。

370:192.168.0.774
20/06/12 23:01:41.40 r8G+EqEg0.net
「誹謗中傷の証拠取得用に」と謳った「Twitter魚拓」なるWebサービスが出来てバズってるが、
やってることは単にスクショ撮ってimgurに上げるだけらしい
スクショはブラウザの開発者機能でいくらでも改竄できるし、
これならArchive.isの方がずっと優秀だな
スクショに法的な証拠能力ってあるのかな

371:192.168.0.774
20/06/12 23:03:10.00 r8G+EqEg0.net
>>361
買収先は確かTwitter非公式クライアントの開発チームじゃなかったっけ
儲からないのは織り込み済みじゃないかな?

372:
20/06/15 08:25:53.32 8HydZjTx0.net
webrecorder.ioの名前とURLが変わった
URLリンク(blog.conifer.rhizome.org)
新しいURL
URLリンク(conifer.rhizome.org)

373:192.168.0.774
20/06/18 15:31:00.91 YE4F+hQG0.net
Twitter魚拓に画像ハッシュを電子署名で埋め込む機能がやっと付いたらしい
結局画像を撮る前の段階で偽造可能なのはどうしようもないけど

374:192.168.0.774
20/06/20 02:54:49.17 h9ZrYl1H0.net
archive todayの魚拓検索でURL以外の文字列入力すると
Googleのカスタム検索経由で全文検索できるようになってるな

375:192.168.0.774
20/06/20 03:30:32.99 7f7o1of+0.net
旧Yahoo地図が完全終了するらしい
ジオカタログ製の世界地図が便利だったから終了するのは惜しい
URLリンク(map.ultra-zone.net)

376:192.168.0.774
20/06/20 12:12:23.28 D5VLdHFC0.net
Googleのやつより見やすいな
日本語で書いてあるせいか?

377:192.168.0.774
20/06/24 20:08:29.48 VaXpj8XL0.net
149 名前:名無しさん@ggmatome :2020/06/24(水) 19:41:32 ID:GJp4RZxo0
Adobe Flash Playerの2020年末サービス終了は、古いゲームの公式サイトとかに影響が出そう

378:192.168.0.774
20/06/25 23:41:47.74 dwRtuOnD0.net
ArchiveTeamがなんかやってるかなと思ったけどまだ動いてないっぽい

379:192.168.0.774
20/06/27 14:07:35 qfiK+Scz0.net
Flashの保存活動やってる人自体はいるよ
ArchiveTeamが動いてないだけかと

380:192.168.0.774
20/07/01 06:54:14.16 pvfyXrsy0.net
This URL has been excluded from the Wayback Machine.のサイトも掘り出したいわね

381:192.168.0.774
20/07/01 07:00:53.26 pvfyXrsy0.net
Wayback Machineで見れない主なドメイン
URLリンク(dion.ne.jp)
URLリンク(biglobe.ne.jp)
URLリンク(homepage2.nifty.com)

382:192.168.0.774
20/07/01 11:22:29.30 ha7maYO50.net
かなりデカい保存対象がやってきた
NAVERまとめ サービス終了のお知らせ : NAVERまとめ公式ブログ
URLリンク(navermatome-official.blog.jp)
>突然ではございますが、NAVERまとめは2020年9月30日をもちましてサービスを終了することとなりました。​​
>下書きや非表示のまとめも含め、9月30日をもちましてすべて閲覧ができなくなります。​

383:192.168.0.774
20/07/01 20:40:49.49 36DWDi3y0.net
naverブランドじゃ将来性見えないもんな
かといってヤフー、ラインブランドに変えてまでやるほどでもないし

384:192.168.0.774
20/07/01 22:39:13.89 4eKj5JMl0.net
>>373
いちいちブロックしてたらキリがないなろう系サイトはともかく
こういうドメインは一部のサイトだけ見れないように緩和してほしいわ

385:192.168.0.774
20/07/02 03:05:37.80 qEIVQ0nx0.net
Webサイト保存してる人はなに使ってる?
自分は巡集とWebsite Explorerを使ってる

386:192.168.0.774
20/07/02 22:25:47.86 PGzwXvql0.net
>>371
ちなみにFlash のアーカイブって何やるの?

387:192.168.0.774
20/07/02 22:55:14.72 VMG0QPRf0.net
>>374
ほぼコピペしか無いサイトだからオリジナルのデータは少なそう…

388:192.168.0.774
20/07/03 01:54:56.18 pnZtief20.net
>>379
8割方はどうでもいいコピペまとめなんだけど、これを個人サイトみたいに使ってる人や、真っ当な有益情報をまとめてくれてる人もいるんだよね
そういった情報が消えるのはもったいないし、今後困る人がいそう

389:192.168.0.774
20/07/03 22:23:28.54 0J0hhHF10.net
来年から新しい著作権法が施行されるらしいけど、
ウェブ魚拓とかの古いデータが、削除されたりしないか少し心配

390:192.168.0.774
20/07/03 23:54:06.51 pnZtief20.net
ウェブ魚拓は削除申請来たらバンバン消してるらしいから今更感ある
archive.todayやInternet Archiveは著作権の前にサーバ処理が追いつくのか心配

391:192.168.0.774
20/07/04 13:35:00.45 inafeRIM0.net
>>382
同意

392:192.168.0.774
20/07/08 22:28:06.73 JMicZAgO0.net
NAVERまとめだけじゃ無くLINEノベルも終了か…
ソフトバンクグループ特有のサービス終了ラッシュ

393:192.168.0.774
20/07/09 01:28:23.13 c1obRcGo0.net
へー、ソフバンは避けよう

394:192.168.0.774
20/07/09 03:09:48.75 K/ssIawO0.net
朝鮮系は避けてたから掠りもしないw

395:192.168.0.774
20/07/09 07:32:19.74 qxukY3NX0.net
ヤフーと合併するってことはこういうことだ
米国のヤフーがその典型で、買収した企業やサービスはことごとく閉鎖させてるしね

396:192.168.0.774
20/07/09 08:42:41.16 c1obRcGo0.net
潰したい企業を買収してからわざと潰すっていう性格の悪い投資家の話聞いたことがあるけど
まさかヤフーがそれだったりしないよな

397:192.168.0.774
20/07/13 15:08:26.85 JeHTcZXr0.net
>>384
うーんこの

398:192.168.0.774
20/07/14 15:25:35.44 bp/ba6L20.net
>>351
変則将棋とかのニッチすぎるカードゲームやボードゲームのサイトもだね

399:192.168.0.774
20/07/15 12:36:07.34 6KInjDIb0.net
保存する価値が特に高いサイト
(時間が経っても役に立たなくなることがまずないため)
レビューサイト
ゲーム攻略サイト
ボードゲーム・カードゲーム関係(ただしTCGなどは除く)
タロット占いなどの占い系
料理レシピ・裁縫などの家事系

400:192.168.0.774
20/07/16 02:27:44.38 okkeNa+i0.net
ウェブ小説サイトとかも

401:192.168.0.774
20/07/17 17:41:35.04 iWA6pxH10.net
旅行・探検系も含めていいかも
あと災害etcで現存しない場所の訪問記とか

402:192.168.0.774
20/07/18 01:13:41.89 MoAmN+OG0.net
昔のイベント体験記もだな

403:192.168.0.774
20/07/18 01:27:31.30 MoAmN+OG0.net
ついでに暇つぶしにネット検索してたら
ocn1.netなるサイトを発見した

404:192.168.0.774
20/07/18 02:15:45.46 HI8FU48P0.net
>>395
URLリンク(www.google.com)

405:192.168.0.774
20/07/18 14:45:04.72 42EZKBGK0.net
>>391-394
こういうサイトを優先的に保存すべきだな

406:192.168.0.774
20/07/19 04:44:14.87 lFOHvKxW0.net
こういう魚拓系サイトってエロ動画とか保存いけんの?

407:192.168.0.774
20/07/19 14:44:03.36 5VoHw/dK0.net
ocn1.netってサーバー名だったのかサイト名ではなかったのか
キューブのへやは一通り保存しといたけど他にもいっぱいあるやん

408:192.168.0.774
20/07/21 21:19:19.64 iEzABfS/0.net
2020年8月31日(月)サービス終了
暮らしのレシピ投稿サイト 「 nanapi 」
URLリンク(nanapi.jp)
料理:約11000ページ
ライフハック & 雑学系:約8000ページ
暮らしの情報サイトnanapi終了のお知らせ
URLリンク(nanapi.jp)
Twitter @nanapi
URLリンク(twitter.com)
(deleted an unsolicited ad)

409:192.168.0.774
20/07/22 00:43:31 Qv2V5tOA0.net
>>400
保存する価値が高いな

410:192.168.0.774
20/07/22 06:22:06.26 5ZyfxxsF0.net
検索サイトにアーカイブが引っ掛かる又はWeb Archiveに保存されてる以外だと実質的な消滅に等しい

411:192.168.0.774
20/07/25 12:03:11.28 vPQBVdbR0.net
> お知らせです。Neverまとめ終了に伴い、【実走!酷道・険道のまとめ】についても、終了させることにしました。
>2013年以来、約7年間のご利用有難う御座いました。
>道路ネタについては、引き続きツイートしていきます。どうぞ、宜しくお願いします。
twitter.com/kendou774/status/1286852266280890368
(deleted an unsolicited ad)

412:192.168.0.774
20/07/25 20:28:57.46 op0juaWZ0.net
ウェイバックでアーカイブしたNAVERまとめ記事でページ移動しようとすると
URLにgrid=falseっていうパラメータが追加されるみたい
誰か原因わかる人いる?
このせいでせっかくアーカイブしても2ページ目以降が参照できない問題が起きてしまう

413:192.168.0.774
20/07/25 23:03:50.67 vPQBVdbR0.net
>>404
自分が取ったアーカイブはそんな症状は出てないな
その問題が出たアーカイブのURLを教えてくれんか

414:192.168.0.774
20/07/26 00:15:07.54 6TmDXbEI0.net
>>405
例えばこのまとめのアーカイブ
2159020990876963301
2ページ目のボタンを押すとこのページに移動してエラー
2159020990876963301?page=2&grid=false
何度か試すと通常通りのページが表示される時もあるようで、今一どういう条件で発生するのかわからない

415:192.168.0.774
20/07/28 01:55:57.75 GOjmQFzm0.net
>>406
そのまとめではエラーにならなかったが、別の複数のまとめでエラー発動したわ
条件は全然分からないな

416:192.168.0.774
20/07/31 18:21:02.96 hz5s2lhM0.net
最近/save/の後にURLつけてブラウザで踏んで保存しようとするととんでもなく時間かかるようになってるんだけど
もっと早く保存する方法ないかな

417:192.168.0.774
20/07/31 19:38:16.52 gaCi8uhU0.net
>>408
同じく
しかもちゃんと保存できてるかどうかも怪しい

418:192.168.0.774
20/07/31 20:26:07 TTL90URn0.net
これ使えんの?
175 名前:py ◆o3kzHb/in8w0 [sage] 投稿日:2019/05/14(火) 19:06:58.64 ID:cP8wStLG0
URLリンク(u1.getuploader.com)
web2IAWBM.dms ver0.000.007 WayBackMachineに保存 (web.archive.org) 2019/05/14

web2IAWBM.dmsはIrvineとDorothy2を使ってInternet Archive WayBack Machineに自動登録(保存)するためのスクリプトです。
自動で全てのリンクをたどって保存してくれるはずです。
web2IAWBM.dmsは素人が作った物なので至らない点も多々ありますが、
一応使える水準になったと思われるので公開します。
無料のウィルススキャンはしましたが、念のためもう一度スキャンされることをお勧めします。
同梱のDorothy2(の一部)は別の方が作った物です。
■ Irvine初回起動前に必ず jwordフォルダを削除してください。■

動作試験環境:windows10pro Irvine1.3.1

419:192.168.0.774
20/07/31 21:15:44.33 x6UEbNzr0.net
>>410
自分で使ってみては?
レビューしてくれ

420:192.168.0.774
20/07/31 22:16:46 BOBaNxn40.net
>>411
>>408-409
へのレスしたつもりなんだけどね
誤解させてごめんねw

421:192.168.0.774
20/07/31 22:59:42 x6UEbNzr0.net
>>412
理解した

このところ/save/にURL繋げて直接保存させるのやってないから分からんけど、
ブラウザのsave page nowのフォームから保存するときとは色々処理が違うのかもね
最近Waybackの調子が特に良くないらしいから多分サーバ自体の問題だとは思うけど

422:192.168.0.774
20/08/02 02:59:54.76 BxGk29Xt0.net
Naverまとめを色々漁ってたらネット上で出回ってるコラの元画像・出典を集めたやつがあった
単なる宣伝まとめに完全汚染される前は、こういう地味だけど役立つまとめを書く人がそこそこいたんだけどな...
00年代から10年代のインターネットの残滓みたいな側面もあっただけに惜しい話だ
ArchiveTeamにどうにかして持っていきたい

423:192.168.0.774
20/08/04 10:42:23 kQccth3l0.net
昔のエロゲーとか普通の深夜アニメとかの公式サイトで保存されていないページが時々ある

424:192.168.0.774
20/08/07 14:35:38.67 SiHrQHil0.net
Googleマップの埋め込みはArchiveTodayで録れる

425:192.168.0.774
20/08/15 19:40:30.73 PMZXDU5C0.net
>>398
無理じゃね?

426:192.168.0.774
20/08/16 20:27:14.92 98xsFRfG0.net
ストリーミング配信のクロールは技術的に結構難しい

427:192.168.0.774
20/08/16 20:27:47.53 98xsFRfG0.net
動画を保存するならメタデータを含めた上で普通にダウンロードした方がいい

428:192.168.0.774
20/08/18 18:55:08 e28RrLlN0.net
トップページは見れるけど細かい中身までは保存されてないのか見れないことが多いわね 特に画像や動画は死んでる

429:192.168.0.774
20/08/18 21:04:20.75 xoxZKMa90.net
さくらインターネット専用サーバ
2020年11月30日で全て終了

430:192.168.0.774
20/08/18 23:33:08.82 FetPd1Vj0.net
>>421
古い専用サーバだけが対象
>この度、1997年6月より提供開始した「専用サーバ」および2007年1月より提供開始した「専用サーバ Platform Ad / St」につきまして、
>2020年11月をもちまして、サービスを終了いたします。
>これらサービスは、サービス開始から10年以上の期間が経過しており、今後、保守部材の確保ができず、サービス継続が困難な状況でございます。
>さくらの専用サーバ(2012年2月 提供開始 ~ 現在申込受付)」はサービス終了の対象ではございません。
URLリンク(server.sakura.ad.jp)

431:192.168.0.774
20/08/19 17:14:03.56 iZ5+0Ecr0.net
>>422
既に消えてるページあるよ
エロゲの回想未収録エロを個別セーブデータで対応してくれてたサイトとか
まあlzhの脆弱性騒動でlzh書庫セーブデータはsなしhttp,xp,win7締め出しみたいにサーバ側に既に全消去されてたけど
http://daidokoro.sakura.ne.jp/data/eroge_data.htm
http://web.archive.org/web/20180430112946/http://daidokoro.sakura.ne.jp:80/data/eroge_data.htm
NGワード引っかかったから、気になるなら半角にテキストエディタかなんかで変換して

432:192.168.0.774
20/09/06 17:22:46.19 CBf1XfYV0.net
サービス終了のお知らせ
長らくのご利用まことにありがとうございます。
大変恐れ入りますが、当サービスは2020年9月末をもって終了させていただきます。
mobile space
携帯(ケータイ)無料ホームページ提供フリーサイト「MobileSpace(モバスペ)」
URLリンク(m-space.jp)

433:192.168.0.774
20/09/07 12:06:40.69 3OpmkuSp0.net
Naverまとめのバックアップしてる有志いないかー?
自分も最近バックアップしてるんだがURL集めとかどこにすればいいかわからない

434:192.168.0.774
20/09/07 15:14:13.63 3OpmkuSp0.net
>>404
それはしゃあない、NAVERまとめは2ページ以降のURLも規則的だから、そこは見る側がインターネットアーカイブからURLをいじってアーカイブを見る方法しかないと思う
2ページ以降のURLがわかる以上アーカイブするにあたってそこまで気にしなくてもいい

435:192.168.0.774
20/09/08 03:14:53.75 rgMOAV4l0.net
>>397
同意

436:192.168.0.774
20/09/08 22:10:50 +a/fwcct0.net
将来役に立つか分らんけど書いとく
Naverまとめは2ページ目以降のURL末尾が
?: ?page=ページ番号
?: ?&page=ページ番号
の2パターンあるので注意
通常であれば2ページ目→?、3ページ目以降→?のパターンで保存されてるはず(だが例外もある)
あとはこの辺 >>404 >>406

437:192.168.0.774
20/09/09 08:08:33.67 iGXkHt4n0.net
とりあえず作ったからURL集めここにしないか?
NAVERの終了近づいてるから立てといた
URLリンク(jbbs.shitaraba.net)
5chだと多量URLは規制くらうし、かといっていちいちGeoLogみたいなURL集め場作るのもあれだし
したらばはGoogle検索ひっかかるししたらば自体もアーカイブできるから万が一にも備えられるしURL保管庫としては優秀
後から集めたURLにタイトルつけてスレ立てすれば後世代の人がググって見つけられる可能性が出てくるのが大きい
他にサービス終了候補出たらここにスレ立ててURL集める感じで

438:192.168.0.774
20/09/09 22:03:15 GaAB5Js70.net
>>429

汎用的に使えるし次スレからここのテンプレに入れた方がいいな

>>429は念の為にトリップ付けてしたらばと5ch両方に書き込んでおくと良いかも
したらばと5ch(&おーぷん2ch)とではトリップの生成アルゴリズムが違うらしく同じ名前でも違うトリップになるけど、とりあえずでも管理人だという証明がある方が何かと安心だしね

439:◆Oddz6L15vQ
20/09/09 22:23:41 iGXkHt4n0.net
>>430
OK、付けておく

440:192.168.0.774
20/09/10 17:58:45.52 lCL9EyAY0.net
150万記事くらいURLかき集めてタイトルとページ数もセットで保存してあるよ
ArchiveTeamにも先月渡したんだけどどうやら忙しいらしくて動きがない

441:192.168.0.774
20/09/10 20:34:28.12 S0dI6L/m0.net
>>432
ArchiveTeamに渡すってことはインターネットアーカイブには保存できてないってこと?

442:192.168.0.774
20/09/11 15:17:14.37 FY5rw0Vj0.net
>>433
ArchiveTeamが保存したサイトはWayback Machineにアップロードされて、最終的にちゃんとInternet Archiveに保存される仕組みになってる

443:192.168.0.774
20/09/11 15:43:42.84 FY5rw0Vj0.net
>>432
150万はすごいな、何を使って収集したのか気になる
あとArchiveTeamとのコンタクトってどうやって取ったん?
サイトの説明を色々読んでるけど窓口が見つからない

444:192.168.0.774
20/09/11 17:53:04.83 vIEy03BU0.net
>>434
いや、そういう意味ではなくArchiveTeamの動きないってことはインターネットアーカイブに保存できてないんじゃないかってこと
もしインターネットアーカイブに現時点で保存できなくて、ArchiveTeamに動きなければ>>432がローカルで保存できてない限り9月30日を迎えたらそれも無駄になる

445:192.168.0.774
20/09/11 18:38:50.57 FY5rw0Vj0.net
>>436
なるほどな、確かにArchiveTeamに動きがなかったら保存されないね
ArchiveTeamが今どういう状況なのかがよく分からないんだけど、本当にNAVERまとめは一切手付かずなのかな?


次ページ
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch