Internet Archive総合 (web.archive.org) #2at ESITE
Internet Archive総合 (web.archive.org) #2 - 暇つぶし2ch150:名無しさん@お腹いっぱい。
17/08/16 00:08:42.74 .net
日付が変わって昨日になるが、18時ごろから1時間くらい、
タイムアウトとか言って、使い物にならなかった。
この時間帯で1時間も使えなかったのって、ほんと酷だわ…。

151:名無しさん@お腹いっぱい。
17/08/16 09:19:32.75 .net
何か特別な時間帯なの?

152:名無しさん@お腹いっぱい。
17/08/20 21:48:59.46 .net
ちょっと古いブラウザで動かないページってどんな作り方なの?

153:名無しさん@お腹いっぱい。
17/08/20 23:28:20.85 .net
何が?

154:名無しさん@お腹いっぱい。
17/08/31 14:11:58.84 .net
IA内に履歴ないURL踏んだときの
セーヴしないという選択なくしたんだな
ちょっと楽ちんになった

155:名無しさん@お腹いっぱい。
17/08/31 17:01:17.43 .net
そうなの?

156:名無しさん@お腹いっぱい。
17/09/01 10:16:43.71 .net
>>154だけど、きのう書いたように仕様変更と思いきや
以前と同じく404吐くのに戻っていた
ちなみに昨日取得したページは、某著名人のブログ2017.8.29夕方アップ記事
きょう取得したのは、昨日と同アカのブログ内の昨晩アップ記事

157:名無しさん@お腹いっぱい。
17/09/01 12:34:48.84 .net
挙動がころころ変わるときはある気がするね。

158:名無しさん@お腹いっぱい。
17/09/01 21:02:34.83 .net
> IA内に履歴ないURL踏ん
でみたけど
クリックと同時に"Saving page now..."になるページと404のワンクッションおくページとが混在。
中の人らがどこをどういじってるのか知らんが当分は不安定な状態が続きそう。
まーどうにかこうにか取得できてるんでありがたくフリー利用させてもらいまふ

159:名無しさん@お腹いっぱい。
17/09/02 01:51:59.68 .net
一昨日(8月31日)、「Wayback Exception」という表示が何度も出て、
サイトの取得を妨げていたんだけど、見られた方はいますか?
「Exception」は“例外”という意味らしいけど、毎日のように取ってるサイトで
このような現象が起きたので驚いてる。
因みに昨日(9月1日)は逆に、その表示を一切見ていない。

160:名無しさん@お腹いっぱい。
17/09/02 06:08:02.02 .net
>>159
いわゆるプログラミング用語の「例外」でしょ?
どうして例外が発生したのか見てないの?
URLリンク(o.8ch.net)

161:名無しさん@お腹いっぱい。
17/09/03 10:40:23.83 .net
>>160
そう、確かにその表示なのだが、
>どうして例外が発生したのか見てないの?
そこまでは見ていない、というよりも分からない。
何しろ、普段から取得している複数の新聞社のニュースサイトを
取る作業をしていた際に、この現象が起きたから。
どうにも原因が思いつかない。

162:名無しさん@お腹いっぱい。
17/09/04 21:57:17.78 .net
Shift_JIS が宣言されていても Windows-31J として処理しくれるような
融通は利かせてくれないものだろうか。
URLリンク(web.archive.org)
①②③④⑤⑥⑦⑧⑨⑩⑪⑫⑬⑭⑮⑯⑰⑱⑲⑳ⅠⅡⅢⅣⅤⅥⅦⅧⅨⅩ㍉㌔
㌢㍍㌘㌧㌃㌶㍑㍗㌍㌦㌣㌫㍊㌻㎜㎝㎞㎎㎏㏄㎡㍻〝〟№㏍℡㊤㊥㊦㊧㊨
㈱㈲㈹㍾㍽㍼∮這��
ⅰⅱⅲⅳⅴⅵⅶⅷⅸⅹ¦'"纊褜鍈銈蓜俉炻昱棈鋹曻彅丨仡仼伀伃伹佖
侒侊侚侔俍偀倢俿倞偆偰偂傔僴僘兊兤冝冾凬刕劜劦勀勛匀匇匤卲厓厲叝
﨎咜咊咩哿喆坙坥垬埈埇﨏塚增墲夋奓奛奝奣妤妺孖寀甯寘寬尞岦岺峵崧
嵓﨑嵂嵭嶸嶹巐弡弴彧德忞恝悅悊惞惕愠惲愑愷愰憘戓抦揵摠撝擎敎昀昕
昻昉昮昞昤晥晗晙晴晳暙暠暲暿曺朎朗杦枻桒柀栁桄棏﨓楨﨔榘槢樰橫橆
橳橾櫢櫤毖氿汜沆汯泚洄涇浯
涖涬淏淸淲淼渹湜渧渼溿澈澵濵瀅瀇瀨炅炫焏焄煜煆煇凞燁燾犱犾猤猪獷
玽珉珖珣珒琇珵琦琪琩琮瑢璉璟甁畯皂皜皞皛皦益睆劯砡硎硤硺礰礼神祥
禔福禛竑竧靖竫箞精絈絜綷綠緖繒罇羡羽茁荢荿菇菶葈蒴蕓蕙蕫﨟薰蘒﨡
蠇裵訒訷詹誧誾諟諸諶譓譿賰賴贒赶﨣軏﨤逸遧郞都鄕鄧釚釗釞釭釮釤釥
鈆鈐鈊鈺鉀鈼鉎鉙鉑鈹鉧銧鉷鉸鋧鋗鋙鋐﨧鋕鋠鋓錥錡鋻﨨錞鋿錝錂鍰鍗
鎤鏆鏞鏸鐱鑅鑈閒隆﨩隝隯霳霻靃靍靏靑靕顗顥飯飼餧館馞驎髙
髜魵魲鮏鮱鮻鰀鵰鵫鶴鸙黑

163:名無しさん@お腹いっぱい。
17/09/06 02:25:34.26 .net
(´‥∀‥`)ほう

164:名無しさん@お腹いっぱい。
17/09/07 00:12:02.88 .net
>>162 は (0x8794) が 這 (0x9487) に化けてるけど、これは 2ch 側の問題だな。
具体的には、 の文字の 1 個以上の連続のうち、先頭バイトだけが
なぜか HTML 上では脱落する。
専ブラで dat を直接読んでいれば脱落は起こらない。
バイト列で表現するとこんな感じ。
41 41 87 94 87 94 87 94 87 94 41 41 (AA這這這尿A)

41 41 -- 94 87 94 87 94 87 94 41 41 (AA這這這尿A)
URLリンク(web.archive.org)
算術記号の ではなくて、ギリシャ文字の Σ (0x83B0) だと起こらない。

165:名無しさん@お腹いっぱい。
17/09/07 15:43:52.89 .net
ほんとだ直アクセスでもそんな感じだな

166:名無しさん@お腹いっぱい。
17/09/09 15:12:07.27 .net
取得したページ上部のデザインがまた変わったなあ
小さくなったり大きくなったり極端だ

167:名無しさん@お腹いっぱい。
17/09/14 10:27:22.74 .net
(過去にもあったけど)
一部のサイトで、以前取ったアドレスが、取れなくなってるな。
取っても、現時点で最新のものしか出てこない。
URLリンク(web.archive.org)
URLリンク(web.archive.org)

168:名無しさん@お腹いっぱい。
17/09/16 18:16:34.78 .net
悪いひとたちがやって来て
みんなを殺した
理由なんて簡単さ
そこに弱いひとたちがいたから
女達は犯さ


169:れ 老人と子供は燃やされた 悪いひとたちはその土地に 家を建てて子供を生んだ そして街ができ 悪いひとたちの子孫は増え続けた 朝鮮進駐軍 関東大震災 日本人大虐殺 https://goo.gl/1ntWvZ https://youtu.be/D0vgxFC04JQ https://goo.gl/h1o4eV https://www.youtube.com/watch?v=sYsrzIjKJBc https://goo.gl/FTqHJ1



170:名無しさん@お腹いっぱい。
17/09/20 14:00:49.17 .net
こういうのもちゃんと読んで反応してるんだろうか
問答無用で弾いてるような印象があるが
URLリンク(yahoo-mbga.jp)

171:名無しさん@お腹いっぱい。
17/09/20 14:03:00.66 .net
User-Agent: *
Disallow: /
もうこれだけ読んでやめてる気がしてならない

172:名無しさん@お腹いっぱい。
17/09/20 19:07:51.75 .net
10分くらい前から使えなくなってる
何が起きた

173:名無しさん@お腹いっぱい。
17/09/20 19:08:23.33 .net
繋がらんな

174:名無しさん@お腹いっぱい。
17/09/20 19:12:57.86 .net
一応戻ったが、何でまた急に…

175:名無しさん@お腹いっぱい。
17/09/20 19:13:02.20 .net
なおったか

176:名無しさん@お腹いっぱい。
17/09/20 19:23:19.47 .net
今落ちてないかい?
ついに…

177:名無しさん@お腹いっぱい。
17/09/20 19:26:13.63 .net
うむ、まただ
メンテの予告はないよね?

178:名無しさん@お腹いっぱい。
17/09/20 19:26:58.18 .net
落ちてるね
このところ順調だったけど

179:名無しさん@お腹いっぱい。
17/09/20 19:30:42.72 .net
ネットワーク診断結果
デバイスまたはリソース(web.archive.org)が応答していません。

180:名無しさん@お腹いっぱい。
17/09/20 19:31:33.35 .net
もう、急に何ヒス起こしてるんだよ…

181:名無しさん@お腹いっぱい。
17/09/20 19:38:10.25 .net
>>169
問答無用も何も、その robots.txt を規則通りに解釈したら
Internet Archive (ia_archiver) の場合は全拒否になるのだが。
| User-Agent: ia_archiver
| Disallow: /
この少し後ろに "User-Agent: *" で始まるグループがあるが、
上の "User-Agent: ia_archiver" を優先するため無視される。
| User-Agent: *
| Disallow: /
| Allow: /sitemap
| Allow: /$
| ...
仮に上の "User-Agent: ia_archiver" とその次の行が無かったとしても、
Internet Archive は Allow 命令には対応していない。
つまり、"User-Agent: *" とその次の Disallow 命令だけが解釈されて、
どっちみち全拒否となる。

182:名無しさん@お腹いっぱい。
17/09/20 20:39:47.04 .net
何度かYahooスポーツの世話になっていたが、久しぶりに古いページを
見ようとしたらデータが取れなくなってるな。

183:名無しさん@お腹いっぱい。
17/09/26 21:11:20.42 .net
取得時モッサリと重たいんだけど時間帯のせいかな

184:名無しさん@お腹いっぱい。
17/09/27 06:43:46.15 .net
Saving page now...が消えたと思いきやまた表示され
Saving page now...が今度こそ消えたと思いきやまた表示され
Saving page now...が(ry
この自動ループに陥って結局手動で停止させるんだが
後から確認してみると取れてるのと取れてないのが2:1ぐらい
めんどくせ

185:名無しさん@お腹いっぱい。
17/09/30 09:53:51.13 .net
モサーリ爆進中

186:名無しさん@お腹いっぱい。
17/10/01 01:02:16.28 .net
根気テストされてるに違いない

187:名無しさん@お腹いっぱい。
17/10/02 11:53:53.32 .net
画像が全然保存できてないな
下手するとさっき保存したものよりも同じページの2009年くらいのスナップショットのほうがたくさん画像が見れたりする

188:名無しさん@お腹いっぱい。
17/10/02 19:51:18.22 .net
>>185
Bummerが3~4回繰り返されるので
既に根気もくそも無くなってるわ
特に19時台が酷い気がするけど
単に気のせいかな

189:名無しさん@お腹いっぱい。
17/10/02 21:30:39.54 .net
気のせいだお
全時間帯まんべんなく酷い

190:名無しさん@お腹いっぱい。
17/10/02 23:44:48.37 .net
ウェブ魚拓も「スカ」が多くなったな
魚拓の類がこんな調子だと本当に困る

191:名無しさん@お腹いっぱい。
17/10/03 18:10:31.64 .net
もうBummer出るのがデフォになってるな
改善される時は来るのだろうか

192:名無しさん@お腹いっぱい。
17/10/04 20:16:52.84 .net
URL検索機能が相変わらず死んだまんまや…

193:名無しさん@お腹いっぱい。
17/10/04 21:57:06.86 .net
検索機能って/*/~*みたいなやつ?

194:名無しさん@お腹いっぱい。
17/10/15 18:42:33.29 .net
wikiにつながらない

195:名無しさん@お腹いっぱい。
17/10/15 20:29:29.29 .net
はぁ?
URLリンク(o.8ch.net)

196:名無しさん@お腹いっぱい。
17/10/16 16:17:25.01 .net
上旬は先月よりだいぶ調子よかったが昨日からまたダメダメ

197:名無しさん@お腹いっぱい。
17/10/21 14:00:43.25 .net
/脱落に因む404大杉

198:名無しさん@お腹いっぱい。
17/10/23 14:40:32.65 .net
去年冬ごろ取得したのは"/"が勝手に加えられての404が多かった

199:名無しさん@お腹いっぱい。
17/10/24 01:09:43.67 .net
なんや


200:それ



201:名無しさん@お腹いっぱい。
17/10/26 00:50:42.39 .net
悪いひとたちがやって来て
みんなを殺した
理由なんて簡単さ
そこに弱いひとたちがいたから
女達は犯され
老人と子供は燃やされた
悪いひとたちはその土地に
家を建てて子供を生んだ
そして街ができ
悪いひとたちの子孫は増え続けた

朝鮮進駐軍 関東大震災 日本人大虐殺
URLリンク(goo.gl)
URLリンク(goo.gl)
URLリンク(youtu.be)
URLリンク(goo.gl)
URLリンク(www.youtube.com)

202:名無しさん@お腹いっぱい。
17/10/30 09:15:18.95 .net
ページ自体が表示されないが、今はどういう状況? メンテ中?

203:名無しさん@お腹いっぱい。
17/11/01 22:03:58.93 .net
Wayback Exception
An unknown exception has occurred. Unexpected Error
こればっか

204:名無しさん@お腹いっぱい。
17/11/24 13:46:14.14 .net
アーカイヴされたことないページへのリンク踏んだら
久々に404にならず"Save this url in the Wayback Machine"が現れてクリック取得ができた
これ常時できてたのって夏休み前だったから感動すら覚える

205:名無しさん@お腹いっぱい。
17/11/24 22:36:52.60 .net
うむ、

206:名無しさん@お腹いっぱい。
17/11/24 22:51:45.43 .net
>>202
夏休みかぁ。若いって良いなぁ。

207:名無しさん@お腹いっぱい。
17/12/12 17:05:40.69 .net
サイトで友達が稼げるようになった情報とか
⇒ URLリンク(rprpe093w.sblo.jp)
興味がある人だけ見てください。
SOF53Y4MWW

208:名無しさん@お腹いっぱい。
17/12/15 14:46:48.96 .net
さて

209:名無しさん@お腹いっぱい。
17/12/17 18:45:14.54 .net
ちくしょ完全にダウンしやがった、、

210:名無しさん@お腹いっぱい。
17/12/17 18:55:40.85 .net
2h前にあった現地の停電の影響
さすがに回避不能だしイラついてもしょうがない
大人しく復旧を待とう

211:名無しさん@お腹いっぱい。
17/12/19 19:03:04.11 .net
今日も調子悪いね

212:名無しさん@お腹いっぱい。
17/12/19 19:31:07.30 .net
日常な気がしてきた

213:名無しさん@お腹いっぱい。
17/12/19 20:14:35.23 .net
あーーーー何か来たぞーーーー
URLリンク(o.8ch.net)

214:名無しさん@お腹いっぱい。
18/01/01 15:04:20.22 .net
新年早々だめだこりゃ

215:名無しさん@お腹いっぱい。
18/01/04 15:44:23.36 .net
>>212
取得しようとしたら、一旦反応はあるものの、
なぜか取得する前段階の画面に戻ってしまっていたな。
結局、1月1日は終始そんな状態だったが、
1日中使えなかったのはあまりに痛すぎる。

216:名無しさん@お腹いっぱい。
18/01/04 20:29:56.52 .net
去年10月の第一週に取得しといたのが半分ぐらい駄目になってる
重要だと思うページは取れてるか確認してみたほうがいい

217:名無しさん@お腹いっぱい。
18/01/04 21:15:03.46 .net
>>214
2015 年よりスクリプトで毎日一回ずつ保存させているものがあるんだけど、
昨年 10 月は第一週に限らずポツポツと抜けている。
URL は公開したくないのでスクショでご勘弁。
URLリンク(i.imgur.com)
URLリンク(i.imgur.com)
URLリンク(i.imgur.com)

218:名無しさん@お腹いっぱい。
18/01/04 21:24:36.49 .net
4月29日何があった

219:名無しさん@お腹いっぱい。
18/01/04 21:58:08.32 .net
>>215
スクリプトってどんな感じの?参考にしたいからやり方教えて下さいm(__)m

220:214
18/01/04 22:01:04.72 .net
>>216
403 ページが繰り返し記録されているので Internet Archive の問題ではない。
ちなみにスクリプトは /save/ にリクエストを投げてから、リダイレクトを処理して
最終的に 200 番か 504 番の応答が返ってくれば保存できたと判断、
それ以外なら計 10 回まで試行するように組んである。
ログは取っていないので、保存できなかった日にどういう応答が
返ってきていたのかは判らない。

221:名無しさん@お腹いっぱい。
18/01/04 22:59:58.51 .net
10月散々だな・・・ここのログ読んでも9月末から10月までは大分やばそうな感じだし、見直してみるか

222:名無しさん@お腹いっぱい。
18/01/04 23:15:25.28 .net
>>215
スクリプトを作成する技術があるのなら、アーカイブするよりも
そのページを直接ハードディスクにhtml(またはmhtml)で保存
するほうが確実ではないのか?

223:214
18/01/05 03:49:29.13 .net
以下長文失礼。
>>220
いわゆる「証拠保全」の目的で、ブログなどを保存させることもあるでしょう・・・。
>>217
こちらでは Windows Scripting Host 用のスクリプトを JScript で書き、
それを Windows のタスクスケジューラで実行させている。
以下、Internet Archive へ仕掛けるアクセスの内容と、HTTP の応答コードの扱いについて簡単に。
1) 保存させたい URL の前に URLリンク(web.archive.org) を付けて、
その URL 向けに HEAD リクエストを投げさせる。
2) 300 番台の応答 (リダイレクト) が返って来た場合、順次追跡して HEAD リクエストを投げさせる。
これは、使用する API によっては特に記述せずとも勝手にやってくれる。
3) 最終的に 200 番の応答が返ってくれば、たぶん保存できている。
保存成否は HTTP の応答コードだけでほぼ判定できる。
コンテントボディは不要なので HEAD メソッドを使っているが、
HEAD を扱えない環境なら GET メソッドでも問題無い。
数百メガバイトの巨大ファイルを保存させようとした場合など、
オリジンサーバから Internet Archive への転送に時間が掛かってしまうと
途中でタイムアウトとなり、504 番の応答が返ってきてしまう。
スクリプトを汎用とする (URL を別途パラメータとして与える) のであれば、
これも一応「保存できた」として扱った方が無難。
504 でも保存がキャンセルされる訳では無いようで、
これをエラーとして扱い再試行させてしまったがために
巨大ファイルを短い間隔で重複して保存させてしまったことがある。

224:216
18/01/05 20:15:59.49 .net
>>221
ご丁寧にご解説ありがとうございましたm(__)m
定期保存の方法は大体理解できたのですが
当方JScriptに詳しくないのでスクリプトの具体的な書き方がわかりません(ノД`)・゜・。
ご無理は承知しておりますが
Pastebin.comなどにスクリプトのサンプルを貼って頂けると有り難いのですが・・・
ぜひとも後学の為によろしくお願い致します。(o_ _)o))

225:名無しさん@お腹いっぱい。
18/01/05 21:16:22.82 .net
スレ違い
しかも今どきm(__)m (ノД`)・゜・。 (o_ _)o))の顔文字
キモいキモすぎる

226:名無しさん@お腹いっぱい。
18/01/06 15:47:30.36 .net
専門板って時間の流れが違う人多いよね

227:名無しさん@お腹いっぱい。
18/01/06 17:38:17.30 .net
時間の流れ方は人それぞれだし、顔文字とか個性があるのは別にいいんじゃない
Internet Archiveに関するスクリプトなら満更スレ違いとも言えないだろうし
Pastebin指定している所見ると、極力スレに迷惑かからないように考慮しているみたいだし
大体このスレ、1年過ぎても1スレの1/5くらいも消費してないくらい話題ないんだから
多少のスレ違いは問題ないっしょ

228:名無しさん@お腹いっぱい。
18/01/06 19:40:14.08 .net
>スクリプトの具体的な書き方がわかりません(ノД`)・゜・。
から判るのは"参考"までに問うてみるなんてレベルには
背伸びしても達しない現状を隠しつつ>>217を書き
レスが来たと見るやベース丸コピの勢いで乞食メンタリティを現す
呆れた自己中クレクレ厨という事実

229:216
18/01/06 22:55:52.85 .net
私のせいでスレが荒れてしまってすみません(>_<)
すべて無知で乞食で心が貧しかった私のせいです。。。
気分を害された方々、本当に申し訳ありませんでしたm(__)m

230:名無しさん@お腹いっぱい。
18/01/09 16:59:38.81 .net
>>224
ひとくちに専門板といっても
この板とシャワートイレ板や文房具板では雰囲気がまったく違う。

231:名無しさん@お腹いっぱい。
18/01/12 11:17:09.62 .net
懐かしいこの使い


232:心地



233:名無しさん@お腹いっぱい。
18/01/12 22:39:58.08 .net
今さっきからメンテナンスに入った
今日は夕方あたりから「503」乱発だったから仕方ないか…
というか昨日・一昨日あたり消えてるっぽいものもあるのだが

234:名無しさん@お腹いっぱい。
18/01/13 08:11:09.82 .net
てか1月10日及び11日の分
やっぱり消えてるわ

235:名無しさん@お腹いっぱい。
18/01/13 08:32:56.05 .net
ありゃりゃ

236:名無しさん@お腹いっぱい。
18/02/27 05:25:01.33 .net
過去に取得されてるURLを現在の表示内容に更新する為に再度保存するにはどこのボタンを押せばいいんですか?

237:名無しさん@お腹いっぱい。
18/02/27 05:28:59.49 .net
>>233
そんなボタンはありません。

238:名無しさん@お腹いっぱい。
18/02/27 08:43:21.75 .net
☆ 日本の、改憲を行いましょう。現在、衆議員と参議院の
両院で、改憲議員が3分の2を超えております。
『憲法改正国民投票法』、でググってみてください。国会の発議は
すでに可能です。平和は勝ち取るものです。お願い致します。☆☆

239:名無しさん@お腹いっぱい。
18/02/27 20:45:30.03 .net
>>233
URLリンク(web.archive.org) の【 Save Page Now 】セクションに
URL入力欄とボタンがあるじゃろ
Capture a web page as it appears now for use as a trusted citation in the future.

240:名無しさん@お腹いっぱい。
18/03/02 07:42:32.15 .net
>>236
御礼が遅れましたがありがとうございました
貴方良い人だ

241:名無しさん@お腹いっぱい。
18/03/03 14:40:00.74 .net
取得歴0のページを新たにセーブしても"2 captures"になるのって何なんだろ

242:名無しさん@お腹いっぱい。
18/03/05 18:14:49.67 .net
去年保存されてしばらくは完全に保存されてたページが
いつの間にかそのページの画像の大半が失われてた

243:名無しさん@お腹いっぱい。
18/03/07 22:29:59.08 .net
This URL has been excluded from the Wayback Machine.
なサイトが復活した事例ってある?
BIGLOBEの例とか見るに必ずしも運営者が手を回したわけじゃないようだし、問い合わせたら復活したりするんじゃないかと思ったんだが

244:名無しさん@お腹いっぱい。
18/03/12 00:57:39.67 .net
Archive.is で Facebook のアーカイブが取れなくなっている。
Archive.is のクローラは Facebook 上では登録ユーザとして振舞っていて、
パブリックでは無いコンテンツのアーカイブも取れるようになっているのだが
そこで使われていたアカウントがブロックされたっぽい。
URLリンク(Archive.is)
Masha とか Nathan とか、過去にアカウント名が変わったことが何回かあるので
今回が初めてでは無いのかも。
>>240
聞いたことが無いですね・・・。

245:名無しさん@お腹いっぱい。
18/04/17 11:35:00.65 .net
今日深夜ずっと繋がらないんだけど何かあった?

246:名無しさん@お腹いっぱい。
18/04/20 09:29:40.69 .net
Archive.isはweb.archive.orgと違ってソース見るとリンクが別の文字列に置き換わるんだな
だから記録したリンクのアドレスをソースで調べようとしてもわからない
リンクアドレスが直接サイト上にすべて表示してあるなら大丈夫だけど
web.archive.orgtが禁止してるサイトを記録できるのはありがたいが中途半端

247:名無しさん@お腹いっぱい。
18/04/23 22:52:27.15 .net
悪いひとたちがやって来て
みんなを殺した
理由なんて簡単さ
そこに弱いひとたちがいたから
女達は犯され
老人と子供は燃やされた
悪いひとたちはその土地に
家を建てて子供を生んだ
そして街ができ
悪いひとたちの子孫は増え続けた

朝鮮進駐軍 関東大震災 日本人10万人大虐殺
URLリンク(youtu.be)
URLリンク(youtu.be)
URLリンク(www.youtube.com)
URLリンク(www.youtube.com)
URLリンク(www.youtube.com)
URLリンク(youtu.be)

248:名無しさん@お腹いっぱい。
18/05/03 21:09:06.81 lbVuV7ORR
久々にあるページのURLを見かける

あるページが閉鎖される

Internet Archive を使う

Wayback Machine doesn't have that page archived.

orz


というか Internet Archive のページ検索機能が欲しい
今はホームページしか見つけてくれない

249:名無しさん@お腹いっぱい。
18/05/22 18:37:32.43 .net
あー重い重い
URLリンク(o.8ch.net)

250:名無しさん@お腹いっぱい。
18/05/24 23:16:48.78 .net
最近は激烈重いな

251:名無しさん@お腹いっぱい。
18/05/31 08:55:50.66 .net
別のところで耳にしたので本当かどうかわかりませんが
webarchiveを用いて消えてしまったリンク
例えばURLリンク(www.chinpoppo.ne.jp)
が昔あったが現在images以下が表のページからのリンクが消されたとして(サーバー内には存在するる)
その画像一覧をWebarchiveを用いると現在のページからも落とせると聞いたが本当でしょうか?
もし可能ならその方法を,またWebarchiveを用いないで出来る方法があれば教えてください
スレ違いならこの質問に適したスレを教えてください

252:名無しさん@お腹いっぱい。
18/05/31 10:37:12.73 .net
>>248
日本語でおk。
「Wayback Machine に保存されているファイルの一覧」は出力できても、
「元サーバには置いてあっても Wayback Machine では保存しなかったファイルの一覧」なんか
出力できるわけ無いわ。

253:名無しさん@お腹いっぱい。
18/05/31 22:03:23.29 .net
/*

254:名無しさん@お腹いっぱい。
18/06/01 09:35:59.56 .net
>>249
ありがとうございました

255:名無しさん@お腹いっぱい。
18/06/23 22:07:00.35 .net
このアーカイブてデータをSSDに全部入れ替えたら
アクセスすごい速くなるんだろうな、金額や手間を
考えたら途方もない話だろうけど

256:名無しさん@お腹いっぱい。
18/06/24 21:17:52.37 .net
ストレージの速度も大事なんだろうけれど
データベース系はメモリが足らないとダメなんだろうなって気がする
それこそカネがかかる話だけれどもね

257:名無しさん@お腹いっぱい。
18/07/05 01:48:27.48 .net
ここ数日 /save/ で保存を試みても失敗することが多くなった。
数回ないし十数回リロードすれば通るけど、本当に鬱陶しい。
URLリンク(o.8ch.net)

258:名無しさん@お腹いっぱい。
18/07/07 04:58:10.52 .net
>>254
右に同じ。
しかも、
>数回ないし十数回リロードすれば通るけど
これがまた結構時間をロスする。
意外とこのサイトの重要性は高まっているので、
ここが機能しなかったら本当に困る。

259:名無しさん@お腹いっぱい。
18/07/07 05:50:54.11 .net
というか基本的な話だが、
同じサイトを複数回取る場合(頻繁にトップページが変わる、新聞社の公式とか)、
Internet Archiveは『10分程度』、間(あいだ)を置かなきゃダメなんだよね。
「Wayback Exception」でタイムロスがあっては尚更困るんだが。

260:名無しさん@お腹いっぱい。
18/07/07 13:46:21.85 .net
他のアーカイブも利用しろよ
やたら重くていけねえ

261:名無しさん@お腹いっぱい。
18/07/07 15:39:37.64 .net
もちろん他のところも利用してるけど、
1日20回限定だったり、サイトの方から拒否しちゃったりでねえ…
それにしてはここ数日、
InternetArchiveにアクセスが集中しすぎているのか?

262:名無しさん@お腹いっぱい。
18/07/07 18:11:15.42 .net
なんかよく分からんエラー出て使えないと思ったらやっぱ不調なのね

263:名無しさん@お腹いっぱい。
18/07/07 18:13:12.53 .net
というか好調のときってあるのかここ

264:名無しさん@お腹いっぱい。
18/07/07 19:14:44.12 .net
午後から本当に「Sorry」ばかりでガチで不調
一時期のウェブ魚拓もそうだったが
不可解な画像を多量にアーカイブするような
平たく言えば「荒らし」が出てきてるのか?

265:名無しさん@お腹いっぱい。
18/07/07 23:50:33.04 .net
困ったねぇ。
URLリンク(o.8ch.net)

266:名無しさん@お腹いっぱい。
18/07/10 19:44:19.48 .net
今日はこればっかり。
URLリンク(o.8ch.net)

267:名無しさん@お腹いっぱい。
18/07/12 17:50:11.87 .net
保守

268:名無しさん@お腹いっぱい。
18/07/15 01:03:22.54 .net
確信

269:名無しさん@お腹いっぱい。
18/07/24 06:42:47.65 .net
これが無くなるとかなり困るな

270:名無しさん@お腹いっぱい。
18/07/24 19:26:12.66 .net
そりゃな
既存の蓄積の替えがきかないという意味ではGoogleとかよりよっぽど重大だな

271:名無しさん@お腹いっぱい。
18/07/25 10:07:04.60 .net
いっそグーグルが買収してその脅威のメカニズムで
ウェイバックをワード検索できたり、負荷を軽


272:くしたりプログラムを再構成してくれないかな



273:名無しさん@お腹いっぱい。
18/07/25 10:39:55.70 .net
>>268
「他人の著作物を勝手に保存してそのまま勝手に再公開する」という
インターネット・アーカイブがやっている行為について訴訟が起こされたけど、
非営利組織であることが米国著作権法のフェアユース規定を適用できるかどうかの
鍵となっていたはず。
買収で営利組織の傘下に入ると、おそらくそこが崩れて
保管されているアーカイブの殆どが違法コピーに成り下がる。

274:名無しさん@お腹いっぱい。
18/07/29 21:16:40.87 .net


275:名無しさん@お腹いっぱい。
18/07/30 08:56:57.18 .net
>>269
厳しい局面を迎えているんだな
その訴訟は継続中なのかな?
結果次第では他の類似サイトにも確実に影響が出る…

276:名無しさん@お腹いっぱい。
18/07/31 01:34:50.00 .net
訴訟されてたとは初目目

277:名無しさん@お腹いっぱい。
18/08/27 22:33:15.82 .net
最近数週間ずっと調子よかったのに
今日は1度めトライで成功するページが2割ぐらい

278:名無しさん@お腹いっぱい。
18/10/01 00:15:17.25 .net
最近はどう?

279:名無しさん@お腹いっぱい。
18/10/01 09:42:09.77 .net
自分とこの環境だと今日は
優─良─可─不可
   ↑
 この辺り

280:名無しさん@お腹いっぱい。
18/10/02 00:22:35.28 .net
結構いいやん

281:名無しさん@お腹いっぱい。
18/10/02 03:21:26.34 .net
「Yahoo!ジオシティーズ」が2019年3月末でサービス終了
URLリンク(news.livedoor.com)

282:名無しさん@お腹いっぱい。
18/10/02 18:31:41.89 .net
頼れるのがInternet Archiveしかいない…!

283:名無しさん@お腹いっぱい。
18/10/02 21:28:33.03 .net
ジオシティーズ消滅でだいぶ貴重なデータが失われるな
黒歴史サイトが消える~って喜んでるのも居るがそんなもんより損失が大きいのが
アーカイブされりゃいいけどニフティなんかアーカイブで見れないサイト多い惨状
他では誰も扱っていないすんげーマニアックなデータを蓄積したサイトとか 勿体無い

284:名無しさん@お腹いっぱい。
18/10/03 12:59:36.15 .net
あれなあ
ドメインレベルで見えなくなってるっぽいのあれなんなんだろうな

285:名無しさん@お腹いっぱい。
18/10/06 20:02:45.36 .net
URLリンク(archive.org) の上の入力欄に URL を突っ込んだ後、
最初に出てくるはずのカレンダ画面が真っ白。

286:名無しさん@お腹いっぱい。
18/10/06 20:09:05.08 .net
うん同じく

287:279
18/10/11 02:20:55.03 .net
>>281 の件は直ったようだ。

288:名無しさん@お腹いっぱい。
18/10/15 20:10:09.03 .net
最近まともに動いてるね

289:名無しさん@お腹いっぱい。
18/10/20 16:16:56.53 .net
いきなり保存できなくなった

290:名無しさん@お腹いっぱい。
18/10/21 11:22:22.45 .net
全ページ検索はまだ?
でもモラル上厳しいか

291:名無しさん@お腹いっぱい。
18/10/21 11:47:41.23 .net
大昔で来てたよね

292:名無しさん@お腹いっぱい。
18/10/21 18:07:24.21 .net
ジオシティーズ削除までに出来る限りアーカイブしとかんとなあ
アーカイブされてそうで意外とされてなかったりする>ジオ

293:名無しさん@お腹いっぱい。
18/10/21 18:46:47.27 .net
それな

294:名無しさん@お腹いっぱい。
18/10/21 19:23:19.76 .net
18日以降にとったキャッシュが全部見れなくなってる こいつぁきつい

295:名無しさん@そうだ選挙に行こう! Go to vote!
18/10/22 07:48:21.85 .net
改めて確認すると17日の夜以降かつ現在の24時間以上前くらいのは全て消えてるは
サイトにもよるのかな やべー

296:名無しさん@お腹いっぱい。
18/10/22 12:41:35.09 .net
実質、魚拓やArchive isと比べたら、アーカイブサイトでは一番順調なところなのに。
何で数日前以降のものが消えるかね!?
管理者は気がついてるのか!?

297:214
18/10/22 12:43:48.87 .net
>>290-291
ウチはどうだろう、と思って見てみたら・・・今月 6 日以降の分が全く保存されていない。
URLリンク(i.imgur.com)
どうも原因はサーバ不調とは別のよう。参考にならず申し訳ない。
>>221 で紹介した手順のまま何も変えていないのだが、明らかにおかしいので
通信内容を追ってみたところ、こちらが送った HEAD リクエストに対して 404 応答を返している。
試しに GET リクエストに切り替えてみると、きちんと 200 応答が返る。多分保存できている。
(以前は途中でリダイレクトがあったはずだが・・・どうだったっけ?)
おそらく仕様が変更されて、HEAD リクエストは使えなくなった、という事だと思う。
以下余談。
>>215 の 3 つのスクショと同じ URL、同じ年のカレンダーを再度見てみた。
URLリンク(i.imgur.com)
URLリンク(i.imgur.com)
URLリンク(i.imgur.com)
>>215 の時点では歯抜けになっていた 10 月分が、かなり埋まっている。

298:名無しさん@お腹いっぱい。
18/10/22 23:54:24.33 .net
月曜日終わりになっても特に改善せず
ここ数日1日以上前の物はすべて消滅

299:名無しさん@お腹いっぱい。
18/10/23 00:41:13.97 .net
前思い出したように復活したことあるよなあ
今回はどうなんだろう

300:名無しさん@お腹いっぱい。
18/10/23 16:41:13.19 .net
Access Denied

301:名無しさん@お腹いっぱい。
18/10/23 18:24:41.33 .net
ここ数日はりきってgeocitiesのアーカイブ保存してたのに消えてるじゃん...最悪
非表示じゃなくてアーカイブごと消滅したってこと?あまり詳しくないからわからんが

302:名無しさん@お腹いっぱい。
18/10/23 23:47:43.02 .net
火曜日終わりになっても順調に消滅中
なんかアナウンスでも欲しい所

303:名無しさん@お腹いっぱい。
18/10/24 00:04:11.87 .net
試しにCNNのアーカイブを確認してみると
URLリンク(web.archive.org)URLリンク(us.cnn.com)
やっぱり17日の昼くらいからさっぱりキャッシュが無くなってる
一応全世界的なのかもしれんが、外国の人は気づいているのだろうか?

304:名無しさん@お腹いっぱい。
18/10/26 07:00:40.48 .net
どうやら復旧した模様 過去の分も含めてリンクが表示されるようになった
どこかにアナウンスとか上がっているだろうか?

305:名無しさん@お腹いっぱい。
18/10/26 08:55:54.62 .net
直ったのか 良かった良かった

306:名無しさん@お腹いっぱい。
18/10/31 21:45:12.44 .net
300

307:名無しさん@お腹いっぱい。
18/11/01 01:59:51.46 .net
ジオ全盛の頃って累積アクセス数でキリ番踏んだら報告するよう書いてる人結構いたなあ
報告めんどくて毎回スルーしてたら後で踏み逃げ常習者として晒されてたりした
懐かしくて確認してみたらアーカイブ取得されてて(ノ∀`)アチャー

308:名無しさん@お腹いっぱい。
18/11/01 02:33:05.67 .net
悪いことはできないな

309:名無しさん@お腹いっぱい。
18/11/09 00:01:04.02 .net
どう晒すん?

310:名無しさん@お腹いっぱい。
18/11/09 09:26:29.80 .net
ぺージを見すぎるとエラーになる?

311:名無しさん@お腹いっぱい。
18/11/09 09:27:20.70 .net
全ページ検索はまだ実現しないんですか?

312:名無しさん@お腹いっぱい。
18/11/09 10:30:55.67 .net
大昔で来てたよね

313:名無しさん@お腹いっぱい。
18/11/09 13:46:06.53 .net
>>306
先月、毎日保存に使っているWebブラウザだと
URLリンク(web.archive.org)
できなくなったのは、ブラウザのCookieを削除したらできるようになった。

314:名無しさん@お腹いっぱい。
18/11/09 15:20:03.04 .net
Wayback Machine does not have this page archived.
見たかったページさようなら

315:名無しさん@お腹いっぱい。
18/11/13 10:50:38.41 .net
また消えてるページがある!?
昨日(11月12日)頻繁に「再読み込み」を促す画面が何度も出ていたが…。

316:名無しさん@お腹いっぱい。
18/11/13 14:48:03.50 .net
「再読み込み」を促す画面
何これ

317:名無しさん@お腹いっぱい。
18/11/13 20:29:41.27 .net
最近、google chromeでアーカイブを見ようとすると
「The Wayback Machine is an initiative of the Internet Archive, a 501(c)(3) non-profit, building a digital library of Internet sites and other cultural artifact


318:s in digital form. Other projects include Open Library & archive-it.org. Your use of the Wayback Machine is subject to the Internet Archive's Terms of Use.」 ってのが出てきて、先に進めない 別のブラウザだと普通に見えるのに



319:名無しさん@お腹いっぱい。
18/12/01 01:21:10.86 .net
英語わからん

320:名無しさん@お腹いっぱい。
18/12/01 02:58:50.17 .net
I don't know English

321:名無しさん@お腹いっぱい。
18/12/08 10:22:01.38 .net
URLリンク(members.jcom.home.ne.jp)が見れない

322:名無しさん@お腹いっぱい。
18/12/08 10:29:30.08 .net
あとAtwikiも魚拓とろうとするとスパム扱いされてできない

323:名無しさん@お腹いっぱい。
18/12/08 22:34:13.94 .net
>>317
そうか?

324:名無しさん@お腹いっぱい。
18/12/09 10:28:12.11 .net
>>318
スパム扱いされた例を貼っとく
URLリンク(web.archive.org)

325:名無しさん@お腹いっぱい。
18/12/11 09:37:18.12 .net
>>319
何だろうねぇ。
URLリンク(web.archive.org)
念のため、この時に使った User-Agent 文字列を貼っておく。
Mozilla/6.0 (Macintosh; Intel Mac OS X 10.13; rv:59.0) Gecko/20100101 Firefox/59.0

326:名無しさん@お腹いっぱい。
18/12/11 09:56:55.30 .net
Mozilla/5.0 (Windows NT 6.1; rv:52.0) Gecko/20100101 Firefox/52.0
これでやってみたら弾かれたw
URLリンク(web.archive.org)

327:名無しさん@お腹いっぱい。
18/12/11 13:50:43.49 .net
atwikiはFirefox 52にトラウマでもあるのか

328:名無しさん@お腹いっぱい。
18/12/11 19:58:30.15 .net
ふむふむ
URLリンク(web.archive.org)
Mozilla/6.0 (Macintosh; Intel Mac OS X 10.13; rv:60.0) Gecko/20100101 Firefox/60.0
>>322
/save/ を叩いた時なんだけど、もし点数方式で判定するなら
◎ IP は archive.org の取得用サーバ群の中の何れか一つが使われる。
米国の IP であること、また名前に www が入っていることは加点対象になる可能性あり。
同じ IP からの繰り返しアクセスも加点対象になる可能性あり。
◎ User-Agent を含め、リクエストヘッダはクライアントのものがそのまま転送される。
古いブラウザを使っていると加点対象になる可能性あり。
◎ さらに Via: HTTP/1.0 web.archive.org (Wayback Save Page) が追加される。
これは間違いなく加点対象。
この辺が総合的に判断されて弾かれているのだろう。
保存に成功することもあるので、Wayback Machine だからと言って一律に判断しているのでは無いと思う。

329:名無しさん@お腹いっぱい。
18/12/11 20:49:04.21 .net
そもそも閲覧回数が多いのってスパムっていうのだろうか
いや本筋と関係ないな

330:名無しさん@お腹いっぱい。
18/12/12 12:01:20.16 .net
biglobe復活したっぽい?

331:名無しさん@お腹いっぱい。
18/12/12 13:36:14.82 .net
なにそれ?まじ?

332:名無しさん@お腹いっぱい。
18/12/13 12:44:14.27 .net
先週くらいから、上のほうに寄付金募集のバナーが出るようになったな。
しかもIEだと、右上の「×」をクリックしても、どうしたわけかバナーが消えない。
この募集は本気だな。

333:名無しさん@お腹いっぱい。
18/12/13 14:08:10.35 .net
将来見たくなった時のためにそれの魚拓も撮っといてくれ

334:名無しさん@お腹いっぱい。
18/12/13 16:19:22.29 .net
>>328
URLリンク(web.archive.org)
これじゃ足りんのか?

335:名無しさん@お腹いっぱい。
18/12/13 16:32:01.50 .net
本気やな

336:名無しさん@お腹いっぱい。
18/12/13 16:38:05.04 .net
フィルタにぶっこんで終了
改悪し杉だ

337:名無しさん@お腹いっぱい。
18/12/13 18:31:05.91 .net
ウィキのコーヒー1杯みたいな洒落たジョークじゃないと金が集まらんぜ

338:名無しさん@お腹いっぱい。
18/12/13 19:00:40.93 .net
アーカイブ内は飲食禁止ですので…

339:名無しさん@お腹いっぱい。
18/12/24 07:37:21.51 .net
URLリンク(www26.atwiki.jp)">URLリンク(web.archive.org))
URLリンク(www26.atwiki.jp)">URLリンク(web.archive.org))
またスパム扱いされてる

340:名無しさん@お腹いっぱい。
18/12/24 11:12:18.71 .net
ハム食べたくなってきた

341:名無しさん@お腹いっぱい。
18/12/24 16:33:59.12 .net
221 名前:名無しさん@お腹いっぱい。[] 投稿日:2018/12/22(土) 16:36:12.78
こういう海外サービスを発見した。
まだちょこっとしか試していないが。
Archive.st
URLリンク(archive.st)<)

342:名無しさん@お腹いっぱい。
18/12/25 15:42:40.96 .net
>>328
本日12月25日現在(これでよろしい?)
URLリンク(i.imgur.com)

343:名無しさん@お腹いっぱい。
19/01/01 02:07:14.14 .net
5ドルは高いなあ

344:名無しさん@お腹いっぱい。
19/01/01 06:17:17.53 .net
12月30日に取った分が消えてる!?

345:名無しさん@お腹いっぱい。
19/01/02 14:42:28.29 .net
“WE’VE REACHED OUR GOAL!”
URLリンク(i.imgur.com)

346:名無しさん@お腹いっぱい。
19/01/02 16:26:04.27 .net
保守

347:名無しさん@お腹いっぱい。
19/01/02 17:30:15.52 .net
何だ俺のサポートはいらなかったんだ

348:名無しさん@お腹いっぱい。
19/01/02 21:03:41.50 .net
Wayback Everywhereってアドオン使ってるけど他に便利なのないかな

349:名無しさん@お腹いっぱい。
19/01/03 10:14:56.81 .net
以前のいつかと同じく、18年12月29日深夜から現在に至るまで取得したアーカイブの消失が起きている
注意されたし

350:
19/01/09 13:23:55.37 .net
名前上がらないけどWebrecorderとかInterPlanetary Waybackとか知ってる?
いいぞ~これ

351:名無しさん@お腹いっぱい。
19/01/09 17:39:45.59 .net
>>345
クラウド保存でなくローカル保存?

352:名無しさん@お腹いっぱい。
19/01/09 21:27:16.68 .net
どういうこっちゃ

353:名無しさん@お腹いっぱい。
19/01/10 15:23:06.86 .net
>>345
使い方がよくわからん。

354:
19/01/11 00:33:29.73 .net
Webrecorderは、Webページからwarcファイルを生成するWebアプリケーション
生成したwarcはコレクションに保存され、そのまま表示したり、
会員なら公開コレクションにすることでURLを貼って公開できる
+ New Sessionの隣の「…」から「Download Collection」でコレクション内のwarcファイルをダウンロードできる
warcファイルは魚拓の規格化された形式で、HTTPのステータスコードから画像や動画までそのページを表示するのに必要な情報を格納している
とりあえずwarcファイルさえあれば後からどうにでもなるから残したいサイトは今すぐcaptureしてこい
warcファイルを表示するには、「Webrecorder-player」というアプリが使える
またWebrecorderのコレクションにwarcファイルをアップロードして追加することも可能なので、そうやって表示や公開をしてもいい
InterPlanetary Waybackはもうちょっと高度な話で、IPFSと連携するためのものなんだけどこれは後でいい

355:名無しさん@お腹いっぱい。
19/01/11 01:54:02.35 .net
I see.

356:名無しさん@お腹いっぱい。
19/01/11 16:54:33.71 .net
アプリとかマンドクセ

357:名無しさん@お腹いっぱい。
19/01/14 23:42:12.54 .net
19/01/13の分から取得したアーカイブが確認不可能になっている

358:名無しさん@お腹いっぱい。
19/01/14 23:59:40.50 .net
いろいろあるな

359:名無しさん@お腹いっぱい。
19/01/15 11:10:48.03 .net
保守

360:名無しさん@お腹いっぱい。
19/01/23 19:17:49.86 .net
最近無茶苦茶重い時あるな
時間帯にもよるけど

361:名無しさん@お腹いっぱい。
19/01/23 23:58:37.78 .net
いうほど最近か?

362:214
19/01/24 03:33:30.27 .net
>>215 と同じ URL の 2018 年カレンダーを貼ってみます。
10 月に連続して欠けているのは、Internet Archive の仕様変更に対し
こちらの対応が遅れた (>>293) ことが原因です。
URLリンク(i.imgur.com)
URLリンク(i.imgur.com)
URLリンク(i.imgur.com)
こちらは URL を公開しちゃってもいいや。
この人の騒動について個人的に興味が無くなってきていること、
また別途取得させている個別エントリのアーカイブで十分なことから、いずれ止めるかもしれません。
URLリンク(web.archive.org)
昨年 3 月以降、一日 2 回の取得に対し計 4 回のスナップショットが記録されているのは、
HTTP から HTTPS へのリダイレクトと HTTPS で取得したブログコンテンツが
それぞれ計上されているためかと思われます。

363:名無しさん@お腹いっぱい。
19/01/27 16:51:33.96 .net
先週辺りから
「502 Bad Gateway」が
表示されることが多くなった

364:名無しさん@お腹いっぱい。
19/01/28 07:20:53.88 .net
NHKニュース公式のスクショが
ちゃんと保存されないポンコツびりには
あきれた

365:名無しさん@お腹いっぱい。
19/01/28 07:22:08.67 .net
×ポンコツびり
〇ポンコツぶり
あー本当に腹が立つ

366:名無しさん@お腹いっぱい。
19/01/29 10:32:25.48 .net
近々でNHK NE○S W○Bのトップページを
InternetArchive経由で魚拓を取った人は
一度確かめてほしい
なぜか画面が「本日現在」の状態になっているから
ウェブ魚拓ではMETAタグが引っかかって駄目
ArchiveTodayも変な画像(白地に黒文字の注意書き?のみ)
を結果として返してくるので駄目
まさか頼みの綱のInternetArchiveで大失敗するとは思わなんだ
どうしてもN○K NEWS ○EBのトップページを残したければ
画面を直に撮影するしか方法は無いようだ

367:名無しさん@お腹いっぱい。
19/01/29 13:31:19.65 .net
htmlに本文が入ってなくて、ajax的に別のファイルから読み込むやつはいかんな。
wixも同じ理由で保存されてない。
本文ファイルのキャッシュが残ってたとしても、それを読み込みに行ってくれないのよね

368:
19/01/30 15:31:24.94 .net
で、それはwebrecorderでも保存できないのかい?

369:名無しさん@お腹いっぱい。
19/02/01 19:43:12.41 .net
>>363
使い方が分かりにくいな
記録(魚拓)は取れても
その取り出し方がいまいち分かり辛い
後日に取り出してその当時の状態を
再現できなければ意味がないし

370:名無しさん@お腹いっぱい。
19/02/02 19:49:25.42 .net
>>362-363
何で「NHK NE○S W○B」のトップページの話を出したかといえば
先週日曜(1月27日)にあった某「国民的」グループの活動休止発表からだった
この時「N○K NEWS ○EB」のトップページでは
最上部の「速報」・そのすぐ下の「JUST IN」・本記事と
同時に3つの見出しで「○活動休止」の文字が並ぶという
何とも稀な状態になっていた
そこでInternetArchiveでページの魚拓を取り
同時にIrfanview経由でスクリーンショットを取った“はず”だったのだが
その画像を何らかの形で保存することをうっかり忘れてしまっていた
そして翌朝になってInternetArchiveを確認したら…
下のような状況になっていた
URLリンク(i.imgur.com)
すなわち明けて1月28日になったが
前日27日に取ったものが表示されないという状態
一応は類似の画像を検索してみたがこんなのしか出なかった
URLリンク(pbs.twimg.com)

371:363続き
19/02/02 19:50:59.02 .net
そんなわけで試しに1月27日以前に取られたものも表示してみたが
結局どの日でも表示されるのは“作業当日”の画面だった
つまりは二重三重で痛恨のミスをやら


372:かしたことになり 本当に今週はそれを引きずった… このままでは何か癪に障るので おまけを罪滅ぼしに置いておく (1月31日) https://i.imgur.com/E96yEeA.jpg https://i.imgur.com/bCjdPXO.jpg https://i.imgur.com/EAUNldo.jpg (昨2月1日) https://i.imgur.com/hpvfmr9.jpg



373:名無しさん@お腹いっぱい。
19/02/06 12:38:23.06 .net
つまりこういうことですわ…某所の3本見出し
(IA経由だと4本見出しになったが多分すぐに消える)
URLリンク(i.imgur.com)
URLリンク(i.imgur.com)
URLリンク(i.imgur.com)

374:名無しさん@お腹いっぱい。
19/02/09 01:56:12.20 .net
時々出てくるこれ、具体的に何かやっているというより、
503 応答のエラーページがこのように書かれているだけとしか思えないんだけどなぁ。
URLリンク(o.8ch.net)

375:名無しさん@お腹いっぱい。
19/02/09 17:40:02.31 .net
>>368
文字通りメンテナンス中と思わせるくらいに
数時間表示される場合もあれば…
この画面が出た後で再読み込みをしたら
すぐにトップ画面に戻る場合もある

376:名無しさん@お腹いっぱい。
19/02/11 03:28:55.18 .net
リンク先がなにもない真っさらなページだった時ってもう諦めたほうがいいですか?

377:名無しさん@お腹いっぱい。
19/02/11 11:07:09.41 .net
一概にはいえないがはい

378:名無しさん@お腹いっぱい。
19/02/20 13:36:23.52 .net
昨日2月19日に取ったものって消えてる!?

379:名無しさん@お腹いっぱい。
19/02/21 00:37:48.78 .net
たしかに2/19にとったやつが消えてますね
前もこんなこと1週間くらい続いたけど戻ったときがあったので様子見ですかね

380:名無しさん@お腹いっぱい。
19/02/21 02:05:25.15 .net
おやまあ難儀だねえ

381:名無しさん@お腹いっぱい。
19/02/25 18:11:13.56 .net
アーカイブのサイトが何だかおかしいね
当サイトは昨日「Sorry,we are busy」なんていう
初めて見た表示が出た
ウェブ魚拓は今日の午前中重かった
Archive isは断続的にキレる
一体全体どうなってるのか

382:名無しさん@お腹いっぱい。
19/02/26 18:41:52.94 .net
当社?

383:名無しさん@お腹いっぱい。
19/02/28 18:45:57.30 .net
最近取得してもすぐ消えるな

384:名無しさん@お腹いっぱい。
19/02/28 20:42:43.21 .net
yahoo!ブログまでサービス終了だ
どんどん老舗が消えていくなあ ネットのデータは儚い

385:名無しさん@お腹いっぱい。
19/02/28 21:02:55.33 .net
えっまじかよ

386:名無しさん@お腹いっぱい。
19/03/01 00:34:09.55 .net
ここ3日間くらいは全部アーカイブ消えてるな

387:名無しさん@お腹いっぱい。
19/03/04 13:45:25.05 .net
Yahoo!ブログ消えるのにYahoo!系はなぜかInternet Archiveで保存しても全部トップページに転送されちゃうから保存できないんだよな…

388:名無しさん@お腹いっぱい。
19/03/10 19:02:20.66 .net
消えるのか…?

389:名無しさん@お腹いっぱい。
19/03/16 12:44:48.31 .net
何だか重くなってるぞ
20分くらい前にはアクセス不能になっていたし

390:名無しさん@お腹いっぱい。
19/03/22 05:46:37.80 .net
2日前くらいからarchive.orgの再生時画面が小さくなってしまって辛い
全画面だと作業が出来ないしなあ

391:名無しさん@お腹いっぱい。
19/04/05 17:49:39.15 .net
>>381
このトップページ転送本当どうにかならんのかな。

392:名無しさん@お腹いっぱい。
19/04/05 21:22:53.08 .net
ほんらいのペエジは保存されてるの

393:名無しさん@お腹いっぱい。
19/04/06 00:51:58.43 .net
>>385
何なんだろうなこれ
自前でHeritrix回すとどんな感じになるんだろう
Yahooブログアーカイブ活動の本スレ
スレリンク(blog板)

394:名無しさん@お腹いっぱい。
19/04/06 21:50:02.80 .net
【保存・記録】ウェブアーカイブ総合 Page.01
スレリンク(internet板)

395:名無しさん@お腹いっぱい。
19/04/06 22:44:56.49 .net
魚拓もInternet Archiveも引っ掛からないスレタイって

396:名無しさん@お腹いっぱい。
19/04/07 02:07:26.56 .net
>>385
3 年前に前スレで挙がったスクリプトがそのまま使われてるんだけどな。
スレリンク(esite板:839番)-854

397:名無しさん@お腹いっぱい。
19/04/09 19:23:32.75 .net
>>390
サンクス。
adblockの詳細設定のマイフィルターリストに「*/yjsecure.js」を登録してadblock有効で転送されなくなった。

398:名無しさん@お腹いっぱい。
19/04/10 16:44:20.47 .net
ボス猫

399:名無しさん@お腹いっぱい。
19/04/10 16:44:54.15 .net
失礼誤爆

400:名無しさん@お腹いっぱい。
19/04/10 17:54:51.45 .net
スレリンク(internet板:78番)-79
/save/ を知ってて /web/2/ を知らないとは。
あと保存の際に http:// や https:// を無条件に外すのも考え物。
HTTP から HTTPS へリダイレクトするサイトだと、そのリダイレクトも
保存回数に計上されてしまう。

401:名無しさん@お腹いっぱい。
19/04/10 18:40:23.58 .net
>>394
そのブックマークレットを作った人間ではないけど、Wayback Machine初心者の自分に/web/2/が何なのか教えて下さい
あと保存回数の計上が増えると何か問題があるの?

402:名無しさん@お腹いっぱい。
19/04/10 18:40:36.94 .net
/save/知ってるのはgeocitiesのスレの方で多用されてたからじゃないかな

403:名無しさん@お腹いっぱい。
19/04/10 18:44:09.20 .net
/save/と/*/はわりかし有名だと思う

404:名無しさん@お腹いっぱい。
19/04/10 21:30:16.96 .net
>>397
これ
/web/2/は初めて聞いたけどその二つは言うほど特別な知識ではないと思うよ

405:名無しさん@お腹いっぱい。
19/04/11 00:15:00.50 .net
/0/と/1/は知ってるけど/2/は初めて見た。

406:名無しさん@お腹いっぱい。
19/04/12 14:03:48.45 .net
今年の2月分
ゴッソリ消えてる!?

407:214
19/04/12 15:44:18.86 .net
>>400
っぽいですね。
URLリンク(i.imgur.com)
ただ、アーカイビングとインデクシングはそれぞれ独立しているみたいなので、
後者だけでデータの欠落が発生しているという可能性もあると思います。

408:名無しさん@お腹いっぱい。
19/04/12 16:25:15.40 .net
はえー

409:214
19/04/14 17:12:22.85 .net
ふっかつっ!
URLリンク(i.imgur.com)

410:名無しさん@お腹いっぱい。
19/04/14 17:15:33.25 .net
えがった

411:名無しさん@お腹いっぱい。
19/04/19 08:25:11.36 .net
全ページ内全文検索はまだ?
なんか問題でもあるのか?

412:名無しさん@お腹いっぱい。
19/04/19 16:18:48.21 .net
昔やってたけどすぐ立ち消えたからきつかったんじゃね

413:名無しさん@お腹いっぱい。
19/04/23 16:43:50.23 .net
Scheduled Maintenance
先ほどからこの表示
長くなりそうか?

414:名無しさん@お腹いっぱい。
19/04/25 00:54:18.11 .net
IAってrobots.txtを読み込んでるんだな
URLリンク(www.digitaltrends.com)
URLリンク(blog.archive.org)
こういう記事が出てたから完全に読み込まないようになったと思ってたんだが、robots.txtでIAを排除してるサイトを保存してくれなかった

415:名無しさん@お腹いっぱい。
19/04/25 07:38:49.03 .net
>>408
機械翻訳使ったのかどうか知らんが、文章の意味を読み取れて無いだけやんか。

416:名無しさん@お腹いっぱい。
19/04/25 15:36:04.78 .net
>>408
米国政府のサイトと米軍のサイト限定って書いてあるな
そこまで強調して書いてある訳ではないとは言えもうちょっと慎重に読もう
しかし、robots.txtが邪魔なら全サイトで無視しちゃば良いのにな
どうせ法的拘束力はないんだし

417:名無しさん@お腹いっぱい。
19/04/25 18:16:09.24 .net
過去分リストが今日から(?)マイナーチェンジしている件

418:名無しさん@お腹いっぱい。
19/04/25 18:52:48.09 .net
自動的に最新ログの年に飛ばない気がする。2019年。

419:名無しさん@お腹いっぱい。
19/05/01 01:04:13.28 .net
改元でなんかいいの録れたら教えてください

420:名無しさん@お腹いっぱい。
19/05/03 15:57:31.30 .net
数分前から「HTTP ERROR 400」と出て使えない

421:名無しさん@お腹いっぱい。
19/05/14 05:19:52.89 .net
手動で1ページ1カテゴリーづつ保存するの面倒くさいんですけど、
自動巡回で指定のサイトやブログをURLリンク(web.archive.org)に保存出来る方法なんて無いですよね?
毎日毎日徹夜で保存して疲れた…保存しても保存してもキリがない…

422:名無しさん@お腹いっぱい。
19/05/14 12:56:17.84 .net
>>415
>毎日毎日徹夜で保存して疲れた…
>保存しても保存してもキリがない…
アーカイブサイト全�


423:ハのユーザーの 最大の悩みでもあるな 一度やり始めたら強迫観念が出てきて 毎日やらねばならなくなる しかも誰もがやっているわけじゃなさそうだから 自分が休んでも他の人が補完してくれる保証はないしね



424:名無しさん@お腹いっぱい。
19/05/15 02:06:18.98 .net
やろうと思えばプログラム組んで出来るよ、ネット探せば色々見つかる
さっきWebアーカイブ総合スレに投稿されたやつを転載
0175 py ◆o3kzHb/in8w0 2019/05/14 19:06:58
URLリンク(u1.getuploader.com)
web2IAWBM.dms ver0.000.007 WayBackMachineに保存 (web.archive.org) 2019/05/14
web2IAWBM.dmsはIrvineとDorothy2を使ってInternet Archive WayBack Machineに自動登録(保存)するためのスクリプトです。
自動で全てのリンクをたどって保存してくれるはずです。
web2IAWBM.dmsは素人が作った物なので至らない点も多々ありますが、
一応使える水準になったと思われるので公開します。
無料のウィルススキャンはしましたが、念のためもう一度スキャンされることをお勧めします。
同梱のDorothy2(の一部)は別の方が作った物です。
■ Irvine初回起動前に必ず jwordフォルダを削除してください。■
動作試験環境:windows10pro Irvine1.3.1

425:名無しさん@お腹いっぱい。
19/05/15 02:09:48.66 .net
IAヘビーユーザーが多いであろうここの住人なら、
自動化手段を発見済みかスクリプト自作してる人がいるだろうと思ってたが、案外そういう訳でもないのかな

426:名無しさん@お腹いっぱい。
19/05/15 05:10:13.79 .net
>>416-418
ありがとうございます。
勇気出して聞いてよかった…頑張る

427:名無しさん@お腹いっぱい。
19/05/15 07:42:21.01 .net
やっぱり Irvine を土台にするよなぁ。みんな考えることは同じだね。
>>418
どうですかねぇ。
URLリンク(web.archive.org)
URLリンク(web.archive.org)

428:名無しさん@お腹いっぱい。
19/05/23 16:45:13.77 .net
archive.orgにファイルアップロードしてる人っている?

429:名無しさん@お腹いっぱい。
19/05/23 21:45:14.89 .net
どんなときもー

430:名無しさん@お腹いっぱい。
19/05/26 03:07:17.45 .net
重宝していた攻略サイトが消えてしまった・・
アーカイブされていたのに何故?何が原因でまるごと
消えてしまったんだ?

431:名無しさん@お腹いっぱい。
19/05/26 13:33:28.50 .net
どこ?

432:名無しさん@お腹いっぱい。
19/05/26 15:46:05.58 .net
archive.orgにファイルアップロードしてる人っている?

433:名無しさん@お腹いっぱい。
19/05/31 17:26:07.60 .net
ベータ版の新しいSave Page Nowを使ってみたかったからユーザー登録してみた
思いのほかあっさり登録できて少し驚いた

434:名無しさん@お腹いっぱい。
19/06/07 03:04:34.14 .net
今、サーバーエラー出てる
503 Service Unavailable
No server is available to handle this request.

435:名無しさん@お腹いっぱい。
19/06/07 04:14:39.73 .net
復活してた

436:名無しさん@お腹いっぱい。
19/06/08 04:29:23.99 .net
スマホからSave Page Nowを使ってTwitterをアーカイブしようとすると必ずエラーを吐いてくる
PCではそんなことになった経験がないんだけど何がおかしいんだろう
あと、これはスマホもPCも関係ないんだが、
Internet Archiveの場合ツイートがjsonと解釈さ
れてしまう場合が多い
Archive.todayやmegalodonは普通のHTMLコンテンツと解釈してくれるんだが、IAだと何でjsonになってしまうんだろう

437:名無しさん@お腹いっぱい。
19/06/25 13:34:53.69 .net
エラー入りました(この表示は初めてだ)
500 Internal Server Error
nginx/1.10.3 (Ubuntu)

438:214
19/06/25 14:24:49.75 .net
落ちてる落ちてる
URLリンク(twitter.com)
(deleted an u


439:nsolicited ad)



440:名無しさん@お腹いっぱい。
19/06/25 17:10:05.80 .net
まだ落ちてんのかよ

441:名無しさん@お腹いっぱい。
19/06/25 18:07:29.24 .net
まだ駄目だね

442:名無しさん@お腹いっぱい。
19/06/25 18:25:49.56 .net
にしてもこうまで長時間の「メンテナンス」はいつ以来か

443:名無しさん@お腹いっぱい。
19/06/25 22:13:06.38 .net
最近400errorみたいな表示が多かったのは前兆だったのか・・・?

444:名無しさん@お腹いっぱい。
19/06/26 01:48:15.81 .net
hmmm

445:名無しさん@お腹いっぱい。
19/06/26 04:56:31.21 .net
おっメンテナンス終わったかな?

446:214
19/06/26 05:24:58.72 .net
URLリンク(twitter.com)
詳しくは述べられていないが何処かで断線していたらしい。
(deleted an unsolicited ad)

447:名無しさん@お腹いっぱい。
19/06/26 11:17:32.59 .net
掃除機か?

448:名無しさん@お腹いっぱい。
19/06/26 13:28:47.85 .net
しかし長かったねえ

449:名無しさん@お腹いっぱい。
19/06/26 18:58:15.72 .net
鼠じゃないの?

450:名無しさん@お腹いっぱい。
19/06/26 20:29:57.40 .net
ミッキーマウスの複数形ってミッキーマイス?

451:名無しさん@お腹いっぱい。
19/06/26 20:30:13.51 .net
ごめんスレ見誤った

452:名無しさん@お腹いっぱい。
19/06/28 20:13:41.33 .net
>>426
> ベータ版の新しいSave Page Now

初耳

453:名無しさん@お腹いっぱい。
19/06/28 20:25:37.04 .net
あー、すまん。勘違いしていた。

454:名無しさん@お腹いっぱい。
19/06/28 22:52:24.09 .net
どっちや

455:名無しさん@お腹いっぱい。
19/07/07 14:56:34.46 .net
どっちらけ

456:名無しさん@お腹いっぱい。
19/07/13 13:26:19.30 .net
なんか保存済みページをIA開いて記事とかの2ページ目から3ページ目に移動しようとすると2ページ目に移動する(移動できてない)。
なんかちょっとおかしい。

457:名無しさん@お腹いっぱい。
19/07/14 02:21:08.08 .net
そのサイト
スクリプトでページ切り替えてるんでねーの?

458:名無しさん@お腹いっぱい。
19/07/14 13:56:13.87 .net
訛っちゅうげ

459:名無しさん@お腹いっぱい。
19/07/19 06:31:44.32 .net
imgur直リンがSavePageNow出来なくなった。

460:名無しさん@お腹いっぱい。
19/07/19 21:22:55.64 .net
Twitterをアーカイブすると必ず表示が崩れる人がいるんだが
あれって何なんだろうか

461:名無しさん@お腹いっぱい。
19/07/19 23:06:25.81 .net
最近保存してないけどツイッターいつもUIが謎の外国語になってたわ

462:名無しさん@お腹いっぱい。
19/07/20 00:37:36.80 .net
>>453
それ多分IAが経由してるサーバーの国の言語で表示されてるんだと思う

463:名無しさん@お腹いっぱい。
19/07/20 10:05:42.37 .net
>>451の症状が治ったっぽい

464:鈴木喜三郎
19/07/23 05:49:06.07 .net
これarchive.vnだと保存できない奴も保存出来るから便利

465:名無しさん@お腹いっぱい。
19/07/23 16:22:05.75 .net
>>456
> これ

どれ?

466:名無しさん@お腹いっぱい。
19/07/23 18:20:17.89 .net
これが示すのはInternet Archive Wayback Machineのことだろ。

467:名無しさん@お腹いっぱい。
19/07/23 18:28:08.66 .net
そうか

468:名無しさん@お腹いっぱい。
19/07/27 14:21:28.66 .net
>>448の症状は直らない

469:名無しさん@お腹いっぱい。
19/07/27 15:47:23.29 .net
具体的にどこよ?

470:名無しさん@お腹いっぱい。
19/07/27 17:52:51.11 .net
URLリンク(web.archive.org)
東洋経済の記事で未保存記事を1ページ目を保存して、1ページ目のアーカイブから2ページ目のリンクを開くと
保存されていないから当然保存用のリンクが表示されるけど、2ページ目のアーカイブから3ページ目のリンクを
クリックすると2ページ目のアーカイブが再度表示される。
以前だったら連続で保存できたのにできなくなって直接SavePageNowに打ち込むしかなくなったっぽい。

471:名無しさん@お腹いっぱい。
19/07/27 17:53:37.41 .net
>>461
具体的にこれ>>462

472:459
19/07/27 18:55:41.10 .net
URLリンク(toyokeizai.net)
URLリンク(toyokeizai.net)
この 2 つを Internet Archive の入力欄に突っ込んでやってみたけど、
どちらも先頭から最後のページまで、"This page is available on the web!" を経て保存できたけどなぁ。
URLリンク(web.archive.org)
URLリンク(web.archive.org)
どうもこちらでは現象が再現できない。

473:名無しさん@お腹いっぱい。
19/07/31 16:56:51.69 .net
>>464
もう一回試してみたけど、また同じ症状になった。page=2が再表示。駄目やん
Firefoxアプデ放�


474:uしてたのが原因かと思って、他のタブ閉じたりしてしばらくたったところで アプデ前にもう一回挑戦したら、何故かpage=3も保存できた。あれ?できた。どうなってるんだ?



475:名無しさん@お腹いっぱい。
19/07/31 21:58:16.17 .net
archive.todayまったく繋がらないけど同じ状況の人いませんか?

476:名無しさん@お腹いっぱい。
19/07/31 22:03:00.21 .net
問題なし

477:名無しさん@お腹いっぱい。
19/08/04 23:29:04.15 .net
>>429
Heritrixの仕様か何かなのかな?
自前でHeritrix動かしたことないから断言は出来ないけど

478:名無しさん@お腹いっぱい。
19/08/07 05:57:03.34 .net
/save/の調子がおかしい

479:名無しさん@お腹いっぱい。
19/08/07 10:04:06.93 .net
Chromeにしたらできた。ブラウザの問題か?

480:名無しさん@お腹いっぱい。
19/08/09 14:25:43.54 .net
5ch全体がまた長い時間落ちてたな…
URLリンク(i.imgur.com)
URLリンク(i.imgur.com)
で当サイトも13時前後にこうなってた
(幸い今は元に戻ってるが)
URLリンク(i.imgur.com)
URLリンク(i.imgur.com)

481:名無しさん@お腹いっぱい。
19/08/10 13:00:17.06 .net
ひょっとしたら改悪が行われたか?
以前ならば、(うまく説明できないが)例えばニュースサイトならば、
本記事以外の近隣記事なり参照記事のURLをクリックすると、
取得前のものについては、新規の取得を促す画面が出ていた。
これが大量に記事を取りたい場合には、非常に助かっていたのだが…
ところが昨日からは、上記と同じ動作を行うと、そういう画面が出なくなった。
代わりに出てきたのがこれ↓
URLリンク(i.imgur.com)
そのため、いちいち一つずつ「Save Page Now」の部分に
URLを打ち込んで、対処している状態だが…。
やっぱりどうにも面倒くさい。
「This page is not available on the web」「because of server error」
ということは、一部のサーバーが動いていないのが原因で、
それさえ治れば、先に触れた機能も復活するのか?
このままでは仕事量が多くなる一方だから、何とかしてほしいんだが。

482:名無しさん@お腹いっぱい。
19/08/10 17:11:05.47 .net
>>472の別パターン
URLリンク(i.imgur.com)

483:471
19/08/10 17:16:33.62 .net
因みに>>472とはメッセージが異なる。
「The Wayback Machine has not archived that URL.」
「This page is not available on the web」
「because request is invalid」

484:214
19/08/10 20:23:49.05 .net
>>472
それ、起こるサイトでは以前から発生しているけどなぁ。
> そのため、いちいち一つずつ「Save Page Now」の部分に
> URLを打ち込んで、対処している状態だが…。
アドレスバーの /web/日付時刻数字/ を /save/ に変えるだけでは駄目なのか?
面倒なことには変わりは無いが。
せっかくブラウザにブックマークツールバーを出してるんだったら
強制保存させるブックマークレットを登録してしまえ。
URLリンク(pastebin.com)

485:名無しさん@お腹いっぱい。
19/08/10 20:57:03.82 .net
ほーんそんなことできるやね

486:名無しさん@お腹いっぱい。
19/08/11 16:13:46.46 .net
>>475
>それ、起こるサイトでは以前から発生しているけどなぁ。
東京スポーツの公式サイトのうち「バックナンバー(本日の紙面)」に関しては、
こうした現象を確認していたんだが 、本当にあるとすればそのくらいで、
いきなり対象となる範囲が広がってしまった印象。
>アドレスバーの /web/日付時刻数字/ を /save/ に変えるだけでは駄目なのか?
>面倒なことには変わりは無いが。
これを試してみたけど、幾分作業が楽になった。これ、しばらく続けてみます。
本当にありがとうございます。

487:名無しさん@お腹いっぱい。
19/08/11 18:37:46.76 .net
Twitterも最近その現象になってしまったな
アーカイブ先への負荷対策とかなんかね

488:名無しさん@お腹いっぱい。
19/08/17 00:10:57.04 .net
>>462の症状は今は直っているぽい

489:名無しさん@お腹いっぱい。
19/08/17 13:08:01.08 .net
>>472に関しても、元に戻ったみたいだ(新規取得を促す画面が復活)。
とはいえ>>475最下段のブックマークレットは、使ってみたら
結構便利なので、しばらく併用ということで。

ところでchromeはともかくとして、先日からIEではかなり使い辛くなった。
保存の後、以前なら左上隅のロゴマークをクリックするとトップページに戻っていたのが、
なぜか違うページに飛ばされるようになった。
上方に四角形がいくつか並んでいるのと、小さな英文が表示されたページだが、
その四角形は関連サイトへのリンクらしく、左端の四角形をクリックすると、
やっとこさ当サイトのトップページに戻ることができた。
さらに言えば、「BROWSE HISTORY」(過去の保存リストが表示される画面行き)が
IEでは使えなくなってしまってる。

490:名無しさん@お腹いっぱい。
19/08/19 18:42:22.44 .net
IEだと使いづらいね。過去のキャプチャ一覧も見られなくなったし。
Microsoft Edgeなら問題なく見られるから今後はEdgeで見ようかな

491:名無しさん@お腹いっぱい。
19/08/19 21:28:32.19 .net
直リン禁止サイトの画像がキャプチャできないっぽい

492:214
19/08/20 00:08:02.41 .net
>>482
元々そういう仕様。
/save/ を使って保存させたとき、ブラウザから Internet Archive へ送られた
リクエストヘッダ類 (俗に環境変数と呼ばれているやつ) は
一部の改変・追加のみで元サーバへ送られるので、
これを偽装することによって直リン回避は可能。
リファラーのみチェックしているサイトについては、やったことがある。
ただ、同一の URL について複数の日付のアーカイブが存在しているときに、
自分が /save/ したものだけ画像あり、他人が /save/ したものは画像無し、
ということになるのであまり実用性は無いと思う。

493:名無しさん@お腹いっぱい。
19/08/20 04:06:07.29 .net
>>480-481
何が悲しくって未だにIE使ってるの?
MSももはやサポート放棄しようとしてるのに

494:名無しさん@お腹いっぱい。
19/08/20 04:09:28.55 .net
Internet Archiveがどうかは分からないけど、最近のサイトは面倒なIE対応を放棄してるところも多いし、
悪いこと言わないからEdgeとかChromeとかFirefoxとかに乗り換えた方が良い
というかIAも長くてあと2,3年でIEじゃちゃんと見れなくなると思うぞ

495:名無しさん@お腹いっぱい。
19/08/20 11:55:38.40 .net
IEだとまったく使い物にならなくなっていたのか。
検索かけて原因見てもだれも指摘してないので調べたら、5chのこのスレでようやく原因判明
クローム使えってか。たしかにweb.archive.org/web/*/ の保存一覧がちゃんと出るようになった
見られないからwebarchiveに無駄に垢とっちゃったよ消したい・・・・

496:名無しさん@お腹いっぱい。
19/08/20 17:01:34.51 .net
>>484
図書館などの公共施設のパソコンだと、
いまだにブラウザといえばIEしか用意されてない。

497:名無しさん@お腹いっぱい。
19/08/21 01:38:06.53 .net
IEは業務決め打ちシステム用が多くて下手に改変もできないが無視して捨てるわけにもいかないがんじがらめ状態なんだろうな

498:名無しさん@お腹いっぱい。
19/08/21 19:32:31.80 .net
>>483
ありがとう。Referer ControlをInactiveにしたら画像もキャプチャできた。

499:名無しさん@お腹いっぱい。
19/08/31 13:21:10.56 .net
こんな表示初めてだ
URLリンク(i.imgur.com)

500:名無しさん@お腹いっぱい。
19/08/31 13:23:41.39 .net
429 Too Many Requests
You have sent too many requests in a given amount of time.
…ありゃスレもあがってないや

501:名無しさん@お腹いっぱい。
19/09/03 11:14:03.82 .net
>>490
これ俺だけじゃなかったのか
てっきりアーカイブし過ぎたせいかと

502:名無しさん@お腹いっぱい。
19/09/03 17:20:01.26 .net
ここ数日
すぐに結果が表示されずに
画面が真っ白になる現象が起きている
今のところ少し時間を置けば普通の状態になるので
使えは


503:するが何だか謎



504:名無しさん@お腹いっぱい。
19/09/03 23:12:39.81 .net
>>492
同じく。
>>493
トップにしかアクセスできない。
ブラウザによってはトップすらアクセスできず。

505:名無しさん@お腹いっぱい。
19/09/03 23:53:16.60 .net
>>490
スクショをJPEGで上げてる時点で程度が知れてる

506:名無しさん@お腹いっぱい。
19/09/04 00:05:55.93 .net
激重だな

507:名無しさん@お腹いっぱい。
19/09/05 02:32:15.75 .net
ようやくトップ以外にもアクセスできるようになった。

508:名無しさん@お腹いっぱい。
19/09/06 17:35:27.43 .net
>>481
URL検索がずっと死んだままで特定サイトの年代別アーカイブが探りにくい
検索エンジンも昔はサクサクで一覧出てきたのが、何年か前にUIがリニュされてから、ずっと激重で不便極まりなかったけど…

509:名無しさん@お腹いっぱい。
19/09/06 18:04:08.37 .net
>>486
Chromeも古い端末だと最終verでも駄目だね。
Edgeが使えるぐらい新しい機種でないと…

510:名無しさん@お腹いっぱい。
19/09/07 17:00:08.96 .net
ピザ

511:名無しさん@お腹いっぱい。
19/09/07 23:07:16.12 .net
ピザピザ

512:名無しさん@お腹いっぱい。
19/09/09 21:12:02.33 .net
30分ほど前からサイトにつながらない

513:名無しさん@お腹いっぱい。
19/09/09 21:26:42.32 .net
こっちは普通に問題なく繋がってる
今もSave Page Nowでいくつか保存してきた
ベータ版SPNのSave outlinksってオプションを初めて使ってみたがめちゃくちゃ便利だな

514:名無しさん@お腹いっぱい。
19/09/09 22:06:55.46 .net
なにそれ
もしゃあして全部保存してくれるの

515:名無しさん@お腹いっぱい。
19/09/10 06:26:29.17 .net
>>503
> ベータ版SPNのSave outlinksってオプション

知らない

516:名無しさん@お腹いっぱい。
19/09/10 06:31:20.60 .net
ベータ版SPNのSave outlinks 
いま試してみたが、ヤフーニュースはやっぱり魚拓とれなかった。

517:名無しさん@お腹いっぱい。
19/09/10 14:26:32.65 .net
海外のブックマークサービスと魚拓サービスのリスト
URLリンク(github.com)

518:名無しさん@お腹いっぱい。
19/09/10 14:53:20.34 .net
>>506
アーカイブが取れて無いのと、例のページ遷移スクリプトが発動してるだけなのと
どっちなんだ

519:501
19/09/10 16:04:06.39 .net
Save outlinksってのは、SPNに投げたURLのページに貼られてるリンク先も全て読み込んで保存してくれるオプション
さすがに無制限にリンクを辿る訳ではなくて1段階しか辿ってくれないけど、それでもかなり手間が省ける
遷移スクリプトの発火をキャンセルしてくれるような機能はおそらくないと思う

520:501
19/09/10 16:23:18.90 .net
ここから使える
URLリンク(web.archive.org)

521:名無しさん@お腹いっぱい。
19/09/10 17:21:54.72 .net
>>508
>>506
今までインターネットアーカイブでヤフー関連のページの魚拓を
取ってもヤフートップに飛ばされた魚拓しか表示されなかったので
ここでは魚拓は取れないものと思っていたが、実は取れていたと知
恵袋に書いてあった。
URLリンク(superbabooooo.blog.jp)

522:名無しさん@お腹いっぱい。
19/09/10 17:43:04.48 .net
またクソ重になってら
他だと取りにくいページもあるのに

523:名無しさん@お腹いっぱい。
19/09/10 17:50:40.56 .net
確か/web/1/が最古、/web/2が最新のアーカイブなんだよね
これ以外に隠しコマンドというか隠しエンドポイント的なURLはあるの?

524:名無しさん@お腹いっぱい。
19/09/10 18:26:40.26 .net
/0/は?

525:名無しさん@お腹いっぱい。
19/09/10 19:08:38.46 .net
>>514
初耳だったのでexample.comで試してみたが最古のものが表示された
/1/と同じなのでは

526:名無しさん@お腹いっぱい。
19/09/11 01:13:51.29 .net
/1996/は?

527:214
19/09/11 13:00:53.66 .net
>>516
/web/年/ とか /web/年月/ とかは、現在の UI が Beta から本導入となった時に廃止された。
今でもエラーとはならないものの、数字の意味する通りには動かなくなっている。
>>513
数字の後ろに付ける、コマンドみたいなものは前スレでほぼ挙がっているから、
いわゆる文字化け


528:騒動以降のレスに一通り目を通しておくと良いと思う。



529:名無しさん@お腹いっぱい。
19/09/12 02:32:02.83 .net
ふむ

530:名無しさん@お腹いっぱい。
19/09/12 03:00:49.41 .net
>>517
情報ありがとう
主なものをまとめるとこんな感じだろうか、間違いや抜けがあったら教えてくれ
(全てURLリンク(example.com)<)
まだ情報を精査出来てないけどここも参考になりうるかも:URLリンク(github.com)

531:名無しさん@お腹いっぱい。
19/09/12 03:03:53.26 .net
新しいSPNのSave outlinksなどのオプションのオンオフ情報はやはりHTTPリクエストの中に含まれてるのかな
このオプションを使った/save/を自動化できたらいいんだが

532:名無しさん@お腹いっぱい。
19/09/12 03:09:00.47 .net
どうでもいいことだが、前スレに比べるとこのスレは書き込み数がだいぶ多いな
何かのきっかけで人口が増えたのかもな

533:名無しさん@お腹いっぱい。
19/09/12 03:15:09.71 .net
個人Webスペースが消える一方だからな

534:名無しさん@お腹いっぱい。
19/09/12 06:36:52.72 .net
>>522
ヤフーブログやヤプログまで消滅するからな。

535:名無しさん@お腹いっぱい。
19/09/12 11:08:25.50 .net
>>512
ここ2~3日おかしいね。
使える時もあるけど、すぐに息切れするかのように
アクセス不可になってしまう。
瞬時に見出しや内容を変えかねないニュースサイトについては、
他が調子が悪かったり、動作のスピードがゆっくりになった分、
ここのサイトがぴったりになってるが、ここもダメになったら本当に痛い。

536:名無しさん@お腹いっぱい。
19/09/12 19:20:26.85 .net
魚拓界という言い方があるかは知らないが、
今年は受難の年だなあ。

537:名無しさん@お腹いっぱい。
19/09/12 21:34:02.49 .net
釣りに引っ掛かりやすそうやつばかり住んでそうな界だな

538:名無しさん@お腹いっぱい。
19/09/13 00:44:04.97 .net
自分の環境ではここ数日の間も普通に保存できてるから受難とか言われてもあまりピンと来ない

539:名無しさん@お腹いっぱい。
19/09/13 00:48:04.43 .net
自分はいつアクセスしても特に何事もなく保存できているが、不安定で使えないという人もいるのか
回線か時間帯かマシンかブラウザかサイト特有の問題かはたまた別の何かか、何がおかしいんだろうな

540:名無しさん@お腹いっぱい。
19/09/13 14:33:47.72 .net
使っていくうちに後になって「アクセス不可」と返してきたり
昨日などは一日中動きが固くなった末やっと画面が変わったら「アクセス不可」
と本当に様々だが
自分にとっては必要なんだよ
誰も新聞社のニュースサイトなんて取ってねえから
環境によって使えませんという話なら誰か自分の代わりにやってほしいわ…

541:名無しさん@お腹いっぱい。
19/09/14 11:22:10.85 .net
どこの新聞社のサイトなんよ
URL分かれば多少は手伝いようがある

542:名無しさん@お腹いっぱい。
19/09/14 14:39:00.18 .net
時間が経つにつれ必然的にアーカイブの重要性は増していくので
IAには頑張ってほしいね

543:名無しさん@お腹いっぱい。
19/09/15 03:19:48.19 .net
何かの間違いで消滅したら一番ショックなサイトな気がしてきた

544:名無しさん@お腹いっぱい。
19/09/16 11:52:43.11 .net
今is共々落ちてる
同時に落ちたらなんにも出来なくて困る・・・

545:名無しさん@お腹いっぱい。
19/09/16 15:43:35.10 .net
14~15日に取った分消えてる!?

546:名無しさん@お腹いっぱい。
19/09/16 17:47:56.69 .net
お世話になります

547:名無しさん@お腹いっぱい。
19/09/17 18:37:03.69 .net
>>534
稀によくある
数日経った後に反映される

548:名無しさん@お腹いっぱい。
19/09/18 00:05:26.20 .net
>>536
まさに稀によくあるの好用例すぎるw
あの図解を思い出せる

●●●●●●●
●●●●●●●
●●●○○○○
○●●●●●●
●●●

549:名無しさん@お腹いっぱい。
19/09/19 22:53:33.55 .net
現在また取得不可能に

550:名無しさん@お腹いっぱい。
19/09/21 13:13:25.89 .net
最近の人ってInternetArchiveって知ってるんだろうか

551:名無しさん@お腹いっぱい。
19/09/21 13:21:52.78 .net
どういうことよ

552:名無しさん@お腹いっぱい。
19/09/21 23:54:10.27 .net
知らない年長者も多く見かけるし、知ってて活用してる若者も多く見かける
老いも若きも関係なく、知ってる人は知ってるし知らない人は知らないんだと思う

553:名無しさん@お腹いっぱい。
19/09/23 02:12:26.72 .net
>>519
id_のコマンドを初めて知ったがすごく便利だなこれ、thx

554:名無しさん@お腹いっぱい。
19/09/24 11:18:16.68 .net
30分くらい前から、5chのスレッドや、imgurの画像が
ハネられるようになったな。
>>541
分かるなあ。
「魚拓を取る」という行為自体が、まだまだ一般的ではないんだよな。

555:名無しさん@お腹いっぱい。
19/09/24 14:20:55.70 .net
twitterとか見ると発言の証拠にスマホのスクショ使ってるのをよく見るよね
あんなんやろうと思えばいくらでもいじれるのに…

556:名無しさん@お腹いっぱい。
19/09/24 14:47:07.74 .net
このスレには未だにスクショをJPEGで貼る奴が・・・

557:名無しさん@お腹いっぱい。
19/09/24 15:42:33.91 .net
>>545
アニメ板とかだとこだわるんだろうか
スクショの目的の多くは再現性では無いと思うから別にファイル形式はどうでもいいのでは

558:名無しさん@お腹いっぱい。
19/09/24 18:49:14.06 .net
URLリンク(i.imgur%2ecom)

559:名無しさん@お腹いっぱい。
19/09/24 19:07:47.61 .net
>>543
>「魚拓を取る」という行為自体が、まだまだ一般的ではないんだよな。
同感だわ
過去の文書や書籍を将来のために保管するのが大事だって意識自体、日本では今ひとつ根付いてない
(どこかの地方図書館が入り切らない蔵書を焼却処分したという最近のニュースが好例)
昔からある紙の資料ですらそんな扱いなんだから、Webアーカイブを取るという意識が根付いているはずもないわな
それにしても、スクショのファイル形式がjpegだとなんか問題があるの?
確かにアニメのキャプとか高い画質が要求される種類の画像なら確かにダメだろうけど

560:名無しさん@お腹いっぱい。
19/09/25 01:58:43.16 .net
学校でweb魚拓の存在を解説するべきだと思うの

561:名無しさん@お腹いっぱい。
19/09/25 03:23:56.97 .net
若いって良いなぁ

562:名無しさん@お腹いっぱい。
19/09/25 23:52:11.76 .net
人が押し寄せて余計重くなったらどうする

563:名無しさん@お腹いっぱい。
19/09/27 16:39:51.22 .net
既に重いんだから多少人が増えたってどうせ主観的な重さ具合は変わらんだろ
少しくらい重くてもアーカイブが増えた方がいい

564:名無しさん@お腹いっぱい。
19/09/28 23:22:06.24 .net
はじめまして。無知ですがすみません。
もう何日もこのインターネットアーカイブ(URLリンク(web.archive.org)
どんなURLを入れても、何も出来ないです。
トップも前まであったURLいれる欄がなくなって(右上のsearchならある)、おかしな文出てるし。
↓トップはURLいれる欄がなくなり、こういう文だけ出てますが、英語わからないので日本語訳してもわけわかりません。

(The Wayback Machine is an initiative of the Internet Archive,a 501(c)(3) non-profit, building a digital library ofInternet sites and other cultural artifacts in digital form.
Other projects include Open Library & archive-it.org.
Your use of the Wayback Machine is subject to the Internet Archive's Terms of Use. )

右上から何のURL検索してみても、日付のも出て来ずにこのトップ


565:文のままです。 でもスマホからなら前みたいに普通に検索出来ることを、スマホからやって、たった今知りました。でもどうしてもパソコンから見たいので。 何日もパソコンからインターネットアーカイブ出来ないのですが、スマホからなら出来るので、 出来ないのはうちのパソコンからだけなのか気になってます。 これはどういうことなのかわかる方いらっしゃいませんか。無知なのですみません。



566:214
19/09/29 00:28:09.44 .net
「ブラウザが古い、ないしサポート外」に一票。
URLリンク(i.imgur.com)
以前 Windows 2000 で頑張っていた人 (>>95-107) を思い出す。

567:名無しさん@お腹いっぱい。
19/09/29 01:08:34.37 .net
>>553
古いブラウザ使ってませんか?

568:名無しさん@お腹いっぱい。
19/09/29 01:10:24.76 .net
>>554
同感
スマホでは見れるって事からもサポート外の古いブラウザのせいという感じがする

569:名無しさん@お腹いっぱい。
19/09/30 17:16:34.34 .net
【ヤフー】Yahoo!ブログ【アーカイブ】
スレリンク(blog板)/
74 Trackback(774) 2019/09/30(月) 17:07:59.58ID:th5gp/Yr
Internet ArchiveでYahooブログを保存すると遷移スクリプトが発火する話なんだけど、
web.archive.org/save のページから「Save outlinks」にチェックを入れて保存すると
どうもYahooのトップページに遷移されずにアーカイブできるみたいだ
さっき偶然発見して何回か試したけど今のところ全て上手く保存されてる

570:214
19/09/30 18:20:55.67 .net
>>557
> Internet ArchiveでYahooブログを保存すると遷移スクリプトが発火する話なんだけど、
ニュースとか知恵袋は yjsecure.js が埋め込まれてるが
ブログも埋め込みあったっけ?

571:名無しさん@お腹いっぱい。
19/09/30 21:58:44.70 .net
save outlinksってURLレベルでは指定できないの?
/save/みたいに/saveoutlinks/みたいなのはない?

572:名無しさん@お腹いっぱい。
19/09/30 22:23:16.38 .net
>>558
ヤフーブログにもyjsecure.jsがあるかは分からない
でも以前web.archive.orgトップページのSPNフォームから保存した時は何回やってもリダイレクトされたよ
向こうのスレでもそれが問題になってたみたいだね
>>559
おそらくない
ただHTTPリクエストにsave outlinksが有効かどうか指定するオプションはあった(ブラウザの開発者機能で確認した)
何とも言えないけどsave outlinksで保存するスクリプトを組める可能性はあると思う


次ページ
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch