Internet Archive総合 (web.archive.org) #3at ESITE
Internet Archive総合 (web.archive.org) #3 - 暇つぶし2ch570:名無しさん@お腹いっぱい。
20/10/20 21:53:07.53 .net
ずっと見られなくなってたtripod.com系のサイトがいつの間にか見れるようになってた
あとIEで見れなくなった
印刷プレビューはIEが一番使いやすかったのに…

571:名無しさん@お腹いっぱい。
20/10/20 22:53:30.54 .net
IE排除は英断というか当たり前だと思う
開発元のマイクロソフトもとっくにサポートやめて「代わりにEdge使ってね」ってしつこいくらい宣伝してたし...

572:名無しさん@お腹いっぱい。
20/10/20 23:00:54.10 .net
運営側にとってはIEってセキュリティホールも仕様の古さも色々と面倒で、本当に悩みの種なんだわ
Internet Archiveに限らずIEでの閲覧を想定しないサイトは今後どんどん増えていくだろうし、
悪いこと言わないから他のブラウザに乗り換えた方が良いよ
というか、これはあくまで個人的な感想だからつもりはないけど、
IEの印刷プレビューって言うほど使いやすいかな?
Chromeに印刷プレビュー機能がなかった10年前じゃあるまいし

573:名無しさん@お腹いっぱい。
20/10/20 23:21:09.35 .net
UserAgentをIEに変えても、普通に見れるが。。
Your browser may not be compatible~ってのは出るけど。

574:名無しさん@お腹いっぱい。
20/10/21 00:30:53.60 .net
「The server didn't respond in time for http://~」がよく表示されると思ったら特定のサイトだけだったか・・・
>10/17は一時半分近くエラー続きだったそうだ。
 道理で保存されてないのがいくつかあるなと思ったら・・・

575:名無しさん@お腹いっぱい。
20/10/21 10:59:34.87 .net
>>559
UserAgentで弾いてる訳じゃなくて、ページの構成自体をIEが対応してない形式に変更したんじゃないの?
IE使ってないから確認できてないけど

576:名無しさん@お腹いっぱい。
20/10/21 18:00:01.04 .net
>>552
archive.is の拓が直接 archive.orgに取り込めない場合は少し前までなら anonymouse のWebプロキシのURL付けると取り込めたりしたが、
(例:URLリンク(anonymouse.org) で取り込む)

…今秋から archive.is へのアクセスが暗号通信( URLリンク(archive.is) )強制にされてしまったんで不可になってしまった。
( anonymouse.は非暗号アクセス http:// のサイトにしか対応してない )
 

577:名無しさん@お腹いっぱい。
20/10/21 19:01:46.68 .net
10/19あたりもひどいなぁ・・・
きちんと保存されてたはずのものがされてないことに。

578:名無しさん@お腹いっぱい。
20/10/21 23:45:30.07 .net
保存が10/19ならもう数日待つべし

579:名無しさん@お腹いっぱい。
20/10/22 00:43:54.18 .net
一時期なものならまだ良いが・・・

580:名無しさん@お腹いっぱい。
20/10/22 12:51:56.97 .net
最低でも一週間は待てとあれほど
まぁ話題が少ないからループするのはしょうがないけど

581:名無しさん@お腹いっぱい。
20/10/22 19:24:33.27 .net
>>46のことか。
ここのところあまりにもひどくてさ・・・

582:名無しさん@お腹いっぱい。
20/10/23 03:51:33.89 .net
もはや不安定さには完全に慣れてしまった

583:名無しさん@お腹いっぱい。
20/10/23 11:25:58.48 .net
一定周期で不安定化するのは
もう定期イベントみたいなもの

584:名無しさん@お腹いっぱい。
20/10/24 22:48:06.96 .net
なんか急にやたら長い変なURLになって保存失敗することが増えた

585:名無しさん@お腹いっぱい。
20/10/24 23:09:23.02 .net
ワケわからんurlになるよな

586:名無しさん@お腹いっぱい。
20/10/25 01:01:50.22 .net
URLはバグってるけど少し経ってから元のURLでAPI確認すると取れてるぽい

587:名無しさん@お腹いっぱい。
20/10/25 01:34:37.40 .net
"The server didn't respond in time for (保存URL)."
ってエラーメッセージが出ても、後で確認すると取れてることが多かったりする

588:名無しさん@お腹いっぱい。
20/10/25 12:49:20.36 .net
とうとうエラーでサイト見れなくなったか?

589:名無しさん@お腹いっぱい。
20/10/25 13:16:13.93 .net
>>574
何を言ってるのか良く判らない、と良く言われるだろw

590:名無しさん@お腹いっぱい。
20/10/25 13:24:21.46 .net
503エラー出てるね
メンテ中かな

591:名無しさん@お腹いっぱい。
20/10/25 13:29:27.09 .net
URLリンク(archive.org)
まさかのトップページで 500 エラーを返されたわw

592:名無しさん@お腹いっぱい。
20/10/25 14:45:08.36 .net
復旧はしたが


593:再度保存するのに要求される待ち時間が30分になってる… ちょっと前は20分、去年あたりは10分で良かったのに…



594:名無しさん@お腹いっぱい。
20/10/25 21:11:43.05 .net
/save/で1ページ保存できたっぽいから、もう1ページやったら
Unknown Errorになった。

595:名無しさん@お腹いっぱい。
20/10/25 21:16:36.58 .net
スポーツ新聞野郎まだ居たのか

596:名無しさん@お腹いっぱい。
20/10/25 21:57:17.13 .net
また取れない
Unknown Errorを繰り返すようになった

597:名無しさん@お腹いっぱい。
20/10/26 00:51:01.37 .net
cloudfront.netがなぜか全部ブロックされていて、こんな風に表示される
Sorry
This URL is in our block list and cannot be captured. Please email us at "info@archive.org" if you would like to discuss this more.
会社のプレスリリースなどでcloudfront.net使ってるところは保存できなくなってるわ

598:名無しさん@お腹いっぱい。
20/10/26 17:19:48.92 .net
Wayback Statsによると
24日午後4時~8時(日本時間25日午前8時~12時頃)にサーバーダウンして4時間ほどページすら見れなかったらしい

599:名無しさん@お腹いっぱい。
20/10/26 19:05:44.02 .net
アメブロとったらかたつむりの画像かえされたんだけどなんでw

600:名無しさん@お腹いっぱい。
20/10/26 21:03:32.40 .net
リアルなやつか?

601:名無しさん@お腹いっぱい。
20/10/26 23:46:49.93 .net
これwマウスの上にかたつむり乗ってるのwリアルがダメな人は見ないで
URLリンク(pbs.twimg.com)">URLリンク(web.archive.org))
上にも書いたけどアメブロの魚拓をとったんだよね
あとからチェックしたら魚拓自体はとれてたんだけどw謎杉
数日前から変なURLに飛ばされることがあるけど結果的に取れてるんだよ

602:名無しさん@お腹いっぱい。
20/10/27 00:07:16.71 .net
想像以上にリアルだった
きもE

603:名無しさん@お腹いっぱい。
20/10/27 00:49:59.93 .net
googleに飛ばされたりpbs.twimgに飛ばされたり
よく分からん怪しいurlに飛ばされたりしてるな

604:名無しさん@お腹いっぱい。
20/10/27 01:26:19.05 .net
>>586
それここ何日か発生してるバグっぽい。
save nowで保存すると、そのページじゃなくて読み込まれるURLの1個が帰ってくる。
変なURLが帰ってくるとびっくりするけど一応保存はされてる模様。

605:名無しさん@お腹いっぱい。
20/10/27 01:28:05.49 .net
確認してないけど、もしかしたら一番長いURLが戻ってくるのかもしれない。

606:名無しさん@お腹いっぱい。
20/10/27 02:13:12.17 .net
そのバグだいぶ前からあった
バグったり直ったりしていた

607:名無しさん@お腹いっぱい。
20/10/27 02:27:39.41 .net
AmebloじゃなくてInternet Achieveのほうの不具合なのか

608:名無しさん@お腹いっぱい。
20/10/27 10:08:38.57 .net
昨日は謎の文字列頁が表示されてびっくりしたよ

609:名無しさん@お腹いっぱい。
20/10/29 03:45:25.34 .net
Your capture will begin in 15s.
またsave nowが混み始めたぞ

610:名無しさん@お腹いっぱい。
20/10/29 11:59:23.94 .net
本レビューサイト「ブクログ」、2年弱ソースコード上にメールアドレスが表示された状態に
URLリンク(security.srad.jp)
Noteに続き、今度はブクログのメルアド流出でbooklog.jpまるごとブロックか削除になったそう

611:名無しさん@お腹いっぱい。
20/10/29 16:27:01.75 .net
結局Wayback Machine頼りじゃなく、自分で保存してInternet Archiveのアカウントでアップロードするのが安全なんだよな

612:名無しさん@お腹いっぱい。
20/10/29 17:39:46.40 .net
excluded表記は削除じゃなくてWaybackMachineのアクセス拒否だって事を願ってる
こんなしょうもない事でポンポン消されたらたまったもんじゃない

613:名無しさん@お腹いっぱい。
20/10/29 22:34:14.27 .net
中国本土で、アメリカのInternet Archive相当の役割をしているサイト、サービスは、どこですか?
URLが知りたいです。

614:名無しさん@お腹いっぱい。
20/10/30 02:14:44.13 .net
>>598
ざっと検索したらそれらしい情報は出てきたが、あなたの欲しい情報が入ってるかは分からん
IPLC Launches the Greater China Archival Resources Web Archive(Ivy Plus Libraries Confederation, 2020/9/9)
URLリンク(ivpluslibraries.org)
Greater China Archival Resources Web Archive(Archive-It)
URLリンク(archive-it.org)

615:名無しさん@お腹いっぱい。
20/10/30 02:16:14.21 .net
archive.orgは金盾でブロックされてるのか
まあ当然っちゃ当然かもしれないけど

616:名無しさん@お腹いっぱい。
20/10/30 09:30:17.93 .net
>>599
ありがとうございます!とても参考になりました。

617:名無しさん@お腹いっぱい。
20/10/31 21:34:11.67 .net
どうでもいい話だけど
「インターネットアーカイブ」で検索しても1ページ目にすら出ないんだな
「internet archive」だとトップなのに
日本人はあんまり使ってないのかな・・・?

618:名無しさん@お腹いっぱい。
20/10/31 21:44:23.02 .net
ウェーバック・マシーンは出てくる

619:名無しさん@お腹いっぱい。
20/11/01 15:21:23.61 .net
>>602
グーグル使うの止めたら?
スマホファーストデザインやるようになったぐらいから、
そこらのアフィカスブログが可愛く見えるくらいアフィカス度激高になってるよグーグル

620:名無しさん@お腹いっぱい。
20/11/05 14:53:16.09 .net
半角無理そう?

621:名無しさん@お腹いっぱい。
20/11/05 14:55:42.77 .net
>>597
アーカイブを消させるための手法として流用されるかも
下手すると第三者がこういった工作をする可能性も

622:名無しさん@お腹いっぱい。
20/11/05 16:20:41.64 .net
sakura03鯖のログって全損なんかな

623:名無しさん@お腹いっぱい。
20/11/06 13:29:44.23 .net
googleキャッシュならまだあるだろうから
保存するなら今のうちだな

624:名無しさん@お腹いっぱい。
20/11/06 21:12:40.12 .net
ここって昔のPCゲームもあるんだな
diablo2ゲット

625:名無しさん@お腹いっぱい。
20/11/07 01:44:34.11 .net
お宝見つけても名前は出さない方が無難
こっそり楽しめ

626:名無しさん@お腹いっぱい。
20/11/07 10:41:21.23 .net
>>597
それで合っていると思う
試しにツールを使って、すでにその状態になっているものをここからダウンロードしようとしたら
「403 Forbidden」が出たから
だからまた見るにはインターネットアーカイブ側でアクセス許可にされるか
それともそれをかいくぐれるツールが出来るかのどっちかしか無いかも

627:名無しさん@お腹いっぱい。
20/11/07 14:46:43.61 .net
>>609
シリアルが画が画が

628:名無しさん@お腹いっぱい。
20/11/10 00:24:38.75 .net
角煮ログも封鎖されたかな

629:名無しさん@お腹いっぱい。
20/11/11 23:22:46.65 .net
URLリンク(analytics0.archive.org)
日本時間で午後10時50分過ぎから鯖落ちしてる模様

630:名無しさん@お腹いっぱい。
20/11/12 02:34:24.00 .net
今はサーバー復活してる、保存も問題なし

631:名無しさん@お腹いっぱい。
20/11/19 10:57:43.27 .net
寄付催促してんな

632:名無しさん@お腹いっぱい。
20/11/19 13:48:19.34 .net
seesaawikiのサイトを取ろうとするとクラッシュしたり挙動がおかしくなる

633:名無しさん@お腹いっぱい。
20/11/19 16:14:02.21 .net
寄付の表示のところに毎日7億5000万ページ(画像やスクリプトを多分含む)保存してると出てるね

634:名無しさん@お腹いっぱい。
20/11/19 23:46:06.93 .net
コスパティオのページ保存すると変なとこにリダイレクトされて上手く保存できなくなった

635:名無しさん@お腹いっぱい。
20/11/20 04:16:43.66 .net
寄付の表示がでるようになったり
一昨日くらいにUnknown Error表示でまくりで放置してた分も依然そのままの状態で取れない
なんだかうまく取れたらクリアってゲームやってる気がしてきた・・・

636:名無しさん@お腹いっぱい。
20/11/20 08:15:01.59 .net
save page nowでやってダメなら時間置いてもう一度やるのが一番早いと思う

637:名無しさん@お腹いっぱい。
20/11/20 08:19:32.56 .net
>>619
変なURLが帰ってくるのは>>584-591で出てるバグなら気にしなくて大丈夫だよ
URLリンク(web.archive.org)の後ろにURLつけて確認してみ

638:名無しさん@お腹いっぱい。
20/11/20 21:31:52.70 .net
こっちで出なくなったと思ったら魚拓で502
おま環?

639:名無しさん@お腹いっぱい。
20/11/21 14:12:11.95 .net
>>617
Archiveteamにwiki専門のグループがあるからそのIRCで頼めば保存してもらえるかも
以前別件でコンタクト取ったときに向こうから保存したい日本のwikiはないかって尋ねてきたこともあるくらいだから積極的に動いてくれると思う
URLリンク(archiveteam.org)

640:名無しさん@お腹いっぱい。
20/11/21 20:01:45.32 .net
なんか古いデータどんどん消してる気がする・・・
何年も前から取ってるページなのに2020年7月からしかないとか変だわ

641:名無しさん@お腹いっぱい。
20/11/21 23:16:26.36 .net
削除以外でもメンテか障害かなんかで
一時的に一部データが閲覧できない場合もあるからな

642:名無しさん@お腹いっぱい。
20/11/22 01:23:53.80 .net
【Web】Internet Archive、Flashコンテンツをアーカイブ プラグインなしで21年以降も閲覧可能に【Rust】 [少考さん★]
スレリンク(newsplus板)

643:名無しさん@お腹いっぱい。
20/11/23 22:59:21.80 .net
妥当だね
メニューがFlashのサイトとかナビゲーションさえできなくなっちゃうからな

644:名無しさん@お腹いっぱい。
20/11/26 06:49:26.37 .net
MacかiPhoneのSafariで見るとkCF~のエラーが出るのは何度か再読み込みすれば直る
ダメなら時間おくしかない

645:名無しさん@お腹いっぱい。
20/11/29 12:26:24.57 .net
save page nowから2GB以上のファイルを保存しようとすると「Resource file size is over 2GB.」のエラーが出るようになってる
ちょっと前までは出なかったのに

646:名無しさん@お腹いっぱい。
20/11/29 13:46:55.47 .net
何を保存してるのか気になる

647:名無しさん@お腹いっぱい。
20/11/29 15:50:01.95 .net
ゲームの修正パッチとか体験版とかだとたまにそのくらい行くな>2GB以上

648:名無しさん@お腹いっぱい。
20/11/29 16:02:24.61 .net
>>622
残念ながらそのバグではない。
クッキー無いとリダイレクト失敗する仕様になっているぽい

649:名無しさん@お腹いっぱい。
20/12/01 10:52:52.75 .net
curlで保存してるけど、最近は調子良すぎなんだが
20秒ぐらいで保存が終わってタイムアウトも1割ぐらい
タイムアウトでもちゃんと保存されてるし、画像やスクリプト込みでこの時間だから、
以前より早いかも
(100個も画像やスクリプトあるページは無理だが)

650:名無しさん@お腹いっぱい。
20/12/04 23:38:28.47 .net
Unknown Errorが出たら保存し直した方がいいかもな
一ヶ月前のUnknown Error保存分をチェックしてみたら
日付だけ表示されたが中身は保存されてないようだ

651:名無しさん@お腹いっぱい。
20/12/05 16:22:36.31 .net
最近APIが重すぎる

652:名無しさん@お腹いっぱい。
20/12/05 17:14:55.42 .net
Sorry
Job failed

653:名無しさん@お腹いっぱい。
20/12/06 13:21:09.09 .net
You have already reached the limit of active sessions
今日2回目の保存なのにこのエラーが出るとか、ふざけすぎでしょw

654:名無しさん@お腹いっぱい。
20/12/06 13:23:29.09 .net
IPアドレス変えてもこのエラー出るので
active sessionsだからサイト全体のセッション数の制限を超えてるということかもしれないが

655:名無しさん@お腹いっぱい。
20/12/06 19:32:55.17 .net
>>639
host規制かそのサイトだけ取れないように規制されてるかじゃね知らんけど

656:名無しさん@お腹いっぱい。
20/12/06 23:36:07.44 .net
>>637
200ページほど/save/で保存した結果、平均3~5回このエラー出るわ
保存されてないのでエラー出たURLだけやり直し

657:名無しさん@お腹いっぱい。
20/12/07 10:35:04.56 .net
>>641
ぶっちゃけ寄付してなきゃ規制されてても不思議じゃないよ、それ
無料に毒されすぎじゃない?
広告大量になったり、変なスクリプトで経費賄うようになったら嫌だなー

658:名無しさん@お腹いっぱい。
20/12/07 17:09:05.18 .net
200ページ程度で規制されるわけない、スクリプトなら数分レベル
寄付しろってのはそう

659:名無しさん@お腹いっぱい。
20/12/07 17:39:59.48 .net
そうやって間隔あけずに一気に叩き込むからすぐサーバー落ちるんじゃないのかよ

660:名無しさん@お腹いっぱい。
20/12/07 21:09:46.97 .net
間隔開けなかったら数分もかからんよ

661:名無しさん@お腹いっぱい。
20/12/07 23:07:54.27 .net
利用者も多いから負荷は可能な限り抑えて利用すべきではあるな

662:名無しさん@お腹いっぱい。
20/12/08 18:52:05.48 .net
1日3億ページ保存してるとサイトで書いてあるのに、たった1


663:人が数百ページ保存したぐらいでなんてこともないわw



664:名無しさん@お腹いっぱい。
20/12/08 22:29:27.53 .net
実際にクッソ重い状態が続く事も珍しくないからな

665:名無しさん@お腹いっぱい。
20/12/09 10:26:17.35 .net
本来機械化しないことを想定して作られてるんだから、
大量にリクエストしたら通常よりも大きな負荷がかかるかもしれない、くらいのことは想像つかないのかよ
やるならせめて寄付くらいはしろ

666:名無しさん@お腹いっぱい。
20/12/09 10:29:24.14 .net
1つのIPからの接続回数や間隔が以前よりも制限されているという事実は、
どのような形であれ大量アクセスはInternet Archiveにとって困るってことの証拠じゃないの

667:名無しさん@お腹いっぱい。
20/12/09 13:07:12.73 .net
てか>>647と同じアホが真に受けて俺も俺もとなるのが1番怖い
自制が効かない・寄付もしないゴミに目を付けられたサービスが改悪しまくるのは分かりきってる

668:名無しさん@お腹いっぱい。
20/12/09 14:19:34.60 .net
数分ってのが10分と仮定しても60秒×10分÷200件=3秒にならん?
間隔短すぎだから間隔を30秒にしろ。

669:名無しさん@お腹いっぱい。
20/12/09 15:04:53.49 .net
なんだ、自動化できずに必死にキーボード叩いてる無能が騒いでるのか

670:名無しさん@お腹いっぱい。
20/12/09 15:26:57.33 .net
キーボード?手動でやるときはマウスだよ

671:名無しさん@お腹いっぱい。
20/12/09 15:52:40.47 .net
curlでの保存方法、教えて

672:名無しさん@お腹いっぱい。
20/12/09 17:22:41.08 .net
>>655
/save/にリクエスト送るだけ

673:名無しさん@お腹いっぱい。
20/12/09 17:52:48.98 .net
適当なヘッダ付けて/save/を叩くだけだから、
HTTP通信さえ出来るツール使えばcurlじゃなくて問答無用で自動化できる
でも下手に叩きすぎてサーバ圧迫して結果制限が厳しくなったら元も子もないから、俺はやった事ない

674:名無しさん@お腹いっぱい。
20/12/09 17:53:20.92 .net
curlじゃなくても

675:名無しさん@お腹いっぱい。
20/12/09 19:40:19.27 .net
URLリンク(www.it-swarm-ja.tech)ウェブサイト全体をアーカイブする方法は?/965342469/
これで合ってる?

676:名無しさん@お腹いっぱい。
20/12/09 21:53:36.06 .net
>>659
すまんけど何を聞こうとしてるのかよく分からん
その質問って結局「ひとつのサイト全体を自分で保存する機能は提供されてないよ」って事以外何も言ってないように見えるけど

677:名無しさん@お腹いっぱい。
20/12/09 21:56:26.36 .net
ちゃんと下まで読んでなかったわ、>>660は取り消す
少なくとも静的サイトはこの方法で行けるね、wgetのmirrorオプションでURLリストを作るとは上手いこと考えたな

678:名無しさん@お腹いっぱい。
20/12/09 22:01:16.11 .net
ただwgetは、JSとかで動的にコンテンツを取ってくるサイトやFlashが使われたサイトには対応できないから、
この回答の方法ではあらゆる種類のサイトを保存することはできない
でもHTMLとCSSだけで頑張ってるような昔の個人サイトなら問題ない

679:名無しさん@お腹いっぱい。
20/12/11 02:53:02.33 .net
間隔っていうか、現状同じIPアドレスから5ページまでしか同時保存リクエスト受け付けてくれない。
6ページ目以上は保存処理が終わってないのが残ってると、タイムアウトになって保存されないよ。
自動化以前にウェブサーフィン(死語)中、手動でブラウザから/save/開いて保存したい時でも、状況は同じ。
今はこの制限内でやればいいだけ。

680:名無しさん@お腹いっぱい。
20/12/12 02:57:25.07 .net
archive teamは数千単位のページを保存する場合はarchive botのIRCで保存依頼するのを推奨してるみたい
> avoid trying to send many thousands URLs; there's Archivebot for that
URLリンク(archiveteam.org)
archive bot
URLリンク(archiveteam.org)

681:名無しさん@お腹いっぱい。
20/12/15 21:01:34.37 .net
新規に保存するとどうやってもこの画面になってしまう…
URLリンク(i.imgur.com)

682:名無しさん@お腹いっぱい。
20/12/15 21:02:45.84 .net
Sorry.
This snapshot cannot be displayed due to an internal error.
さっき初めて出た、保存はされてるがエラーで表示できないという謎のエラー

683:664
20/12/15 21:04:28.30 .net
タッチの差だったごめん

684:名無しさん@お腹いっぱい。
20/12/15 23:57:41.06 .net
そのエラー出ても後で取り直せば大丈夫っぽい

685:名無しさん@お腹いっぱい。
20/12/16 06:37:15.41 .net
てか、以前は保存終わった後に保存しますか?の表示出たのがこれに変わっただけじゃね
なんかバグってるんだよね

686:名無しさん@お腹いっぱい。
20/12/16 17:34:12.89 .net
今は正常になったか

687:名無しさん@お腹いっぱい。
20/12/16 20:02:08.13 .net
Magic Viewer
URLリンク(chrome.google.com)
chromeの拡張機能を入れて、右クリックして、「すべての画像を見る」をクリックすると外部リンクの画像が自動でアーカイブされる。
サイトによっては、ブラウザのページを数回、再読み込みをする。

688:名無しさん@お腹いっぱい。
20/12/17 04:44:35.32 .net
前は/save/で保存したページはLive Web Proxyってコレクションに入ってたのに
最近はSave Page Nowコレクション扱いになってるな
10月ぐらいからファイルが増えてないし、Live Web Proxyって引退したのかもしれない
URLリンク(archive.org)
このスレでも10月はエラー多かった書き込みあったしな、移行期間だったのだろう

689:名無しさん@お腹いっぱい。
20/12/17 10:47:26.64 .net
後で取り直したけど取れてないわ
取れてる取れてないの繰り返しにはうんざり
どこが運営してるのかわからないのは限りなく不安だが
もうarchive.todayしかない

690:名無しさん@お腹いっぱい。
20/12/17 16:01:59.78 .net
過去レスすら読めない人の為に次スレではこれ(>>9)をテンプレに入れた方がいいな

691:名無しさん@お腹いっぱい。
20/12/17 16:39:47.92 .net
11月分でいまだに反映されてないものも多々あるから
システムいじくってる最中で保存されてないものもあるかもな

692:名無しさん@お腹いっぱい。
20/12/17 17:05:10.84 .net
スポーツ新聞野郎、まだ居たのか。

693:名無しさん@お腹いっぱい。
20/12/17 21:53:46.16 .net
なにかしらのerrorが頻発するのが困りもの

694:名無しさん@お腹いっぱい。
20/12/17 23:36:55.01 .net
>>676
スポーツ新聞アーカイブしてるとは一言も言ってないし同一人物とは限らんよ
毎日適当なページを実験用に保存し続けてInternet Archiveの挙動をテストしてる人もいたはずだし

695:名無しさん@お腹いっぱい。
20/12/18 00:36:49.29 .net
お前らがしているのは多分、アイドル・声優のブログのアーカイブだろ

696:名無しさん@お腹いっぱい。
20/12/18 01:28:46.93 .net
504とか503で何のアーカイブも見られん

697:名無しさん@お腹いっぱい。
20/12/18 01:47:52.99 .net
アイドルも声優も、ブログどころかウィキペディアの記事すら見たことないわ
偏見すぎ

698:名無しさん@お腹いっぱい。
20/12/19 23:30:14.53 .net
「curl -Ll URLリンク(web.archive.org)○○○○.com/[(数字)-(数字)].html(.jpg)」
ttpではなく、httpに修正して
saveではなく、エラー軽減のため西暦の数字で
連番の数字で自動保存される。

699:名無しさん@お腹いっぱい。
20/12/20 03:27:16.25 .net
エラーさんざんでまくり&数日たって再度見に行くと真っ白のページが保存された形跡
これじゃしばらく試行しながら様子見するしかねえな

700:名無しさん@お腹いっぱい。
20/12/24 21:46:55.38 .net
Fail with status: 503
ばっか表示される

701:名無しさん@お腹いっぱい。
20/12/25 04:04:48.90 .net
あだしまの公式サイトは33回も保存されていて、IAでもちゃんと開けるのにAPIは情報なし。
APIがぶっ壊れたのか。

702:名無しさん@お腹いっぱい。
20/12/25 22:32:48.69 .net
保存してHrmになってしまうと日付だけ保存&表示されて
以後同一ページを保存してもずっとHrmになってしまう状況が11月から続いている

703:名無しさん@お腹いっぱい。
20/12/26 02:55:00.36 .net
news.y


704:ahoo.co.jp/bylineから始まるYahooニュースの記事を保存しようとするとこれが表示される 専門家のブログのコピー記事だからブロックしてるのかな Sorry This URL is in our block list and cannot be captured. Please email us at "info@archive.org" if you would like to discuss this more.



705:名無しさん@お腹いっぱい。
20/12/26 07:23:35.18 .net
録れてる奴もあるみたいだしよくわからんな
繰り返される悲劇はもうウンザリだ 「右直事故」防止に切り札はあるのか!?(佐川健太郎) - 個人 - Yahoo!ニュース
URLリンク(news.yahoo.co.jp)">URLリンク(web.archive.org))

706:名無しさん@お腹いっぱい。
20/12/26 11:36:52.53 .net
 
archive.org ? ウェブサイト全体をアーカイブする方法は?
URLリンク(www.it-swarm-ja.tech)">URLリンク(web.archive.org))
 

707:名無しさん@お腹いっぱい。
20/12/26 17:10:27.56 .net
>>688
これArchive Teamが保存したものをWayback Machineに移管したやつだね
Save Page Nowでは取れないけど、外部の人間が取ったものを移管したから結果的に取れてるように見えてる

708:名無しさん@お腹いっぱい。
20/12/30 16:01:54.23 .net
寄付を煽るためにわざとエラー連発させるように仕込んでるのかな

709:名無しさん@お腹いっぱい。
20/12/30 17:30:24.61 .net
そんなリスキーなことしないでしょ

710:名無しさん@お腹いっぱい。
21/01/02 23:03:35.16 .net
>>686のHrmのままのページは保存し直せば反映されるようになった
放置しとくと日付だけ表示されるHrmのまま

711:名無しさん@お腹いっぱい。
21/01/03 14:23:02.24 .net
Hrmって何て発音するんだ

712:名無しさん@お腹いっぱい。
21/01/04 09:24:29.97 .net
「ふーむ」って言う途中でちょっと舌を丸める感じだと思っている
正確な発音はわからん

713:名無しさん@お腹いっぱい。
21/01/04 21:44:38.49 .net
ハァーンムッって読んでた

714:名無しさん@お腹いっぱい。
21/01/07 05:03:25.08 .net
>>690
Collectionsのところ見たけど、Focused CrawlsとTop DomainsはArchive Teamが収集してるものじゃないよ
ブロックされているURLも移管してるのはそういう仕組みだろうけど
ヤフージャパンはアクセス数多いドメインとはいえ、ニュース系のページは収集してくれないんだなぁ

715:名無しさん@お腹いっぱい。
21/01/07 13:28:13.11 .net
ヤフーニュースはSavePageNowでも取れるよ
ただ一部の記事で何故かBlockListエラーが出る
理由は謎(メールすれば聞けるのかもしれないけど)

716:名無しさん@お腹いっぱい。
21/01/07 13:35:08.85 .net
なんか待ち時間すごい長くて全然アーカイブできない

717:名無しさん@お腹いっぱい。
21/01/07 14:27:18.78 .net
既アーカイブへのURL検索落ちてる?

718:名無しさん@お腹いっぱい。
21/01/07 16:30:50.05 .net
The capture is estimated to start in xxx minutes
今日はこればっかり

719:名無しさん@お腹いっぱい。
21/01/08 02:00:41.10 .net
今は直ったかな?

720:名無しさん@お腹いっぱい。
21/01/08 10:11:43.26 .net
The capture is estimated to start in 61 minutes.

721:名無しさん@お腹いっぱい。
21/01/09 00:15:31.32 .net
URLリンク(i.imgur.com)

722:名無しさん@お腹いっぱい。
21/01/09 04:00:24.16 .net
改憲などという重要なものをアニメ絵に頼るカス団体は信用しない

723:名無しさん@お腹いっぱい。
21/01/09 11:27:19.35 .net
しかもその絵、無断使用じゃねーの?

724:名無しさん@お腹いっぱい。
21/01/09 11:47:42.84 .net
落ち着いたかと思ったらJob failed祭り

725:名無しさん@お腹いっぱい。
21/01/09 16:52:25.91 .net
ヨブ無能

726:名無しさん@お腹いっぱい。
21/01/09 21:56:53.82 .net
実はちうごくじんなんじゃね

727:名無しさん@お腹いっぱい。
21/01/11 04:45:59.10 .net
寄付した人間のジョブは優先して処理するみたいな仕組みが導入されたらできる限り寄付したい

728:名無しさん@お腹いっぱい。
21/01/11 13:33:23.25 .net
年収20万ドルのエンジニア雇うだけの金があるのに、金で困ってすらないよ
その割にサーバーはザコだが

729:名無しさん@お腹いっぱい。
21/01/12 10:01:11.50 .net
Job failed.ばかりで全然アーカイブできない

730:名無しさん@お腹いっぱい。
21/01/14 08:53:53.82 .net
Sorry
This URL has been already captured 10 times today. Please email us at "info@archive.org" if you would like to discuss this more.
これは今日10回じゃなくて過去24時間に10回の文間違いじゃないの
内容が変わりまくるサイトを保存できなくなった

731:名無しさん@お腹いっぱい。
21/01/14 11:03:11.23 .net
自分以外の誰かも同じサイト保存してる可能性もあるしな

732:名無しさん@お腹いっぱい。
21/01/14 15:57:48.45 .net
一覧性は下がるが、とりあえず後ろに適当なパラメーターでもつければどうか。?1とか。
サイト側にとって未定義のパラメーターなら大抵のサイトはパラメーターなしと同じものを返してくるだろう。

733:名無しさん@お腹いっぱい。
21/01/14 22:53:43.10 .net
またスポーツ新聞野郎か

734:名無しさん@お腹いっぱい。
21/01/15 05:48:54.80 .net
例の人は書き込みの中に必ずスポーツ新聞の話を含めるから多分別人

735:名無しさん@お腹いっぱい。
21/01/15 05:50:45.57 .net
まあ別にスポーツ新聞のアーカイブを手作業で何回取ろうがそれは個人の勝手だから、外野がどうこう言うもんじゃないよ
随分遠回りなことしてるように見えても本人にとっては大事なんだろ、ほっとけ

736:名無しさん@お腹いっぱい。
21/01/16 00:22:05.68 .net
Please email us at "info@archive.org" if you would like to discuss this more.
ってあるんだから
ここで愚痴言うくらいならメール送ったらいいんじゃない?

737:名無しさん@お腹いっぱい。
21/01/16 16:38:22.29 .net
皆さんに質問です!
アーカイブされたページを全文検索できるようになるまで、
あと何年くらいかかると思いますか?

738:名無しさん@お腹いっぱい。
21/01/16 20:12:08.58 .net
昔はできてたこともある気がするから負の数じゃないかな

739:名無しさん@お腹いっぱい。
21/01/17 00:21:40.84 .net
いつにも増して調子悪いな

740:名無しさん@お腹いっぱい。
21/01/18 13:51:31.62 .net
undefined is not an object (evaluating 'e.map')
これって保存できてるの?

741:721
21/01/18 15:47:47.92 .net
公開待ち状態みたいだったらしく、1時間後に見たら保存したページが見れるようになった。
マッピングが届いてないとかそんな感じっぽい。

742:名無しさん@お腹いっぱい。
21/01/21 23:18:29.78 .net
Sorry
Live page is not available: chrome-error://chromewebdata/

743:名無しさん@お腹いっぱい。
21/01/22 15:38:58.53 .net
Changesの項目消えた?
あんま使ってなかったからいいけどさ

744:名無しさん@お腹いっぱい。
21/01/22 16:01:35.20 .net
724
今見たら復活してた
タイミングが悪かっただけかな

745:名無しさん@お腹いっぱい。
21/01/22 16:51:49.89 .net
4日ぐらい前に保存した画像でSaved 2 timesとなってるのに青い丸が出ないが
遅れてるだけなのかこれ

746:名無しさん@お腹いっぱい。
21/01/22 22:31:31.69 .net
>>721
Internet Archive サービス終了までに実現できると思う?
いくら遅くてもいいけど

747:名無しさん@お腹いっぱい。
21/01/24 01:33:05.61 .net
ただRecallを復活させればよくね

748:名無しさん@お腹いっぱい。
21/01/24 04:31:27.21 .net
URLリンク(blog.archive.org)
ここに載ってる、savepagenow@archive.orgに他人から来たメールをFwdで送ったら
URLを抽出して保存された後に保存済URLが返ってくるのって今も機能してるのか?
メールが返ってこないんだが
ブログ記事の数日後に書かれたコメント欄の時点でメール返ってこねぇって書いてる人いるけども

749:名無しさん@お腹いっぱい。
21/01/24 14:34:02.42 .net
>>664
英語での交渉が得意な人しか使えないじゃん

750:名無しさん@お腹いっぱい。
21/01/24 19:17:01.62 .net
>>732
今時DeepLあたりでも使えばそこまで英語で苦戦することは無いよ
というか英語圏のボランティア団体なんだからこちらが英語に合わせるのは当然のことじゃない?

751:名無しさん@お腹いっぱい。
21/01/24 19:18:46.98 .net
英語が嫌だったらArchiveTeamの日本支部でも作るしかないよね
まあそうなったとしても誰かが英語で本部とやり取りしないといけない訳だからあんまり意味無いけど

752:名無しさん@お腹いっぱい。
21/01/25 09:13:54.98 .net
おいおい何だよこれ
URLリンク(o.5ch.net)

753:名無しさん@お腹いっぱい。
21/01/25 10:13:47.99 .net
>>735
>>723-724
反映を待ってればいい、ダメならもう一度撮り直すしかない

754:名無しさん@お腹いっぱい。
21/01/25 20:24:16.53 .net
次スレの>>1にはアーカイブが取れない問題のQ&A入れないとダメだな

755:名無しさん@お腹いっぱい。
21/01/26 20:37:45.84 .net
エラー文が多すぎて週に1個は新しいのが増えてるからまとめるのめんどくさいわw

756:名無しさん@お腹いっぱい。
21/02/07 15:31:24.66 .net
おまえ今日もう10回とったからダメーっていうのやめて欲しいわ
そもそもエラーだったから取り直してるのはカウントすんなよ

757:名無しさん@お腹いっぱい。
21/02/14 16:09:56.27 .net
archive.isの同じurlの取得間隔が伸びてるっぽい
前にとってから10時間以上経つのに取れない

758:名無しさん@お腹いっぱい。
21/02/15 17:54:43.88 .net
追記
やっぱり丸一日経たないと同じurlのアーカイブ取得出来なくなってるっぽい 全てのurlかどうかは不明

759:名無しさん@お腹いっぱい。
21/02/15 19:35:35.74 .net
>>741
>>741
毎日保存してるのに24時間以上たたないと保存できないのは困る
----------
> このサイトにアクセスできませんweb.archive.org で接続が拒否されました。
> ERR_CONNECTION_REFUSED
保存しすぎて個人的に Web.archive.org にアクセス拒否されたかと思ったw
Down for Everyone or Just Me
URLリンク(downforeveryoneorjustme.com)
> Web.archive.org Status
> Is web.archive.org down right now?
> It's not just you! web.archive.org is down.

760:名無しさん@お腹いっぱい。
21/02/15 19:36:14.63 .net
Internet Archive 鯖落ち?繋がらないわ

761:名無しさん@お腹いっぱい。
21/02/15 19:40:02.46 .net
>>742
その表示初めて見るけどブラウザ何使ってる?

762:名無しさん@お腹いっぱい。
21/02/15 19:52:03.70 .net
wayback machineぶっ壊れた

763:名無しさん@お腹いっぱい。
21/02/15 20:02:02.56 .net
>>744
Google Chrome
URLリンク(i.imgur.com)

764:名無しさん@お腹いっぱい。
21/02/15 20:18:19.09 .net
telnet で web.archive.org:80 へ接続を仕掛けても繋がらない。
鯖が死んでるわ。

765:名無しさん@お腹いっぱい。
21/02/15 21:30:42.26 .net
アメリカは今早朝だから運営寝てるのか

766:名無しさん@お腹いっぱい。
21/02/15 22:21:55.65 .net
メンテナンス情報も書いてない。まさか、F5アタックなのか?

767:名無しさん@お腹いっぱい。
21/02/15 22:24:25.21 .net
あぁ朝鮮半島からか

768:名無しさん@お腹いっぱい。
21/02/15 23:18:16.36 .net
復活したね
保存もできるよ

769:名無しさん@お腹いっぱい。
21/02/15 23:21:29.92 .net
あ、何ページか保存したら接続エラーの連続だらけになった
まだ完全復活できてない模様

770:名無しさん@お腹いっぱい。
21/02/16 01:10:12.48 .net
>>749
てかIAは鯖落ちしようが何も言わない
サンフランシスコ時間で朝になったから、今日も@internetarchiveは更新を始めたようだが、
いつも通りだんまりだね。4時間近く止まってたんだから一言欲しいけど

771:名無しさん@お腹いっぱい。
21/02/16 02:53:38.24 .net
>>719
そこにメールしても返信すらないから意味ないよ
送っても誰もメール見てないんじゃね

772:名無しさん@お腹いっぱい。
21/02/16 10:22:33.21 .net
APIのレスポンス増やしてほしいな
せめて落ちてるときは今落ちてるよ的なのを返して欲しい

773:名無しさん@お腹いっぱい。
21/02/16 22:20:35.70 .net
URLリンク(twitter.com)
午前中に技術的な問題が発生
URLリンク(twitter.com)
鯖落ちは一時的なバグが原因
(deleted an unsolicited ad)

774:名無しさん@お腹いっぱい。
21/02/17 23:26:58.40 .net
東京大学総合図書館、Internet Archiveとの連携を開始:同館デジタルアーカイブ資料4,000点以上が対象
URLリンク(current.ndl.go.jp)

775:名無しさん@お腹いっぱい。
21/02/19 13:11:41.55 .net
job failedの連打

776:名無しさん@お腹いっぱい。
21/02/19 18:11:43.08 .net
job failed多すぎて笑う
APIの反映も遅いし

777:名無しさん@お腹いっぱい。
21/02/19 22:14:59.50 .net
job failedでも保存はされてるか

778:名無しさん@お腹いっぱい。
21/02/20 20:16:11.82 .net
job failedは保存されてなくね?
internal server errorは一応されてるみたいだけど

779:名無しさん@お腹いっぱい。
21/02/21 09:59:06.84 .net
時間おいてやり直すしかないね

780:名無しさん@お腹いっぱい。
21/02/21 13:11:02.40 .net
あれ?job failedでもThis URL has been already captured 10 times todayが出たな
ということは内部的には取れてるのか・・・?よく分からん

781:名無しさん@お腹いっぱい。
21/02/22 14:27:20.34 .net
Fail with status: 498 No Reason Phrase
なんやこれ

782:名無しさん@お腹いっぱい。
21/02/24 15:46:58.89 .net
>>763
上でも書いてる人いるけど、多分保存できてないと思う
最新から10個前の保存時間から24時間経たないとできない

783:名無しさん@お腹いっぱい。
21/02/25 00:31:49.91 .net
job faildばっかり(´・ω・`)

784:名無しさん@お腹いっぱい。
21/02/25 14:27:18.94 .net
job faildは取れている時と取れていない時があるから困りもの

785:名無しさん@お腹いっぱい。
21/02/27 10:54:16.04 .net
We're sorry ― something's gone wrong.
Our team has been notified.
これしか表示されなくなった
完全にぶっ壊れてる

786:名無しさん@お腹いっぱい。
21/02/27 21:12:05.69 .net
チームは何してるの

787:名無しさん@お腹いっぱい。
21/02/28 11:46:27.82 .net
Save Page Nowで保存中に他人が保存したアドレスがたまに表示されてるんだけど、これやばくない?
試しにcurlで/save/から保存するのと同時に、WebブラウザからVPN使って別のIPアドレスにした上でSPNで別のサイトを保存してみたら、
curlで保存中の画像やJavascriptのアドレスがWebブラウザの方に出てきてしまった。
普通に情報流出していてワロタ
このスレでも他人のアドレスが出てくる状態になった報告があるみたいだけど、直す気ないのかな。マジで直したほうがいいと思う。
>>570-572
>>586-591

788:名無しさん@お腹いっぱい。
21/03/01 20:37:48.02 .net
ここ2週間ぐらい、
archive.todayで、
インスタグラムを保存できなくなってるの 俺だけ?
2週間くらい前までは、インスタグラム保存できてたのに。
他に インスタグラムを保存できる魚拓サイトありますか?

789:名無しさん@お腹いっぱい。
21/03/01 23:25:20.89 .net
インスタビューア的な外部サイトがいくつもあるから
それを介して保存するって方法がある
URLをしっかり記録しておかないと参照できなくなるってのが面倒だけど

790:名無しさん@お腹いっぱい。
21/03/02 14:01:49.74 .net
web.archive.org/save であるべーじを保存できた(3月2日)
保存出来た時に表示されるリンクをクリック
→二月中旬に保存したものに飛ぶ
カレンダーを見ると3月2日に保存マークがある
→それをクリックすると二月中旬に保存したものに飛ぶ
これって3月2日に保存は出来たけど閲覧できない状態ということ?

791:名無しさん@お腹いっぱい。
21/03/03 13:37:44.10 .net
>>772
>インスタビューア的な外部サイトがいくつもあるから
>それを介して保存するって方法がある
回答 ありがとうございます。
「インスタビューア的な外部サイト」でググっていますが、見つかりませんorz。
ちなみにパソコン ユーザーです。
保存ができる、おすすめのインスタビューア的な外部サイトを教えていただければ幸いです。m(_ _)m

792:名無しさん@お腹いっぱい。
21/03/03 15:26:40.68 .net
この保存職人たちの怒りのスレいわく、
URLリンク(archive.org)
Poster: Hitsmello Date: Nov 29, 2020 10:39am
Also, lately, I've noticed that the "Job failed" only seems to happen if I check the "Save outlinks" AND the "Please email me the results" boxes.
It WILL save properly if I just check "Save also in my web archive" and "Save outlinks". Gee, I wonder why...
ログインしてSave outlinksとPlease email me the resultsにチェックを入れるとjob failedが出ずに保存できるらしい
俺はアカウントから保存して、ファイルに名前が残るのはやだから、試してないけど

793:名無しさん@お腹いっぱい。
21/03/03 15:31:00.65 .net
>>773
反映待ち状態になってるから、数日後に見れるようになったか確認してみて
大抵は24時間、遅くても2日以内に見れるようになるはず
急いでるか保存失敗してそうなら、同じURLなら30分後以降にまた保存できるので再度保存するのもあり

794:名無しさん@お腹いっぱい。
21/03/03 18:22:54.32 .net
This URL has been already captured 10 times today
同じURLで連続10回保存失敗した場合でもこのエラーが出る。
失敗してるのにこれはないだろ。capturedできてねーぞ。

795:名無しさん@お腹いっぱい。
21/03/03 20:33:32.32 .net
>>774
instagram viewerとかでググって出てきたサイトに投稿を表示させて、その内容を保存するってこと
サイトによって表示される情報量がまちまちだから色々試して使いやすいのを探す必要がある
(例) プロフィール画面
URLリンク(web.archive.org)
(例) 投稿画面
URLリンク(web.archive.org)
可能な限りは公式サイトを保存したいところだけど
どうしても無理ならこうするしかないんじゃないかな

796:名無しさん@お腹いっぱい。
21/03/04 17:47:00.70 .net
save画面でキャプチャできたのかリンクが出たからクリックしたらサイトは保存されていませんと出る

797:名無しさん@お腹いっぱい。
21/03/05 04:44:26.90 .net
なんか調子悪いな?

798:名無しさん@お腹いっぱい。
21/03/05 16:53:21.35 .net
さっき知ったけど、IAの社員でWayback Machine責任者のマーク・グラハムさんがSave Page Nowや/save/のAPIの仕様説明書を公開してくれた
URLリンク(webapps.stackexchange.com)
自動翻訳かけても読む価値あると思う
Save Page Now 2 Public API Docs Draft
URLリンク(docs.google.com)
URLリンク(docs.google.com)
Limitationsのところに制限について書いてあるのを拾ってみると
・同じIPアドレスから同時に6ページ以上SPNや/save/で保存すると自動でエラーになる
・10秒でレスポンス戻ってこなかったらタイムアウト
・50秒で保存先URLはタイムアウト
・spn@archive.org宛に保存したいURLのメールを送ると500個まで保存してくれる(俺の経験上結果がエラーだらけになる可能性大なので確実に保存したいなら手動で)
・ログインしてない同じIPアドレスから画像なども含めて1日2万ページ以上は保存リクエストだせない、ログインしてれば制限なし
・ログインしてAPIキーを取得すれば、プログラムから保存するのもできる
この制限に引っかからないようにすれば、大量保存してる人はうまくいくはず
サンプルコードにも失敗したら保存を繰り返すようなコードになってるから、保存エラーが多いのは認識してるんだろう

799:名無しさん@お腹いっぱい。
21/03/05 16:59:20.94 .net
あとこんなのを発見
IAにログインした上で、Googleスプレットシートに保存したいURLを並べて登録すると保存してくれるサービス
URLリンク(archive.org)

800:名無しさん@お腹いっぱい。
21/03/05 18:13:28.08 .net
>>778
ありがとうございます。上手くいきました

801:名無しさん@お腹いっぱい。
21/03/05 19:51:34.90 .net
A snapshot was captured.が出ればとりあえずは様子見でいいんかな
スナップショット等への反応が即時でないが

802:名無しさん@お腹いっぱい。
21/03/05 20:16:22.56 .net
保存できてもその保存できたページが表示できるまで時間かかってるっぽい?
カレンダーで確かに今日の日付で保存されてるのにそこをクリックしても過去に保存されたページしか出ない
first archiveの場合は成功しましたのリンククリックしても保存されてないになっちゃう

803:名無しさん@お腹いっぱい。
21/03/05 21:10:51.47 .net
>>9を見ろ

804:名無しさん@お腹いっぱい。
21/03/06 02:15:27.01 .net
>>781
思ってたより全然神サービスだったわありがてー

805:名無しさん@お腹いっぱい。
21/03/06 17:13:17.16 .net
>>777
これが一番腹立つ

806:名無しさん@お腹いっぱい。
21/03/07 17:50:27.08 .net
頑なにとってくれないサイトあるよね

807:名無しさん@お腹いっぱい。
21/03/09 01:33:30.80 .net
ページによって挙動が違うのがなんとも

808:名無しさん@お腹いっぱい。
21/03/09 01:45:34.00 .net
数日にわたって全く保存されなかったやつが今試したら一発で通りやがる
気分屋だなあ

809:名無しさん@お腹いっぱい。
21/03/09 21:49:05.86 .net
またおかしなurlに飛ぶようになった
今回はgoogle系ばかり

810:名無しさん@お腹いっぱい。
21/03/10 07:27:06.81 .net
なんか論文検索始まった
URLリンク(scholar.archive.org)
Sci-Hubキラーになるかwww

811:名無しさん@お腹いっぱい。
21/03/10 21:05:30.75 .net
google系の変なurlに飛ぶようになってない?今までもそんなことあった?

812:名無しさん@お腹いっぱい。
21/03/10 21:12:27.07 .net
去年もあったが今回はgoogle系にだけだな

813:名無しさん@お腹いっぱい。
21/03/10 21:25:03.54 .net
>>795
なるほど しばらく待てば直るものか?

814:名無しさん@お腹いっぱい。
21/03/10 22:53:02.34 .net
URLリンク(web.archive.org)
Save Page Now から保存を完了した後に表示される Visit page のリンク先が
保存したページそのもののアーカイブではなく、
その中の画像だったりスクリプトだったりのアーカイブになることがあるんだよね。
これも一連の異常と関係してるのかな。

815:名無しさん@お腹いっぱい。
21/03/11 00:11:38.24 .net
>>797そう!それになるんだよ。最近調子悪いんだな……

816:名無しさん@お腹いっぱい。
21/03/11 13:41:23.28 .net
結局最近のは保存できていないってことかな?

817:名無しさん@お腹いっぱい。
21/03/11 15:47:38.66 .net
>>799
その通り…保存できてなくて困ってるよ

818:795
21/03/11 15:57:13.93 .net
念のため記しておくと、こちらでは「保存できない」という問題は起きていない。
確かに保存完了直後には見られないことがあっても、数時間~数日後には表示できている。
保存完了画面のリンクが別のファイルを指しているので、実際に見てみるには
URL を入れ直さなきゃならないという点は何とかしてほしいと思う。

819:名無しさん@お腹いっぱい。
21/03/11 17:54:51.72 .net
おかしなurlに飛ばされても後でチェックすると保存はできているな

820:名無しさん@お腹いっぱい。
21/03/11 18:44:03.64 .net
おお、今確認したらちゃんと保存されてた!保存しなおさないといけないと思ったから焦ったよ
教えてくれてありがとう

821:名無しさん@お腹いっぱい。
21/03/12 02:59:00.85 .net
google系だけじゃないぞ、多分アナリティクスのjsファイルURLが帰ってくることがあるからそう言ってるだろうけど
例えばある人のfc2ブログの記事を保存したら帰ってきたのはそのページで読み込まれるcssやjsファイルだったし

822:名無しさん@お腹いっぱい。
21/03/13 18:56:41.68 .net
Live page is not available:が出たけどちゃんとセーブされてるのもあるな

823:名無しさん@お腹いっぱい。
21/03/13 22:35:06.61 .net
「おかしなurlに飛ばされる」ってのは結局
物事をきちんと説明できない池沼が騒いでいただけなのか?

824:名無しさん@お腹いっぱい。
21/03/15 00:54:48.12 .net
保存して本来表示されるべきページではないurlが表示されている事を報告しているものを
池沼呼ばわりとはどういう了見かな?

825:名無しさん@お腹いっぱい。
21/03/15 08:05:56.29 .net
韓国人・朝鮮人式に考えれば良いのですよ。
行先の違うリンクを確認もせずにクリックして、勝手に飛んで行ったのであっても、
チョンにとっては「自分は常に正しい、悪いのは他人」ですから
飛ばされたことになっちゃうんですよ。

826:名無しさん@お腹いっぱい。
21/03/15 11:07:06.87 .net
Job failedは無くなったけどエラー自体はあんまり変わってないな
ページが存在するのにLive page is not availableが出たりするし

827:名無しさん@お腹いっぱい。
21/03/15 15:13:50.78 .net
全く意味がわかってないアホがいるようだ
まあ今はあの現象は直ってるようだがな

828:名無しさん@お腹いっぱい。
21/03/18 01:41:28.07 .net
あーページにぐぐる地図が埋め込まれてるとおかしくなるな なるほど

829:名無しさん@お腹いっぱい。
21/03/18 09:04:58.59 .net
Google地図だけtodayで取る

830:名無しさん@お腹いっぱい。
21/03/20 19:27:34.98 .net
直ってないな

831:イモー虫
21/03/22 04:29:32.07 .net
あんま騒ぎになってないがなんでだろ
ガラケーからだけエラーが頻発かと思えば違うんだね

832:名無しさん@お腹いっぱい。
21/03/24 20:24:38.95 .net
twitterでjsonとられる現象減ったね

833:名無しさん@お腹いっぱい。
21/03/27 19:47:08.19 .net
Live page is not available

834:名無しさん@お腹いっぱい。
21/04/01 09:36:27.49 .net
案の定エイプリルフールページで殺到してるのか重いな

835:名無しさん@お腹いっぱい。
21/04/02 14:14:32.26 .net
そういうことか

836:名無しさん@お腹いっぱい。
21/04/04 15:52:25.36 .net
archive,todayってURL保存した後にzipでDL出来るみたいだけど
攻略サイト保存したらちゃんと階層や画像も一括でまとめてzipでDL出来んの?

837:名無しさん@お腹いっぱい。
21/04/05 16:29:25.73 .net
URLリンク(lab.syncer.jp)
このサイト使うとtwitterの動画保存できる

838:名無しさん@お腹いっぱい。
21/04/07 05:09:08.66 .net
This page is not available on the web/because of server error がでてこんにゃろと思ってたら
いきなりロードされて保存済みページが表示されたりがあるな

839:名無しさん@お腹いっぱい。
21/04/16 00:59:24.77 .net
なんかYahooニュースのURLを保存するとこれが出たりする
ブロックリストに入れるような記事かこれ?
This URL is in our block list and cannot be captured.
Please email us at "info@archive.org" if you would like to discuss this more.

840:名無しさん@お腹いっぱい。
21/04/16 05:40:19.79 .net
特定個人が発信する政治的記事の過去の言質を取られないようにするためと思われる
主にコロナ関連で

841:名無しさん@お腹いっぱい。
21/04/16 07:10:27.48 .net
もしあれだったら5chのニュースキャップなどでニューススレ立ててそっちを保存するか
yahooなら大抵二次なので一次ソースをたどってそっちを保存

842:名無しさん@お腹いっぱい。
21/04/16 10:12:44.29 .net
24時間経過しないと取得できたか分からない

843:名無しさん@お腹いっぱい。
21/04/16 17:12:55.38 .net
同じドメインのサイトを一括で保存してDL用にZipでまとめてくれるサイトってねーの?

844:名無しさん@お腹いっぱい。
21/04/17 09:24:30.32 .net
ウェブ魚拓の方なんだけど取得できる時とできない時の条件の違いがよく分からんわ

845:名無しさん@お腹いっぱい。
21/04/17 11:41:17.37 .net
IA全然とれねー

846:名無しさん@お腹いっぱい。
21/04/19 11:42:38.28 .net
iaは最近ずっと調子悪い印象

847:名無しさん@お腹いっぱい。
21/04/20 01:48:29.85 .net
最近またjob failed出るようになったな

848:名無しさん@お腹いっぱい。
21/04/20 16:17:10.58 .net
>>827
うちウェブ魚拓いくら待ってもロボット拒否でbanされたわw

849:名無しさん@お腹いっぱい。
21/04/20 21:36:13.88 .net
twitterぜんぜん保存されてないな。万単位のフォローがいる垢でも保存されてなかったりする

850:名無しさん@お腹いっぱい。
21/04/21 21:20:44.52 .net
>>831
Web魚拓はReCaptchaのマークが右下に表示されてから12秒くらい待ってボタン押すと保存できるはず。
長く待ちすぎるとロボット拒否される

851:名無しさん@お腹いっぱい。
21/04/21 23:45:37.52 .net
スマートフォンでアーカイブしたものをスマートフォンで見ようとすると見れないが3Gガラケーでは見れる謎

852:名無しさん@お腹いっぱい。
21/04/22 21:24:08.86 .net
俺が対策書いた途端にWeb魚拓の仕様が変わって草。
このスレ見てる誰かがスクリプトでも走らせてるのか

853:名無しさん@お腹いっぱい。
21/04/23 17:18:11.69 .net
最新のブラウザ使ってても「お前のブラウザ古いぞ」的な警告文(黄色)出るの俺だけ?

854:名無しさん@お腹いっぱい。
21/04/25 18:05:22.97 .net
インターネット官報誰も保存してない

855:名無しさん@お腹いっぱい。
21/04/30 13:23:56.96 .net
アカウント作成時の捨てアド排除が始まってるなぁ
二ヶ月前はこんなこと無かったのに
URLリンク(o.5ch.net)

856:名無しさん@お腹いっぱい。
21/04/30 13:34:48.94 .net
あと、ユーザプロフ画面でアバター画像をアップロードしてない場合に
Gravatarを参照しなくなった
画像のタイムスタンプからして先月初旬の変更か
URLリンク(archive.org)
Last-Modified: Sun, 07 Mar 2021 00:42:48 GMT
URLリンク(o.5ch.net)

857:名無しさん@お腹いっぱい。
21/04/30 18:23:16.44 .net
>>832
ちょっと違うけど20年近く続いてる個人サイトとか、あとベテラン作家のブログが保存されてたのにサイトの方は�


858:ゥ分が作業するまでアーカイブに無かったってことはあったな (後者は今のサイトが出来てから2年ぐらいしか経ってなかったのもあるんだろうけど)



859:名無しさん@お腹いっぱい。
21/04/30 21:42:19.54 .net
Twitterのアーカイブは殆どArchive Teamのやつだから
ユーザーページは取られてないけど個別のツイートは殆ど取られてるはず

860:名無しさん@お腹いっぱい。
21/05/03 02:26:37.76 .net
ページが存在するのにLive page is not availableになるのいい加減にしてくれ

861:名無しさん@お腹いっぱい。
21/05/04 08:19:29.48 .net
「Check My Links」という拡張機能を使えばリンクの未保存ページが自動アーカイブできるよ
URLリンク(www.jtm.gr.jp)

862:名無しさん@お腹いっぱい。
21/05/04 22:21:00.51 .net
アカウントの Mailing Lists Settings の項目が増えたな。
Stay up to date with what’s happening at the Internet Archive by signing up for our free newsletters.
□ Best of the Archive: Useful resources, unique stories, and fun finds from our collections
□ Monthly Updates: A snapshot of the main news stories about the archive each month
□ Event Notices: Invitations to and news about our events
□ Donor Communications: Messages for and about our generous supporters
どれも要らないけどw

863:名無しさん@お腹いっぱい。
21/05/05 11:05:32.13 .net
インスタ保存したいんだけどできないね

864:名無しさん@お腹いっぱい。
21/05/05 21:50:33.16 .net
>>845
インスタはちょっと前から出来なくなった
個別の画像URLを抽出して保存は出来る

865:名無しさん@お腹いっぱい。
21/05/06 13:16:03.43 .net
Batchの設定も少し増えた

866:名無しさん@お腹いっぱい。
21/05/07 09:48:31.47 .net
Save screen shotにチェック入れても取られないときあるな
後から取られてるんだろうか?

867:イモー虫
21/05/07 16:22:46.45 .net
ちなみにその個別画像urlテンプレ
https●:●//www.●instagram.●com/p/11桁のインスタ画像個別の英数/media/?size=l

868:名無しさん@お腹いっぱい。
21/05/07 18:40:26.38 .net
こっちもほぼsavescreenshotが機能してない
裏で取れてたりするんかね

869:名無しさん@お腹いっぱい。
21/05/08 03:19:50.67 .net
たまにyoutubeの動画がアーカイブされてるけど手動で取る方法はないんですかね?

870:名無しさん@お腹いっぱい。
21/05/08 05:54:04.89 .net
APIの情報も信用できないし、どれが取れていて どれが取れていないかは
結局自分たちの目で見て確認するしかないという現状。

871:名無しさん@お腹いっぱい。
21/05/08 16:28:03.01 .net
保存の確認のためにWayback Machine Availability APIを使ってみたけど、
保存されてるURLでもスナップショット無しだと返ってくる
壊れてるなこれw

872:名無しさん@お腹いっぱい。
21/05/08 17:02:12.53 .net
>>851
URLリンク(web.archive.org)URLリンク(www.youtube.com)動画のID と入力し保存。すぐには保存されないけど、数週間待って見てみると保存できてる

873:名無しさん@お腹いっぱい。
21/05/08 19:57:36.18 .net
>>854
4K画質のとかでも保存されるの?

874:名無しさん@お腹いっぱい。
21/05/08 23:10:05.55 .net
>>854
おお、ありがとうございます
保存までに時間が掛かるんですね

875:名無しさん@お腹いっぱい。
21/05/09 02:38:40.84 .net
>>846
画像のアドレスの仕様にもよるがしおりをつけておかないと後で検索のしようがなくなりがちなやつ
imgurの画像とかも保存自体は出来るがどこの何の画像なのかはどこかに記載されてないとカオスに

876:名無しさん@お腹いっぱい。
21/05/09 03:59:33.78 .net
>>854
それ動画ページが見れるだけで動画自体は保存されないんじゃないの?

877:名無しさん@お腹いっぱい。
21/05/09 04:04:52.08 .net
>>855
YouTubeのビデオは、訴えられる危険を犯した専用の解読スクリプトを書かないと
ビデオを保存できないので無理。
imgurのようなビデオに静的なリンクを張っている所とは違う。
URLリンク(web.archive.org)
<video draggable="false" playsinline="" autoplay="" … >
<source type="video/mp4" src=
"URLリンク(web.archive.org)
></video>

878:名無しさん@お腹いっぱい。
21/05/09 04:48:52.27 .net
動画自体も保存されてるよ。自動クロール率は低いけど
適当にURL貼るとこれとか
URLリンク(www.youtube.com)">URLリンク(web.archive.org))

879:名無しさん@お腹いっぱい。
21/05/09 21:18:48.23 .net
>>860
消されてない動画の場合、見るたびにそっちを取りに行ってる可能性がある
まぁ自分も詳しくないので詳しい人いたら教えてほしい

880:名無しさん@お腹いっぱい。
21/05/10 02:03:24.91 .net
>>861
保存された動画を再生してるみたい
動画のソース
URLリンク(r4---sn-n4v7sne7.googlevideo.com)">URLリンク(web.archive.org))

881:名無しさん@お腹いっぱい。
21/05/10 02:10:49.84 .net
Youtubeの動画とかもちゃんと保存されんのか……

882:名無しさん@お腹いっぱい。
21/05/10 02:13:29.44 .net
YouTubeは定期的に仕様変更してるからIAがそれに対応していくのは難しいらしい
だから昔のページだと動画が保存されてるのもあるけど今はされてない

883:名無しさん@お腹いっぱい。
21/05/10 05:21:32.71 .net
>>864
自分もよく分かってないけど今も保存されてるっぽいよ
昨日の動画が保存されてたから
URLリンク(www.youtube.com)">URLリンク(web.archive.org))

884:名無しさん@お腹いっぱい。
21/05/10 14:48:04.32 .net
またサーバーが落ちたのか繋がらないな
archive.orgの方は接続出来るみたいだが…

885:名無しさん@お腹いっぱい。
21/05/10 16:09:21.18 .net
URLリンク(archive.org)
日本時間で14時20分すぎから鯖落ち中らしい

886:名無しさん@お腹いっぱい。
21/05/10 16:34:25.60 .net
web.archive.org までは到達できている。また内部のネットワーク障碍か。
URLリンク(o.5ch.net)

887:名無しさん@お腹いっぱい。
21/05/10 17:37:18.38 .net
復旧したっぽい

888:名無しさん@お腹いっぱい。
21/05/11 13:44:37.60 .net
なんか今日はIAの調子やたらいいな
これまで表示されなかったスクショなんかもちゃんと取れてるし

889:名無しさん@お腹いっぱい。
21/05/11 15:27:21.28 .net
Youtubeは少なくとも今年1月にとった分は動画まで保存できてたから、時間が経てば取れると思う。

890:名無しさん@お腹いっぱい。
21/05/11 19:00:41.67 .net
>>849
わからん…

891:名無しさん@お腹いっぱい。
21/05/14 18:54:25.52 .net
waybackmachine使っただけで訴えられた事例とかあるの?

892:名無しさん@お腹いっぱい。
21/05/15 00:01:24.67 .net
IA自体はともかく利用者はないだろ

893:名無しさん@お腹いっぱい。
21/05/15 00:54:51.91 .net
ウェブ魚拓保存者がIP開示されたケース
URLリンク(gigazine.net)

894:名無しさん@お腹いっぱい。
21/05/15 02:45:03.16 .net
ウェブ魚拓はそういうのもあって今は利用していない

895:名無しさん@お腹いっぱい。
21/05/16 07:35:08.10 .net
429エラーでもこれはお手上げ
URLリンク(o.5ch.net)

896:名無しさん@お腹いっぱい。
21/05/17 10:22:21.67 .net
Cannot get status of 16進数(32桁)というのが出る

897:名無しさん@お腹いっぱい。
21/05/18 16:27:53.74 .net
保存日時の情報は記録されているけれど、外部リンク調査日時の記録はされていないんだろうな。
これも記録してあればいいのに。

898:名無しさん@お腹いっぱい。
21/05/18 18:54:24.22 .net
なんではてなブログアーカイブするとfacebookなんちゃらになるんだ

899:名無しさん@お腹いっぱい。
21/05/19 03:51:09.54 .net
ツイッターも意味不明な表示になったがちゃんと正式urlでアーカイブされてた

900:名無しさん@お腹いっぱい。
21/05/19 23:05:23.86 .net
サイト内のzip落としたらUAが表示される某サイトで
二度Sorry出したら二度ともUAが表示されていたから保存されてはいるようだ

901:名無しさん@お腹いっぱい。
21/05/20 17:13:05.62 .net
Cannot save Internet Archive URLs!
今日はこのエラー連発で1時間後にやり直したらできたり不安定すぎる
保存できなかった理由も書いてない

902:名無しさん@お腹いっぱい。
21/05/21 18:08:48.24 .net
Twitterで特定のアカウントだけexcludedってあるんだな
本人が申請したっぽいけど

903:名無しさん@お腹いっぱい。
21/05/22 13:44:06.50 .net
ハイパーリンクの情報は当然持ってるとして各ファイルの被リンク情報はなくてもやっていけるんだろうかと少々心配になる
ビッグデータとして利用する客が考えればいいことか知らんが

904:名無しさん@お腹いっぱい。
21/05/23 07:32:01.41 .net
そもそも今のIAはとにかく情報を溜め込むことだけ考えてそれをどう活用するかは今後次第って感じじゃないかなあ
現状のsaveだけでもサーバー不安定になるレベルで常にやってるし(それでも全然間に合ってなさそうなのが怖いが)

905:名無しさん@お腹いっぱい。
21/05/23 22:01:09.82 .net
URLで検索してアーカイブ一覧を表示しようとすると次のエラーが出るのだけど
混雑で検索エンジンが止まってるだけかな
The search engine encountered the following error: invalid or no response from Elasticsearch

906:名無しさん@お腹いっぱい。
21/05/24 07:19:04.30 .net
ほう URLリンク(www.elastic.co)

907:名無しさん@お腹いっぱい。
21/05/25 04:48:03.82 .net
>>509
ページ全体は無理だが画像などバラのパーツは個別に保存が可能だったりすることもある
ザル運営のブラウザゲームなどはありがち

908:名無しさん@お腹いっぱい。
21/05/25 08:24:52.11 .net
Cannot fetch the target URL due to system overload.
ナニコレ

909:名無しさん@お腹いっぱい。
21/05/25 08:29:38.17 .net
>>890
> due to system overload
そういうことだろ

910:名無しさん@お腹いっぱい。
21/05/25 17:48:23.78 .net
>>890
URLリンク(translate.google.co.jp)

911:名無しさん@お腹いっぱい。
21/05/25 23:05:34.28 .net
オーバーロードはなろう系で唯一お薦めできる作品

912:名無しさん@お腹いっぱい。
21/05/26 03:28:24.76 .net
最近データベースの入れ替えでもしてるの?
Explore more than X billion web pages saved over time
のXが一瞬半分になったり変動がすごい

913:名無しさん@お腹いっぱい。
21/05/26 05:53:27.55 .net
オーバーロードが良かったのは一期だけ(アニメ

914:名無しさん@お腹いっぱい。
21/05/26 18:10:11.99 .net
This snapshot cannot be display


915:ed due to an internal error.



916:名無しさん@お腹いっぱい。
21/05/26 21:05:39.01 .net
回復したかな

917:名無しさん@お腹いっぱい。
21/05/27 03:31:52.31 .net
system overloadが出ても/*/の後にURLつけると保存できてることがあるので、
一応確認してみるのおすすめ

918:名無しさん@お腹いっぱい。
21/05/27 22:10:47.88 .net
保存時間の間隔が30分から45分になってる…

919:名無しさん@お腹いっぱい。
21/05/28 02:03:32.64 .net
アイヤー

920:名無しさん@お腹いっぱい。
21/05/28 09:59:53.85 .net
URLリンク(homepage2.nifty.com)

This URL has been excluded from the Wayback Machine.
になってるのはなんでだろう?ジオシティーズみたいな普通のホームページサービスだったみたいだけど

921:名無しさん@お腹いっぱい。
21/05/28 10:04:26.18 .net
>>901
> ジオシティーズみたいな普通のホームページサービスだったみたいだけど
ワロタ

922:名無しさん@お腹いっぱい。
21/05/28 15:24:41.10 .net
ジオシティーズやトクトクは普通だけどフリーティケットシアターは普通じゃない的な

923:名無しさん@お腹いっぱい。
21/05/30 04:42:48.43 .net
/*/はFail with status: 498 No Reason Phrase

924:名無しさん@お腹いっぱい。
21/05/30 17:45:08.98 .net
なるべく円高米ドル安の時に寄付したほうがいいんだろうな。

925:名無しさん@お腹いっぱい。
21/05/30 19:21:56.74 .net
batchのページ開いてもトップに飛ばされてしまうようになった

926:名無しさん@お腹いっぱい。
21/05/31 01:22:39.81 .net
batchのページが復活したっぽい。よかった

927:名無しさん@お腹いっぱい。
21/06/01 03:49:59.92 .net
swfのあるページの取得厳しいんだっけ
Cannot fetch the target URL due to system overload.がでる
todayのほうで試したらプロセスが空白で進行せず
megarodonは見かけ上はとれてるがソースからswfの現物アドレスを消して保存してるっぽい
ファイル固有の問題だろうか
デバッガでは開けるんだが

928:名無しさん@お腹いっぱい。
21/06/01 04:36:21.94 .net
swfってただのファイルじゃないの
どうしてそんなことが起こるのですか

929:名無しさん@お腹いっぱい。
21/06/01 11:28:13.18 .net
We only allow new captures of the same URL every 45 minutes.

930:名無しさん@お腹いっぱい。
21/06/01 13:18:27.55 .net
That's too hard to me...

931:名無しさん@お腹いっぱい。
21/06/01 13:20:35.24 .net
激遅の/save/で行けたりしない?>swf
保存できても表示が更新されないので本当に保存されているか未確認だけど

932:名無しさん@お腹いっぱい。
21/06/01 17:10:58.68 .net
flash表示システムってどうなったんだっけ

933:名無しさん@お腹いっぱい。
21/06/01 19:40:12.28 .net
サポート終了で表示できないっぽい

934:名無しさん@お腹いっぱい。
21/06/02 01:04:22.30 .net
ファイル1個だけなら画像の確認とかやらないから拡張子関係なく超高速で保存できるはずだけど

935:名無しさん@お腹いっぱい。
21/06/02 01:50:07.20 .net
Cannot fetch the target URL due to system overload.
出すぎ

936:名無しさん@お腹いっぱい。
21/06/02 04:57:26.97 .net
>>912
個別のswfのアドレス投げ込んだら保存できたからひとまずはいいことにする
開くときは開けるアドレスを知ってないとあかんね
デバッガだと「swfを置いてるページ」では開けないんでarchiveのソースに書かれてる現物のアドレスを掘り出してデバッガに渡すまでしないと開かない
(開けるのは確認できた)
>>913
なんかアナウンスされてたよね archiveのswf全部を勝手にブラウザ上で再生してくれるようなものを期待しちゃうけど
そこまでするのは結構大変なはず

937:名無しさん@お腹いっぱい。
21/06/02 08:47:16.75 .net
3Gガラケーの本体自体にフラッシュの再生機能付いててアーカイブ含め見れるが画面が小さいのがあかんな
ガラケー向けの時計フラッシュまちうけフラッシュは本体が壊れない限り確実に永遠に見れるけどペリーのピアノ講師ネタとか永遠に失われそう

938:名無しさん@お腹いっぱい。
21/06/02 14:33:51.58 .net
SPNを保存されたかの確認に使うというわけ分からん状況になってる。
誰かが過去に保存したであろう複数ページの記事が途中歯抜けで保存されているのを見かけた。保存失敗か?
元の記事はもう見れないから補完してあげることもできなかった。

939:名無しさん@お腹いっぱい。
21/06/02 14:54:32.98 .net
twitterの保存だけやけに時間かかるんだけど

940:名無しさん@お腹いっぱい。
21/06/09 00:42:55.87 .net
「Ruffle」というchrome拡張機能使えばFlash見れるよ

941:名無しさん@お腹いっぱい。
21/06/09 01:11:29.08 .net
Sorry
You have already reached the limit of active sessions

先週からエラー出まくり

942:名無しさん@お腹いっぱい。
21/06/09 06:03:50.69 .net
>>922
おまいさんのやり方が悪いだけ。先月の制限強化に引っ掛かってるんだろ。
URLリンク(docs.google.com)
> 2021-05-23
> Anonymous users have lower concurrent captures limit (limit=3) compared to authenticated users (limit=5).
制限値を超えないよう、保存開始のタイミングを調整するしか無い。
アカウントを作ってログインすれば従前の制限値に戻る上、空きセッション数を API で
得られるようになるので、自動的に空きを待ってから保存するようなシステムも
組めるようになる。
URLリンク(web.archive.org) (ログインしていなければ 503 エラー)
Change Log に記載は無いが、ログイン済みユーザの制限値は 6 に緩和されている模様。
("available":6)
URLリンク(o.5ch.net)

943:名無しさん@お腹いっぱい。
21/06/09 15:34:51.37 .net
なんかリファラー変更ができなくなったっぽいんだけど俺環?

944:名無しさん@お腹いっぱい。
21/06/09 16:25:44.73 .net
ブラウザが (IA のヘッドレスブラウザも含めて) リファラを送らなくなったとか
そういう話じゃ無くて?

945:名無しさん@お腹いっぱい。
21/06/09 17:46:21.43 .net
マジか。じゃ もうリファラ必要なサイトは保存できなくなったのか

946:名無しさん@お腹いっぱい。
21/06/09 18:29:55.92 .net
制限するぐらいなら、有料化しろよ

947:名無しさん@お腹いっぱい。
21/06/10 05:14:53.41 .net
金ローの画像はどういう仕組みなんだろう
URLリンク(kinro.ntv.co.jp)
保存ができてるのかできてないのかがようわからん
/*/上の階層/*/ってファイルサイズは見れんよね

948:名無しさん@お腹いっぱい。
21/06/10 09:28:25.29 .net
API を使うとクッキーも送れるけど、ハイジャック耐性の無いユルいサイトしか使い道が無いな。
URLリンク(web.archive.org)
ちなみに force_get を 0 (または省略) にしておかないと capture_cookie を指定しても無視される。

949:名無しさん@お腹いっぱい。
21/06/10 09:46:43.59 .net
そうそう、IA のアーカイブはサーバのレスポンスヘッダが丸ごと保存されていることに留意。
つまり Set-Cookie でクッキーが返されていた場合、それも保存されているという事。
ログイン管理にクッキーを利用しているサイトで、アーカイブのデータを利用して
誰かに勝手にログインされるという事も起こりうる。

950:名無しさん@お腹いっぱい。
21/06/10 16:53:57.18 .net
なにそれこわい

951:名無しさん@お腹いっぱい。
21/06/12 22:30:39.38 .net
また繋がらなくなった?
保存しようとしても503やら404の画面になるんだけど…

952:名無しさん@お腹いっぱい。
21/06/12 22:36:49.23 .net
そうみたい

953:名無しさん@お腹いっぱい。
21/06/12 22:49:26.53 .net
しばらくは駄目そうだな

954:名無しさん@お腹いっぱい。
21/06/12 23:14:58.67 .net
最近、頻繁に使うようになったけど、今繋がらないみたいだね。
だいたいどれくらいで復帰するんだろうか?
1日2日はかかるかな?

955:名無しさん@お腹いっぱい。
21/06/12 23:18:19.16 .net
503エラー?

956:名無しさん@お腹いっぱい。
21/06/13 00:44:05.86 .net
さっき見たときは直ってた

957:名無しさん@お腹いっぱい。
21/06/13 08:29:59.22 .net
親切な表示が出るようになってる
You may close your browser window and the page will still be saved.

958:名無しさん@お腹いっぱい。
21/06/13 17:29:48.96 .net
さじをなげたか

959:名無しさん@お腹いっぱい。
21/06/14 11:43:37.62 .net
Batch Archiveに入れない

960:名無しさん@お腹いっぱい。
21/06/15 07:00:28.90 .net
向こうで計画停電が起こるみたいだから、こっちの時刻で16日の0時30分からしばらくサービス停止するらしい。
URLリンク(i.imgur.com)
URLリンク(www.jisakeisan.com)

961:名無しさん@お腹いっぱい。
21/06/15 09:25:17.87 .net
>>941
Due to a planned power outage, our services will be reduced on Tuesday, June 15th, starting at 8:30am PDT until the work is complete. We apologize for the inconvenience.
この程度の英文すら機械翻訳使わなきゃ読めない低能

962:名無しさん@お腹いっぱい。
21/06/15 14:04:45.44 .net
喧嘩はよそで一人でやってろよ

963:名無しさん@お腹いっぱい。
21/06/15 15:21:07.34 .net
人は上から目線で間違いを訂正するときに性行為より快感を感じるらしい

964:イモー虫
21/06/18 20:45:23.13 .net
読み込み機能は機能しているのか

965:名無しさん@お腹いっぱい。
21/06/19 14:06:16.43 .net
The capture is estimated to start in 120 minutes. You may close your browser window and the page will still be saved.
うっかりログインし忘れるとこれだわw

966:名無しさん@お腹いっぱい。
21/06/19 18:36:08.03 .net
523分待ちだったわ 撮ってくれるんならまあいいけど

967:名無しさん@お腹いっぱい。
21/06/19 19:35:06.80 .net
>>901
members.jcom.home.ne.jpも This URL has been excluded from the Wayback Machine.になるね

968:名無しさん@お腹いっぱい。
21/06/19 21:03:13.89 .net
残り763分

969:名無しさん@お腹いっぱい。
21/06/19 23:24:40.50 .net
今968分待ち、今日中に1000分超えるかな

970:名無しさん@お腹いっぱい。
21/06/20 00:40:25.87 .net
1085分、てかアカウントでログインして保存しようとしてもこの表示出るじゃん
アカウント作った意味ないわ

971:名無しさん@お腹いっぱい。
21/06/20 01:26:26.34 .net
待ち時間が一度表示されてしまうと、その後ログインして
同じURLの再保存を試みても待ち時間が延びるだけ。

972:名無しさん@お腹いっぱい。
21/06/20 03:44:33.22 .net
1393分待ちになってる

973:名無しさん@お腹いっぱい。
21/06/20 12:42:15.80 .net
保存は匿名で出来るんですか?

974:名無しさん@お腹いっぱい。
21/06/20 12:58:58.94 .net
まだログインしないと待ち時間が出る状態なの?
ご愁傷様w

975:名無しさん@お腹いっぱい。
21/06/20 15:59:50.29 .net
今は直ってるな
というか別に待ち時間があっても後で保存されるんだから良くね?

976:名無しさん@お腹いっぱい。
21/06/21 02:12:27.28 .net
伊是名夏子のブログのアーカイブを見ようとすると
6月初めぐらいからThis URL has been excluded&#12316;が出るようになってるんだけど、
非表示化か削除依頼出したみたいだねこれ。

977:名無しさん@お腹いっぱい。
21/06/21 10:45:02.62 .net
アーカイブのアーカイブが必要になりそう

978:名無しさん@お腹いっぱい。
21/06/21 14:15:21.05 .net
archive.isなら消されない

979:名無しさん@お腹いっぱい。
21/06/21 14:49:55.10 .net
archive.is 自体が消えてしまったりしないの? という話が。

980:名無しさん@お腹いっぱい。
21/06/21 19:46:33.38 .net
永久不滅アーカイヴが必要

981:名無しさん@お腹いっぱい。
21/06/22 06:37:35.24 .net
Cannot get status of spn2-2afbf2c51be876410f7a78331b331ea74cd21c67-5a282757

982:名無しさん@お腹いっぱい。
21/06/24 00:03:38.03 .net
>>955
ログインしてても普通に待ち時間表示出るけど、時間帯によって変わったりするの?

983:名無しさん@お腹いっぱい。
21/06/27 13:37:52.83 .net
>>954
>>57
問題なのは関連付けされてる場合はログインしている時のメールアドレスやユーザ名、ログイン関係なくハッシュ化したIPアドレスやUserAgent部分がWARCファイルの名前フィールド部分に保存される可能性がある。
気になるなら保存するときだけUserAgentやIPアドレス変えたり保存するページごとに別ければいい。

984:名無しさん@お腹いっぱい。
21/06/28 11:48:52.21 .net
何度許可してもログインしなおしてもBatchのArchive URLsに入れない

985:名無しさん@お腹いっぱい。
21/07/02 11:56:14.72 .net
Batch入れないけど、騒いでるの俺だけっぽいから俺環なのか

986:名無しさん@お腹いっぱい。
21/07/02 15:17:24.60 .net
皆さん自前でバッチ処理しているから使ってない、に一票

987:名無しさん@お腹いっぱい。
21/07/12 07:09:59.53 .net
あるWEBサイトの一部が消えているのだけれど、
インターネットアーカイブでも履歴が残っていないことがある
忍者とかいうブログサイトを使っているのだが、
あそこって削除した画像とかの履歴を残さないようにする機能とかあるのだろうか

988:名無しさん@お腹いっぱい。
21/07/12 16:06:59.65 .net
>>968
他の魚拓サイトにも残ってないの?まあブログはアーカイブされてないことが多いからなぁ。

989:名無しさん@お腹いっぱい。
21/07/12 16:33:16.08 .net
忍者って昔やたらボット除けに精を出してた所じゃないか
って今時の人は知らんのか
で、もうそろそろ次スレテンプレの話題でも

990:名無しさん@お腹いっぱい。
21/07/12 23:07:03.45 .net
〓テンプレ(案
現行の関連スレ
URLリンク(refind2ch.org)

991:名無しさん@お腹いっぱい。
21/07/14 01:47:06.23 .net
ツイッターのアーカイブ保存、回収の法則テンプレに入れようぜ。
アーカイブ保存は
mobile.ツイッター.com
でなければならないが
回収web.archive.org/web/9999/はmobile.を外さなきゃならない
ってこれガラケーだけ?

992:名無しさん@お腹いっぱい。
21/07/14 04:14:39.67 .net
ガラケー?そんなものの情報要るの?

993:名無しさん@お腹いっぱい。
21/07/16 04:27:32.78 .net
普通にTwitterをアーカイブすればmobileは付かないと思うんだが・・・
それは置いといて>>5とかの話は入れたほうが良さそう

994:名無しさん@お腹いっぱい。
21/07/16 13:46:21.98 .net
最近は反映が早い

995:名無しさん@お腹いっぱい。
21/07/18 03:03:30.60 .net
Hrm.
The Wayback Machine has not archived that URL.って出るサイトは
どうやってもみれないんですか?

996:名無しさん@お腹いっぱい。
21/07/18 18:09:30.90 .net
>>976
アーカイブしてないからそもそも保存されてない

997:名無しさん@お腹いっぱい。
21/07/18 19:27:16.87 .net
URLリンク(wiki.archiveteam.org)
archiveteamが保存した一部のスナップショットを見ると、この「俺たちが保存したぜ」画像のURLを読み込むから、
誰がどのページを見たかarchiveteamのウィキサイトに情報が漏れるんだけど、ただのスパイじゃねーか。
Internet Archiveの人は誰も気付いてないのかなこれ。

998:名無しさん@お腹いっぱい。
21/07/18 20:43:46.80 .net
と、自分でスクリプトを組んでアーカイブできない無能が文句を垂れております。

999:名無しさん@お腹いっぱい。
21/07/19 02:22:16.98 .net
>>979
個人がアップロードしたWARCファイルは扱ってないじゃん
結局のところ制限引っかからないように/save/にURL投げるコードしか組めんよ
何も知らない無能はお前だ

1000:名無しさん@お腹いっぱい。
21/07/19 05:43:32.79 .net
そのレベルの情報を気にするなら個人でproxyなりVPNなり使えばいいのでは
なぜArchiveTeamだけを気にしてるのかは知らんが

1001:名無しさん@お腹いっぱい。
21/07/19 22:59:58.68 .net
>>978
ほんまや
About this captureの説明のところに埋め込んであった
でもブラウザの挙動はCSPで読み込みブロックってなってるから
インターネットアーカイブ側の対策でデータは送信されてない感じかね

1002:名無しさん@お腹いっぱい。
21/07/23 00:21:19.80 .net
25周年記念サイト
URLリンク(anniversary.archive.org)

1003:名無しさん@お腹いっぱい。
21/07/23 16:15:09.58 .net
インターネットアーカイブが25歳になったら、知識がすべての人にとってよりアクセスしやすくなった極めて重要な瞬間を経て、戻る方法から進む方法への旅にあなたを招待します。
アレクサンドリア図書館からヨハネスグーテンベルクによる印刷機の発明まで。
情報への権利の第一修正の保証からワールドワイドウェブの作成まで、知識へのアクセスは常に建設者と夢想家のおかげでした。
さて、ブリュースター・ケールという若いコンピューター科学者がデジタル時代の「すべての図書館」を建設することを夢見ていた1996年にさかのぼります。
人類の出版されたすべての作品を含み、一般に無料で、時代を超えて非営利団体として構成されたライブラリ。彼はこのデジタルライブラリをインターネットアーカイブと名付けました。
その使命は、すべての人に「すべての知識への普遍的なアクセス」を提供することで


1004:す。 この25年のマイルストーンに関するブリュースターの考察を読む バーチャルセレブレーションに参加する あなたが世界のどこにいても、私たちと一緒に祝いに来てください。 ウェイバックからウェイフォワードへ:25のインターネットアーカイブ 星を目指して到達したビルダーと夢想家との仮想の旅。 10月21日木曜日午後6時PT(午後9時ET)



1005:名無しさん@お腹いっぱい。
21/07/24 02:54:26.16 .net
YoutubeのURL取ったら下のメッセージが出た
It may take a few days for YouTube videos to become available for playback.
動画もアーカイブされてるってことでいいのかな?

1006:名無しさん@お腹いっぱい。
21/07/24 13:53:59.14 .net
Youtubeを保存したいなら手動保存が望ましい。クローラーの保存だと再生できないケースあり。

1007:名無しさん@お腹いっぱい。
21/07/31 03:20:35.58 .net
そろそろ6000億超えるか

1008:名無しさん@お腹いっぱい。
21/07/31 19:00:56.16 .net
<title>だけでも検索できるといいんだけどなあ

1009:名無しさん@お腹いっぱい。
21/07/31 21:11:28.65 .net
いまツイッターの動画って保存できねえんだっけ

1010:名無しさん@お腹いっぱい。
21/08/01 03:48:55.71 .net
そうなの?(そうなの?)

1011:名無しさん@お腹いっぱい。
21/08/01 16:10:13.05 .net
>>989
これ使ってURL変換すると保存できるよ
URLリンク(lab.syncer.jp)

1012:名無しさん@お腹いっぱい。
21/08/01 18:08:12.29 .net
ページからたどれなくならね

1013:名無しさん@お腹いっぱい。
21/08/01 18:27:20.02 .net
それはしゃーない

1014:名無しさん@お腹いっぱい。
21/08/01 19:07:49.48 .net
次スレたのんます

1015:名無しさん@お腹いっぱい。
21/08/13 03:38:50.58 .net
>>994
Internet Archive総合 (web.archive.org) #4
スレリンク(esite板)

1016:名無しさん@お腹いっぱい。
21/08/13 07:19:48.01 .net
Tor clients have already done 200,000 captures today. Please email us at "info@archive.org" if you would like to discuss this more.
とか出てきたんやけど・・・

1017:名無しさん@お腹いっぱい。
21/08/13 09:36:18.65 .net
Tor使ってないのに俺も今日初めてそのエラーが出てきた
9時過ぎたので、一応リセットされて表示されなくなったが、
毎日これが出たら困るな、特に朝保存したい場合は

1018:名無しさん@お腹いっぱい。
21/08/13 13:38:54.09 .net
健康のための朝保存

1019:名無しさん@お腹いっぱい。
21/08/13 19:21:46.35 .net
>>995
おつでござんす


次ページ
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch