Internet Archive総合 (web.archive.org) #4at ESITE
Internet Archive総合 (web.archive.org) #4 - 暇つぶし2ch450:名無しさん@お腹いっぱい。
22/05/18 20:56:55.97 .net
1時間前に比べて重い

451:名無しさん@お腹いっぱい。
22/05/18 21:34:17.24 .net
ようやく解消

452:名無しさん@お腹いっぱい。
22/05/19 19:46:35.64 .net
いつもの寄付表示
今回は赤色だったり青だったり緑だったり
種類増えてて笑う

453:名無しさん@お腹いっぱい。
22/05/21 13:09:44.07 .net
archive.today壊れてらっしゃる?

454:名無しさん@お腹いっぱい。
22/05/21 15:50:47.29 .net
保存されたJAVAが別の画像(など)を動的に引用してる時に
「オリジナルの画像のアドレス」を呼んでしまってるせいで正しく動作しない(呼ばれてる画像自体はアーカイブにある)やつは
アーカイブ上で何とかならんもんだろうか

455:名無しさん@お腹いっぱい。
22/05/21 15:53:32.08 .net
>>441
容量もだが権利関係でやばいのが多すぎる気が

456:名無しさん@お腹いっぱい。
22/05/21 19:49:16.37 .net
curlでもIAログインモード、cookieのページみても出来ないぞ(IAが対策?)
数万urlは保存したいのだが(特に画像)

457:名無しさん@お腹いっぱい。
22/05/22 08:29:18.90 .net
curlで/save/から保存しようとすると「This URL is in our block list and cannot be captured」が出るけど
ウェブブラウザからだとちゃんと保存されるのに遭遇した
ちょっと上で書いてる人もいるけど、UserAgent以外の部分も見るのかなこれは

458:名無しさん@お腹いっぱい。
22/05/25 00:41:46.06 .net
>>451
Cookieは知らんが、今のSPNの制限内であっても、outlinksを辿って時間かからない単一の画像URLだけなら、
少なくとも1分間で4個のURLの保存できるだろうから、24時間で5760個、数万URLあっても1週間以内に保存終わるはず。

459:名無しさん@お腹いっぱい。
22/05/25 23:49:41.59 .net
5次元データストレージって実用化されたら凄そう
割れたら終わりな気もするけど

460:名無しさん@お腹いっぱい。
22/05/27 10:52:55.05 .net
質問です
Internet Archiveにおいて
著作権の扱いはどうなっているのでしょうか?
無断で複製禁止のものをアーカイブした場合
Internet Archive側が著作権侵害となるのでしょうか?
それともアーカイブユーザー側が著作権侵害となるのでしょうか?
ご回答よろしくお願いします

461:名無しさん@お腹いっぱい。
22/05/27 20:01:04.98 .net
アメリカのフェアユースと図書館法と非営利団体ということで守られるので問題ないですが、
「日本人が日本から投稿した」という部分が違法になり得るので、
そこを隠せてすぐに逃げられる形でやれば問題ないです

462:名無しさん@お腹いっぱい。
22/05/27 20:26:08.07 .net
>>456
治外法権はとっくに終わってるので「日本人が」は要らん

463:名無しさん@お腹いっぱい。
22/05/31 03:41:16.24 .net
他人のツイートを全部保存する方法ってないの?

464:名無しさん@お腹いっぱい。
22/05/31 08:31:12 .net
>>458
このツール使えば全ツイートのURLぶっこ抜ける
ArchiveTeamの人が管理してるから安定性もあるんじゃないかな
URLリンク(github.com)

465:名無しさん@お腹いっぱい。
22/06/01 11:47:43.48 .net
>>453 その自動化ツールってなんてやつ?

466:名無しさん@お腹いっぱい。
22/06/01 12:03:28.50 .net
SPNを自動化できるツールとかってある?

467:名無しさん@お腹いっぱい。
22/06/02 21:01:25.82 .net
「The capture is estimated to start in ** minutes.」
同じサイトでも出たり出なかったり

468:名無しさん@お腹いっぱい。
22/06/03 13:04:18.14 .net
ここ何日かjob failedが出るの多すぎ
特に今日はひどい

469:名無しさん@お腹いっぱい。
22/06/03 18:58:45 .net
「The capture is estimated to start in * hours, * minutes.」
昨日よりひどくなってる・・・

470:名無しさん@お腹いっぱい。
22/06/04 09:49:35 .net
ようやく正常に

471:名無しさん@お腹いっぱい。
22/06/04 23:35:18.33 .net
と思ったらまたか
○時間とかではないだけまだ良いが

472:名無しさん@お腹いっぱい。
22/06/06 22:07:55 .net
また○時間レベルでかかるようになってしまった
数時間前まではなんともなかったのに・・・

473:名無しさん@お腹いっぱい。
22/06/06 22:44:35.15 .net
確かにここのところjob failed多いな

474:名無しさん@お腹いっぱい。
22/06/07 23:09:12.43 .net
「The capture is estimated to start in * minutes. You may close your browser window and the page will still be saved.」
今日は21時台から使ってると30分ぐらいごとに出たり出なかったり波があるようだ
そのまま本当に取得できてる場合と「Internal server error.」と出る場合があるからおちおち閉じるわけにもいかないのがなぁ

475:名無しさん@お腹いっぱい。
22/06/08 02:39:39.28 .net
日付変わってすぐは正常だったのにしばらくしてまた「The capture is estimated to start in * hours, * minutes.」
それにしても今月になってから毎日のように時間かかること多いなぁ

476:名無しさん@お腹いっぱい。
22/06/08 13:00:04.29 .net
月初は時間かかるのが多い印象

477:名無しさん@お腹いっぱい。
22/06/08 15:33:31.27 .net
>>459
今のWeb版Twitterはゴテゴテ糞思いUIに改悪されまくりやがったのでワシはRSS串経由で取ったりしてる

【Feedly】RSSリーダー総合【Inoreader】
スレリンク(esite板)

478:名無しさん@お腹いっぱい。
22/06/11 02:19:49 .net
インフォシークとかサービス終了したサイトの終了告知を最優先で表示するのあれなんとかならねえの

479:名無しさん@お腹いっぱい。
22/06/11 03:02:27.42 .net
>>473
広告除去の拡張機能に自分でルールを追加すれば思いのまま。

480:名無しさん@お腹いっぱい。
22/06/12 00:51:33.91 .net
どういうことなの

481:名無しさん@お腹いっぱい。
22/06/13 22:24:09.42 .net
木曜あたりからは順調だったのに、結局また何時間単位とか・・・

482:名無しさん@お腹いっぱい。
22/06/14 09:


483:51:48 .net



484:名無しさん@お腹いっぱい。
22/06/14 12:37:06.24 .net
>>477
2年前のIPアドレスお漏らし騒動のときに運営がIAにアーカイブ除外申請したからそれ以降保存できなくなってる

485:名無しさん@お腹いっぱい。
22/06/15 20:52:24.39 .net
過疎サイトに突然大量アクセスが来たのですがロボットか誰かがせっせと保存してるのでしょうか…
URLリンク(i.imgur.com)

486:名無しさん@お腹いっぱい。
22/06/20 11:28:15.69 .net
既出だったら申し訳ないのですが、archive.orgでツイートやtwitterプロフィール画面をSave Page Nowで保存すると、モバイルサイトでの表示形式で保存されてしまいます。
どうすればPCの表示形式で保存できますか?

487:名無しさん@お腹いっぱい。
22/06/23 10:44:42.70 .net
>>480
Twitterの仕様変更のせいだと思うから無理だと思う
過去ログ見れば分かるけど一時期それで取れなくなった

488:名無しさん@お腹いっぱい。
22/06/23 18:07:01.22 .net
7000億突破したな

489:名無しさん@お腹いっぱい。
22/06/24 01:27:16.59 .net
俺も5000万ぐらい貢献したかな

490:名無しさん@お腹いっぱい。
22/06/24 23:15:31.53 .net
調子悪いな

491:名無しさん@お腹いっぱい。
22/06/25 01:43:20 .net
The capture will start in ~5 seconds because we are doing too many captures of www.youtube.com right now. You may close your browser window and the page will still be saved.

初めてこのエラーが出た
5秒以内に保存始まったが

492:名無しさん@お腹いっぱい。
22/06/25 10:04:48.83 .net
前から出てたエラーに詳細が追加されたんじゃない?

493:名無しさん@お腹いっぱい。
22/06/25 21:04:47 .net
普通に重いときは5秒どころか20秒ぐらいかかってる気がするんだがw

494:名無しさん@お腹いっぱい。
22/06/26 17:14:28.40 .net
>>481
やっぱり仕様変更なんですかね・・・・
見た目のよさと保険でNitter噛ませてみます

495:名無しさん@お腹いっぱい。
22/06/28 03:39:15 .net
困ったな

496:名無しさん@お腹いっぱい。
22/06/29 01:38:37.94 .net
最近YouTubeのURLをSPNで保存すると?v=動画ID&google_abuse=GOOGLE_ABUSE_EXEMPTION〜ってURLに飛ばされてることがある。
SPNのIPアドレスがYouTubeの一時アクセス制限に引っかかってるようで、ちゃんとページが保存されてない場合も。

497:名無しさん@お腹いっぱい。
22/06/30 21:27:00.59 .net
URLリンク(twitter.com)

反五輪の会 NO OLYMPICS 2020

組織委員会、明日ウェブサイト閉鎖!逃げ足早すぎる!!皆さん、資料の保存を急いで!!
#TOKYO2020 OCOG


    __
反五輪の会 NO OLYMPICS 2020@hangorinnokai
Jun 29
組織委員会、明日18:00ウェブサイト閉鎖。 tokyo2020.jp/ja/news/news-20…
東京2020組織委員会公式ウェブサイト閉鎖のお知らせ
  
(deleted an unsolicited ad)

498:名無しさん@お腹いっぱい。
22/07/02 10:35:52.35 .net
>This video is archived but not yet indexed for playback.Please try again tomorrow
ほう

499:名無しさん@お腹いっぱい。
22/07/02 10:43:22.92 .net
>>474
任意のアドレスを開いた時に一番古いアーカイブを呼ぶように強制できる?

500:名無しさん@お腹いっぱい。
22/07/02 21:15:53.79 .net
>>493
公式 Wayback Machine 拡張機能を入れれば?
「Oldest」ボタンを押せば表示される。
URLリンク(i.imgur.com)
The Official Wayback Machine Extension
URLリンク(chrome.google.com)
URLリンク(microsoftedge.microsoft.com)
URLリンク(addons.mozilla.org)
URLリンク(apps.apple.com)

501:名無しさん@お腹いっぱい。
22/07/04 20:52:32.70 .net
実質中身がなくなってるやつを判別してその直前がわかる


502:機能があればいいのにな 別のページへの転送になっている、あたりを基準にするとか



503:名無しさん@お腹いっぱい。
22/07/05 05:46:27.12 .net
見たいのに…

504:名無しさん@お腹いっぱい。
22/07/05 18:17:21.48 .net
/web/1/

505:名無しさん@お腹いっぱい。
22/07/05 19:52:58.59 .net
>>495
"Calendar" 表示の "Changes" をポチれば?

506:名無しさん@お腹いっぱい。
22/07/06 17:43:53 .net
お、なんだそれ

507:名無しさん@お腹いっぱい。
22/07/10 00:46:22.12 .net
>>480です。とりあえずですが解決方法が見つかりました。
ツイッターのURLにモバイルを入れると、アイコンの画質はガビガビになりますが、レイアウトは見やすく保存できました。
URLリンク(mobile.twitter.com)ユーザーネーム

508:名無しさん@お腹いっぱい。
22/07/11 10:14:42.46 .net
Sorry
Cannot start capture
{
"exception" : "Command # 1 (LLEN spn2-api) of pipeline caused error: OOM command not allowed when used memory > 'maxmemory'.",
"message" : "Cannot start capture",
"status" : "error",
"status_ext" : "error:celery"
}

509:名無しさん@お腹いっぱい。
22/07/11 11:48:38.84 .net
保存できんね

510:名無しさん@お腹いっぱい。
22/07/11 13:13:04 .net
今も無理だ、なんかあったのか?

511:名無しさん@お腹いっぱい。
22/07/11 13:26:31 .net
保存できなかったからこのスレきた

512:名無しさん@お腹いっぱい。
22/07/11 13:29:13 .net
昨日保存できたん?

513:名無しさん@お腹いっぱい。
22/07/11 15:13:44.90 .net
>>505
昨日どころか今朝もできてたのに9時直前から>>501の表示
>>471ということだったが、今月は月初でも調子良かったのに・・・

514:名無しさん@お腹いっぱい。
22/07/11 16:17:32.15 .net
ようやく回復か

515:名無しさん@お腹いっぱい。
22/07/13 09:55:00 .net
去年あたりから続いてた訴訟、そろそろ決着しそう
日本だと話題になってないけど、海外SNSだと結構議論されてる

Internet Archive(IA)と大手出版社4社の訴訟において、略式判決の要求が提出される
URLリンク(current.ndl.go.jp)

516:名無しさん@お腹いっぱい。
22/07/14 15:07:51.64 .net
Sorry.
This snapshot cannot be displayed due to an internal error.
どのサイトで試してもこれが出てアーカイブできない

517:名無しさん@お腹いっぱい。
22/07/14 17:09:48.59 .net
初書き込み失礼します。
私は先日、とあるお方のTwitterの過去の書き込みを分かりやすく見たいと身近な人物に相談したところ総合.ツイログが良いと言われ、
総合.ツイログから拝見させて頂いていたのですがそのときに誤って画面の右の方にある『Internet Archive Save Page Now』と書かれたボタンを押してしまい
WayBack Machineというサイトに登録されてしまったみたいなのです。色々と調べてここでなら相談できそうだと思い質問させて頂きたいのですが、
他者のTwitterのツイログを本人の同意なくWayBack Machineに登録してしまったことって違法になるのでしょうか?
一般的にTwitter等におけるコメント自体には個性がないから著作権は認められないし画像も無い、そんで海外のサービスやから大丈夫、捕まらないと思う。と説明はされたのですが
どうにも特定されて逮捕されそうという不安な気持ちが拭えません。
違法でない場合は良いサービスを知ったのでこれからは全部写真を撮って保存するのではなく登録した方が楽なので消さないで良いかと思うのですが、
違法である場合はどうにかして消したいのです。その場合は自分が登録されたTwitterの所有者でなくても消すことは出来るのでしょうか。
どうかご回答の程、よろしくお願い致します。

518:名無しさん@お腹いっぱい。
22/07/14 17:09:55.12 .net
ワイもThis snapshot cannot be displayed due to an internal error.で保存できん。
yahooニュースだからかと思ってたけど違うかねえ
URLリンク(news.yahoo.co.jp)

519:名無しさん@お腹いっぱい。
22/07/14 17:20:33.92 .net
>>510
ツイッターのアーカイブなんて腐るほど保存されてるからタイーホされないと思う。
総合.ツイログが万が一閉鎖されても、Internet Archiveに残ってれば安心や

520:名無しさん@お腹いっぱい。
22/07/14 17:49:00.21 .net
>>512さん
返信が遅くなってしまい誠に申し訳ございません。
『ツイッターのアーカイブなんて腐るほど保存されているからタイーホはないと思う。』
そうでしたか。これで安心できました。本当にありがとうございます。

521:名無しさん@お腹いっぱい。
22/07/15 20:18:27.49 .net
>>509だがどうやらSave outlinksを選択するとThis snapshot cannot be displayed due to an internal error. が出るみたい
なので現状は非会員と同じく一つ一つアーカイブやらなければならない羽目に

522:名無しさん@お腹いっぱい。
22/07/21 14:45:54.17 .net
503

523:名無しさん@お腹いっぱい。
22/07/21 19:20:36 .net
議員になった赤松健がIAが既にやってるゲームのアーカイブ保存を提唱してるな

524:名無しさん@お腹いっぱい。
22/07/22 03:29:22.94 .net
そこらへんうまくやっていってほしいね

525:名無しさん@お腹いっぱい。
22/07/23 11:18:24.80 .net
昨日から画面推移時にクラッシュ頻発する
SPNは問題ない

526:名無しさん@お腹いっぱい。
22/07/23 18:17:14 .net
We're sorry — something's gone wrong.
Our team has been notified.

昨日あたりからこれがよく出るが、
取得済みかどうか調べるときに不便

527:名無しさん@お腹いっぱい。
22/07/23 21:21:39 .net
>>519
俺もそれ出たわ
別の端末から使うか、別垢作ってそれでログインするかしたら方法回避できた

528:名無しさん@お腹いっぱい。
22/07/23 23:24:26.82 .net
>>519
URLリンク(web.archive.org)
にアクセスするとこの画面出るっぽいな
カレンダーとかSPNのページは上のリンクに繋がってるからエラーが出てるんだと思う

529:名無しさん@お腹いっぱい。
22/07/24 19:35:45.02 .net
This page is unavailable for archiving right now!
つべにて

530:名無しさん@お腹いっぱい。
22/07/24 23:42:58.94 .net
>>510
むしろみんなガンガン使ってる

531:名無しさん@お腹いっぱい。
22/07/25 17:09:30 .net
ここに保存されたユーチューブって実際のところ再生できるの

532:名無しさん@お腹いっぱい。
22/07/25 18:23:51.72 .net
>>524
webページを保存するのとは別にYouTube動画を保存するプロセスが特別に用意されてるっぽい
動画が保存されてアーカイブページに反映されるまでには若干時間がかかるけど、完了すれば再生できるようになる

533:名無しさん@お腹いっぱい。
22/07/27 04:46:52.44 .net
これまで見れてたサイトが、キャッシュは存在するのに読み込み途中でキャッシュされてないときの画面になるので、おかしいなと思ってここに来てみたのだが、ずっと挙動おかしいのか。

534:名無しさん@お腹いっぱい。
22/07/27 14:06:07.79 .net
まじか

535:名無しさん@お腹いっぱい。
22/07/27 22:53:13.53 .net
>>526
逆にNHKラジオのJavaScriptで動的にファイルを読み込んで作成するページが
だめだったけど、過去に「対応したかな?」と保存してみてだめだったページ
が表示されるようになった。表示できていないだけで保存されていた。
ひょっとして、聴き逃しページの配信ファイルの情報を記述したJSONも
保存されていているのかな? と思って調べたら保存されていて、誰かが
ページを保存してくれたおかげで期限が過ぎたやつを下載できた。

536:名無しさん@お腹いっぱい。
22/07/27 23:13:17.56 .net
redditをアーカイブしようとすると404NotFound出るの俺だけ?

537:名無しさん@お腹いっぱい。
22/07/30 13:36:46 .net
outlinksって何階層まで保存してくれるの?

538:名無しさん@お腹いっぱい。
22/07/30 15:15:46 .net
大量のURLを保存したいんだけどどうすればいい?

539:名無しさん@お腹いっぱい。
22/07/30 19:49:12.50 .net
Outlinksって一回でリンク70個しか保存してくれないのか…
2万控えてるってのに

540:名無しさん@お腹いっぱい。
22/07/31 01:03:56.96 .net
へー70までなんだ

541:名無しさん@お腹いっぱい。
22/08/01 08:19:55 .net
スレリンク(internet板)
こっちもスレあるけど、こことどっちが本スレでどっちに書き込めばいいの?

542:名無しさん@お腹いっぱい。
22/08/01 13:46:00 .net
ティーカップがあったはずなんだけど、知らない?

543:名無しさん@お腹いっぱい。
22/08/01 18:44:49 .net
>>534
このスレは archive.org のサービスについてのスレで、
向こうのスレはアーカイブ作業用(終了するサービスを記録したり保存を呼びかけたり)って感じじゃないかな

544:名無しさん@お腹いっぱい。
22/08/01 20:07:00.53 .net
>>536
なるほど。聞いてみてよかった。

545:名無しさん@お腹いっぱい。
22/08/02 15:45:38.64 .net
Before you continue to YouTubeが出て再生できない

546:名無しさん@お腹いっぱい。
22/08/06 12:31:32.23 .net
 
「いかがでしたか?」問題に「欲しい情報が出ない」問題… Google検索の第一人者が語る、検索で不満が募る“意外な理由”とは
スレリンク(newsplus板)
 

547:名無しさん@お腹いっぱい。
22/08/11 08:58:16.01 .net
調子悪い?

548:名無しさん@お腹いっぱい。
22/08/11 09:05:43.02 .net
昨日から「The capture will start in ~** minutes because our service is currently overloaded. You may close your browser window and the page will still be saved.」
PDFの場合は表示されず

549:名無しさん@お腹いっぱい。
22/08/17 13:50:51.51 .net
昨日遅くからアクセスしづらいことが多い
それとは別件だが、
最近一部のサイトで正常に取得できてないのに、
なぜか取得できてる扱いを受けることが多い
できてるとみなされるものだから取得し直そうとすれば45分待たなければならない

550:名無しさん@お腹いっぱい。
22/08/18 17:24:07.29 .net
ここ数日深夜~早朝(日本時間)がつながりづらい
と思ったら今もとか・・・

551:名無しさん@お腹いっぱい。
22/08/18 19:54:57.84 .net
つながったと思えばそれも束の間でまたつながらず

552:名無しさん@お腹いっぱい。
22/08/19 17:17:16.09 .net
今日もまたつながりづらいことが多い(5chを含めてほかにはつながる)
新手の規制なのだろうか

553:名無しさん@お腹いっぱい。
22/08/20 00:59:46.23 .net
Before you continue to YouTube

554:名無しさん@お腹いっぱい。
22/08/20 01:17:48.76 .net
日付変わってからの傾向
・20分ごとにつながるときが来る
・使えるのは3分程度、それでまたつながらなくなるの繰り返し
話題にならないところを見ると俺環なんだろうが、
なぜIAだけつながらないのかが謎

555:名無しさん@お腹いっぱい。
22/08/20 23:47:28.88 .net
>>546
www-ghacks-net.translate.goog/2021/04/01/here-is-the-easiest-way-to-get-rid-of-googles-before-you-continue-to-youtube-prompt/?_x_tr_sl=en&_x_tr_tl=ja&_x_tr_hl=ja&_x_tr_pto=sc

これのこと?
プライベートモードではなく通常モードで使うべきということか
で、今は何事もなかったかのような状況
あとは「正常に取得できてないのに取得できてる扱い」がなんとかなれば・・・だが、
まともにつながるだけでも大違いか

556:名無しさん@お腹いっぱい。
22/08/21 12:21:06.05 .net
youtubeのshortの方は後で動画取りに来ない感じなのか

557:名無しさん@お腹いっぱい。
[ここ壊れてます] .net
むしろそこが読めん

558:名無しさん@お腹いっぱい。
[ここ壊れてます] .net
一昨日昨日とせっかく順調だったのにたった今・・・

559:名無しさん@お腹いっぱい。
22/08/23 23:29:24.71 .net
togetterって保存できても閲覧できないようになってる?
カレンダーから飛んでも現在のページに戻されてしまう

560:名無しさん@お腹いっぱい。
22/08/25 05:13:13.00 .net
最近ドメイン指定で/*/を見てるとArchiveteamがサイトマップのXMLファイルURLをいろんなブログで保存してるのを見かけるんだけど
そのサイトマップに載ってるブログ記事のURLの方を保存してほしいな
サイトマップだけじゃ意味ない

561:名無しさん@お腹いっぱい。
22/08/25 10:26:00.53 .net
archive.org
(failed)net::ERR_CONNECTION_TIMED_OUT

562:名無しさん@お腹いっぱい。
22/08/25 11:36:11.20 .net
IA自体が落ちるとか大丈夫なのか

563:名無しさん@お腹いっぱい。
22/08/25 11:57:50.22 .net
Internet Archiveに保存したデータって100年後も残ってると思う?
本当に永久に残せる気がしなくて悩んでる

564:名無しさん@お腹いっぱい。
22/08/25 13:45:37.67 .net
復旧まだ?

565:名無しさん@お腹いっぱい。
22/08/25 13:55:43.16 .net
>>556
デジタル情報を後世に残せる可能性が唯一あるのがInternet Archiveだろうね
ネット規制が年々厳しくなってるから情報を本にまとめて国立国会図書館に納本した方が案外残ってたりするかも?

566:名無しさん@お腹いっぱい。
22/08/25 15:35:07.68 .net
やっぱり落ちてたんだ なんらかの方法でアク禁喰らったかと思ったw

567:名無しさん@お腹いっぱい。
22/08/25 16:40:22.94 .net
アク禁喰らうほど負荷かけちゃ駄目よ

568:名無しさん@お腹いっぱい。
22/08/25 16:53:16.25 .net
「Temporarily Offline
Internet Archive services are temporarily offline.
Please check our Twitter feed for the latest information.
We apologize for the inconvenience.」
今日は俺環だけではなかったのか・・・

569:名無しさん@お腹いっぱい。
22/08/25 17:22:38.17 .net
10時サーバーが落ちていた
16時サーバーが落ちていた
17時サーバーが復旧してメンテ中になっていた
twitter.com/internetarchive/status/1562637688918142976
2022年8月25日(木)12:07:12 JST
> We are working to resolve the outage affecting
> URLリンク(archive.org) & @waybackmachine
お前らの行動あるある
archive.ph/foxJV
archive.ph/LMz1C
archive.ph/z1gVl
archive.ph/W61NL
(deleted an unsolicited ad)

570:名無しさん@お腹いっぱい。
22/08/25 17:55:50.65 .net
ほんとに落ちてて草
ここがサ終したらと思うとゾッとするわ

571:名無しさん@お腹いっぱい。
22/08/25 18:12:34.13 .net
>>1
URLリンク(twitter.com)
-
(deleted an unsolicited ad)

572:名無しさん@お腹いっぱい。
22/08/25 21:27:27.54 .net
直った

573:名無しさん@お腹いっぱい。
22/09/08 00:46:00.71 .net
kiwifarmsという掲示板住民の嫌がらせ対象となった活動家らがCloudflareに対して抗議
掲示板はCloudflareからのブロックに続き、Wayback Machineのアーカイブ対象からも除外されたことで物議を醸してる
URLリンク(i.imgur.com)
Reddit r/Archiveteam のスレでは賛否両論
URLリンク(www.reddit.com)
参考
ITmedia『Cloudflare、フォーラムKiwi Farmsをブロック 「命にかかわる脅威と判断」』
URLリンク(www.itmedia.co.jp)

574:名無しさん@お腹いっぱい。
22/09/08 01:06:13.64 .net
redditをSPNすると404になるやつ、まだ直ってないのか・・・

575:名無しさん@お腹いっぱい。
22/09/10 16:56:52.81 .net
昨日あたりから調子悪い?

576:名無しさん@お腹いっぱい。
22/09/11 01:37:35.36 .net
Not Fundになる

577:名無しさん@お腹いっぱい。
22/09/11 07:29:45.30 .net
404 not found継続中

578:名無しさん@お腹いっぱい。
22/09/11 12:04:17.42 .net
確かにここ何日か「Internal server error.」とか「Not Found」が頻繁に出てる

579:名無しさん@お腹いっぱい。
[ここ壊れてます] .net
エラー出ても2、3回やれば保存が始まるか保存制限に引っ掛かるかのガチャだな
保存できる確率は1/3か1/4

580:名無しさん@お腹いっぱい。
22/09/11 23:57:16.77 .net
エラーになった後もう一度やると「The same snapshot had been made seconds/minutes ago」が返ってくることがある
保存できてるならちゃんと返してほしいが

581:名無しさん@お腹いっぱい。
22/09/12 12:47:12.64 .net
本当にできてるならまだ良いが、
できてないのにできてるとみなされて「The same snapshot had been made ** minutes, ** seconds ago. You can make new capture of this URL after 45 minutes.」なんてことも
本当にできてないのに45分待ちはきつい
ちなみに「web.archive.org/web/*/(URL)/*」では本当にできてる場合は緑or青、みなされてるだけの場合は赤or黄で表示

582:名無しさん@お腹いっぱい。
22/09/12 23:14:14.97 .net
>>574
> ちなみに「web.archive.org/web/*/(URL)/*」では本当にできてる場合は緑or青、みなされてるだけの場合は赤or黄で表示
嘘はいかんよ。
緑として記録されても、リダイレクトされた先で 403 や 404 (つまり赤) ってこともありうる。
IA の説明通り、HTTP のステータスコードのみで考えるべし。

583:名無しさん@お腹いっぱい。
[ここ壊れてます] .net
直った気がする

584:名無しさん@お腹いっぱい。
22/09/13 11:03:38.19 .net
某M社からDMCA報告が来たらしく、アップしてた動画が削除された
IAも巡回してるんだな(YouTubeの元動画は放置なのが謎だけど)
MAD動画とかは--metadata=noindex:trueで上げた方がいいかも

585:名無しさん@お腹いっぱい。
22/09/15 13:39:05.63 .net
てか最近YouTubeの動画URLが一度&themeRefresh=1が付いたURLにリダイレクトされてもう一度リダイレクトされて元のURLに戻るようになってるんだけど
SPNの動画ファイルの保存までちゃんとできてる?

586:名無しさん@お腹いっぱい。
22/09/16 16:32:46.10 .net
>>575
済まない、「できてる場合:青、できてる場合とできてない場合と:緑」
communityserver.org/contents/2602/

587:sage
22/09/17 14:17:53.95 .net
最近、ラブライブや仮面ライダー関連のツイッターの返信コメント欄が保存されていないのは>>571>>572が原因かな?
URLリンク(twitter.com)の中の各返信コメント欄URLをインターネットアーカイブで検索しても見つからなかったし。
(deleted an unsolicited ad)

588:名無しさん@お腹いっぱい。
22/09/17 14:20:02.00 .net
最近、各ツイッターのページの返信コメント欄をインターネットアーカイブで探しても過去のデータでは見つからないパターンが多いな。
担当者さぼってんのか?それとも保存する人いなくなったのか?

589:名無しさん@お腹いっぱい。
22/09/19 01:06:12.59 .net
あらら?インターネットアーカイブが現状では見れなくなっている。

590:名無しさん@お腹いっぱい。
[ここ壊れてます] .net
そうなってくるとインターネットアーカイブアーカイブがいるな

591:名無しさん@お腹いっぱい。
22/09/20 10:26:44.70 .net
>>581
Twitterを大量に保存してるのはArchiveTeamだから
youtubeの動画と違って公式じゃないんよね

592:名無しさん@お腹いっぱい。
22/09/21 03:41:43.60 .net
それはゲリラか何かなのか

593:名無しさん@お腹いっぱい。
22/09/26 02:13:39.95 .net
>>581
他人に頼ってないで重要だと思うなら自らSave Page NowにツイートのURL突っ込めんでいけばいいだろ
ArchiveTeamも全てのツイートURLを保存してるわけじゃないし抜けまくりだぞ

594:名無しさん@お腹いっぱい。
[ここ壊れてます] .net
ニコニコ動画で「vipper吹き替え」と言う物が消えるのですが
お暇な方いればそのアーカイブ活動に協力していただきたいです

私がアーカイブしようとしている物は大体アーカイブできていて
あと「タグ」と「コメント」だけです
詳しい事はニコニコ大百科の掲示板にレスしています
URLリンク(dic.nicovideo.jp)
URLリンク(dic.nicovideo.jp)
(ID: Yv+WglHqgh のレスです)

595:名無しさん@お腹いっぱい。
22/09/26 11:32:22.44 .net
A screen shot was captured. View screen shot:
SPNでページのスクショ画像が一緒に保存されたりされなかったりする機能が始まってる様子

596:名無しさん@お腹いっぱい。
22/09/26 14:41:39.24 .net
何の意味があるんだろう
当時のレンダリングエンジンの記録?

597:名無しさん@お腹いっぱい。
22/09/26 15:55:53.05 .net
今どきの動的なサイトだとSPNじゃ取れなかったりするが
スクショなら見た目だけでもアーカイブ出来たりする

598:名無しさん@お腹いっぱい。
22/09/26 23:47:44.20 .net
(´‥∀‥`)ほう

599:名無しさん@お腹いっぱい。
22/09/28 09:19:48.78 .net
9月20日以降ツイートのアーカイブが自動で取られなくなってる?
めんどくせぇんだよなぁ膨大な数のツイート1つ1つ手動でアーカイブさせんの

600:名無しさん@お腹いっぱい。
22/10/02 14:01:31.65 .net
Sorry
Job failed

601:名無しさん@お腹いっぱい。
[ここ壊れてます] .net
「Job failed」今日はやたら出るなぁ
取得したいサイトとの相性の問題かと思ったらあちらこちらでそんな感じ

602:名無しさん@お腹いっぱい。
22/10/06 08:09:49.83 .net
>>586 自分が初めて見る前のデータが見たいだけですが…。
仕事中などで見られなかったデータとか。
アクティブチームも最近全然見てないパターン多すぎ。
ちゃんとの人の事考えてるのか?
もう少し早くできないものか。

603:名無しさん@お腹いっぱい。
22/10/06 10:56:37.49 .net
>>595
文句言ってる暇があったら自分で実行すればいいだけでは?
アクティブチームが誰だかは知らんが、ArchiveTeamは誰でも参加できるぞ
URLリンク(wiki.archiveteam.org)

604:名無しさん@お腹いっぱい。
22/10/07 08:02:54.16 .net
インターネットアーカイブもすべてのYouTubeのURLを保存してるわけではないと思いますが・・・。
URLリンク(www.youtube.com)
URLリンク(www.youtube.com)
URLリンク(www.youtube.com)
これらのページの保存が遅すぎる。

605:名無しさん@お腹いっぱい。
22/10/07 23:59:11.39 .net
上でも書いてる人いるけど、/shorts/から始まるYoutubeのショート動画って動画ファイルの自動保存対応してないのかな?
watch?v=に置き換えたURLでも見れるので、念の為両方のURLで保存してるけど、ショート動画のファイルだけ保存できていないような・・・

606:名無しさん@お腹いっぱい。
22/10/08 15:48:17.11 .net
動画まで保存するとコスト凄そうだな

607:名無しさん@お腹いっぱい。
22/10/10 01:58:16.83 .net
>>592 最近ツイッターの公開直後のデータがアーカイブされなくなっているのはこれが原因だとしたら納得いく。
アクティブチームが膨大な数のツイート1つ1つ手動でアーカイブさせるのはめんどくさいのはわかるけど・・・。

608:名無しさん@お腹いっぱい。
22/10/10 01:59:45.27 .net
>>592 もしかするとYouTubeの動画の方もアーカイブが自動で取られなくなってるかもしれない。

609:名無しさん@お腹いっぱい。
[ここ壊れてます] .net
>>598 >>601
ほう

610:名無しさん@お腹いっぱい。
[ここ壊れてます] .net
つべとれてないね

611:名無しさん@お腹いっぱい。
22/10/11 17:46:02.12 .net
全くだ。
URLリンク(www.youtube.com)
上記のURLの保存が遅すぎる。
何やってんだ担当者は!

612:名無しさん@お腹いっぱい。
22/10/16 00:14:47.38 .net
>>604
人に文句言ってないで自分で保存しろ

613:名無しさん@お腹いっぱい。
22/10/16 10:20:41.68 .net
YouTubeの自動アーカイブって容量的に非現実的に思える

614:名無しさん@お腹いっぱい。
22/10/16 18:14:42.48 .net
でも本家はそれでやっていっているんでしょう?

615:名無しさん@お腹いっぱい。
22/10/16 19:05:29.39 .net
やっていってないぞ
クローラーは全ての動画を保存していないし、SPNでも全て保存する訳ではない。(CNNとかのニュースは割と保存される)
それに、インターネットアーカイブの人も「少数の人しか興味がなく、長い動画を、メタデータを付加することなく、ただインターネットアーカイブに突っ込むのはやめてね」(訳)と言っている。
URLリンク(www.reddit.com)
それでも雑談とゲームの動画をすぐに保存してほしいのなら、寄付するといいよ。開発に参加するのもいい。

616:名無しさん@お腹いっぱい。
22/10/17 19:38:48.84 .net
選別はどういう原理なんだろう

617:名無しさん@お腹いっぱい。
22/10/17 23:52:20.94 .net
アーカイブって著作権引っかかりそうで
手軽にできない
一応引用って形で引っかからないんだろうか
正直ページとしては残しておきたいもの結構あるんだけどなぁ…

618:名無しさん@お腹いっぱい。
22/10/18 01:15:56.16 .net
>>610
SPNの話ならフェアユースで合法だよ

619:名無しさん@お腹いっぱい。
22/10/18 13:57:43.00 .net
dtiがサービス終了だって

620:名無しさん@お腹いっぱい。
22/10/21 12:04:03.87 .net


621:名無しさん@お腹いっぱい。
22/10/23 09:50:10.13 .net
ファボ1万以上のツイートでもアーカイブチームが取りに来なくなってるな
どうしたんだろ?Twitter社からお𠮟りでも受けた?

622:名無しさん@お腹いっぱい。
22/10/25 10:08:14.34 .net
みんなSPNの話ばっかりでアイテムのアップロードは使わないの?

623:名無しさん@お腹いっぱい。
22/10/26 00:05:19.14 .net
ここ1週間何度試しても「Cannot resolve host (URL)」と表示されて取得できないサイトが
前はなんのこともなく取得できてたのに・・・

624:名無しさん@お腹いっぱい。
22/10/30 05:24:56.68 .net
Internal Server Error for URLリンク(www.excite.co.jp) (HTTP status=500).

625:名無しさん@お腹いっぱい。
22/11/01 19:41:42.25 .net
二人くらい垢消しが確定してるユーザーのツイートを一人で手動で片っ端からアーカイブ取ってたけど
量多くて時間はかかるし自分が動かなきゃ誰もやらんから自分がしくじったら一生残せなくなるという罪悪感もあるしで
兎に角ツラい こういう不毛な作業こそ全部ロボットにやらせるべきやろ
なんかいいツールでもないもんかねぇ

626:名無しさん@お腹いっぱい。
22/11/03 10:45:34.96 .net
>>605 だから仕事や睡眠の関係で早く保存できない場合があるから自分で早く保存しろと言われても・・・。

627:名無しさん@お腹いっぱい。
22/11/03 10:50:22.06 .net
>>614 ・・・ツイッター社からお叱りを受けたとしたらツイッターのページの自動アーカイブが出来なくなったのも納得がいく。
権利関係かな?

628:名無しさん@お腹いっぱい。
22/11/05 19:47:39.33 .net
archive.stが取れない…

629:名無しさん@お腹いっぱい。
22/11/06 12:06:34.61 .net
Saving page URLリンク(w.atwiki.jp)
Worker exited prematurely: signal 15 (SIGTERM) Job: 644.

630:名無しさん@お腹いっぱい。
22/11/06 12:24:09.00 .net
>>618
URLリンク(github.com)
これでURL集めて後はその辺のスクリプトでアーカイブすればいい

631:名無しさん@お腹いっぱい。
22/11/09 17:23:42.06 .net
YouTube動画の保存初めてやってみたんだけど
すごい時間かかるうえエラー出て何度やってみても保存できないのも多いし
うまく保存できてもコメント欄はなぜか明らかに違う動画のものだったり文字化けしまくりでめちゃくちゃだった…
あんまり使えないな

632:名無しさん@お腹いっぱい。
22/11/10 06:12:44.32 .net
12月までに保存じゃー
URLリンク(geolog.mydns.jp)

633:名無しさん@お腹いっぱい。
22/11/12 06:08:18.30 .net
ツイッター保存するとほぼ全てfirst archiveになる
何万もいいねされてバズってるのでもそう
もうツイッターは一切自動保存しないのかな…

634:名無しさん@お腹いっぱい。
22/11/12 11:26:29.99 .net
今週SPNで保存してもfaviconだけしか保存されない例が何回も起きたんだが
24時間後に同じURLを確認するとやっぱり保存できてなかったわ
保存できてるか確認したほうがいいよ

635:名無しさん@お腹いっぱい。
22/11/13 16:46:40.56 .net
>>625
zipかなんかに全部か分割して別の場所に投稿してほしい。
管理人見かけたら言っといて。

636:名無しさん@お腹いっぱい。
22/11/14 13:49:25.52 .net
>>625
学区以外のwww.geocitiesのページ開こうと思っても
まともに開けないくらい重いんだが

637:名無しさん@お腹いっぱい。
22/11/14 20:47:39.81 .net
>>622
このエラーが出たら数分後に自動で保存をやり直してくれる時とやってくれない時があるなー。
最近出るようになった他のセグメンテーション系エラーも同じ感じ。
>>624
今の所、コメント欄のJavaScript周りがおかしいので直してほしいね。

638:名無しさん@お腹いっぱい。
22/11/14 22:52:15.62 .net
今日は調子が良い気がするようなしないような

639:名無しさん@お腹いっぱい。
22/11/16 04:29:12.79 .net
5ちゃんのアーカイブもGone.になってしまうの多い
最近ここ調子悪いけど大丈夫なんかね
寄付金のお願いもずっと出てるし

640:名無しさん@お腹いっぱい。
22/11/16 20:08:56.54 .net
>>632
普通のブラウザでも同じ鯖に連続してアクセスするとGone.になるから、
時間を置いて取得するしかない。それがどのタイミングなのかは分からないけど

641:名無しさん@お腹いっぱい。
22/11/16 21:36:23.91 .net
締め付け厳しくなってるのか、
20分ぐらいつながらないことが

642:名無しさん@お腹いっぱい。
22/11/17 17:20:37.12 .net
worldstarhiphop.com
200万以上も魚拓が保存されているようだが、excludedと表示される

643:名無しさん@お腹いっぱい。
22/11/18 10:43:43.03 .net
最近重すぎる

644:名無しさん@お腹いっぱい。
22/11/18 19:58:05.57 .net
今日は「Job failed.」がやたら出るなぁ
あまりやり直すと1分あたり3件までのしばりで引っかかる
前はもう少しできたっけ・・・これも締め付け厳�


645:オくなってるような 取得できてるのかも怪しくて確認すると「Fail with status: 503」



646:名無しさん@お腹いっぱい。
22/11/18 22:06:53.56 .net
システム運用がカツカツなんだろうな

647:名無しさん@お腹いっぱい。
22/11/19 00:38:40.53 .net
SPNの最新ファイルを見てみると、
18日9時〜14時33分(日本時間18日午後6時〜午後11時33分)の間はファイルが全く追加されてなかったので、
5時間ほど保存できなかったっぽい
この間に保存しようとしたらjob failedエラーだらけだった
今は問題なく保存できるぜ

648:名無しさん@お腹いっぱい。
22/11/22 04:48:34.40 .net
WaybackMachineとなOpenLibraryとか
もっと知られてもいいもんだろこれ
知ってるのと知らないのじゃ全然便利さが違う
そもそもInternetArchiveが知られて無さすぎる

649:名無しさん@お腹いっぱい。
22/11/24 06:21:48.95 .net
そりゃまあ一般人はネットのアーカイブなんてこれっぽっちも
気にしてないからな

650:名無しさん@お腹いっぱい。
22/11/25 01:50:48.75 .net
誰も動かないから自分が動かなきゃいけない
自分がアーカイブ間に合っていれば遺せたのに
こんな使命感持っちまったせいで病んじまったわ
消える前に残すのも大事だが既に消えてしまった物を「消える前に残す」以外の手段で発掘する方法ってないもんかね

651:名無しさん@お腹いっぱい。
22/11/25 08:18:14.39 .net
哲学的じゃの
もうどうにも取り戻せないから「消えてしまった」と言うのだよ

652:名無しさん@お腹いっぱい。
22/11/25 20:11:50.98 .net
大げさだけどなんか人の命みたいだ
でも亡くなった人が自分の生きた証にみたいに一生懸命残してたブログとかが跡形もなく消えてしまってたりすると…悲しい

653:名無しさん@お腹いっぱい。
22/11/26 23:33:08.71 .net
また>>547に近い事態で困ってて別のブラウザでアクセスし直したらつながった
たまにつながらないこともあるが、回復は先に使ってたブラウザより早い
同じ時間帯に使い比べたら片方つながらないのに、もう片方はなんのこともなくつながったり
たまたまか、それともブラウザとの相性の問題か・・・

654:名無しさん@お腹いっぱい。
22/11/27 04:04:49.75 .net
>>645
まぁロードバランサが入ってるだろうし、アクセス毎に運試しをやってるようなもんだな

655:名無しさん@お腹いっぱい。
22/11/27 17:26:01.10 .net
前は重くても繋がってはいたが
最近はアクセスすら出来ないことが多い

656:名無しさん@お腹いっぱい。
22/11/27 17:46:34.00 .net
本当に繋がんないね
資金繰りヤバいんじゃないかと心配になる

657:名無しさん@お腹いっぱい。
22/11/27 19:23:05.98 .net
archive.todayを代用してください。

658:名無しさん@お腹いっぱい。
22/11/27 20:58:34.67 .net
結局ローカルでも保存するしかないやん

659:名無しさん@お腹いっぱい。
22/11/28 02:04:21.68 .net
Wayback Machine がダウンしているかタイムアウトで保存できない、
あるいは、保存に成功したのを開けないのが続いてて困る
URLリンク(archive.is)

660:名無しさん@お腹いっぱい。
22/12/01 08:14:56.48 .net
>>639
最新ファイルはどこで見れるか教えていただけませんか・

661:名無しさん@お腹いっぱい。
22/12/01 08:30:40.22 .net
>>652
>>269

662:名無しさん@お腹いっぱい。
22/12/01 09:32:56.82 .net
ありがとうございます

663:名無しさん@お腹いっぱい。
22/12/03 09:15:41.02 .net
テスト

664:名無しさん@お腹いっぱい。
22/12/03 09:16:59.78 .net
URLリンク(www.youtube.com)
URLリンク(www.youtube.com)
アクティブチームの皆さん、上記のURLのアーカイブが遅いぞ、もしかしてこの時はW杯で忙しかったのか?
自分は寝てました。

665:名無しさん@お腹いっぱい。
22/12/04 07:15:29.49 .net
>>656
URLリンク(archive.ragtag.moe)
URLリンク(hololivevideos.download)

666:名無しさん@お腹いっぱい。
22/12/04 10:51:22.42 .net
動画はtubeupで上げれば良くね?
URLリンク(github.com)

667:名無しさん@お腹いっぱい。
22/12/04 15:29:19.99 .net
>>658 権利が無いから無理です。

668:名無しさん@お腹いっぱい。
22/12/04 19:31:01.38 .net
もしInternetArchiveが無くなったら
割とひどい文化的な痛手になるんじゃないだろうか
どっか国立のサービスにデータ引き渡すのかな

669:名無しさん@お腹いっぱい。
22/12/04 22:22:21.88 .net
YouTubeの動画の再生ページでもアーカイブが自動で取られなくなっている・・・?

670:名無しさん@お腹いっぱい。
22/12/05 17:04:47.22 .net
>>660
ジオシティーズがなくなった時の損失の比ではなさそうだな…

671:名無しさん@お腹いっぱい。
22/12/06 18:59:20.83 .net
ここ最近、公開直後にアーカイブされてないこと多いよな。
運営も最善を尽くすと言っていたが、やはり難しいのか・・・?
と思ってたら対象の下記のURLをアーカイブ保存するのに時間がかかっている。
URLリンク(www.youtube.com)
もしかするとシステムのエラーが引っ掛かっているかも・・・。

672:名無しさん@お腹いっぱい。
22/12/07 14:49:59.21 .net
そもそも動画保存はオマケなので
確実にするならローカルに保存すべき

673:名無しさん@お腹いっぱい。
22/12/07 18:58:22.97 .net
私は動画公開直後のページのデータを求めているのです。

674:名無しさん@お腹いっぱい。
22/12/07 23:36:49.30 .net
>>665
youtubeのページのデータならなおさら不安定だと思うが
yt-dlpとかでメタデータごと落とせば?

675:名無しさん@お腹いっぱい。
22/12/08 00:06:43.49 .net
>>664
何でもそうだが誰でも好きな時に見れるようにしてようやくアーカイブと言えるんだよなぁ
自分一人だけの手元にずっとあっても意味がないんだよ

676:名無しさん@お腹いっぱい。
22/12/09 18:57:23.93 .net
Twitterマスク氏、15億アカウントを削除すると発表 対象は休眠ユーザー
スレリンク(newsplus板)
これ故人のも全部消えてしまうんだろうか

677:名無しさん@お腹いっぱい。
22/12/10 13:28:20.80 .net
Twitterのフルアーカイブってどうすればいいのでしょうか?
単純にアーカイブしたいアカウントのトップをアーカイブしても
ある程度直近のツイートがアーカイブされるだけで
スクロールした場合などの古いツイートはアーカイブされないのですが…
現状個別にツイート開いてアーカイブするしかないんでしょうか?

678:名無しさん@お腹いっぱい。
22/12/10 16:22:21.70 .net
このサイトでアーカイブすればいい
URLリンク(archive.md)

679:名無しさん@お腹いっぱい。
22/12/10 19:54:05.27 .net
最近waybackmachineでツイートのアーカイブがされにくくなってる。
俺は手動で片っ端から保存してるけど、量が膨大過ぎて到底追いつかん。

680:名無しさん@お腹いっぱい。
22/12/12 11:30:16.44 .net
されにくい、じゃなくてされてない
そのせいで今まで通り勝手に録ってくれれば残ってた物が残らなくなって滅茶苦茶腹立つ
そうでなくても勝手に録られてた頃でさえそれ以前の過去は録ってくれない無能だった
人一人の力で1日にアーカイブにブッ込めるのは1000くらいが限界だっての

681:名無しさん@お腹いっぱい。
22/12/12 17:23:21.95 .net
そんなにアーカイブをするのは確固たる出典が欲しいウィキペディアン?

682:名無しさん@お腹いっぱい。
22/12/12 19:02:11.51 .net
保存したページ見ようとしたら延々と読み込みが続いて見れないんだがサイト側が保存対策でもしたんだろうか

683:名無しさん@お腹いっぱい。
22/12/12 23:24:17.63 .net
Twitterは保存する人が多すぎで時間かかるわって表示されるね

684:名無しさん@お腹いっぱい。
22/12/13 18:18:36.60 .net
>>670
archive.md は古い端末からだと画像認証やり難くなってしまった…。
11月までは画像認証じたい要求されなかったけど

685:名無しさん@お腹いっぱい。
22/12/13 18:23:17.04 .net
>>675
Nitter変換( >>488 )で拓取るほうがたぶん楽。
Twitter公式はUIがムチャクチャ重くなってしまった

686:名無しさん@お腹いっぱい。
22/12/14 00:48:53.31 .net
Nitterも本家ツイートが消えると連動して消えるから結局手間は同じなんだよな…
ちょっとくらい猶予くれたら完璧に録れるのだが

687:名無しさん@お腹いっぱい。
22/12/14 13:53:28.10 .net
>>669
>>623

688:名無しさん@お腹いっぱい。
22/12/14 16:15:23.92 .net
また取得エンジン不具合か・・・

689:名無しさん@お腹いっぱい。
22/12/15 10:52:17.55 .net
>>670
>>679
ありがとうございます
もう故人になったアカとかのアーカイブが捗ります
参考にさせていただきます

690:名無しさん@お腹いっぱい。
22/12/15 14:09:48.67 .net
最近サムネが沢山あるサイトを開くとサムネが表示されない事がある

691:名無しさん@お腹いっぱい。
22/12/17 18:54:58.46 .net
archive todayはwaybackmachineと違って全ツイートが保存できるんでしょうか?
初歩的な質問で、すみません

692:名無しさん@お腹いっぱい。
22/12/18 18:14:08.31 .net
>>683
全ツイート保存は無理だけどtodayの方が保存件数多いみたいね
数えてみたらWayBack で保存されるツイートは40件くらいだけど、 today は百数十件保存されてた
全ツイート保存は愚直に1ツイートずつ投げていくしかない

693:名無しさん@お腹いっぱい。
22/12/19 08:35:36.36 .net
例のWayback拒否ニュースサイトが記事にWaybackのリンクを貼るのはおかしいだろ

694:名無しさん@お腹いっぱい。
22/12/19 23:05:57.30 .net
>>684
それが数百程度で済むならいいんだが数千、数万超えると自分一人だけの力だと到底取り切れなくなる
生半可な覚悟で挑戦して、中途半端に記録して挫折して、再開するかと思ったら鍵かけられたり最悪ツイ消し垢消し
これで何度苛付かされたか!
指定の垢のツイートをひたすら遡ってツイート1つ1つのURLをWaybackmachineにブチ込んでいく
これやらせるの別に生身の人間じゃなくても十分可能だと思うんだけど

695:名無しさん@お腹いっぱい。
22/12/19 23:45:24.38 .net
todayはIPバレるみたいな話がありましたけど、今もそうなんですか?

696:名無しさん@お腹いっぱい。
22/12/20 07:55:12.74 .net
>>687
URLリンク(archive.is)
2020 年に入ってからお漏らししなくなってるかな。

697:名無しさん@お腹いっぱい。
22/12/20 17:03:59.68 .net
>>688
そうなんですね
ありがとうございます

698:名無しさん@お腹いっぱい。
22/12/23 12:23:17.31 .net
過去tweetの確認ですがwayback machineでjsonで保存されているやつは中身を見ることは出来ないんでしょうか

699:名無しさん@お腹いっぱい。
22/12/24 16:14:40.64 .net
>>690
俺が知ってる限りない
もし元のツイートが現存してるならお手数おかけするが改めて取り直しておいて欲しい
マジで無能だと思うよ 折角取ったのにjsonとかいうよくわからん形式で保存しよってからに

700:名無しさん@お腹いっぱい。
22/12/24 16:56:04.32 .net
>>691
ありがとうございます 承知いたしました

701:名無しさん@お腹いっぱい。
22/12/25 12:02:04.99 .net
>>690
textがツイート本文なので、そこを変換すれば見れるよ
URLリンク(tech-unlimited.com)
jsonでも表示形式が違うだけでデータは保存されてる

702:名無しさん@お腹いっぱい。
22/12/26 12:48:15.60 .net
もうすぐ2023か…
インターネット上の情報がまた一つ年をとるのか…
残していかないとな

703:名無しさん@お腹いっぱい。
22/12/26 14:51:38.79 .net
>>693
見ること出来ました!大変ありがとうございました!

704:名無しさん@お腹いっぱい。
22/12/27 16:49:50.40 .net
広告画像のドメインは大半がブロックリストに入ってるけど
個人的にはああいうのも重要だと思うんだけどなぁ

705:名無しさん@お腹いっぱい。
23/01/01 12:33:10.80 .net
ゲームアツマールがサービス終了するらしいけど
サイトの構造的にアーカイブは厳しいかな?

706:
23/01/01 14:05:31.41 .net
ツイッターはモバイル用サイト(mobile.~)だと正常に保存されないのね
PC用サイトのURLを入力して保存する必要があるからスマホからだと気をつけないとならない

707:名無しさん@お腹いっぱい。
23/01/01 15:17:22.03 .net
>>698



708: φ(..)メモメモ



709:名無しさん@お腹いっぱい。
23/01/03 01:24:57.31 .net
archive todayでインスタ保存できるんやね
今日初めて知った
インスタはウェイバックで保存できないが故に記録が手薄になってるのは禍根を残すと思う

710:名無しさん@お腹いっぱい。
23/01/03 05:00:02.49 .net
>>700
Wayback Machineで上手く保存できない所はArchive today使ってるなぁ
例えばboothの商品ページとかArchive today使ってる一方商品画像そのものはWayback Machineで録ってる
結局は最終的に原本が消える前にどこかに残せさえすればいい

711:名無しさん@お腹いっぱい。
23/01/07 11:52:29.07 .net
中の人曰く去年帯域幅を80Gbpsから140Gbpsに増やしたらしい
twitter.com/textfiles/status/1547365784770543618
だからちょっと早くなってるはず
(deleted an unsolicited ad)

712:名無しさん@お腹いっぱい。
23/01/08 12:48:26.32 .net
twitterの保存がスムーズになってるな

713:名無しさん@お腹いっぱい。
23/01/08 20:48:19.82 .net
今InternetArchiveの総データ量って
何PBになってるんだろうか
てかPBって冷静に考えるとクソ多いな

714:名無しさん@お腹いっぱい。
23/01/08 23:56:10.95 .net
>>704
運用コスト馬鹿にならないだろうなぁ
ストレージ(サーバ)に回線にデータバックアップに、気が遠くなりそう

715:名無しさん@お腹いっぱい。
23/01/09 00:42:30.99 .net
2021年12月時点で保存容量は212ペタバイトみたいだね
そのうち57ペタバイトをwaybackが占めているんだと
URLリンク(archive.org)
そこらのサービスと違ってうっかりデータ破損でもした時に
賠償しますでは済まないのが恐ろしいね
人類が将来参照できる史料が一瞬で失われてしまうんだもの

716:名無しさん@お腹いっぱい。
23/01/09 00:46:01.79 .net
保存容量というよりデータ量といった方が正しいか

717:名無しさん@お腹いっぱい。
23/01/09 19:41:49.29 .net
インターネットアーカイブそのもののバックアップが将来的には必要だと思うけどね

718:名無しさん@お腹いっぱい。
23/01/10 08:41:36.86 .net
There was a delay in registering this snapshot with the Wayback Machine.
The snapshot may not be available right now, please try again later.
→このスナップショットを Wayback Machine に登録するのに遅延がありました。
スナップショットは現在利用できない可能性があります。後でもう一度試してください。
後日忘れたころに取得できてるなら良いが、やり直さなきゃなんない可能性て・・・

719:名無しさん@お腹いっぱい。
23/01/10 16:06:49.97 .net
スナップショット取得完了後にその保存ページを確認しても、のちに消えている可能性があるということ?

720:名無しさん@お腹いっぱい。
23/01/10 23:41:52.58 .net
そう、それが心配
せっかく時間かけても消えてたら(取得できてなかったら)悲しい
今は「Job failed.」が出やすい
ようやく取得できたと思ったら今度は・・・
There was a delay in registering this snapshot with the Wayback Machine.
You may be redirected to a previous version right now. This snapshot will be available later.
→このスナップショットを Wayback Machine に登録するのに遅延がありました。
現在、以前のバージョンにリダイレクトされる場合があります。このスナップショットは後で利用可能になります。
本当に可能なら良いが

721:名無しさん@お腹いっぱい。
23/01/10 23:49:16.56 .net
取得できたと思ったら→Doneになったと思ったら(取得できてるのかはまだ確実ではない)

722:名無しさん@お腹いっぱい。
23/01/19 00:07:06.28 .net
最近のインターネットアーカイブ、この辺の時間ずっと落ちてるな

723:名無しさん@お腹いっぱい。
23/01/19 06:33:50.54 .net
>>713
ありゃりゃ

724:名無しさん@お腹いっぱい。
23/01/20 18:32:14.50 .net
今日はいつもに増して「Job failed.」が出る
やり直しも1分あたり3件までのしばりで非効率

725:名無しさん@お腹いっぱい。
23/01/21 10:48:18.26 .net
皆様におかれましては既知であるとは思われますが、今やっと見付けたので共有いたしまする
Time Travel
timetravel.mementoweb.org
あっちこっちのWeb archiveを串刺しで検索してくれる

726:名無しさん@お腹いっぱい。
23/01/21 15:18:06.87 .net
>>716
それは自分が
「このページの魚拓をとりたい」
と思ってもとれないんですよね。
たしか。

727:名無しさん@お腹いっぱい。
23/01/21 16:19:21.13 .net
某有名人のインスタ調べたけど全くと言っていいほど保存されてなくて笑った。
もう少しインスタやらSNSやらの保存も強化しても良いんじゃないかと思った(まあ口出すなら寄付しろと言われるかもしれんが)

728:名無しさん@お腹いっぱい。
23/01/21 21:17:47.90 .net
>>717
> あっちこっちのWeb archiveを串刺しで検索してくれる

729:名無しさん@お腹いっぱい。
23/01/22 02:50:05.38 .net
Internet Archive にアップロードされた DVD-ROM ディスクイメージから
中のファイルを直接ダウンロードすると、1 ギガバイトあたりでちょん切れる問題
URLリンク(archive.org)
ここの TI308752D0A_2.ISO の中の ZZIMAGES/ZZIMAGES/PREINST7.SWM をダウンロードすると、
1485739900 バイトのはずが 1074528256 バイトで終わってしまう。
HTTP の Content-Length ヘッダは送られて来ないので、ダウンローダでの検知は不可能。
元の .iso をダウンロードすれば済む話なんだけどね。
パッケージの中のファイルが見える機能は便利でよく使うけど、こういう制限があるんだなぁ、と。
UDF 以外のファイルシステム (ISO 9660 とか Joliet とか) でも起こるかは未確認。
他のパッケージ形式 (.tar とか .7z とか .zip とか) で起こるかも未確認。

730:名無しさん@お腹いっぱい。
23/01/23 18:48:19.71 .net
PANDORATV
ウェブリブログ
Lobi

1月31日にサービス終了

731:名無しさん@お腹いっぱい。
23/01/28 23:14:25.28 .net
>>721
一度に複数のサービスがあと数日とかこんなん一人~少人数が人力でカバーすんの無理やろ

732:名無しさん@お腹いっぱい。
23/01/29 22:55:14.90 .net
重い

733:名無しさん@お腹いっぱい。
23/01/30 15:32:24.15 .net
LINE BLOG サービス終了のお知らせ
URLリンク(lineblog.me)

734:名無しさん@お腹いっぱい。
23/01/30 15:46:52.71 .net
それにつながらないことが多くて作業を進めづらいし

735:名無しさん@お腹いっぱい。
23/01/30 22:39:37.25 .net
>>724
LINE BLOGさえも終わりか…

736:名無しさん@お腹いっぱい。
23/01/31 20:50:43.21 .net
ただ今制限を設けております

737:名無しさん@お腹いっぱい。
23/02/01 19:31:42.08 .net
一時応答しなくなってた

738:名無しさん@お腹いっぱい。
23/02/02 00:15:32.12 .net
ところでさ、最近Save Page Nowの同時保存制限が3個から4個に変わった?
タブ4個開いて数秒で立て続けに保存ボタン押してもYou have already reachedって出ないんだけど。
5個目は今まで通り出て待たされるが。

739:名無しさん@お腹いっぱい。
23/02/03 11:48:23.73 .net
>>729
>>435のドキュメントのLimitationsを見ると、匿名ユーザーは1分間に4までって書いてるから合ってる
SPN2 APIを使ってる人に聞きたいんだけど、User statusって取得できてる?
ドキュメントの通りに送ってもログインしろよ的なエラーが返ってくるんだが
キーが合ってるのは確認済み

740:名無しさん@お腹いっぱい。
23/02/04 14:47:54.24 .net
>>729
確かにそのようだ
締めつけ厳しい傾向の中でありがたい
あとはつながらないことが多い問題がなぁ

741:名無しさん@お腹いっぱい。
23/02/04 19:44:00.52 .net
Firefoxユーザーだが今年に入ってから接続エラーばかりでweb.archive.org自体見れない状態が続いてたが、
about:supportにある「起動時キャッシュの消去」をしてみたら見れるようになって解決した。
同じ状況の人がいるなら自己責任で試してみるといいよ。一番上のリフレッシュのボタンは初期化されるから押さないように。
これをやった後でもたまに同じエラーが表示されるが前よりはマシになった。

742:名無しさん@お腹いっぱい。
23/02/05 19:08:01.22 .net
どうもユーザの新規登録周りがおかしくなってるような。
メアドやパスワードを入れて、認証メールが来るところまでは良いんだけど
ある条件の時、メールに記載された URL を開いても常に Sorry, we're kinda busy になってしまう。
ユーザ名が英数字のみの時は問題なし、かな漢字や絵文字を使うとダメ。
おそらくプロフページの URL が archive.org/details/@user_数字
となるようなケースで問題が起きてるのではないかと。

743:名無しさん@お腹いっぱい。
23/02/05 21:09:01.70 .net
>>730
問題無いけどなぁ。
GET /save/status/user HTTP/1.1
Accept: application/json
Authorization: LOW xxxxxxxxxxxxxxxx:xxxxxxxxxxxxxxxx
Connection: close
Host: web.archive.org
HTTP/1.1 200 OK
Server: nginx/1.19.5
Date: Sun, 05 Feb 2023 12:06:03 GMT
Content-Type: application/json
Content-Length: 79
Connection: close
x-app-server: wwwb-app53
x-ts: 200
x-tr: 79
X-location: save2stat
X-RL: 0
X-NA: 1
X-Page-Cache: MISS
X-NID: -
Referrer-Policy: no-referrer-when-downgrade
Permissions-Policy: interest-cohort=()
{"available":8,"daily_captures":0,"daily_captures_limit":100000,"processing":0}

744:名無しさん@お腹いっぱい。
23/02/06 11:45:14.45 .net
>>734
まじかー・・・、ありがとう
もう一度確認してみるわ

745:名無しさん@お腹いっぱい。
23/02/12 06:52:17.87 .net
リンク先が画像の場合は自動で保存してほしいんだよなぁ。
サムネだけ保存しても意味無いし。

746:名無しさん@お腹いっぱい。
23/02/12 11:00:21.26 .net
>>736
Save outlinks 使えよ

747:名無しさん@お腹いっぱい。
23/02/12 21:00:12.74 .net
>>736
ChatGPT(人工知能)を学習させといた
URLリンク(i.imgur.com)
問: Internet Archive の wayback machine を知っていますか?
答: はい、私は Internet Archive の Wayback Machine について知っています。(以下省略)
問: Wayback Machine の "Save Page Now" で保存したいページ内のリンク先のページも同時に保存する方法を教えてください。
答: Wayback Machine の "Save Page Now" を使用して、ページ内のリンク先のページも同時に保存することはできません。Wayback Machine は、単独のページを保存することしかできません。(以下省略)
問: あなたの回答は、間違っています。Wayback Machine の "Save Page Now" で外部リンクを保存するには、Internet Archive にログインすると使えるようになる "Save outlinks" オプションを使います。
答: 申し訳あります。その通りです。Wayback Machine の "Save Page Now" 機能には、Internet Archive にログインすると使える "Save outlinks" オプションがあります。このオプションを使用することで、ページ内の外部リンクも同時に保存することができます。再度、お詫び申し上げます。ありがとうございました。

748:名無しさん@お腹いっぱい。
23/02/13 00:02:24.47 .net
>>738
それ学習してるのはログインしてる間だけだろ?
次回ログイン後や他のユーザーからは学習効果ない

749:名無しさん@お腹いっぱい。
23/02/13 19:59:01.85 .net
>>737
ページが複数階層で全部の階層に大量のリンクあっても同じ事言えるんか?
Outlinksぐらいとっくに知っとるわボケが

750:名無しさん@お腹いっぱい。
23/02/13 20:23:37.77 .net
>>740
手で掘れよ、どーせ暇なんだろ?

751:名無しさん@お腹いっぱい。
23/02/15 10:15:39.14 .net
curlでの保存確認が途中から429エラーになる。

752:名無しさん@お腹いっぱい。
23/02/15 18:49:59.88 .net
URLリンク(web.archive.org)
ベタベタ貼ってるアフィのせいか延々と読み込み繰り返して見れないんだが何か対応策とかないかね

753:名無しさん@お腹いっぱい。
23/02/16 04:32:39.08 .net
>>742
Status: 429 - Too Many Requests
API で User status を調べて available が1以上になるまで待ってから次の処理をする
{"available":8,"daily_captures":58,"daily_captures_limit":100000,"processing":0}
{"available":0,"daily_captures":170,"daily_captures_limit":100000,"processing":24}

754:名無しさん@お腹いっぱい。
23/02/16 06:56:24.96 .net
>>738
Bing の AI Chat が使えるようになたので Wayback Machine について
訊いてみたら、AI が Wayback Machine を使ってユーザーの質問に
答えることができると言っていた
URLリンク(i.imgur.com)

755:LBXBB
23/02/16 13:28:08.07 .net
3日前ぐらいから、Internet Archiveに繋がりにくくなっているんですけど、同じ症状に悩んでる同士いますか?

756:名無しさん@お腹いっぱい。
23/02/17 07:27:55.83 .net
「The capture will start in ~* hour, ** minutes because our service is currently overloaded. You may close your browser window and the page will still be saved.」
数分単位はここ数日見かけるが、○時間単位とか久々

757:名無しさん@お腹いっぱい。
23/02/17 12:27:29.15 .net
twitter保存できなくなった?
保存してもツイートが表示されない
自分だけ?

758:名無しさん@お腹いっぱい。
23/02/17 19:10:36.19 .net
>>748
モバイル用URLを突っ込んでない?

759:名無しさん@お腹いっぱい。
23/02/18 08:47:18.37 .net
748とは別だけど、モバイルドメイン関係なく昨日の夜からツイートのURLを保存しようとするとJob failedしか出ないわ

760:名無しさん@お腹いっぱい。
23/02/18 10:55:10.00 .net
てかツイートを保存しようとするとapi.twitter.comの方にリダイレクトされてちゃんと保存されてないな。
Twitter APIの改悪は関係あるのかこれ。

761:名無しさん@お腹いっぱい。
23/02/19 07:27:45.62 .net
>>751
たしかにAPI改悪と関係ありそうだな
アーカイブ取得エンジン(というのかな)がWebブラウザ(擬似)によるアクセスと認識されなくなったとか

762:名無しさん@お腹いっぱい。
23/02/19 13:34:25.72 .net
すまん、748だけど数日経って確認したら保存できてたわ。 保存の仕様が変わってtweetが見れるようになるまで時間がかかることがあるみたい。 直近3200ツイートを同時保存する機能も追加されてる。

763:名無しさん@お腹いっぱい。
23/02/21 00:31:31.75 .net
>>753
>>直近3200ツイートを同時保存する機能
これってどこの話?見つからないけど

764:名無しさん@お腹いっぱい。
23/02/21 21:53:11.17 .net
>>754
save page nowにtwitterのリンク入れると出るよ。

765:名無しさん@お腹いっぱい。
23/02/22 03:03:59.75 .net
>>755
あなたは、選ばれし者のようですね。
 □ Archive up to 3,200 most recent Tweets from this Twitter profile
こちらでは、twitter_archiver は "display: none" として隠されていました。
URLリンク(i.imgur.com)
|<div id="wm-twitter-archiver" style="display: none;">
| <input type="checkbox" name="twitter_archiver" id="twitter_archiver">
| <label for="twitter_archiver">Archive up to 3,200 most recent Tweets from this Twitter profile</label>
|</div>

766:名無しさん@お腹いっぱい。
23/02/22 03:56:35.13 .net
URLリンク(web.archive.org)
クッキーを読んでログインユーザだと判定すると
#wm-capture-outlinks や #wm-capture-screenshot 等を非表示解除してるけど、
それとは別の条件で #wm-twitter-archiver の非表示を解除してるなぁ。

767:名無しさん@お腹いっぱい。
23/02/22 04:37:36.03 .net
>>756
display: none消して、style変更してチェックボックス出現させたら動作してくれたりしない?

768:名無しさん@お腹いっぱい。
23/02/22 10:58:16.45 .net
ボタンが表示される条件分かったわ
トップページのSave Page Nowに入力するだけだと表示されない
遷移後のページ( URLリンク(web.archive.org) )で再入力すると表示される
対応URLはTwittetのプロフィールページ
(mobile.twitter.comは非対応)

769:名無しさん@お腹いっぱい。
23/02/22 10:58:31.78 .net
神機能だな

770:名無しさん@お腹いっぱい。
23/02/24 04:07:00.59 .net
重い重い
URLリンク(o.5ch.net)

771:名無しさん@お腹いっぱい。
23/02/24 04:25:43.53 .net
重いというか、午前1時頃以降に保存しようとした分は保存できてないっぽい。
SPNの復帰まで待つしかないな。

772:名無しさん@お腹いっぱい。
23/02/24 05:25:25.65 .net
つながらないよりは増しとはいえ、4時間待ちか・・・
閉じても保存されてるという建前だが、待った挙げ句「Job failed.」とかfaviconだけ(>>627)とかでおちおち閉じるわけにも

>>729
数日前3件までに戻ったようだ
1件の差とはいえ・・・

773:名無しさん@お腹いっぱい。
23/02/24 05:47:30.05 .net
と思ったらつながりづらい
これでは二重苦
今のうちに保存しなきゃなんないものが多いときにかぎ・・・いえ、なんでも

774:名無しさん@お腹いっぱい。
23/02/24 13:49:21.36 .net
3200ツイート保存できるやつ、使ってる人がいたら何日位で完了したか教えてほしい
自分は2日経ったけどまだ完了メールが来ない

775:名無しさん@お腹いっぱい。
23/02/24 18:30:54.01 .net
763の件、今は数分~10数分に落ち着いた

776:名無しさん@お腹いっぱい。
23/02/26 13:10:11.40 .net
>>765だけど今見たら完了してた
あと下のエラーが出たから、1日に合計1万ツイートが限界っぽい
複数ユーザーをアーカイブしたいときは注意
This host has been already captured 10,000 times today by this user account.

777:名無しさん@お腹いっぱい。
23/03/01 03:57:25.37 .net
初心者なんですけどアーカイブしたあともとのURLを無くしたら発掘するのは不可能ですか?
もちろん検索機能なんてないですよね

778:名無しさん@お腹いっぱい。
23/03/01 04:05:45.32 .net
フリーワードで検索できるよ

779:名無しさん@お腹いっぱい。
23/03/01 13:22:58.05 .net
【中居正広】 ワク接種 ⇒ 虫垂炎 ⇒ ターボ癌
://mao.2ch.sc/test/read.cgi/cancer/1668137860/l50
URLリンク(o.5ch.net)

780:名無しさん@お腹いっぱい。
23/03/01 14:11:13.39 .net
対策すると運営にお願いせずともアーカイブとるの不可能なんだな
URLリンク(x0o0x.ml)

781:名無しさん@お腹いっぱい。
23/03/01 14:58:25.32 .net
>>768-769
検索できるけどドメイン単位だからURLを無くしたら事実上発掘不可能
Collection Searchに含まれてるなら可能性はあるけど、まぁまず無理と考えていい

782:名無しさん@お腹いっぱい。
23/03/01 17:02:04.45 .net
>>771
見せたくない情報ならそもそもネット上に載せるなと言いたいね

783:名無しさん@お腹いっぱい。
23/03/02 00:05:27.82 .net
ニュース記事とかだったらtwitterに共有された短縮リンクの残骸とかが残ってたりするから、twitterで検索かけたりしてみてみるのもあり。

784:名無しさん@お腹いっぱい。
23/03/06 23:55:19.29 .net
20数分待ち
また○時間単位まで膨れ上がってしまうのかどうか

785:名無しさん@お腹いっぱい。
23/03/07 01:01:54.86 .net
残念ながら本当に膨れ上がった

786:名無しさん@お腹いっぱい。
23/03/07 07:36:38.75 .net
と思ったら今度は>>764

787:名無しさん@お腹いっぱい。
23/03/09 20:01:49.70 .net
ようやく8000億突破したね

788:名無しさん@お腹いっぱい。
23/03/10 22:36:33.18 .net
>>778
過去6年分遡って表示されてるページ数確認してみた
毎年約1.2倍ペースで指数関数的に増えてるみたい
URLリンク(i.imgur.com)
※2016年10月に数え方が変わったか何かで大幅に数字が減少してたから2017年から表示してる

789:名無しさん@お腹いっぱい。
23/03/10 22:38:45.08 .net
>>765
3月頭にリクエストしたのが1週間後にメールきた
Twitterの一括保存は大分時間かかるね

790:名無しさん@お腹いっぱい。
23/03/14 12:04


791::02.25 .net



792:名無しさん@お腹いっぱい。
23/03/15 13:50:39.43 .net
>>779
集計方法がURLの数からWebページの数に変わったから数字が減少したんだと思う
多分だけど

793:名無しさん@お腹いっぱい。
23/03/15 18:29:13.47 .net
また>>775

794:名無しさん@お腹いっぱい。
23/03/15 21:00:18.98 .net
その後39分待ちをピークに落ち着いた

795:名無しさん@お腹いっぱい。
23/03/16 08:48:47.33 .net
反応はあるけど落ちてる
URLリンク(o.5ch.net)

796:名無しさん@お腹いっぱい。
23/03/16 10:03:03.66 .net
<a href="URLリンク(o.5ch.net) src="URLリンク(o.5ch.net) />

797:名無しさん@お腹いっぱい。
23/03/16 18:56:40.40 .net
1時間待ち
よりによって取得しなきゃなんないものが多(ry
ただ時間がかかるだけならわからないではない(のちのち無事取得できてるなら良い)
だが待った挙げ句「Job failed」で取得できてないこともあるし、
早く済ませたいからと取得するものがあまり多いと「429 Too Many Requests」が出たり、
最悪つながらなかったり

798:名無しさん@お腹いっぱい。
23/03/16 20:35:28.47 .net
787の件は落ち着いた

799:名無しさん@お腹いっぱい。
23/03/16 22:53:47.10 .net
せっかく落ち着いたと思ったらまた20数分待ちか

800:名無しさん@お腹いっぱい。
23/03/19 00:40:27.17 .net
This host has been already captured 100,845.0 times today. Please try again tomorrow. Please email us at "info@archive.org" if you would like to discuss this more.
みんなでYoutubeの様々なページを10万個保存し続けたらこの制限エラーが出るわけか?
アメリカ時間基準でも1日が始まってから15時間半でこの表示が出たら結構困るんだけど。
SNS系サイトのドメインは制限取っ払って欲しいな。

801:名無しさん@お腹いっぱい。
23/03/19 01:01:44.26 .net
>>790
>>107-117

802:790
23/03/19 02:05:20.29 .net
どうも。その書き込みの1つ(>>113)は俺だから覚えてるけど、
YoutubeのURLを保存しようとしてこのエラーが出たのは初めて見かけたので、報告の意味で書いた。
制限取っ払ってほしい状況は1年半前と変わってない。

803:名無しさん@お腹いっぱい。
23/03/19 02:23:57.43 .net
>>790
俺も初めてこの表示出た
APIドキュメントにも記載は無いし、バグだと思いたいが・・・

804:名無しさん@お腹いっぱい。
23/03/22 05:38:12.76 .net
Not Found
The requested URL was not found on the server. If you entered the URL manually please check your spelling and try again.
1回でただけだが

805:名無しさん@お腹いっぱい。
23/03/22 12:15:17.01 .net
40数分待ち
ただし、PDFは除く(過去には逆にPDFが時間かかるということがあったが)

806:名無しさん@お腹いっぱい。
23/03/22 13:17:49.38 .net
>>794
このエラーが出たら、保存できてる時と、できてないときがあるので、あとで確認したほうがいい。
ページがないって言ってる割にはエラーの判定がおかしいよな。
>>795
PDFや画像やテキストファイル系はページについてるファイルを巡回しないからなのか判らんが、
overloadedが出て待たされてる時でも順番の割り込みできる仕様になってるみたい。
急いでるなら画像のURLだけを保存かけてみるのも手。

807:名無しさん@お腹いっぱい。
23/03/22 21:50:02.10 .net
zippyshare閉鎖マジ?

808:名無しさん@お腹いっぱい。
23/03/23 11:48:24.14 .net
noteてとれないんだっけ

809:名無しさん@お腹いっぱい。
23/03/23 13:26:31.42 .net
Note.comはSPNで保存できるけど、robots.txtでia_archiveをブロックしてるから保存してるのを見れないって状態。
Noteが閉鎖してrobots.txtが消されて解消するか、IAがrobots.txtを完全無視する方針になったら多分復活するはず。
保存できるならしとくだけしといたほうがいい。Availability APIでも保存されてるスナップショットはないって返ってきちゃうけどね。
何年か前に投稿者のIPアドレスかホスト名が載ってた時のも含めてデータ自体はどこかに残ってる。

810:名無しさん@お腹いっぱい。
23/03/23 17:28:19.93 .net
>>771
こういうのとかってアーカイブ取る方法ないですか?
GIGAZINEとかも。

811:名無しさん@お腹いっぱい。
23/03/23 19:27:09.83 .net
>>800
GIGAZINEみたいなexcluded系はIAには保存されてる、閲覧が制限されてるだけ
見れることが重要ならtodayを使えばいい
771の様にサイト側で対策されてるタイプは難しい

812:名無しさん@お腹いっぱい。
23/03/23 20:35:30.06 .net
>>800
Webプロキシを間に挟んで間接的に取る方法もある
信頼性とか参照可能性が損なわれるのが欠点

813:名無しさん@お腹いっぱい。
23/03/25 13:44:06.78 .net
IAがフェアユースに基づくと主張して電子書籍を公開していたことに対して、
出版社が著作権侵害を申し立てた裁判の判決が下された
判決は出版社の主張が認められ、IAの敗訴
IAはこの判決を不服とし控訴すると宣言
URLリンク(i.imgur.com)
【関連記事】
The Fight Continues
URLリンク(blog.archive.org)
The Internet Archive has lost its first fight to scan and lend e-books like a library
URLリンク(www.theverge.com)
U.S. judge rules Internet Archive's digital book lending violates copyrights
URLリンク(www.reuters.com)
Judge Decides Against Internet Archive
URLリンク(file770.com)

814:名無しさん@お腹いっぱい。
23/03/25 14:11:37.65 .net
>>801 , >>802
ありがとうございます。

815:名無しさん@お腹いっぱい。
23/03/28 22:14:09.96 .net
doi.orgを保存しようとすると403エラーで保存できないって返ってくるのはちょっとまずいな。
サイト閉鎖したら転送先の論文URLを探すの大変だわ。

816:名無しさん@お腹いっぱい。
23/03/29 00:46:01.00 .net
LinkedIn も Internet Archive をブロック
999 とか変なエラーコード返して来てるw
URLリンク(o.5ch.net)

817:名無しさん@お腹いっぱい。
23/03/29 02:14:03.72 .net
日付が変わってすぐは数分待ちだったのが、1時間待ちに

818:名無しさん@お腹いっぱい。
23/03/29 19:37:54.81 .net
>>799
ほー 勉強になあるわ

819:名無しさん@お腹いっぱい。
23/03/29 19:39:49.22 .net
>>803
同 ps://scan.netsecurity.ne.jp/article/2023/03/28/49118.html

820:名無しさん@お腹いっぱい。
23/03/29 23:39:14.48 .net
PDF以外もPDFも数十分待ち

821:名無しさん@お腹いっぱい。
23/03/30 01:20:09.90 .net
2時間待ち
昨日の比ではない膨れ上がり方・・・

822:名無しさん@お腹いっぱい。
23/03/30 05:23:29.98 .net
今の所1時間45分待ち
午前0時半にボタン押した分が20230329172xxxだから日本時間で午前2時半に保存完了してた
1時間50分後ぐらいだから予定時間通りの遅れ

823:名無しさん@お腹いっぱい。
23/03/30 06:18:00.83 .net
こっちは4時間待ちに
環境によるのか・・・

824:名無しさん@お腹いっぱい。
23/03/30 14:24:03.48 .net
昨日からsave待ちメッセージ いったいなんなのよ ということで

The capture will start in ~4 hours, 12 minutes because our service is currently overloaded. You may close your browser window and the page will still be saved.

825:名無しさん@お腹いっぱい。
23/03/30 14:51:09.40 .net
>>798-799
過去にIAにいくつか保存したnote記事が、note側がIA保存対策したのか、その後IA上に残ってなかった覚えがある。(非公開のままか、本当にキャッシュを削除したのは不明)

saveしたとしても、後にサイト側からの要求でキャッシュ一斉削除される可能性は0ではないんだろうなと。

826:名無しさん@お腹いっぱい。
23/03/30 15:04:06.33 .net
test

827:名無しさん@お腹いっぱい。
23/03/30 15:04:44.65 .net
保存してキャッシュがその時は見れてたのに、ある日を境に、
web.archive.org/web/*/ note.com/{.../記事ID}
でいうカレンダーページに、何もキャッシュが残ってなかったっていうことね。

828:名無しさん@お腹いっぱい。
23/03/30 19:57:54.23 .net
昨日の夕方だか夜からの長時間待ち、まだ落ち着いてないなぁ
環境によるだろうが、こっちは3時間台

829:名無しさん@お腹いっぱい。
23/03/30 20:55:02.40 .net
>>815-817
そもそもアーカイブされた内容の「削除」って、出来るのか?
サイト別に分けて保存している訳じゃあるまいし
申し出のあったサイトについて、前方一致か何かで非表示にしてるだけだろ
ちなみに例の事件の直後、note から IA へ連絡が行ったようで
全体が excluded になった話は前スレで既出
robots.txt 云々と過去の仕様の話をしてる奴は無視するに限る

830:名無しさん@お腹いっぱい。
23/03/30 22:07:48.83 .net
1時間待ちだの24分待ちだの今日は長過ぎる・・・何の制限なんだ

831:名無しさん@お腹いっぱい。
23/03/30 23:17:44.96 .net
>>819
DMCA関係なら削除は出来るはず
昔あったpixivのパクリサイトは完全に消えてる(一度も取られてないとは考えにくい)
まぁ815のnoteの話は違うと思うけど

832:名無しさん@お腹いっぱい。
23/03/31 01:41:44.50 .net
ついに5時間台
こりゃ落ち着きそうにない

833:名無しさん@お腹いっぱい。
23/03/31 08:42:19.81 .net
The capture will start in ~7 hours, 52 minutes because our service is currently overloaded. You may close your browser window and the page will still be saved.

珍しい。

834:名無しさん@お腹いっぱい。
23/03/31 12:29:09.15 .net
やっとオーバーロードの表示出なくなったのはいいんだけど、
ボタン押して保存始まるまで1分ぐらい待たされてる感じがあるのは俺環か気のせい?
何時間も待たされるよりはいいけどさ。


次ページ
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch