Internet Archive総合 (web.archive.org) #3at ESITE
Internet Archive総合 (web.archive.org) #3 - 暇つぶし2ch845:名無しさん@お腹いっぱい。
21/04/17 11:41:17.37 .net
IA全然とれねー

846:名無しさん@お腹いっぱい。
21/04/19 11:42:38.28 .net
iaは最近ずっと調子悪い印象

847:名無しさん@お腹いっぱい。
21/04/20 01:48:29.85 .net
最近またjob failed出るようになったな

848:名無しさん@お腹いっぱい。
21/04/20 16:17:10.58 .net
>>827
うちウェブ魚拓いくら待ってもロボット拒否でbanされたわw

849:名無しさん@お腹いっぱい。
21/04/20 21:36:13.88 .net
twitterぜんぜん保存されてないな。万単位のフォローがいる垢でも保存されてなかったりする

850:名無しさん@お腹いっぱい。
21/04/21 21:20:44.52 .net
>>831
Web魚拓はReCaptchaのマークが右下に表示されてから12秒くらい待ってボタン押すと保存できるはず。
長く待ちすぎるとロボット拒否される

851:名無しさん@お腹いっぱい。
21/04/21 23:45:37.52 .net
スマートフォンでアーカイブしたものをスマートフォンで見ようとすると見れないが3Gガラケーでは見れる謎

852:名無しさん@お腹いっぱい。
21/04/22 21:24:08.86 .net
俺が対策書いた途端にWeb魚拓の仕様が変わって草。
このスレ見てる誰かがスクリプトでも走らせてるのか

853:名無しさん@お腹いっぱい。
21/04/23 17:18:11.69 .net
最新のブラウザ使ってても「お前のブラウザ古いぞ」的な警告文(黄色)出るの俺だけ?

854:名無しさん@お腹いっぱい。
21/04/25 18:05:22.97 .net
インターネット官報誰も保存してない

855:名無しさん@お腹いっぱい。
21/04/30 13:23:56.96 .net
アカウント作成時の捨てアド排除が始まってるなぁ
二ヶ月前はこんなこと無かったのに
URLリンク(o.5ch.net)

856:名無しさん@お腹いっぱい。
21/04/30 13:34:48.94 .net
あと、ユーザプロフ画面でアバター画像をアップロードしてない場合に
Gravatarを参照しなくなった
画像のタイムスタンプからして先月初旬の変更か
URLリンク(archive.org)
Last-Modified: Sun, 07 Mar 2021 00:42:48 GMT
URLリンク(o.5ch.net)

857:名無しさん@お腹いっぱい。
21/04/30 18:23:16.44 .net
>>832
ちょっと違うけど20年近く続いてる個人サイトとか、あとベテラン作家のブログが保存されてたのにサイトの方は�


858:ゥ分が作業するまでアーカイブに無かったってことはあったな (後者は今のサイトが出来てから2年ぐらいしか経ってなかったのもあるんだろうけど)



859:名無しさん@お腹いっぱい。
21/04/30 21:42:19.54 .net
Twitterのアーカイブは殆どArchive Teamのやつだから
ユーザーページは取られてないけど個別のツイートは殆ど取られてるはず

860:名無しさん@お腹いっぱい。
21/05/03 02:26:37.76 .net
ページが存在するのにLive page is not availableになるのいい加減にしてくれ

861:名無しさん@お腹いっぱい。
21/05/04 08:19:29.48 .net
「Check My Links」という拡張機能を使えばリンクの未保存ページが自動アーカイブできるよ
URLリンク(www.jtm.gr.jp)

862:名無しさん@お腹いっぱい。
21/05/04 22:21:00.51 .net
アカウントの Mailing Lists Settings の項目が増えたな。
Stay up to date with what’s happening at the Internet Archive by signing up for our free newsletters.
□ Best of the Archive: Useful resources, unique stories, and fun finds from our collections
□ Monthly Updates: A snapshot of the main news stories about the archive each month
□ Event Notices: Invitations to and news about our events
□ Donor Communications: Messages for and about our generous supporters
どれも要らないけどw

863:名無しさん@お腹いっぱい。
21/05/05 11:05:32.13 .net
インスタ保存したいんだけどできないね

864:名無しさん@お腹いっぱい。
21/05/05 21:50:33.16 .net
>>845
インスタはちょっと前から出来なくなった
個別の画像URLを抽出して保存は出来る

865:名無しさん@お腹いっぱい。
21/05/06 13:16:03.43 .net
Batchの設定も少し増えた

866:名無しさん@お腹いっぱい。
21/05/07 09:48:31.47 .net
Save screen shotにチェック入れても取られないときあるな
後から取られてるんだろうか?

867:イモー虫
21/05/07 16:22:46.45 .net
ちなみにその個別画像urlテンプレ
https●:●//www.●instagram.●com/p/11桁のインスタ画像個別の英数/media/?size=l

868:名無しさん@お腹いっぱい。
21/05/07 18:40:26.38 .net
こっちもほぼsavescreenshotが機能してない
裏で取れてたりするんかね

869:名無しさん@お腹いっぱい。
21/05/08 03:19:50.67 .net
たまにyoutubeの動画がアーカイブされてるけど手動で取る方法はないんですかね?

870:名無しさん@お腹いっぱい。
21/05/08 05:54:04.89 .net
APIの情報も信用できないし、どれが取れていて どれが取れていないかは
結局自分たちの目で見て確認するしかないという現状。

871:名無しさん@お腹いっぱい。
21/05/08 16:28:03.01 .net
保存の確認のためにWayback Machine Availability APIを使ってみたけど、
保存されてるURLでもスナップショット無しだと返ってくる
壊れてるなこれw

872:名無しさん@お腹いっぱい。
21/05/08 17:02:12.53 .net
>>851
URLリンク(web.archive.org)URLリンク(www.youtube.com)動画のID と入力し保存。すぐには保存されないけど、数週間待って見てみると保存できてる

873:名無しさん@お腹いっぱい。
21/05/08 19:57:36.18 .net
>>854
4K画質のとかでも保存されるの?

874:名無しさん@お腹いっぱい。
21/05/08 23:10:05.55 .net
>>854
おお、ありがとうございます
保存までに時間が掛かるんですね

875:名無しさん@お腹いっぱい。
21/05/09 02:38:40.84 .net
>>846
画像のアドレスの仕様にもよるがしおりをつけておかないと後で検索のしようがなくなりがちなやつ
imgurの画像とかも保存自体は出来るがどこの何の画像なのかはどこかに記載されてないとカオスに

876:名無しさん@お腹いっぱい。
21/05/09 03:59:33.78 .net
>>854
それ動画ページが見れるだけで動画自体は保存されないんじゃないの?

877:名無しさん@お腹いっぱい。
21/05/09 04:04:52.08 .net
>>855
YouTubeのビデオは、訴えられる危険を犯した専用の解読スクリプトを書かないと
ビデオを保存できないので無理。
imgurのようなビデオに静的なリンクを張っている所とは違う。
URLリンク(web.archive.org)
<video draggable="false" playsinline="" autoplay="" … >
<source type="video/mp4" src=
"URLリンク(web.archive.org)
></video>

878:名無しさん@お腹いっぱい。
21/05/09 04:48:52.27 .net
動画自体も保存されてるよ。自動クロール率は低いけど
適当にURL貼るとこれとか
URLリンク(www.youtube.com)">URLリンク(web.archive.org))

879:名無しさん@お腹いっぱい。
21/05/09 21:18:48.23 .net
>>860
消されてない動画の場合、見るたびにそっちを取りに行ってる可能性がある
まぁ自分も詳しくないので詳しい人いたら教えてほしい

880:名無しさん@お腹いっぱい。
21/05/10 02:03:24.91 .net
>>861
保存された動画を再生してるみたい
動画のソース
URLリンク(r4---sn-n4v7sne7.googlevideo.com)">URLリンク(web.archive.org))

881:名無しさん@お腹いっぱい。
21/05/10 02:10:49.84 .net
Youtubeの動画とかもちゃんと保存されんのか……

882:名無しさん@お腹いっぱい。
21/05/10 02:13:29.44 .net
YouTubeは定期的に仕様変更してるからIAがそれに対応していくのは難しいらしい
だから昔のページだと動画が保存されてるのもあるけど今はされてない

883:名無しさん@お腹いっぱい。
21/05/10 05:21:32.71 .net
>>864
自分もよく分かってないけど今も保存されてるっぽいよ
昨日の動画が保存されてたから
URLリンク(www.youtube.com)">URLリンク(web.archive.org))

884:名無しさん@お腹いっぱい。
21/05/10 14:48:04.32 .net
またサーバーが落ちたのか繋がらないな
archive.orgの方は接続出来るみたいだが…

885:名無しさん@お腹いっぱい。
21/05/10 16:09:21.18 .net
URLリンク(archive.org)
日本時間で14時20分すぎから鯖落ち中らしい

886:名無しさん@お腹いっぱい。
21/05/10 16:34:25.60 .net
web.archive.org までは到達できている。また内部のネットワーク障碍か。
URLリンク(o.5ch.net)

887:名無しさん@お腹いっぱい。
21/05/10 17:37:18.38 .net
復旧したっぽい

888:名無しさん@お腹いっぱい。
21/05/11 13:44:37.60 .net
なんか今日はIAの調子やたらいいな
これまで表示されなかったスクショなんかもちゃんと取れてるし

889:名無しさん@お腹いっぱい。
21/05/11 15:27:21.28 .net
Youtubeは少なくとも今年1月にとった分は動画まで保存できてたから、時間が経てば取れると思う。

890:名無しさん@お腹いっぱい。
21/05/11 19:00:41.67 .net
>>849
わからん…

891:名無しさん@お腹いっぱい。
21/05/14 18:54:25.52 .net
waybackmachine使っただけで訴えられた事例とかあるの?

892:名無しさん@お腹いっぱい。
21/05/15 00:01:24.67 .net
IA自体はともかく利用者はないだろ

893:名無しさん@お腹いっぱい。
21/05/15 00:54:51.91 .net
ウェブ魚拓保存者がIP開示されたケース
URLリンク(gigazine.net)

894:名無しさん@お腹いっぱい。
21/05/15 02:45:03.16 .net
ウェブ魚拓はそういうのもあって今は利用していない

895:名無しさん@お腹いっぱい。
21/05/16 07:35:08.10 .net
429エラーでもこれはお手上げ
URLリンク(o.5ch.net)

896:名無しさん@お腹いっぱい。
21/05/17 10:22:21.67 .net
Cannot get status of 16進数(32桁)というのが出る

897:名無しさん@お腹いっぱい。
21/05/18 16:27:53.74 .net
保存日時の情報は記録されているけれど、外部リンク調査日時の記録はされていないんだろうな。
これも記録してあればいいのに。

898:名無しさん@お腹いっぱい。
21/05/18 18:54:24.22 .net
なんではてなブログアーカイブするとfacebookなんちゃらになるんだ

899:名無しさん@お腹いっぱい。
21/05/19 03:51:09.54 .net
ツイッターも意味不明な表示になったがちゃんと正式urlでアーカイブされてた

900:名無しさん@お腹いっぱい。
21/05/19 23:05:23.86 .net
サイト内のzip落としたらUAが表示される某サイトで
二度Sorry出したら二度ともUAが表示されていたから保存されてはいるようだ

901:名無しさん@お腹いっぱい。
21/05/20 17:13:05.62 .net
Cannot save Internet Archive URLs!
今日はこのエラー連発で1時間後にやり直したらできたり不安定すぎる
保存できなかった理由も書いてない

902:名無しさん@お腹いっぱい。
21/05/21 18:08:48.24 .net
Twitterで特定のアカウントだけexcludedってあるんだな
本人が申請したっぽいけど

903:名無しさん@お腹いっぱい。
21/05/22 13:44:06.50 .net
ハイパーリンクの情報は当然持ってるとして各ファイルの被リンク情報はなくてもやっていけるんだろうかと少々心配になる
ビッグデータとして利用する客が考えればいいことか知らんが

904:名無しさん@お腹いっぱい。
21/05/23 07:32:01.41 .net
そもそも今のIAはとにかく情報を溜め込むことだけ考えてそれをどう活用するかは今後次第って感じじゃないかなあ
現状のsaveだけでもサーバー不安定になるレベルで常にやってるし(それでも全然間に合ってなさそうなのが怖いが)

905:名無しさん@お腹いっぱい。
21/05/23 22:01:09.82 .net
URLで検索してアーカイブ一覧を表示しようとすると次のエラーが出るのだけど
混雑で検索エンジンが止まってるだけかな
The search engine encountered the following error: invalid or no response from Elasticsearch

906:名無しさん@お腹いっぱい。
21/05/24 07:19:04.30 .net
ほう URLリンク(www.elastic.co)

907:名無しさん@お腹いっぱい。
21/05/25 04:48:03.82 .net
>>509
ページ全体は無理だが画像などバラのパーツは個別に保存が可能だったりすることもある
ザル運営のブラウザゲームなどはありがち

908:名無しさん@お腹いっぱい。
21/05/25 08:24:52.11 .net
Cannot fetch the target URL due to system overload.
ナニコレ

909:名無しさん@お腹いっぱい。
21/05/25 08:29:38.17 .net
>>890
> due to system overload
そういうことだろ

910:名無しさん@お腹いっぱい。
21/05/25 17:48:23.78 .net
>>890
URLリンク(translate.google.co.jp)

911:名無しさん@お腹いっぱい。
21/05/25 23:05:34.28 .net
オーバーロードはなろう系で唯一お薦めできる作品

912:名無しさん@お腹いっぱい。
21/05/26 03:28:24.76 .net
最近データベースの入れ替えでもしてるの?
Explore more than X billion web pages saved over time
のXが一瞬半分になったり変動がすごい

913:名無しさん@お腹いっぱい。
21/05/26 05:53:27.55 .net
オーバーロードが良かったのは一期だけ(アニメ

914:名無しさん@お腹いっぱい。
21/05/26 18:10:11.99 .net
This snapshot cannot be display


915:ed due to an internal error.



916:名無しさん@お腹いっぱい。
21/05/26 21:05:39.01 .net
回復したかな

917:名無しさん@お腹いっぱい。
21/05/27 03:31:52.31 .net
system overloadが出ても/*/の後にURLつけると保存できてることがあるので、
一応確認してみるのおすすめ

918:名無しさん@お腹いっぱい。
21/05/27 22:10:47.88 .net
保存時間の間隔が30分から45分になってる…

919:名無しさん@お腹いっぱい。
21/05/28 02:03:32.64 .net
アイヤー

920:名無しさん@お腹いっぱい。
21/05/28 09:59:53.85 .net
URLリンク(homepage2.nifty.com)

This URL has been excluded from the Wayback Machine.
になってるのはなんでだろう?ジオシティーズみたいな普通のホームページサービスだったみたいだけど

921:名無しさん@お腹いっぱい。
21/05/28 10:04:26.18 .net
>>901
> ジオシティーズみたいな普通のホームページサービスだったみたいだけど
ワロタ

922:名無しさん@お腹いっぱい。
21/05/28 15:24:41.10 .net
ジオシティーズやトクトクは普通だけどフリーティケットシアターは普通じゃない的な

923:名無しさん@お腹いっぱい。
21/05/30 04:42:48.43 .net
/*/はFail with status: 498 No Reason Phrase

924:名無しさん@お腹いっぱい。
21/05/30 17:45:08.98 .net
なるべく円高米ドル安の時に寄付したほうがいいんだろうな。

925:名無しさん@お腹いっぱい。
21/05/30 19:21:56.74 .net
batchのページ開いてもトップに飛ばされてしまうようになった

926:名無しさん@お腹いっぱい。
21/05/31 01:22:39.81 .net
batchのページが復活したっぽい。よかった

927:名無しさん@お腹いっぱい。
21/06/01 03:49:59.92 .net
swfのあるページの取得厳しいんだっけ
Cannot fetch the target URL due to system overload.がでる
todayのほうで試したらプロセスが空白で進行せず
megarodonは見かけ上はとれてるがソースからswfの現物アドレスを消して保存してるっぽい
ファイル固有の問題だろうか
デバッガでは開けるんだが

928:名無しさん@お腹いっぱい。
21/06/01 04:36:21.94 .net
swfってただのファイルじゃないの
どうしてそんなことが起こるのですか

929:名無しさん@お腹いっぱい。
21/06/01 11:28:13.18 .net
We only allow new captures of the same URL every 45 minutes.

930:名無しさん@お腹いっぱい。
21/06/01 13:18:27.55 .net
That's too hard to me...

931:名無しさん@お腹いっぱい。
21/06/01 13:20:35.24 .net
激遅の/save/で行けたりしない?>swf
保存できても表示が更新されないので本当に保存されているか未確認だけど

932:名無しさん@お腹いっぱい。
21/06/01 17:10:58.68 .net
flash表示システムってどうなったんだっけ

933:名無しさん@お腹いっぱい。
21/06/01 19:40:12.28 .net
サポート終了で表示できないっぽい

934:名無しさん@お腹いっぱい。
21/06/02 01:04:22.30 .net
ファイル1個だけなら画像の確認とかやらないから拡張子関係なく超高速で保存できるはずだけど

935:名無しさん@お腹いっぱい。
21/06/02 01:50:07.20 .net
Cannot fetch the target URL due to system overload.
出すぎ

936:名無しさん@お腹いっぱい。
21/06/02 04:57:26.97 .net
>>912
個別のswfのアドレス投げ込んだら保存できたからひとまずはいいことにする
開くときは開けるアドレスを知ってないとあかんね
デバッガだと「swfを置いてるページ」では開けないんでarchiveのソースに書かれてる現物のアドレスを掘り出してデバッガに渡すまでしないと開かない
(開けるのは確認できた)
>>913
なんかアナウンスされてたよね archiveのswf全部を勝手にブラウザ上で再生してくれるようなものを期待しちゃうけど
そこまでするのは結構大変なはず

937:名無しさん@お腹いっぱい。
21/06/02 08:47:16.75 .net
3Gガラケーの本体自体にフラッシュの再生機能付いててアーカイブ含め見れるが画面が小さいのがあかんな
ガラケー向けの時計フラッシュまちうけフラッシュは本体が壊れない限り確実に永遠に見れるけどペリーのピアノ講師ネタとか永遠に失われそう

938:名無しさん@お腹いっぱい。
21/06/02 14:33:51.58 .net
SPNを保存されたかの確認に使うというわけ分からん状況になってる。
誰かが過去に保存したであろう複数ページの記事が途中歯抜けで保存されているのを見かけた。保存失敗か?
元の記事はもう見れないから補完してあげることもできなかった。

939:名無しさん@お腹いっぱい。
21/06/02 14:54:32.98 .net
twitterの保存だけやけに時間かかるんだけど

940:名無しさん@お腹いっぱい。
21/06/09 00:42:55.87 .net
「Ruffle」というchrome拡張機能使えばFlash見れるよ

941:名無しさん@お腹いっぱい。
21/06/09 01:11:29.08 .net
Sorry
You have already reached the limit of active sessions

先週からエラー出まくり

942:名無しさん@お腹いっぱい。
21/06/09 06:03:50.69 .net
>>922
おまいさんのやり方が悪いだけ。先月の制限強化に引っ掛かってるんだろ。
URLリンク(docs.google.com)
> 2021-05-23
> Anonymous users have lower concurrent captures limit (limit=3) compared to authenticated users (limit=5).
制限値を超えないよう、保存開始のタイミングを調整するしか無い。
アカウントを作ってログインすれば従前の制限値に戻る上、空きセッション数を API で
得られるようになるので、自動的に空きを待ってから保存するようなシステムも
組めるようになる。
URLリンク(web.archive.org) (ログインしていなければ 503 エラー)
Change Log に記載は無いが、ログイン済みユーザの制限値は 6 に緩和されている模様。
("available":6)
URLリンク(o.5ch.net)

943:名無しさん@お腹いっぱい。
21/06/09 15:34:51.37 .net
なんかリファラー変更ができなくなったっぽいんだけど俺環?

944:名無しさん@お腹いっぱい。
21/06/09 16:25:44.73 .net
ブラウザが (IA のヘッドレスブラウザも含めて) リファラを送らなくなったとか
そういう話じゃ無くて?

945:名無しさん@お腹いっぱい。
21/06/09 17:46:21.43 .net
マジか。じゃ もうリファラ必要なサイトは保存できなくなったのか

946:名無しさん@お腹いっぱい。
21/06/09 18:29:55.92 .net
制限するぐらいなら、有料化しろよ

947:名無しさん@お腹いっぱい。
21/06/10 05:14:53.41 .net
金ローの画像はどういう仕組みなんだろう
URLリンク(kinro.ntv.co.jp)
保存ができてるのかできてないのかがようわからん
/*/上の階層/*/ってファイルサイズは見れんよね

948:名無しさん@お腹いっぱい。
21/06/10 09:28:25.29 .net
API を使うとクッキーも送れるけど、ハイジャック耐性の無いユルいサイトしか使い道が無いな。
URLリンク(web.archive.org)
ちなみに force_get を 0 (または省略) にしておかないと capture_cookie を指定しても無視される。

949:名無しさん@お腹いっぱい。
21/06/10 09:46:43.59 .net
そうそう、IA のアーカイブはサーバのレスポンスヘッダが丸ごと保存されていることに留意。
つまり Set-Cookie でクッキーが返されていた場合、それも保存されているという事。
ログイン管理にクッキーを利用しているサイトで、アーカイブのデータを利用して
誰かに勝手にログインされるという事も起こりうる。

950:名無しさん@お腹いっぱい。
21/06/10 16:53:57.18 .net
なにそれこわい

951:名無しさん@お腹いっぱい。
21/06/12 22:30:39.38 .net
また繋がらなくなった?
保存しようとしても503やら404の画面になるんだけど…

952:名無しさん@お腹いっぱい。
21/06/12 22:36:49.23 .net
そうみたい

953:名無しさん@お腹いっぱい。
21/06/12 22:49:26.53 .net
しばらくは駄目そうだな

954:名無しさん@お腹いっぱい。
21/06/12 23:14:58.67 .net
最近、頻繁に使うようになったけど、今繋がらないみたいだね。
だいたいどれくらいで復帰するんだろうか?
1日2日はかかるかな?

955:名無しさん@お腹いっぱい。
21/06/12 23:18:19.16 .net
503エラー?

956:名無しさん@お腹いっぱい。
21/06/13 00:44:05.86 .net
さっき見たときは直ってた

957:名無しさん@お腹いっぱい。
21/06/13 08:29:59.22 .net
親切な表示が出るようになってる
You may close your browser window and the page will still be saved.

958:名無しさん@お腹いっぱい。
21/06/13 17:29:48.96 .net
さじをなげたか

959:名無しさん@お腹いっぱい。
21/06/14 11:43:37.62 .net
Batch Archiveに入れない

960:名無しさん@お腹いっぱい。
21/06/15 07:00:28.90 .net
向こうで計画停電が起こるみたいだから、こっちの時刻で16日の0時30分からしばらくサービス停止するらしい。
URLリンク(i.imgur.com)
URLリンク(www.jisakeisan.com)

961:名無しさん@お腹いっぱい。
21/06/15 09:25:17.87 .net
>>941
Due to a planned power outage, our services will be reduced on Tuesday, June 15th, starting at 8:30am PDT until the work is complete. We apologize for the inconvenience.
この程度の英文すら機械翻訳使わなきゃ読めない低能

962:名無しさん@お腹いっぱい。
21/06/15 14:04:45.44 .net
喧嘩はよそで一人でやってろよ

963:名無しさん@お腹いっぱい。
21/06/15 15:21:07.34 .net
人は上から目線で間違いを訂正するときに性行為より快感を感じるらしい

964:イモー虫
21/06/18 20:45:23.13 .net
読み込み機能は機能しているのか

965:名無しさん@お腹いっぱい。
21/06/19 14:06:16.43 .net
The capture is estimated to start in 120 minutes. You may close your browser window and the page will still be saved.
うっかりログインし忘れるとこれだわw

966:名無しさん@お腹いっぱい。
21/06/19 18:36:08.03 .net
523分待ちだったわ 撮ってくれるんならまあいいけど

967:名無しさん@お腹いっぱい。
21/06/19 19:35:06.80 .net
>>901
members.jcom.home.ne.jpも This URL has been excluded from the Wayback Machine.になるね

968:名無しさん@お腹いっぱい。
21/06/19 21:03:13.89 .net
残り763分

969:名無しさん@お腹いっぱい。
21/06/19 23:24:40.50 .net
今968分待ち、今日中に1000分超えるかな

970:名無しさん@お腹いっぱい。
21/06/20 00:40:25.87 .net
1085分、てかアカウントでログインして保存しようとしてもこの表示出るじゃん
アカウント作った意味ないわ

971:名無しさん@お腹いっぱい。
21/06/20 01:26:26.34 .net
待ち時間が一度表示されてしまうと、その後ログインして
同じURLの再保存を試みても待ち時間が延びるだけ。

972:名無しさん@お腹いっぱい。
21/06/20 03:44:33.22 .net
1393分待ちになってる

973:名無しさん@お腹いっぱい。
21/06/20 12:42:15.80 .net
保存は匿名で出来るんですか?

974:名無しさん@お腹いっぱい。
21/06/20 12:58:58.94 .net
まだログインしないと待ち時間が出る状態なの?
ご愁傷様w

975:名無しさん@お腹いっぱい。
21/06/20 15:59:50.29 .net
今は直ってるな
というか別に待ち時間があっても後で保存されるんだから良くね?

976:名無しさん@お腹いっぱい。
21/06/21 02:12:27.28 .net
伊是名夏子のブログのアーカイブを見ようとすると
6月初めぐらいからThis URL has been excluded&#12316;が出るようになってるんだけど、
非表示化か削除依頼出したみたいだねこれ。

977:名無しさん@お腹いっぱい。
21/06/21 10:45:02.62 .net
アーカイブのアーカイブが必要になりそう

978:名無しさん@お腹いっぱい。
21/06/21 14:15:21.05 .net
archive.isなら消されない

979:名無しさん@お腹いっぱい。
21/06/21 14:49:55.10 .net
archive.is 自体が消えてしまったりしないの? という話が。

980:名無しさん@お腹いっぱい。
21/06/21 19:46:33.38 .net
永久不滅アーカイヴが必要

981:名無しさん@お腹いっぱい。
21/06/22 06:37:35.24 .net
Cannot get status of spn2-2afbf2c51be876410f7a78331b331ea74cd21c67-5a282757

982:名無しさん@お腹いっぱい。
21/06/24 00:03:38.03 .net
>>955
ログインしてても普通に待ち時間表示出るけど、時間帯によって変わったりするの?

983:名無しさん@お腹いっぱい。
21/06/27 13:37:52.83 .net
>>954
>>57
問題なのは関連付けされてる場合はログインしている時のメールアドレスやユーザ名、ログイン関係なくハッシュ化したIPアドレスやUserAgent部分がWARCファイルの名前フィールド部分に保存される可能性がある。
気になるなら保存するときだけUserAgentやIPアドレス変えたり保存するページごとに別ければいい。

984:名無しさん@お腹いっぱい。
21/06/28 11:48:52.21 .net
何度許可してもログインしなおしてもBatchのArchive URLsに入れない

985:名無しさん@お腹いっぱい。
21/07/02 11:56:14.72 .net
Batch入れないけど、騒いでるの俺だけっぽいから俺環なのか

986:名無しさん@お腹いっぱい。
21/07/02 15:17:24.60 .net
皆さん自前でバッチ処理しているから使ってない、に一票

987:名無しさん@お腹いっぱい。
21/07/12 07:09:59.53 .net
あるWEBサイトの一部が消えているのだけれど、
インターネットアーカイブでも履歴が残っていないことがある
忍者とかいうブログサイトを使っているのだが、
あそこって削除した画像とかの履歴を残さないようにする機能とかあるのだろうか

988:名無しさん@お腹いっぱい。
21/07/12 16:06:59.65 .net
>>968
他の魚拓サイトにも残ってないの?まあブログはアーカイブされてないことが多いからなぁ。

989:名無しさん@お腹いっぱい。
21/07/12 16:33:16.08 .net
忍者って昔やたらボット除けに精を出してた所じゃないか
って今時の人は知らんのか
で、もうそろそろ次スレテンプレの話題でも

990:名無しさん@お腹いっぱい。
21/07/12 23:07:03.45 .net
〓テンプレ(案
現行の関連スレ
URLリンク(refind2ch.org)

991:名無しさん@お腹いっぱい。
21/07/14 01:47:06.23 .net
ツイッターのアーカイブ保存、回収の法則テンプレに入れようぜ。
アーカイブ保存は
mobile.ツイッター.com
でなければならないが
回収web.archive.org/web/9999/はmobile.を外さなきゃならない
ってこれガラケーだけ?

992:名無しさん@お腹いっぱい。
21/07/14 04:14:39.67 .net
ガラケー?そんなものの情報要るの?

993:名無しさん@お腹いっぱい。
21/07/16 04:27:32.78 .net
普通にTwitterをアーカイブすればmobileは付かないと思うんだが・・・
それは置いといて>>5とかの話は入れたほうが良さそう

994:名無しさん@お腹いっぱい。
21/07/16 13:46:21.98 .net
最近は反映が早い

995:名無しさん@お腹いっぱい。
21/07/18 03:03:30.60 .net
Hrm.
The Wayback Machine has not archived that URL.って出るサイトは
どうやってもみれないんですか?

996:名無しさん@お腹いっぱい。
21/07/18 18:09:30.90 .net
>>976
アーカイブしてないからそもそも保存されてない

997:名無しさん@お腹いっぱい。
21/07/18 19:27:16.87 .net
URLリンク(wiki.archiveteam.org)
archiveteamが保存した一部のスナップショットを見ると、この「俺たちが保存したぜ」画像のURLを読み込むから、
誰がどのページを見たかarchiveteamのウィキサイトに情報が漏れるんだけど、ただのスパイじゃねーか。
Internet Archiveの人は誰も気付いてないのかなこれ。

998:名無しさん@お腹いっぱい。
21/07/18 20:43:46.80 .net
と、自分でスクリプトを組んでアーカイブできない無能が文句を垂れております。

999:名無しさん@お腹いっぱい。
21/07/19 02:22:16.98 .net
>>979
個人がアップロードしたWARCファイルは扱ってないじゃん
結局のところ制限引っかからないように/save/にURL投げるコードしか組めんよ
何も知らない無能はお前だ

1000:名無しさん@お腹いっぱい。
21/07/19 05:43:32.79 .net
そのレベルの情報を気にするなら個人でproxyなりVPNなり使えばいいのでは
なぜArchiveTeamだけを気にしてるのかは知らんが

1001:名無しさん@お腹いっぱい。
21/07/19 22:59:58.68 .net
>>978
ほんまや
About this captureの説明のところに埋め込んであった
でもブラウザの挙動はCSPで読み込みブロックってなってるから
インターネットアーカイブ側の対策でデータは送信されてない感じかね

1002:名無しさん@お腹いっぱい。
21/07/23 00:21:19.80 .net
25周年記念サイト
URLリンク(anniversary.archive.org)

1003:名無しさん@お腹いっぱい。
21/07/23 16:15:09.58 .net
インターネットアーカイブが25歳になったら、知識がすべての人にとってよりアクセスしやすくなった極めて重要な瞬間を経て、戻る方法から進む方法への旅にあなたを招待します。
アレクサンドリア図書館からヨハネスグーテンベルクによる印刷機の発明まで。
情報への権利の第一修正の保証からワールドワイドウェブの作成まで、知識へのアクセスは常に建設者と夢想家のおかげでした。
さて、ブリュースター・ケールという若いコンピューター科学者がデジタル時代の「すべての図書館」を建設することを夢見ていた1996年にさかのぼります。
人類の出版されたすべての作品を含み、一般に無料で、時代を超えて非営利団体として構成されたライブラリ。彼はこのデジタルライブラリをインターネットアーカイブと名付けました。
その使命は、すべての人に「すべての知識への普遍的なアクセス」を提供することで


1004:す。 この25年のマイルストーンに関するブリュースターの考察を読む バーチャルセレブレーションに参加する あなたが世界のどこにいても、私たちと一緒に祝いに来てください。 ウェイバックからウェイフォワードへ:25のインターネットアーカイブ 星を目指して到達したビルダーと夢想家との仮想の旅。 10月21日木曜日午後6時PT(午後9時ET)



1005:名無しさん@お腹いっぱい。
21/07/24 02:54:26.16 .net
YoutubeのURL取ったら下のメッセージが出た
It may take a few days for YouTube videos to become available for playback.
動画もアーカイブされてるってことでいいのかな?

1006:名無しさん@お腹いっぱい。
21/07/24 13:53:59.14 .net
Youtubeを保存したいなら手動保存が望ましい。クローラーの保存だと再生できないケースあり。

1007:名無しさん@お腹いっぱい。
21/07/31 03:20:35.58 .net
そろそろ6000億超えるか

1008:名無しさん@お腹いっぱい。
21/07/31 19:00:56.16 .net
<title>だけでも検索できるといいんだけどなあ

1009:名無しさん@お腹いっぱい。
21/07/31 21:11:28.65 .net
いまツイッターの動画って保存できねえんだっけ

1010:名無しさん@お腹いっぱい。
21/08/01 03:48:55.71 .net
そうなの?(そうなの?)

1011:名無しさん@お腹いっぱい。
21/08/01 16:10:13.05 .net
>>989
これ使ってURL変換すると保存できるよ
URLリンク(lab.syncer.jp)

1012:名無しさん@お腹いっぱい。
21/08/01 18:08:12.29 .net
ページからたどれなくならね

1013:名無しさん@お腹いっぱい。
21/08/01 18:27:20.02 .net
それはしゃーない

1014:名無しさん@お腹いっぱい。
21/08/01 19:07:49.48 .net
次スレたのんます

1015:名無しさん@お腹いっぱい。
21/08/13 03:38:50.58 .net
>>994
Internet Archive総合 (web.archive.org) #4
スレリンク(esite板)

1016:名無しさん@お腹いっぱい。
21/08/13 07:19:48.01 .net
Tor clients have already done 200,000 captures today. Please email us at "info@archive.org" if you would like to discuss this more.
とか出てきたんやけど・・・

1017:名無しさん@お腹いっぱい。
21/08/13 09:36:18.65 .net
Tor使ってないのに俺も今日初めてそのエラーが出てきた
9時過ぎたので、一応リセットされて表示されなくなったが、
毎日これが出たら困るな、特に朝保存したい場合は

1018:名無しさん@お腹いっぱい。
21/08/13 13:38:54.09 .net
健康のための朝保存

1019:名無しさん@お腹いっぱい。
21/08/13 19:21:46.35 .net
>>995
おつでござんす

1020:名無しさん@お腹いっぱい。
21/08/13 19:26:23.91 .net
IAの中の人はTorがどういうものか分かってないらしいw

1021:名無しさん@お腹いっぱい。
21/08/13 20:25:45.61 .net
999!

1022:名無しさん@お腹いっぱい。
21/08/13 20:56:15.43 .net
【 html化されたこのスレを読んでいるお前へ 】
おい、お前。そう、お前だよ。
「このスレおもろいから見てみ」「2ちゃんの歴史に残る名スレだぜ」とか言われてホイホイと
このhtml化されたスレを見にきた、お前のことだ。
どうだ?このスレおもしれーだろ。
でもな、お前はこのスレを読むだけで、参加することはできねーんだよ。
可愛そうにな、プププ。
俺は今、ライブでこのスレに参加してる。
すっげー貴重な経験したよ。この先いつまでも自慢できる。
まあ、お前みたいな出遅れ君は、html化されたこのスレを指くわえて眺めてろってこった。

1023:1001
Over 1000 Thread.net
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 498日 18時間 48分 6秒

1024:過去ログ ★
[過去ログ]
■ このスレッドは過去ログ倉庫に格納されています


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch