monazilla Part 5at TECH
monazilla Part 5 - 暇つぶし2ch637:デフォルトの名無しさん
07/01/20 22:08:46
Perlについての質問箱 29箱目
スレリンク(tech板)
から誘導されてきました。

2chViewer ●にログインして、過去ログをひたすら(ウェイトは挟みつつ)取得するPerlスクリプトを書いたのですが、
●ログインは出来るものの、肝心の過去ログが取得できません。gzip圧縮された「-ERR もう つかえません」と言うメッセージが取得されるだけです。
●アカウントそのものは既成の専用ブラウザ(OpenJane 0.1.12.6b)で生きていることを確認しています。
ソースはこれです。 
URLリンク(sub.jetabbs.org)  (コメント・メッセージがキモくてごめんなさい)
何が原因かわからないでしょうか?

638:デフォルトの名無しさん
07/01/20 22:26:26
>>637
Perlのソースをうpしても、「Perlのソースが読める」と、「●の実装を理解してる」の両方を満たす人しか回答できないよ。
送信してるヘッダを書いた方が判りやすいと思う。

それと、目的が「作る」のではなくて「ログを落とす」なら、壷インストールしてIEを自動操縦する方が簡単と思う。

639:デフォルトの名無しさん
07/01/21 02:04:00
>>637
●持ちじゃないからテストできなくてスマンが、163行目はraw=.0じゃなくraw=0.0が正解じゃね?

640:637
07/01/21 03:44:12
>>638
発想の転換させてくれてありがとう。
IE自動操縦ではなくてJaneにdat落ちURLを渡すだけにしたよ。認証&取得はJaneまかせに。
URLリンク(sub.jetabbs.org)

>>639もサンクスな。

641:デフォルトの名無しさん
07/01/21 18:53:04
ブラウザの機能の一環として、30分おきに自動で約10板分の
subject.txtを自動で読みに行くのは怒られる?

642:デフォルトの名無しさん
07/01/21 18:57:07
サーバーサイドだったら構わないだろうけど、個々のユーザーに自動取得させるのはどうかと思うよ。
使い道によっては嵐ツールに早代わりするから。

まあやるならしっかりとUAを名乗ることだね。

643:デフォルトの名無しさん
07/01/21 20:30:51
個人的には瞬間的にストレスかけるのは好きじゃないから、
もし同じような実装するとしたら3分おきに1つの板のsubject.txtを取りに行くようにするかな・・・


644:デフォルトの名無しさん
07/01/27 13:22:41
JBBS で倉庫行きになったスレって dat 取れないんだっけ?

645:デフォルトの名無しさん
07/01/27 15:23:36
>>644

>>495

646:644
07/01/27 22:19:08
>>645
だめなんすね。
どうもです。

647:デフォルトの名無しさん
07/01/29 14:21:05
板が移転したときの判定について質問です。
板更新しないとブラウザ上では移転前のURLのsubject.txtを読みに行きます。

ケース1:初めて読む板でIf-SinceModifiedを付けずにリクエストしたとき
スレッドが1つもないsubject.txtが存在していてHTTP StatusはOKが返ってきます。
このときはダイアログで板移転をうながせば良いかと思います。

ケース2:2回目以降読む板でIf-SinceModifiedをつけてリクエストしたとき
Not Modifiedが返ってきます。
通常、Not Modifiedが返ってきたらローカルのsubject.txtを読んで表示してます。
本当は移転先のsubject.txtを読まなければいけません。
この場合、どうやって移転したと判定すれば良いでしょう?
前回の読み込みから10分以上経っていたらIf-SinceModifiedを付けないとか?


648:デフォルトの名無しさん
07/01/29 17:22:50
subject.txtは書き込み毎に更新されるので、IMSフラグを
付ける必要はないと思う。それで帯域が節約されるとしたら
よっぽどの過疎板ってことだから。

649:デフォルトの名無しさん
07/01/29 18:01:42
>>647
なにか勘違いしてる
手元にあるsubject.txtが空でなければ、If-Modified-SinceつけてNot Modified が返ってきたら
サーバーのsubject.txtが空な訳はないだろ。

あと前にも書いたけど、If-Modified-Sinceじゃなくて If-None-Match 推奨。

650:647
07/01/29 18:12:28
>>648
うーん確かに。だったら単純に更新連打抑制機能だけつければいいのかな?
他のブラウザはどうなってるんだろう。

>>649
うお。確かに勘違いでした。
今は未だケース1のスレッドが1件も無かったら板移転と判断のロジックが入ってないので、
ローカルに空subject.txtが保存されますね。
それでIf-Since-Modifiedしたら、それは・・・すみません。
If-None-Matchの件も上のレス見て納得しました。


651:デフォルトの名無しさん
07/01/30 07:46:57
>>650
前にちらっと読んだ kage のソースでは、1秒以内の同じ URL へのリクエストは
シカトするようになってた気がする。

652:デフォルトの名無しさん
07/02/12 18:21:15
こっちにもはっておきますね。
キーワードを表示して欲しいとかって話みたいです。

★☆ひろゆきから2chブラウザ作者さんへお願い☆★
スレリンク(software板)

653:デフォルトの名無しさん
07/02/12 19:23:47
>>652
その「関連キーワード」ってなんじゃろか?

654:委員長 ◆/DABoneCRY
07/02/12 19:45:26
>653
例えばこのスレッドをIEで開いて、最上部を見て下さい。

キーワード【 dat monazilla ブラウザ gzip Encoding ch 取得 】

といった物があります。
それをクリックして貰えれば「ああ、なるほど」と分かって貰えると思いますよ。

655:委員長 ◆/DABoneCRY
07/02/12 19:46:45
むを!上げてもた……
見逃してやって下さい。

656:デフォルトの名無しさん
07/02/12 20:04:40
ふむふむ
URLリンク(p2.2ch.io) の後にURL貼付ければいいのか

例えばこのスレ(スレリンク(tech板)l50)なら
URLリンク(p2.2ch.io)スレリンク(tech板)l50 になるんだな

657:デフォルトの名無しさん
07/02/13 12:07:17
最後のl50、l100・・・、なしとかでキーワードの結果が違うのね
どれが一番良いんだろ?

658:デフォルトの名無しさん
07/02/13 15:59:13
>>654
ああ、なるほど。そのスレに関連するキーワードが自動的に抽出されて最上部に
検索リンクがはられるということか。

659:デフォルトの名無しさん
07/02/13 22:08:11
>>657
推測だが、指定範囲のなかでキーワードを拾ってるんじゃなかろうか

660:デフォルトの名無しさん
07/03/31 17:05:32
同じhost上のdatファイルを何個か連続して欲しいときって
Keep-Aliveのほうが効率いいと思うんだけど

GET /tech/dat/1174585528.dat HTTP/1.1
User-Agent: Monazilla/1.00
Host: pc11.2ch.net
Accept: */*
Accept-Encoding: gzip, deflate
Connection: Keep-Alive

こんなリクエスト5連ちゃんくらいしてもレスポンスヘッダには
全部 Connection: close が入ってるんだよね。
そもそも HTTP/1.1 でリクエストしてるから "Connection: Keep-Alive" いらないだろ
とか思って、なしでも試したけどどっちでも close されちゃう。
オレ的にはこれでも連ちゃんでdat取れるから、べつにいいんだけど 2chとしてはどうなの?

あと、もうひとつ質問なんだけど、巡回みたいなことするときに、
「最低でもリクエストの間隔はこのくらいは開けろ」、とか
「連ちゃんでのリクエストは何回までにしろ」とか「この時間帯は避けろ」とか
そういうのってないの? 常識の範囲ではわかってるつもりだけど、2ch的にはどうなんでしょ?


661:デフォルトの名無しさん
07/03/31 17:30:07
そのへんをあやふやにして運営してるのが2chです。
明確にすればそこスレスレで負荷をかけまくれるからね。

問題があればアク禁にされるってのが基本的な姿勢。

運営版でそれとなしに聞いてみればいいよ。
こんなサービスをしたいのですがどうですか~って感じで。

FOXかひろゆきに気に入られたら鯖も無料で貸してもらえるよ。
あと法人名で問い合わせればjigみたいに個別に対応してもらえるかもしれない。

662:デフォルトの名無しさん
07/03/31 18:14:07
こっちは「keep-aliveでもcloseでもいいよ」って選択肢をサーバーに示している。
サーバーがcloseを望んでるんだから気にしなくていい。

サーバーの仕組み上、Keep Alive のほうが負荷が高くなるケースもあって、
2chでは Keep Alive を無効にしていることが多い。

663:660
07/03/31 18:51:45
レスさんくす。

そんなもんなんだ。
けど、それってぎゃくに難しいよなぁー・・・


664: ◆TWARamEjuA
07/03/31 19:40:43 BE:3485748-2BP(6811)
(´-`).。oO(運用情報板を読んでいないんだろうなぁ。。。)

665:デフォルトの名無しさん
07/03/31 21:01:53
>>660のをハイパーターミナルで試してみた
プロパティでTCP/IP ポート80 アドレスはnslookupでとってきて。
さらに設定タブ>ASCII設定で
ν行末に改行文字
νローカルエコー
ν受信データに改行文字をつける
ν右端で折り返す
>>660のリクエストの行末に改行2つ(これがリクエスト・レスポンスのヘッダーとボディの分け目のマーク)つけてテキスト(req.txt)に保存して、
そして、もう一つテキストを作って(cap.txt)、転送>テキストのキャプチャ(cap.txt)
そして、転送>テキストファイルの送信(req.txt)でリクエスト送るとレスポンス返ってきた。
ここまではいいんだが、
でcap.txtをcap.htmlに変えて色々文字コード変えてもボディが文字化けしたままなんだけど、これはハイパーターミナルのエンコードが既にシフトJISだからかなあ?

666:デフォルトの名無しさん
07/03/31 21:41:58
自己解決しました
レスポンス
Content-Encoding: gzip
でした

667:デフォルトの名無しさん
07/04/10 11:29:28
最近2chブラウザ(とても使えるレベルじゃないのでみたいなもの)作ってるんですが、
be付きで書き込む場合って●を使って書き込むDOLIB 1.00の仕様と同じなんですか?

668:デフォルトの名無しさん
07/04/10 12:03:42
>>667
違うよ。全然違うよ。
beはcookieとしてメアドと認証コードを送る。
それぞれDMDMとMDMDというのがキーになっている。
そこ以外は通常時と同じようにPOST。
のはず。

669:667
07/04/10 12:16:06
やっぱり違いますか。ということは通常書き込むときは、

"Cookie: NAME=" + 名前 + "; MAIL=" + メール + "; " + 返ってきたSet-Cookie:のPONとexpiresとpath=/ + "; hana=mogera"

で書き込めてますけど、

"Cookie: NAME=" + 名前 + "; MAIL=" + メール + "; DMDM=" + be登録アドレス + "; MDMD=" + be認証コード + 返ってきたSet-Cookie:のPONとexpiresとpath=/ + "; hana=mogera"

で大丈夫ですか?
上記の名前、メールはURLエンコードしてますが、be書き込み時のbe登録アドレスとbe認証コードもURLエンコード必須ですか?

670:667
07/04/10 15:52:19
URLエンコードなしでBe書き込みできました。どうもです。

671:委員長 ◆/DABoneCRY
07/04/11 09:03:31
マルチですが、情報を。
書き込み不可となっているブラウザがいくつか発生しているそうです。

とりあえず、私が把握した情報だけ。
想像も入っているのですが、鯖側でクッキーの処理が変わったのか
複数行のクッキーだと受け取って貰えないようです。

//この処理だとダメ
IdhEdit->Request->CustomHeaders->Clear();
IdhEdit->Request->CustomHeaders->Add("Cookie:NAME="+CmbName->Text);
IdhEdit->Request->CustomHeaders->Add("Cookie:MAIL="+CmbMail->Text);
IdhEdit->Request->CustomHeaders->Add("Cookie:"+gCookie);

//この処理だとOK
IdhEdit->Request->CustomHeaders->Clear();
AnsiString CookieCode = "Cookie: NAME=" + CmbName->Text +"; MAIL=" + CmbMail->Text
+ "; " +gCookie;
IdhEdit->Request->CustomHeaders->Add(CookieCode);

実際には鯖側で処理を変えたのか、それとも鯖とIndyの相性(\nと\r\nとか)なのか
はたまた、Windowsアップデートがあったそうなので、それが影響しているのか不明ですが
とりあえず、A Boneでは、上記の変更で修正出来ましたので、ご連絡しておきます。

672:stream ◆PNstream2s
07/04/11 16:40:28
ちなみに、複数行のCookieは確か間違いなんで今回の件にかかわらず直したほうがいいです

673:デフォルトの名無しさん
07/04/30 15:56:11
ニコニコが人気らしいが、あんな風にプレイヤーと専ブラが融合した物を
誰か作ってみんかね。
キャプチャデバイスから映像を取り込みつつ、実況板(指定したスレ)から
ログを取り込んで重ねて表示とか。

674:デフォルトの名無しさん
07/05/01 11:37:38
そのアイデアは楽しそうだね。

キャプチャのメーカによってプログラムを変えないと
いけないだろうから複数の人に向けては難しいかもね。

ワンセグとかだと割りと簡単に取れたりするのかな?

675:デフォルトの名無しさん
07/05/01 22:06:44
ビデオデバイスを扱う汎用なインターフェースがあるっぽい?

676:デフォルトの名無しさん
07/05/01 22:31:33
古いものならVFW、最近のならWDM

677:デフォルトの名無しさん
07/05/02 00:20:53
テレビを表示してるウィンドウに、半透明化した専ブラのウィンドウを重ねればいいんじゃね?
と思ったが、テレビが見難い…
文字だけ表示し、ウィンドウの枠などが透明な専ブラがあればいいのかな

678:デフォルトの名無しさん
07/05/07 03:13:02
>>676
DirectShowだろ

679:デフォルトの名無しさん
07/05/07 20:36:05
read.cgi再開発スレ Part2
スレリンク(operate板:655-番)
> 655 :動け動けウゴウゴ2ちゃんねる :2007/05/07(月) 17:28:03 ID:KXXfawU50
> スレがdat落ちしてた時read.cgiなら>>1は読めるのに
> ●ログインしてない専用ブラウザだとスレタイすら分からないのはひどい
> 専ブラにもpastdat.soを開放するべきだ
>
> 656 :stream ◆PNstream2s :2007/05/07(月) 18:58:19 ID:3mprCz2C0
> スレリンク(operate板:768-769番)
> read.htmlが入ってるところなら、datファイルにUserAgentがMonazilla以外でアクセスすれば
> dat落ちしているならリターンコードが203で、内容がそれなりのものが返って来る。
>
> 657 : 株価【1540】 △△ ◆cZfSunOs.U :2007/05/07(月) 19:44:27 ID:T2091+Se0
> >>655-656 ただ,専ブラが Monazilla 以外の User-Agent をよこしてくるようになると
> 後々面倒なことになるかも知れない(専ブラとそれ以外の判別処理が煩雑になるなど)ので,
> 専ブラの各作者さんで話し合って,pastdat.so / anydat.so 対応であることを示す統一した目印
> (例えば User-Agent を Monazilla/1.00 (SomeBrowser/1.0; pastdat) のようにするとか)
> を決めてもらえるといいような気もします.
> そうしてもらえれば,pastdat.so / anydat.so に対応する処理を入れます.
>
> # 今は,pastdat.so が入ってるのは雪だるまだけ,anydat.so が入っているのは
> # read.html が入っている鯖だけなんですが,これやると anydat.so 全鯖配布になるのかな.

680:デフォルトの名無しさん
07/05/08 00:09:52
その通り pastdat を追加で良いんでね?
Monazillaのヴァージョン番号とかだと、更なる機能追加とかあったときに、
対応・未対応の区別が面倒だし。
BとCの機能は対応してるがAには未対応、みたいな。

681:n|a
07/05/08 22:10:22
>>679
実際にUAの値を使うのはサーバ側なので、
パースの容易さや将来の拡張性等の点でサーバ側に都合の良い仕様を
提案してもらった方がいいのではないでしょうか。

専ブラ側でUAに文字列を追加するのはそれほど問題にならないと思いますし。

682:●
07/05/09 00:11:19
話をぶったぎって悪いが
ようやく自作ブラウザでログインして書き込みできるようになったんで記念カキコ


683:デフォルトの名無しさん
07/05/09 00:24:40
>>679
独自のHTTPヘッダで対応するのは無理?

684:デフォルトの名無しさん
07/05/09 22:32:13
>>682
オメ

685:デフォルトの名無しさん
07/05/09 23:58:52
クッキーなしの状態からクッキーもらってbbs.cgiにポスト
するまでの処理がわかりません。誰かおせーて。
あとスレのたてかた。

686:デフォルトの名無しさん
07/05/10 21:08:18
どこまで調べた・試したかくらいは書こうぜボーヤ

687:デフォルトの名無しさん
07/05/10 21:39:36
>>685
IE等の普通のWebブラウザと同じだよ。

688:デフォルトの名無しさん
07/05/15 11:04:58
>>679に興味のある作者って少ないんだね。

689:○
07/05/15 13:52:52
買えよ

690:●
07/05/15 13:53:43
ってログインしとらんかった・・・

691:デフォルトの名無しさん
07/05/15 21:18:11
●飼うほど使わないしぃ・・・

692:デフォルトの名無しさん
07/05/16 10:40:22
1だけ読めてもねぇ

693:デフォルトの名無しさん
07/05/16 16:47:53
>>685
俺はだいたいこんなかんじ。

1. リクエストヘッダーのクッキーに、ローカルに保存しておいたクッキーの値を読み込む。クッキーが無い場合は空。
2. bbs.cgiにポスト
3. レスポンスを読んで、「書きこみました。」の文字があれば終了。
4. レスポンスを読んで、「書きこみ確認」の文字があれば、レスポンスヘッダーのクッキーをローカルに保存する。1へ戻る。(※無限ループにならないように戻るのは1回だけ)
5. レスポンスを読んで、3,4以外だったらエラーなので終了。


スレ立ての場合は、ポストする内容から key=datキー を削って代わりに subject=スレ名 を付け加える。
それと submit=書き込む を submit=新規スレッド作成 に変えるだけで後はレス書きこみと同じ。

694:デフォルトの名無しさん
07/05/16 22:30:15
>>693
なるほど、参考になりました。ありがとう。

695:デフォルトの名無しさん
07/05/17 00:06:44
2chブラウザで使う主機能(datの取得とか書き込みとか)をまとめたライブラリを
誰も作らないのはなんでなんだぜ?

696:デフォルトの名無しさん
07/05/17 00:16:13
調べりゃわかるのに何で作るんだぜ?

調べてもわからなければここで聞けばいいんじゃね?

697:デフォルトの名無しさん
07/05/17 00:38:42
>>695
lib2chってのがあったよ。

698:デフォルトの名無しさん
07/05/17 11:32:57
言語もOSもバラバラだから作ろうにも・・・

699:デフォルトの名無しさん
07/05/17 17:27:08
OSXならThousand2chとか

700:デフォルトの名無しさん
07/05/17 17:43:31
>>695
じゃあとりあえずCのソケット関数で作ってくれ
#include <sys/socket.h>

#include <winsock.h>


701:デフォルトの名無しさん
07/05/17 19:27:19
CかC++でHTTPを扱うライブラリで何かお勧めない?
OSはWindowsかun*xで

702:デフォルトの名無しさん
07/05/17 19:44:02
WinHttp

703:デフォルトの名無しさん
07/05/17 21:07:35
>>695
JavaとC#で使えるライブラリお願いします><

704:デフォルトの名無しさん
07/05/18 00:46:15
Jakarta HttpClient

705:デフォルトの名無しさん
07/05/18 00:49:18
>>695
書き込みの仕様が不定期に変わるから。

706:デフォルトの名無しさん
07/05/18 01:01:59
そこで誰かがライブラリを修正すればみんなハッピー!

あー幻想幻想

707:デフォルトの名無しさん
07/05/18 08:17:16
俺じゃない誰かがOpenLib2chを作成するんだ!

708:デフォルトの名無しさん
07/05/18 10:12:22
必要なのはライブラリではなく、
明確な仕様とその変更の通知

709:デフォルトの名無しさん
07/05/18 21:32:22
ここだな
URLリンク(info.2ch.net)

710:デフォルトの名無しさん
07/05/20 01:41:34
まちBBSに対応させたいんですが、
2chと違ってread.cgi経由で読み出すしかないんですかね?

711:デフォルトの名無しさん
07/05/20 22:06:43
うん
まちはread.plだけどね

712:デフォルトの名無しさん
07/05/21 00:58:03
ありゃread.cgiで組んじゃった
でもちゃんと動作してるみたいだし良いか

それにしてもまちBBSのread.cgiが吐き出すhtmlって汚いなぁ

713:デフォルトの名無しさん
07/05/22 01:37:42
ちょっと質問
2chブラウザの起動時オプションとかでexeにURL渡すとそこを開いてくれるって
あるじゃない?
あれって

なんたら.exe http://ホスト名/test/read.cgi/板キー/スレキー/

で、統一されてるのかな?
Janeしか使ってないんで他のがどうなってるか知りたいんだ

714:デフォルトの名無しさん
07/05/22 02:42:45
ギコナビはそれでいった。

715:デフォルトの名無しさん
07/05/22 15:00:03
へぇ
起動オプションでURL渡すとかそんな使い方あったのか



716:デフォルトの名無しさん
07/05/22 20:24:54
統一したって話は聞かないから、ブラウザごとにバラバラじゃないかね。

717:713
07/05/22 20:51:58
情報アリ
ツール作ってて、取得したURLから2chブラウザで直接開けると便利だなぁと
思って聞いたんだが開けないの使ってる人はあきらめる!って方向で行くわ

だいぶ形になってきて後はデバグだorz

718:デフォルトの名無しさん
07/05/22 21:53:26
普通に考えて、標準のURL以外の形式に限る理由なんかないだろう。

719:デフォルトの名無しさん
07/05/22 22:00:59
2ch専用のスキームがほしいかな
2ch://pc11.2ch.net/test/read.cgi/tech/1057329161/
これで普通のブラウザと区別できる

720:デフォルトの名無しさん
07/05/22 22:32:31
2ch.net/test/read.cgi/
の部分はチェックすればいいだけじゃね?

721:デフォルトの名無しさん
07/05/25 01:58:17
実装しちゃるって奇特な専ブラ作者さんはおられんかの

【要望】
スレッド上に貼られた、MD5、SHA-1等のハッシュ値に該当する画像ファイルが
特定の指定したフォルダにあった場合にサムネイル表示する機能

ぶっちゃけ壊滅しつつある画像うpろだの代替機能を
P2Pソフト+専ブラで実現できんものかと

722:デフォルトの名無しさん
07/05/25 12:36:45
著作権法違反幇助の罪で捕まっちゃわない?

723:デフォルトの名無しさん
07/05/25 19:03:15
専ブラ自体はローカルのファイル検索して表示するだけだし問題無いと思う。

で、P2Pソフトの方はnyとかだとタイムリーなネタは無理だね

724:デフォルトの名無しさん
07/05/26 21:23:54
特定のフォルダにある画像ファイルのハッシュをあらかじめキャッシュしておく必要はあるかな。
あと、ハッシュらしき文字列を判定する機能も必要。

725:デフォルトの名無しさん
07/06/02 06:07:07
画像ファイルの入手も問題だな。

726:デフォルトの名無しさん
07/06/02 14:18:51
というか、別に専ブラで実装しなくとも
URLリンク(localhost:12345)
みたいなのでできそうな気がする。

727:デフォルトの名無しさん
07/06/02 17:22:08
スレ上に張られたハッシュ値をいちいちコポペするのかい

728:デフォルトの名無しさん
07/06/12 14:04:27
エンジン内臓を誰か作ってください。
エンジン内臓を作ってよ

ギコナビからIEやjaneから

729:デフォルトの名無しさん
07/06/12 15:24:06
日本語でおk

730:デフォルトの名無しさん
07/06/12 22:40:17
臓物を作るのか

731:デフォルトの名無しさん
07/06/12 22:48:03
内臓はグロイからやだ。

732:デフォルトの名無しさん
07/06/26 18:15:46
live2chみたいな実況中継型のブラウザを作ってみたいんだけど連続してスレをリロードするとき
最低でも何秒以上あけないと荒らしと認定されてアク禁食らうようなことになったりしない?

733:気まぐれアナスイ
07/06/26 18:54:45
>>732
個人で管理なので大変なのでしょう…
termkeep.される事を理解できれば その様な状態には為らないと思います。


734:デフォルトの名無しさん
07/06/30 17:06:09
>>732
日本語勉強しろ

735:デフォルトの名無しさん
07/06/30 17:19:32
>>733
> termkeep.される事を理解できれば

なるほど、その間隔は2ちゃんの鯖から制御されるのか

736:デフォルトの名無しさん
07/06/30 19:25:24
行く先々でこのコテ見かけるわ最近

737:デフォルトの名無しさん
07/07/03 15:39:32
URLリンク(info.2ch.net)
鯖死んでるの?なんかさっきから鯖から応答がない・・・

738:デフォルトの名無しさん
07/07/03 15:54:35
>>737
サーバーダウン(鯖落ち)情報 part159
スレリンク(operate板:183-番)

739:デフォルトの名無しさん
07/07/03 15:58:07
把握。
ひろゆき( ´Д` )

740:デフォルトの名無しさん
07/07/21 18:41:47
よくある次スレ検索機能みたいなのってどういう仕組みになってんの?

741:デフォルトの名無しさん
07/07/21 22:22:38
>>740
基本的には、スレタイの先頭数文字の一致。あとは【】をとばすとか、いろいろ考えられると思う。

742:デフォルトの名無しさん
07/07/21 23:06:53
結局自分で探すのが一番

743:デフォルトの名無しさん
07/07/21 23:15:07
自分で探すときの考え方をそのままプログラムに反映させるだけだろ
・・・と口で言うほど簡単ではないけど、基本的にはそうだと思う・・・

744:デフォルトの名無しさん
07/07/22 03:10:59
ということは高精度なOCRが必要になるってことでしあ

745:デフォルトの名無しさん
07/07/22 19:54:46
>>740
Janeはコサイン係数で文字列の類似度から次スレを見つけてるみたい。

twintailは文字列を単語毎に分解してるだけだから簡単な実装で大丈夫だと思うよ。

746:デフォルトの名無しさん
07/07/25 11:41:26
webブラウザで
スレリンク(tech板:6番)
を見たときに >>6 だけじゃなく >>1 も表示されるのって
前からそうだったっけ?

747:デフォルトの名無しさん
07/07/25 13:14:24
>>746
>>6しか表示されないけど?
l6だと最後の6レスと>>1が表示される
nl6とかl6nにすると>>1は表示されない

748:746
07/07/25 15:02:29
あ、ごめん、JavaScript モードにしてるからだったみたい。
CGI モードだと 6 だけだった。

749:デフォルトの名無しさん
07/08/25 00:29:06
一ヶ月書込みがないな

750:デフォルトの名無しさん
07/08/26 11:34:22
役割を終えたということで・・・・

751:デフォルトの名無しさん
07/08/26 17:39:04
2chの仕様変更でもない限り盛り上がらないだろうな

ところで2ch以外の掲示板の話題はスレ違い?
俺はまちBBSのスレッド取得について詳しく書いてあるサイトがあれば教えて欲しいんだが。
あぼーんがあるとsubject.txtに書かれているレス数と最終レスの番号がずれるのでどうやって差分取得をすればいいのかわからない。

752:デフォルトの名無しさん
07/08/26 18:17:50
あぼーんなら差分取得はしない


753:デフォルトの名無しさん
07/08/26 19:01:49
>>751
DATで取れないのは最初から読み直し

754:デフォルトの名無しさん
07/08/26 20:37:53
まちBBSって .cgi ファイルになってて取得できなくない?
どうやってあぼーん検出するの?

755:デフォルトの名無しさん
07/08/26 21:27:47
>>754
>あぼーんがあるとsubject.txtに書かれているレス数と最終レスの番号がずれるので

756:デフォルトの名無しさん
07/08/26 22:41:49
それってスレを取得する度にsubject.txtも更新する必要があるような・・・

757:デフォルトの名無しさん
07/09/05 23:40:09
誘導されました。
2chブラウザ作っているのですが、qb5.2ch.netに書き込み確認のcookieタグを
取得しようとしても正しく取得できません。
調べるとhttpのヘッダが他のサーバーと違います。
これはどうしてですか?

書き込みをしようとした時にcokkieが書かれたヘッダです。
---------------
news22.2ch.net
---------------
HTTP/1.1 200 OK
Date: Tue, 04 Sep 2007 14:49:57 GMT
Server: Apache/2.0.55
Set-Cookie: PON=***********; expires=Friday, 01-Jan-2010 00:00:00 GMT; path=/
Set-Cookie: HAP=******; expires=Friday, 01-Jan-2010 00:00:00 GMT; path=/
Vary: Accept-Encoding
Content-Length: 1911
Connection: close
Content-Type: text/html; charset=shift_jis

---------------
qb5.2ch.net
---------------
HTTP/1.1 200 OK
Date: Tue, 04 Sep 2007 14:37:59 GMT
Server: Apache/2.0.52 (Unix) PHP/4.3.10 mod_ssl/2.0.52 OpenSSL/0.9.7c-p1
Set-Cookie: PON=***********; expires=Friday, 01-Jan-2010 00:00:00 GMT; path=/
Set-Cookie: HAP=******; expires=Friday, 01-Jan-2010 00:00:00 GMT; path=/
Vary: Accept-Encoding
Connection: close
Transfer-Encoding: chunked
Content-Type: text/html; charset=shift_jis

758:デフォルトの名無しさん
07/09/06 00:00:28
HTTP/1.1を名乗っているのにChunked-Transter-Encodingを理解しない者は
腹を切って死ぬべきだ。詳しくはRFC2616で熟知すべし。

759:デフォルトの名無しさん
07/09/06 00:06:01
HTTPヘッダが違うのは鯖がそういう環境だからだろう。
ていうかヘッダ見る限りクッキー取得できてるじゃねぇか。


760:デフォルトの名無しさん
07/09/06 00:17:10
>>758-759
どうもありがとう。
Chunked調べたら分かりました。

761:デフォルトの名無しさん
07/09/09 14:07:51
【鯖落ち】板の不具合報告スレ+9【重い重い重い重い重い.....】
スレリンク(tawara板)&START=218&END=218

知らぬ間にread.cgiになってたのね

それ以外の情報がまだ無いけど・・・

762:デフォルトの名無しさん
07/09/09 18:50:28
まだじゃね?

763:デフォルトの名無しさん
07/09/10 08:57:18
>>761
情報サンクス。
dat直読みか、rawmodeを載せてくれるとうれしいなあ。
差分取得が楽になる。


764:デフォルトの名無しさん
07/09/18 14:32:06
monazilla.org 更新再開されてたんだな。
phpのWarningがでまくってるけど。

765:デフォルトの名無しさん
07/09/18 18:01:29
他力本願だけどなw

766:デフォルトの名無しさん
07/09/18 21:10:07
Warning: main(module/asm4cmt/): failed to open stream: No such file or directory in /home/monazill/public_html/index.php on line 116

Warning: main(): Failed opening 'module/asm4cmt/' for inclusion (include_path='.:/usr/local/lib/php') in /home/monazill/public_html/index.php on line 116

Warning: Cannot modify header information - headers already sent by (output started at /home/monazill/public_html/index.php:116) in /home/monazill/public_html/index.php on line 1542



ググッてもmonazilla.orgのキャッシュしか見つからないぜw

767:デフォルトの名無しさん
07/09/28 23:35:37
BBS_THREAD_TATESUGI=64

おそらく連続してスレ建てするのを規制する行だと思うんだけど
64とされていた場合、次にスレ建てできるようになるまでどのくらいの
時間がかかるんだっけ?

768:デフォルトの名無しさん
07/09/28 23:45:56
スレリンク(operate板:947-948番)n

769:デフォルトの名無しさん
07/09/29 15:17:11
>>767
新しいスレが64個立つまで

770:デフォルトの名無しさん
07/09/29 16:53:25
過疎スレで64個って永杉だろorz・・・

771:デフォルトの名無しさん
07/09/30 10:26:28
過疎はきついなw

772:●
07/09/30 13:04:33
買え

773:デフォルトの名無しさん
07/09/30 16:10:07
買わされ続けて解約できないと聞いたから嫌

774:○
07/09/30 16:45:20
解約手続きしたこと無いからわからんが
2chをやり続ける限り●も買い続けるぜ。

775:●
07/09/30 16:45:48
ログインしてなかた

776:デフォルトの名無しさん
07/09/30 18:15:45
メール送ったら解約できたぜ。
送ったメールに対する返信・確認や連絡は一切なくてうさんくさいこと
この上なかったが、引き落としされなくなってた。

二度と買わねぇ

777:デフォルトの名無しさん
07/10/31 02:08:43
指定した2ちゃんの特定の板にある全てのスレを読み込んで
特定の文字、ID、名前、E-mail欄で検索をかけるちょっとしたツール
を自作しよかと思ってるんだけど似たようなツールって既に現存したりする?

778:デフォルトの名無しさん
07/10/31 10:03:01
転送量・・・一つの板だけならそんなでもないかな。わかんないけど><

779:デフォルトの名無しさん
07/10/31 11:15:41
個人的にやるなら大丈夫だけど、ツールを配布するなら狐が激怒するから注意。

了承取っとかないとちょっとしたクロールでもバンされるから。

780:デフォルトの名無しさん
07/10/31 11:22:36
そんなのUserAgentを適切に設定すればOK

781:デフォルトの名無しさん
07/10/31 11:31:15
クロールはip単位でバンしてるから。
ちょっと前まではgooglebotさえバンしてたぐらいだから。

みみずんやら閉鎖したにくちゃんねるやら、2nnとかは
ipの範囲を申告して了承を受けて取得してる。

782:デフォルトの名無しさん
07/10/31 11:59:04
あいつら最近そういうの取り締まるのやる気ないから

783:777
07/10/31 12:17:20
了解ッス。
キワモノの扱いってことはそういうツールは公にはなさそうだね。
というわけで自作する道を選びます(・ω・)ノシ

一つの板にある全てのスレを読み込んでいくわけになるんだけど
何秒以上間を置いてから読み込んだ方がいいとかわかる?
そこらへんも実際にやってみないことには何ともいえないのかな?

784:デフォルトの名無しさん
07/10/31 13:00:32
運営側は何秒までならいいですよ~なんて絶対に言わない。
言えばそこギリギリで負荷を掛ける奴がいるから。

定期的にクロールすれば負荷のグラフが突出、
するとログを調べられて規制の対象になる。

その辺りの調整はrootがやってるから、該当スレと負荷グラフを見てこっそりやるしかないわ。

785:デフォルトの名無しさん
07/10/31 13:06:13
ちなみに公式の本文検索や投稿者検索は有料であります。
URLリンク(find.2ch.net)

786:デフォルトの名無しさん
07/10/31 13:07:05
逆に配布してみんなやるようにすればいい
そうすれば自分だけ目を付けられることはなくなる

787:デフォルトの名無しさん
07/10/31 13:23:38
>>786
鬼才現る

788:デフォルトの名無しさん
07/10/31 13:28:16
2chは最近はそれほど負荷に悩んでるって訳でもない。
サーバーの能力の伸びは今では利用者数の伸びをはるかに上回っているし。
それにひろゆきの年収を考えてみろ、いざとなればサーバーなんていくらでも増強するだろう。


789:デフォルトの名無しさん
07/10/31 14:15:15
設備をケチれば狐の会社が儲かる不思議。
rootは知的好奇心から鯖運営を無償でしてる(ことになってる)。

実際ひろゆきは2chのサーバー代は全く払ってない。(BE鯖、ひろゆき直轄を除く)
●のプール金から払ってることにしてるだけ。

790:デフォルトの名無しさん
07/10/31 15:27:41
たしかそれがひろゆがたとえ逮捕されても死んでも2ちゃんはすぐには無くならない根拠となってるよな

791:デフォルトの名無しさん
07/10/31 18:01:35
逮捕されたり死んだら、実際にサーバーがあるアメリカの会社のJimが
ひろゆきの代わりに管理人になると言われてる。

ちなみに彼はbbspinkの管理人ね。
内紛があって狐とはあまり仲がよくないけど、今でも一応ビジネスパートナー。

792:デフォルトの名無しさん
07/11/01 09:27:46
>>788
この場合は負荷ではなく転送量の問題の方が大きいと思うが・・・

793:デフォルトの名無しさん
07/11/01 09:29:11
>>792
転送量に悩んでるって話も聞かないな

794:デフォルトの名無しさん
07/11/01 11:14:23
よーしパパ、自作専ブラのgzip転送サポートしないで作っちゃうぞー

795:デフォルトの名無しさん
07/11/01 13:40:33
今出回ってる奴らはgzipサポートしてんのかね

796:デフォルトの名無しさん
07/11/01 13:49:59
そういえば鯖によってはgzip圧縮しないと転送してくれないものもあるんだっけ?
主要な2ちゃんブラウザってどれもgzip圧縮でやりとりしてるの?

797:デフォルトの名無しさん
07/11/01 13:55:32
offlaw.cgi経由はgzipでないと無理じゃなかったっけ

798:デフォルトの名無しさん
07/11/01 18:07:45
>>795
gzip受けられないと5年前ぐらいの過去ログがとれなくなるから
さすがにしてるんじゃね?

799:デフォルトの名無しさん
07/11/01 18:34:08
2ちゃんのログをC#を使って取得しているんだけどその際参考にさせてもらってる
サイトが↓

URLリンク(dobon.net)

WebRequestクラスを使ってログを取得しているんだけど上記のページで紹介されてる
サンプルプログラムってgzipデータをやりとりなんてややこしいことやってないよね?

gzip圧縮しなくてもログ取得できてるから気にしてなかったんだが、もしgzip圧縮された
ログを取得して読めるようにするには上記のサンプルプログラムをどう改造したらいいの?

800:デフォルトの名無しさん
07/11/01 18:41:28
URLリンク(www.atmarkit.co.jp)

これじゃだめ?

801:デフォルトの名無しさん
07/11/01 18:43:52
>>799
2.0以降なら
HttpWebRequest.AutomaticDecompression

802:デフォルトの名無しさん
07/11/01 19:02:51
>>800-801
ありがとう(・ω・)ノシ

でも.NET 2.0以降じゃないと対応してないのか・・・
あいにく1.1(VS2003)で開発しているんだよね(´・ω・`)

803:デフォルトの名無しさん
07/11/02 09:10:29
>>802
今時1.1はちとアレだ、Express Editionでも落として来い

と言いたいところだが

804:デフォルトの名無しさん
07/11/04 01:52:33
お題: 完成した専ブラをみんなに使ってもらうには

805:デフォルトの名無しさん
07/11/04 03:32:37
Microsoftに売り込んでWindowsにバンドルしてもらう

806:デフォルトの名無しさん
07/11/04 12:18:21
>>804
monazillaに登録されると一気に人が押し寄せてくるよ

807:デフォルトの名無しさん
07/11/06 11:21:52
いらないレスを削除してスレをまとめる機能を専ブラに付けようと思ってるんだが。
一体どう計算させればできるのだろうか?

独自ファイルを一時的に作り、datに毎行移動フラグを付加してみたら良いのか。
 読み込んだdat
  ↓
 一時保存ファイル(移動フラグ、フォントサイズ変更フラグ、色変更フラグなど付加)
  ↓
 HTML変換

808:デフォルトの名無しさん
07/11/06 11:46:02
いらないレスは透明あぼん扱いにして飛ばしちゃえば?

809:デフォルトの名無しさん
07/11/06 19:50:35
>>808
それどうやれば使えるの……ってググってくるよ。
あぼ~んのやり方知らないとか、やっぱりdatの扱い方を熟知しないと辛いか……

810:デフォルトの名無しさん
07/11/06 22:42:30
dat->html変換にはかけてるんでしょ。その変換がレス単位なら、
外部条件によって実行するか、<--あぼん-->とだけに
するかだけの話じゃないの?

811:デフォルトの名無しさん
07/11/06 23:01:09
どんなスキルで作ろうとしてるのか不安になるな・・・

812:デフォルトの名無しさん
07/11/07 09:09:01
工エエェェ(´д`)ェェエエ工工

>>809
こんな感じかな
dat読み込み

本文とか名前欄でいらない物が入ってるかチェックしていらないものはあぼん書き換え
ここでサイズ変更とか色変更もここでやればいいと思う

一時ファイルに書き出し?

html変換

813:デフォルトの名無しさん
07/11/07 12:24:35
>>811
javaで作る予定。
スキルは……2chの仕様書は何となく理解できたくらい。

>>812
そんな感じ。
そう複雑になるものではないはずなんだけど、もしかしたら無駄な行程を入れてしまっているのかも知れない……

814:デフォルトの名無しさん
07/11/07 21:12:02
>>813
> 2chの仕様書
kwsk

815:デフォルトの名無しさん
07/11/07 21:20:08
>>814
これ。
URLリンク(www.monazilla.org)

816:デフォルトの名無しさん
07/11/07 21:44:26
ところで、スレまとめソフトを公開してはいけない規約とかあったか?
参考にしようとしたらどこ探しても見あたらないんだ。
2chまとめブログが最近増えてきてるからどっか大手が作ってるんだろうなと思ってたんだが、ないんだな。

817:デフォルトの名無しさん
07/11/08 10:53:24
>>816
2ちゃん消滅騒動以来負荷をかけない、転送量を抑えるというのが暗黙の了解と思っている。
取得したdatに関してはどう使おうが問題はないはず

818:デフォルトの名無しさん
07/11/08 13:41:36
どなたかdatをHTMLに変換する方法を優しく教えてくれませんか。
形式を見てもどうすれば本文を<b></b>で囲ったり名前の前に番号を振ったりできるのか分かりません……

819:デフォルトの名無しさん
07/11/08 13:45:19
ただの文字列操作だ。

Jane等のオープンソースのコードを読んでみろ。

820:デフォルトの名無しさん
07/11/08 14:11:36
ありがとうございます。

821:デフォルトの名無しさん
07/11/08 15:59:32
>>818
おいおい
datを1行読んで<>で分解して本文の前後に"<b>"と"</b>"を結合するだけだろ

822:デフォルトの名無しさん
07/11/08 16:45:18
>>818
ぶっちゃけお前に2ちゃんブラウザは無理。
見た目より難易度高いよ、作るの。

823:デフォルトの名無しさん
07/11/08 21:09:47
>>818
正規表現でグループ化すれば

824:デフォルトの名無しさん
07/11/21 20:49:25
作って公開して自らスレを立ててもいいのだろうか
Duawinなんかは1=開発者のようだが

825:デフォルトの名無しさん
07/11/21 21:24:17
宣伝しなきゃデバッグしてくれるユーザーは現れないよ。

826:デフォルトの名無しさん
07/11/21 22:03:25
つか、良いとか悪いって基準はなんなんだよw

827:デフォルトの名無しさん
07/11/21 22:28:14
>>824
是非お願いします。

828:デフォルトの名無しさん
07/12/02 07:03:27
逆襲スレ落ちてしまったのか。

829:デフォルトの名無しさん
07/12/24 23:15:39
逆襲からここにたどり着くのが大変だった

830:デフォルトの名無しさん
08/01/13 02:59:27
age

831:デフォルトの名無しさん
08/01/24 15:05:57
PSPから書き込み

832:デフォルトの名無しさん
08/01/24 15:22:41
もう一度

833:デフォルトの名無しさん
08/01/24 15:43:58
しつこく
改行
テスト

834:名なし
08/01/24 16:02:08





835:デフォルトの名無しさん
08/01/24 16:07:03
たなは

836:デフォルトの名無しさん
08/01/24 17:12:22
ここにも貼り
URLリンク(foo-bar-web.hp.infoseek.co.jp)
PSP用のmonazillaです

837:デフォルトの名無しさん
08/01/25 10:11:38
おぉ、乙!

838:デフォルトの名無しさん
08/01/25 16:54:51
てすと


839:デフォルトの名無しさん
08/02/10 18:02:13
ただいまmonazilla.orgでは、記事を投稿して下さる方を募集しています。
2ちゃんねる専用ブラウザの開発者様は是非ご応募ください。

URLリンク(www.monazilla.org)

840:デフォルトの名無しさん
08/02/10 23:50:54
>>839
目的は何?

841:デフォルトの名無しさん
08/02/11 02:39:39
>>840
monazilla.orgを盛り上げて、2chブラウザの世界も盛り上げるためでしょう。

>>839
宣伝で、一言ずつソフトウェア板の2chブラウザのスレに声をかけてみたら?

842:デフォルトの名無しさん
08/02/11 21:03:20
>>839
ここは技術的話題がメインだから >>841 が言うようにソフトウェア板の
例えば乱立スレとかに・・・んーそれはそれで問題が起きそうだな・・・

843:デフォルトの名無しさん
08/03/24 12:48:49
………

844:デフォルトの名無しさん
08/03/27 13:25:20
今まで動いていた●での過去ログ読み込みができなくなりました・・・
Firefoxでofflaw.cgiへのsid付きURLベタウチ&User-Agent:Monazilla/1.00 kage(1.00)だと
きちんと読めました。
これと同じURLで自分のプログラムから送信しても
-ERR もうつかえません
となります。
User-Agentの指定、セッションのURLエンコード、他に何かミスりそうなことありますかね。

845:デフォルトの名無しさん
08/03/27 14:10:44
>>844
Firefoxでクッキー削除してみたらどうなるかな
FirefoxアドオンのLive HTTP headersでリクエストとレスポンスを確認してみたら何かわかるかも


846:デフォルトの名無しさん
08/04/13 12:22:41
UTF8になるのかな・・・

datをUTF8にするのはどうだろうスレッド
スレリンク(operate板)

847:デフォルトの名無しさん
08/04/13 14:32:29
何か問題でも?>DATのUTF8化

848:デフォルトの名無しさん
08/04/13 19:32:13
文字コードの変更だからめちゃくちゃ面倒だろ。

BE板のみがEUCになったときでも対策大変だったのに。

849:デフォルトの名無しさん
08/04/13 22:10:54
EUCはSjisに変換すれば良いだけだったけど、
UTF8はSjisに含まない文字もあるので大変
内部処理も表示も変えないと

850:デフォルトの名無しさん
08/04/13 22:54:24
全部UTF-8に変換すればいいじゃない

851:デフォルトの名無しさん
08/04/13 22:58:51
Windows9xのころからあるレガシーな開発環境だと
Unicodeまともに対応してないとかありえるけど
Windows2000が登場して8年だし、もう仕方ないよな

852:デフォルトの名無しさん
08/04/13 23:14:55
仕様変更するなら早い方がいい
後になればなるほど対応が大変になる

853:デフォルトの名無しさん
08/04/13 23:37:39
datサイズがどうなるとか、生きてるdatも変換してしまうのかとか、UTF8とSJISのdatが混在してしまうのかとか
過去ログはどうするのかとか、UTF8はUTF8専用のdatを用意するのかとか、古い専ブラ(開発が停止している専ブラ)を見捨ててしまうのかとか、
いろいろ問題があるようだからすぐにはやらないとは思うけどな

854:デフォルトの名無しさん
08/04/14 02:14:12
だがいつかはやらなきゃいけないことでもある

855:デフォルトの名無しさん
08/04/14 07:56:13
なんでやらなきゃいけないの?

856:デフォルトの名無しさん
08/04/14 13:31:44
遅くなる前にというけど、もう十分手遅れだと思われ・・・
やるとしたら既存のは捨て、新たなシステムで、ということになるだろう。
文字コードよりも、もっと仕様固める方がいいな。
エラーとかわけわかめ。

857:デフォルトの名無しさん
08/04/14 14:13:16
結局 >>846 のリンク先の話題は、専ブラ的にはまったく関係ない方向性で収束したっぽいね。

ひ(r 「dat を UTF-8 にしたい。read.js が使えるから。AAがまずい?」
stream 「UTF-8 にしてもAAは問題なし」
SunOs 「UTF-8 にしないと read.js が使えないって?IE6 では anydat.so でやってる」
ひ(r 「anydat.so って重くない?」
SunOs 「IE6 は捨てよう、JavaScript 周りが変だし」
stream 「Shift_JIS は腐っていやがる」
SunOS 「早すぎたんだ」
ひ(r 「anydat.so がなければ人大杉が無くなるんじゃ?」
SunOs 「別に anydat.so は重くない。read.js 全面移行できないのは IE6 が腐ってるから」
SunOs 「おいちゃんが『人大杉で read.html に振らないようにして欲しい』と言ってたし」
ひ(r 「ほいだら、人大杉のときは、read.htmlをデフォルトで動くようにしちゃってくださいー。」
スレリンク(operate板:93番)
SunOs 「した」

… と思ったらまだ何かやるつもりか。

stream 「多言語扱えたほうが便利でしょ」
未承諾 「perl 処理方面は軽くなる?」
 :
 :

ひ(r 「文字コードを変えるとしたら、サーバ移転ごととかそんな感じすかね。」
スレリンク(operate板:167番)
む 「UTF-8 にするなら、専ブラ的にも bbs.cgi 的にも SETTING.TXT でやるのがいいのでは?」
む 「2chの内部処理的な意味で」
む 「PC 方面は UTF-8 にしてもわりかし大丈夫そう。携帯方面はどうだろう?」
strem 「Shift_JIS の板と UTF-8 の板が混在するってこと?」
む 「混在するかどうかはともかく、bbs.cgi 的には両対応にしたい」
 :
 :

858:デフォルトの名無しさん
08/04/14 15:03:11
時期を指定して、これより以降に保存されるdatはすべてUTF-8で保存されます
と決めちまったらどうだ?

これなら各ブラウザも余裕を持って対応改修できるだろ。

859:デフォルトの名無しさん
08/04/14 19:09:44
まあ、猶予期間は必要だわな

860:デフォルトの名無しさん
08/05/23 06:26:47
あげ

861:デフォルトの名無しさん
08/05/26 15:24:30
さげ

862:デフォルトの名無しさん
08/05/27 15:47:47
サーバー型のブラウザを作ろうと思ってます
取得したDATをどの程度使っていいのか判断がつきません
DATをDBに格納して使うって著作権に触れないんですかね?

863:デフォルトの名無しさん
08/05/27 16:10:12
>>862
個人でサーバーにスクリプトを設置する方式だったら問題ないと思うよ。

公開型だったらdat落ちと同時にDBから削除しなければ、怖い人から訴えられるかもね。
ノラp2やorz、讃岐などを参考にね。公式p2やべっかんこは参考にはできない。

864:862
08/05/28 11:32:27
>>863
公開型を考えています
・常識的な負荷/転送量にする(差分取得・gzip)
・dat落ちは即削除

この辺を守れば問題無いと考えてよさそうですね
ありがとうございました

865:デフォルトの名無しさん
08/05/28 12:41:44
dat消さなくても問題ないだろ
過去ログ置き場とかいっぱいあるし

866:デフォルトの名無しさん
08/05/28 16:09:54
>>865
あれって厳密に言えばNGですよね?

867:デフォルトの名無しさん
08/05/28 16:32:30
dat落ちしてないスレッドとdat落ちしたスレッドで扱いが違うなんてことはない。
どっちも著作権的には同じ。

868:デフォルトの名無しさん
08/05/28 17:17:00
著作権ではなくて●の問題じゃないだろうか
dat落ちは運営の資金源にもなるわけで

869:デフォルトの名無しさん
08/05/28 17:20:31
>>864
人気が出たら常識的な負荷ではなくなるのが難しいところですが。
公式コンテンツになるか許可が下りれば問題はなくなりますがね。

>>867
当面の敵は著作権じゃない。
狐、root、ひろゆきだ。

870:デフォルトの名無しさん
08/05/28 18:01:29
とりあえず好きなように作ってみて
おこられたらまた考えればいいんじゃね?

871:デフォルトの名無しさん
08/05/28 18:36:31
>>865の通りだ
問題はない

872:デフォルトの名無しさん
08/05/28 19:52:44
dat 落ちした物を公開するのに金が絡まなければ、とりあえず問題ないんじゃない?
むしろ、公開型の問題は「書き込み機能」があるか否かじゃないかな。
いわゆる非公式の公開 p2 は軒並み N.G. 喰らってるべ?
書き込み機能を持たせたいなら、そこはひ(r とかおいちゃんとかに相談じゃないかな?

873:デフォルトの名無しさん
08/05/28 20:25:51
URLリンク(ss.chbox.jp)
とりあえずここ見てる限りバーボンが問題だな。
バーボンの除外は運営と利害が一致しないと回避は無理。

書き込み機能はひろゆきの管轄だな。
そして狐による規制の嫌がらせを受けるw(公式p2の例)

874:デフォルトの名無しさん
08/05/29 12:53:19
>公開型の問題は「書き込み機能」

これは何故だろう
荒らされやすいとか、それを通り越してアタックされやすいとかそんな理由なのでしょうか


875:デフォルトの名無しさん
08/05/29 13:22:30
>>874
鯖管がしっかり管理してないと身元を隠して書き込みできるようになるから

876:デフォルトの名無しさん
08/05/29 21:18:35
>>874
大きく分けて問題点は二つかな。

・せっかく2ch側でプロクシとか荒らし規制とかしているのに、そこから書き込み
 できるようでは意味が無い(まぁ、現状でも公式 p2 で似たようなケースはあるけど)
 → 現状、非公式な書き込み機能付き中間鯖は、のきなみ N.G.

・お上が「ログを出しなさい」と言ってきた場合、2ch -> 公開鯖管とお鉢がまわって
 くるけど、それへの事前の処理(ちゃんとログの管理をしているか)、対応。
 → まぁ、ログさえちゃんとしていればいいだろうけど(それでも膨大な量になるかと)

特に一番目の問題は、なんとか許可を取り付けても、少なくとも常に2chと同等
レベルの規制機構・処理が必要になるから、できたとしても大変だと思うぞ。

877:デフォルトの名無しさん
08/05/29 22:30:09
ノラp2は公開プロキシと同じだからね。
書き込み責任者を割り出せなければ管理人の責任になるとの理屈かな。

公式p2はひろゆきの関連企業の業務になったから問題はないんだろう。

878:デフォルトの名無しさん
08/05/29 22:40:18
なるほど
書き込みは公式に飛ばすのが無難かもね

879:デフォルトの名無しさん
08/05/30 02:31:11
公式p2はユーザ単位でのピンポイント制御できるからな

880:デフォルトの名無しさん
08/06/07 22:05:19
てs

881:デフォルトの名無しさん
08/07/18 19:02:20
勉強の為に専ブラ作ってるんですけど、dat⇒htmlって必要ですか?
てか表示部分はwebbrowser使うのが基本?

richtextじゃダメ…ですよね…

882:デフォルトの名無しさん
08/07/18 19:26:57
richtextでもかまわないだろ

883:デフォルトの名無しさん
08/07/18 19:27:10
まて
dat->htmlが必要かどうかをこのスレで聞くことにどのくらい意義があるんだ?

884:デフォルトの名無しさん
08/07/18 22:32:02
出力なんてどうにでもなるだろうjk

885:デフォルトの名無しさん
08/07/21 19:22:40
好きなようにつくればいいのです。

886:デフォルトの名無しさん
08/07/21 19:53:56
あ、レスついてた。
datからそのまま表示させるより、
html形式にしてから表示させるほうがいろいろ便利なのかなーと…。

まぁそれくらいもわからないほど知識ないって事です。すんません

887:はらぐろ
08/07/22 08:26:24
弱小ブラウザ開発のはらぐろとか言う者です。
サイト移転したんでmonazillaからのリンクも更新して欲しいので、
とりあえずここに書いておきます。
えくすちゃねらー
URLリンク(www.optimize0.jp)

888:デフォルトの名無しさん
08/07/23 23:12:00
>>887
URLリンク(monazilla.org)
更新しました。


URLリンク(jbbs.livedoor.jp)
に他の記者さんがいることがあるので次回はこちらからもどうぞ。

889:デフォルトの名無しさん
08/07/24 01:28:35
ちなみに記者募集スレッドというのがあります
記者になればmonazillaを自分で編集できますよ

URLリンク(jbbs.livedoor.jp)

>>886
richtextで作ったらスレに貼られたURLをクリックとか
ポップアップ表示とか制御できない(し辛い)気が

勉強でどの程度のものを作るのかによりますが

890:デフォルトの名無しさん
08/07/24 14:06:58
しばらく考えてwebbrowserで作ってたけど、レスポップアップで挫折です。
本当にありがとうございました。

誰か障りだけでもヒントください

891:デフォルトの名無しさん
08/07/24 16:02:53
>>890
OpenJaneのソース嫁
URLリンク(cvs.sourceforge.jp)

892:デフォルトの名無しさん
08/07/24 16:55:33
高度すぎて&デルファイで意味不明だったオワタ。
とりあえず別の勉強します。thx

893:はらぐろ
08/07/25 00:02:36
変更ありがとうございました。

894:デフォルトの名無しさん
08/09/13 18:35:27
保守ですまん

895:名無しさんだよもん
08/09/15 23:50:40
プログラマー諸氏がんがれ!

896:デフォルトの名無しさん
08/09/16 22:00:17
イヤなんか今さら開発しても出尽くしてるし・・・みたいな・・・

897:デフォルトの名無しさん
08/09/16 23:46:16
rep2がもっとクライアントサイドによらんかなってのはある
スレ一覧のソートぐらいならJavascriptでできるんじゃないか、とか

898:デフォルトの名無しさん
08/09/17 12:24:32
さすが kage だ何ともないぜ… Cookies.txt の hana=mogera 系エントリが無限に増えそうで
怖いけど

899:デフォルトの名無しさん
08/09/29 23:37:21
DATの差分取得を試みているんですが、

If-Modified-Since: リモートDATの最終更新時刻(値は応答ヘッダのLast-Modifiedを調べる)
Range: bytes=ローカルDATのファイルサイズ-

の2つを要求ヘッダに入れることは必須ですか?
それともRangeだけでも差分取得は出来ますか?

膨大な数のdatファイルごとにIf-Modified-Since値を記憶しておくのは管理が面倒です。
ローカルのDATファイルのサイズは簡単に調べられますのでRangeだけで差分取得
ができるのならプログラムはぐっと簡単になります。

URLリンク(age.s22.xrea.com)

900:デフォルトの名無しさん
08/09/30 00:19:40
あぼーんで減ったバイトと新たな書き込みで増えたバイトが
たまたま同じだった場合、rangeだけでどうする?

901:デフォルトの名無しさん
08/09/30 00:28:42
ローカルのdatファイルの最終更新日時を使うのじゃだめなの?

902:899
08/09/30 01:21:43
>>900
事前にsubject.txtをDLして各スレのレス数を解析しておこうと思っています。
これなら新たな書き込みがされればレス数が増えてるので、たまたまバイト数
が同じだった場合でもあぼーんを検知でき(実際何もDLされてこないわけですから)
ると思います。

>>901
ローカル側のファイル更新時刻をif-Modified-Since型に変換できるなら
それもありのような気がします。

903:899
08/09/30 01:28:28
ちょこちょこっとプログラムを組んでみたんですが、

if-Modified-Since

を指定しないと差分取得は出来ないようですね。
いくら Range でローカル側のファイルサイズを申告しても
1からdatを再取得してしまうようです。

差分取得するならローカル側のファイルの更新時刻をどうにかして
調べて if-Modified-Since に収納してやらないとならないようです(´・ω・`)

904:デフォルトの名無しさん
08/09/30 01:48:26
Last-Modifiedだけでなく、ETagも見た方がいい
>>424とか参照

905:899
08/09/30 02:33:59
>>904
たとえばC#でLast-Modifiedを保存するには

HttpWebRequest.LastModified

でリモートファイルの更新時刻を取得することができ、
またデータのフェチの際は

HttpWebRequest.IfModifiedSince

に更新時刻を出力すればサーバーとやりとりできました。

ETagに関してサーバから取得、出力するにはどうしたらいいでしょうか?
出力に関しては

HttpWebRequest.IfNoneMatch

でETagをサーバーに送信できるようですが、ETagの取得に関しては
どう操作すればいいか分かりません(´・ω・`)

906:デフォルトの名無しさん
08/09/30 05:08:15
ここで特定のフレームワークのこと聞かれてもな
まあ、普通に考えれば任意のヘッダを送受信する手段くらいあるはず
探せ

907:デフォルトの名無しさん
08/09/30 12:31:27
ETagにしろ更新日時にしろ応答ヘッダで返ってくるんだが
まずHTTPの資料を読むことを薦める

あと、>>902の方法だと透明あぼーんしか検知できなくないか?
subject.txtを毎回取得しにいく仕様もどうかと思うぞ



908:デフォルトの名無しさん
08/09/30 12:53:11
>膨大な数のdatファイルごとにIf-Modified-Since値を記憶しておくのは管理が面倒です。
そもそもこんなことを言ってる時点で(以下略

他の専ブラ参考にすれば?
datと同名のidx作って管理するとか、データベース使うとか、datの扱いの基本中の基本でしょ。

909:デフォルトの名無しさん
08/09/30 13:01:47
たまにだけど、subject.txtのレス数と実際のレス数が違うことがあるから100%信用すると痛い目に遭いそう

秒単位の更新チェックは知らなかった・・・ツール更新しなきゃ

910:899
08/09/30 15:08:16
ETagはサーバーが返してくる値をローカルに保存しておかないといけないですか?
ローカルに保存したdatファイルからETag用の値を計算できればわざわざ
ローカルにETag値を保存しておく必要は無くなると思うのですが。

911:デフォルトの名無しさん
08/09/30 15:35:24
じゃあそうすれば?


912:デフォルトの名無しさん
08/09/30 19:49:15
ローカルに ETag を算出…?どうやって?まさか「ETag 計算方法」とかでググって
出てくるものを実装して「たまたまそのとき一致したらからおk」とか思ってないよな?

913:デフォルトの名無しさん
08/09/30 20:55:40
弱いETagならローカルで算出やつでも通用するんじゃない?
強いETagはまず不可能だろうけど

914:899
08/09/30 21:45:35
話は変わりますが、サーバーにDATを要求し、返ってきたヘッダーに書かれた情報を見ようと

GetResponseHeader("Content-Range")

という命令を書いてみたのですがなぜか何も取得できませんでした。

GetResponseHeader("Content-Length")
GetResponseHeader("Content-Type")

はきちんと値が返ってきました。

2chの鯖には変数"Content-Range"を返さないものがあるということでしょうか?

915:デフォルトの名無しさん
08/09/30 21:49:47
送るヘッダが間違ってるだけだろ

916:デフォルトの名無しさん
08/09/30 22:05:37
誰か多段ポップアップの方法をVBでお願いします。
あれはスキンとかに対応してjavascriptで実装したほうが簡単なのでしょうか…

917:899
08/09/30 22:47:34
もう一つヘッダがらみの質問です

2chでは転送量を抑えるためGZipで圧縮をかけたデータのやりとりを推奨
しているようです。そこで以下のように(言語はC#です)GZipフラグをヘッダ
に付けてリクエストを出すようにしています。

webRequest.AutomaticDecompression = DecompressionMethods.GZip;

ただこの方法だと差分取得で問題が発生してしまいました。

webRequest.AddRange( fileSize );

の fileSize の部分にローカルにDLしたDATファイル(GZip圧縮は解除され
平文のテキストファイルです)のファイルサイズを調べて指定したのですが、
どうやらGZipフラグを付けると AddRange で指定すべきファイルサイズは
GZipで圧縮したときの容量ではないといけないようなんです。

ローカルのDATファイルのファイルサイズを指定すると416:RequestedRangeNotSatisfiable
が返されてそれ以降DATを取得できなくなってしまいます。

GZipで差分データをやりとりするときは、GZip圧縮をかけた状態で受け取った
DATのサイズを計測し、それを累積加算しながら AddRange でリクエストしない
とデータは取得できないのでしょうか?DATファイルひとつごとにGZipで受け取った
ときのサイズを累積加算してローカル側に記憶しておく必要があるうえに、
万が一その値を失った場合は最初からDATを取得しなければならない等
不便が予想されるわけですがみなさんはどうやって対処されていますか?

918:デフォルトの名無しさん
08/09/30 23:13:59
今はgzipなんて推奨してません。

919:デフォルトの名無しさん
08/09/30 23:16:33
というのはウソです。

920:デフォルトの名無しさん
08/09/30 23:23:03
関連するAPIをぜんぶ実装して
モジュールとして公開してくれてるひとっていますか?

921:デフォルトの名無しさん
08/09/30 23:23:58
>>917
twintailはどうなってるのか読んでみた?
C#のソースが公開されてるから読んでみたら?
URLリンク(www.geocities.co.jp)

922:899
08/10/01 01:15:16
>>917に自己補足です。
GZip圧縮を有効にしたとき、鯖によってうまくいったりいかなかったりするようです。

実況鯖はGZip圧縮をONにしてもうまく差分取得できました。
一方でN速+といった通常鯖はGZip圧縮をONにすると
416:RequestedRangeNotSatisfiable
エラーが返されてしまうようです。

2ちゃんはGZip圧縮は非推奨ってことなんでしょうか(´・ω・`)?

>>921
ありがとうございます。
時間ができたときにソースコードを読ませてもらいます。

923:デフォルトの名無しさん
08/10/01 01:19:03
転送量が問題だったのは過去の事

924:899
08/10/01 01:25:33
>>923
> 転送量が問題だったのは過去の事

そ、そうなんですか(;´∀`)

それでは多くの2ちゃんブラウザではGZip圧縮をかけずに転送してるんでしょうか?

925:デフォルトの名無しさん
08/10/01 01:39:01
今はサーバーリソースの方が問題だからそもそもgzipの圧縮をやらない。

926:899
08/10/01 02:02:23
>>921
> URLリンク(www.geocities.co.jp)

で紹介されたTwinTailブラウザのソースをざっとですが見てみました。

ソースコードの中に
「datファイルがgzip圧縮されていればtrue、そうでなければfalseを指定する」
と記述されたパートがありました。もしかしたら鯖ごとにdatがGZip圧縮されて
いたりされていなかったりするということでしょうか?

>>922の例で言えば実況鯖はGZip圧縮がONで、それ以外の一般鯖はGZip圧縮
がOFFだったため、違いが生じたのでしょうか?

だとしたら何らかの方法で鯖ごとにGZip圧縮されてるかされてないかを識別し、
それに従ってdatをフェチする際にGZip圧縮フラグをONにするかOFFにするか
自動選択させればどの鯖にも対応できるようになるかもしれません。

あるいはGZip圧縮は無視して全鯖非圧縮でdatを取得するようにしてしまっても
いいかもしれませんね(´・ω・`)

927:デフォルトの名無しさん
08/10/01 03:01:08
GZIP要求を出して圧縮されて返ってくれば解凍、datで返ってくればそのまま
どちらの形式で返ってきたかは応答ヘッダを見ればいい

GZIP圧縮すべきかどうかは>>248-249

928:デフォルトの名無しさん
08/10/01 12:59:26
HTTPプロトコルを理解するためにRFC2616を読んだり
Wiresharkとかで既存ブラウザがどういう通信しているか見ればいいのに

929:899
08/10/01 13:00:32
>>927
もう一度調べてみたんですが、要求ヘッダに

req.AutomaticDecompression = DecompressionMethods.GZip;

とGZipをリクエストしておけばほとんどの鯖はGZipで圧縮されたデータを
送信してくれるようです。

では問題は何かと言いますと、初回以降の差分要求をするときにヘッダー
に付けて送信する If-Range ヘッダーに記述する容量を、圧縮されたとき
のものにしておく必要があるようなんです。

たとえば生では10バイトのDATをGZip圧縮して送信してもらったとします。
GZip圧縮をかけた結果5バイトに圧縮されたとします。
すると次回以降差分要求をするときに If-Range ヘッダーには10バイトでは
なく5バイトと記述しておかないと正しく差分データが受信できないようなんです。
そうでないと鯖からエラーコード416が返されてしまうようです。

これは結構ゆゆしき問題なんです。
ローカルに保存したDATは当然GZip圧縮を解除した状態なので、GZip圧縮を
かけたときのサイズを If-Range ヘッダーに記述するには、圧縮されたときの
のデータサイズをDATファイルごとにどこかに記憶しておく必要があるんです。
管理が面倒になるうえにこの圧縮されたときのサイズのデータが吹き飛べば
DATは最初から再取得しなければならなくなるんですね。

GZip圧縮は綺麗さっぱり忘れて無圧縮状態でデータを送信するようにした
ほうがいいってことなんでしょうか?
あるんです。


930:デフォルトの名無しさん
08/10/01 13:57:09
>>929
差分取得の時はAcceptEncodingにgzipを付けずに生で受け取る。
初回のレス1から読むときのみAcceptEncodingにgzipを付ける。
でホントにgzipだったら解凍する。生だったらそのまま。

ま、最初はgzip無視で作っちゃってもいいと思う。
君一人が非圧縮で受信したところでたいした負荷でもないし。
余裕出来たら、レス1から読むときはgzipで読むでいいのでは。

931:デフォルトの名無しさん
08/10/01 14:00:54
あと、HTTPサーバーの基本知識をもう少し付けるべきだと思うけど、
独自仕様もあるので注意。
板移転はレスポンスにステータスコード301,302といったリダイレクトが返ってくるわけじゃない。
200が返ってきて、中のjavascriptの
window.href=移転先URL
を見ないと駄目。しかも移転先に、さらに移転先が書いてある場合も。

932:899
08/10/01 15:31:30
>>930
> 差分取得の時はAcceptEncodingにgzipを付けずに生で受け取る。
> 初回のレス1から読むときのみAcceptEncodingにgzipを付ける。
> でホントにgzipだったら解凍する。生だったらそのまま。

その手がありましたか(`・ω・´)!

言われてみれば圧縮されたgzipファイルを差分取得するっておかしな概念ですよね。
レスが加えられていくごとに圧縮ファイル全体はつど変化していくわけですし
そうなればif-Rangeで範囲指定をしても取得できるデータに誤差が生じるのは
当たり前です。

Janeといった一般的なブラウザも差分取得時は無圧縮で取得してたりするんでしょうか?

ちなみにC# + .NET2.0で開発していますがこれ幸いか落としてきたデータの
gzipを解凍する手順はプログラマーが意識しなくてもいいようです。
勝手に解凍してくれるようで普通にReadToEnd()で読めちゃったりしています。

>>931
了解です。移転の検出は実装したほうがよさそうですね。

933:デフォルトの名無しさん
08/10/01 18:16:03
何度でも書くけどHTTPの資料読もうな
脊髄反射で質問するのはもう止めような

934:デフォルトの名無しさん
08/10/01 19:06:56
>>932
他のブラウザがどう動いてるかはパケットキャプチャを使って調べる。

935:デフォルトの名無しさん
08/10/02 06:09:25
>>933
HTTPの資料嫁とか方向違うだろ
どう見ても言語側でHTTPアクセスをサポートするライブラリ使ってるっぽいし

936:デフォルトの名無しさん
08/10/02 07:30:00
HTTPの資料読んでたら半分は質問減ったと思うが
C# + .NET2.0で開発してる人は読まないのか?

937:デフォルトの名無しさん
08/10/02 08:20:43
>>935
HttpWebRequest/Responseは、HTTPの仕様を知ってはいるんだけど、
自分でリクエストを組み立てたりレスポンスヘッダを解析したり
chunk転送をデコードしたり、KeepAliveを管理するのが面倒な人向け。

938:デフォルトの名無しさん
08/10/02 08:41:45
ごめん>>933だけで脊髄反射しちゃった

939:デフォルトの名無しさん
08/10/02 13:53:29
HTTPの仕様は読む必要あるだろう
if-modified-sinceやらe-tag、クッキーの仕様とか知らんと話にならん。
俺も浅い知識で組んだせいで後の修正大変だった。
一番大変なのは2ちゃんのどこにも明記されてないような謎仕様と
トライアンドエラーで戦わないと行けないことだ。


940:デフォルトの名無しさん
08/10/02 18:47:16
>>939
そういうのは、monazilla-ML(だっけ?)に入って聞いたほうが早いんじゃない?

941:デフォルトの名無しさん
08/10/02 19:43:54
あれまだ機能してんのかな・・・

942:899
08/10/02 20:32:17
>>937
C# with .NET2.0の環境でもヘッダを解析したり構築したりして
送受信されてる奇特な方っていらっしゃるんですか?

943:デフォルトの名無しさん
08/10/03 18:29:56
HTTPの意味もよく分からず開発を始めて質問しまくる人とか
人の忠告を聞かない人はよく見かけるね

944:デフォルトの名無しさん
08/10/03 19:19:08
っ 鏡

945:デフォルトの名無しさん
08/10/05 10:16:41
>>942
プログラムの勉強をしたい人とか、生粋のプログラマとか。

車輪の再発明と言われるけどプログラムやプロトコルを勉強するには
一から作るのが一番良い方法だと思うよ。
作ったうえでライブラリを使うともっと理解が出来る、ただ使うだけなら疑問を持たず
「そうなんだ、こうしないとダメなんだ」で終わらしておく方が良い。

946:デフォルトの名無しさん
08/10/05 11:29:25
HTTP1.0はシンプルだから、ソケット使って自前で通信したほうが
用途によってはコードも分かりやすいこともある

947:デフォルトの名無しさん
08/10/05 14:02:00
1.0 限定ならな… 1.1 になるととたんに面倒くさくなる。
クライアント側が GET ~ HTTP/1.0 しているのに、HTTP/1.1 で返事を返してくる
サーバって多いはずだけど、Apache ってどうだっけ?

948:デフォルトの名無しさん
08/10/05 14:04:34
>>947
HTTP/1.1という返事は、「うちのサーバーは1.1まで対応してますよ」って意味であったはず

949:デフォルトの名無しさん
08/10/05 17:10:33
よく読むスレを登録しておき、未読スレがないか一度に確認させるプログラムを
作ろうと思っているんですが、各スレを連続で読み込みするのにどのくらいの
時間をおけばいいものなんでしょうか?

それともそういうことは気にせず、いくつスレを登録してようと一度に一気に
読み込むプログラムを組んでしまっていいものなんでしょうか?

2ちゃんの方で明確な指針が掲載されていないと言うことは常識の範囲内で、
ということなんでしょうが、どのあたりが常識とか決まっているんでしょうか?

950:デフォルトの名無しさん
08/10/05 17:11:44
↑あと上記に絡んだ質問です。

過度に連続読み込みしたことで2ちゃん側からシャットアウトされる可能性って
ありますか?もしシャットアウトされたとしたらどんな返答が返ってくるんでしょうか?
シャットアウトされたことも知らずに続けて連続読み込みのリクエストを出し続ける
と後々問題になりそうなので・・・

951:デフォルトの名無しさん
08/10/05 17:56:01
>>950
ばーぼんなんとかだったかな

952:デフォルトの名無しさん
08/10/05 18:04:15
スレリンク(operate板:962番)
962 名前:鷲鴨 ★[] 投稿日:2008/09/15(月) 06:27:06 ID:???0 (PC)
みんなでツールで巡回しやがって
ボボン値も変更するか

巡回は負荷かかるから締め出し

953:デフォルトの名無しさん
08/10/05 18:28:04
>>951
「ばーぼん」ですか・・・
ちょっとググッてきます。

>>952
とはいえ、きょうび巡回機能が無い2ちゃんブラウザなんてお話にならないかと・・・

954:デフォルトの名無しさん
08/10/05 18:41:39
未読チェックだけならsubject.txt取得だけでいいだろ

955:デフォルトの名無しさん
08/10/05 19:27:55
>>954
チェックしたいスレが複数の板をまたがると

956:デフォルトの名無しさん
08/10/05 20:54:45
複数の板のsubject.txtを取得すればいいだけの話だあろ

957:デフォルトの名無しさん
08/10/05 21:01:45
リードのみでも連続アクセスするとばーぼんへ飛ばされるんですね。
ばーぼん回避のためにスレ1つ読むごとに1秒間のウェイトを入れておこうとおもいます(´・ω・`)

958:デフォルトの名無しさん
08/10/05 21:02:25
バーボン飛ばされたらつなぎなおせばOK

959:デフォルトの名無しさん
08/10/05 21:16:32
こういうことはあんま言っちゃいけんのかもしれんが
プロクシサーバを複数確保して巡回させればボボン回避は
十分可能なんじゃないか?

960:デフォルトの名無しさん
08/10/06 02:28:47
複数確保が簡単にできる環境は少ないんでは。

961:委員長 ◆/DABoneCRY
08/10/06 02:43:13
「ダメだ!辞めろ」と言うつもりはありませんが、
どれくらい時間をおけば「許される」というものではないと思います。
限界ギリギリを狙おうとするのではなく、可能な限り負荷をかけないよう
配慮する発想の方が健全だと思います。

962:デフォルトの名無しさん
08/10/06 02:49:00
>>960
っ サイバーシンドローム

963:デフォルトの名無しさん
08/10/06 12:57:01
>>925
折角、GZIPInputStream調べてgzip転送に対応しようと思ったのに必要なかったのか。・゚・(ノД`)・゚・。

964:デフォルトの名無しさん
08/10/06 19:27:18
>>925
gzip圧縮やってないってどこのサーバ?

>>963
今もAccept-Encodingにgzip設定すれば圧縮して返してくるから
クライアント側は対応しておく方がベターでしょう

965:デフォルトの名無しさん
08/10/06 20:02:20
>>964
そうなん(・∀・)?実況専用ブラウザにしようと思ってるけど、じゃあそうしよう。

966:デフォルトの名無しさん
08/10/08 18:24:57
多くの2ちゃんブラウザでは鯖移転を自動的に検出して対応していますが、
これはどういう仕組みで追尾しているんでしょうか?

できればこの便利な機能をマイブラウザにも実装したいと思っています。

967:デフォルトの名無しさん
08/10/08 18:29:33
<URLリンク(qb.2ch.net) のソースコードとか見りゃ分かるはずだ

968:デフォルトの名無しさん
08/10/08 18:42:55
> 板が移転した場合、/板のキー/のHTMLに移転先が書いてあるので、それを調べるのがよいかと。

URLリンク(age.s22.xrea.com)


HTMLに移転先が書かれているとのことですが、どの場所に書かれているのか決まっているんでしょうか?


> subject.txtが見つからない場合は、板が移転したと判断しても大丈夫でしょう。

あと移転したかしてないかは subject.txt があるかどうか調べればいいとのことですが、
たとえば先ほど

URLリンク(gimpo.2ch.net)

URLリンク(anchorage.2ch.net)

に移転した板の、移転前のsubject.txtを調べてみると
URLリンク(gimpo.2ch.net)
移転したはずなのにまだ存在しているようです(まっさらな状態ですが)。
これだとsubject.txtの有無で移転の有無を調べることができないかと思うのですが
一般的な2ちゃんぶらうざは何をもって移転したしないを判断しているんでしょうか?

969:デフォルトの名無しさん
08/10/08 20:54:19
なぜ>>967を無視する。

location.hrefを辿ってくだけだ。

970:デフォルトの名無しさん
08/10/08 23:25:53
URLリンク(qb.2ch.net)

のHTMLソース内にlocation.hrefが見あたらないのはブラウザで読むと転送されてしまうからでしょうか?

971:デフォルトの名無しさん
08/10/08 23:34:26
<html>
<head>
<script language="javascript">
window.location.href="URLリンク(qb3.2ch.net)"</script>
<title>2chbbs..</title>
<meta http-equiv="Content-Type" content="text/html; charset=x-euc-jp">
</head>
<body bgcolor="#FFFFFF">
Change your bookmark ASAP.
<a href="URLリンク(qb3.2ch.net)">GO !</a>
</body>


972:デフォルトの名無しさん
08/10/09 01:19:47
>>971
どうも、やはりすぐに転送されたためにそのページは飛ばされて見えなかったようです。

973:デフォルトの名無しさん
08/10/09 01:36:12
ところで上記のHTMLファイルのフルパスは

URLリンク(qb.2ch.net)

でよろしいでしょうか?

974:デフォルトの名無しさん
08/10/09 12:32:26
>>973
Webサーバ(アパッチ?)の設定により、URLを/で止めた場合のアクセスは異なる
/で止めておけばWebサーバ側が設定によりindex.htmlとかindex.cgiとかを返してくれるから/で止めておけばいいと思う

975: ◆TWARamEjuA
08/10/09 23:08:19
(´-`).。oO(971を読めば判ると思うけれども。。。2ch鯖監視係。もそうしています。@板移転自動追尾)

976:デフォルトの名無しさん
08/10/09 23:26:38
どうもです。index.htmlは抜きでトライしてみます。

977:デフォルトの名無しさん
08/10/09 23:41:37
window.location.href="URLリンク(qb3.2ch.net)"</script>
これ最後のセミコロンがないね
JavaScriptってセミコロンなしでもいいんだっけ?

978:デフォルトの名無しさん
08/10/09 23:49:18
いいんだよ

979:デフォルトの名無しさん
08/10/09 23:56:32
グリーンダヨ

980:デフォルトの名無しさん
08/10/10 00:58:02
板移転ってDATファイルを読み込んだり板一覧を更新するときに毎回
location.hrefのところを読んで検出してるんですか?

それとも毎回検出するのは無駄ですか?

981:デフォルトの名無しさん
08/10/10 01:11:50
URLリンク(menu.2ch.net)
が更新されてたらそれを取得するだけでいい。

bbsmenuが移転に対応してないときに検出すればそれだけで事足りる。
あとはユーザーに明示的に移転作業をさせたいときとか。

982:デフォルトの名無しさん
08/10/10 15:09:42
取得できなければ移転してんじゃね?
302ってなんだか良く分からんが。

983:デフォルトの名無しさん
08/10/10 16:39:36
302 Found

おそらく「移転したよ」という意味。

984:デフォルトの名無しさん
08/10/10 21:02:18
委員長空気・・・

985:デフォルトの名無しさん
08/10/10 22:26:19
本来404を返す状況で
ErrorDocumentが外部URLを指している場合
代わりに302が返る。

まめちしきな。

986:デフォルトの名無しさん
08/10/11 01:06:11
>>985
> ErrorDocumentが外部URLを指している場合

ここのところよく分からないんだが

987:デフォルトの名無しさん
08/10/11 02:36:47
>>986
URLリンク(httpd.apache.org)


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch