2ちゃんねるスレタイ検索 dig.2ch.net(ver 0.04)★3at OPERATEX
2ちゃんねるスレタイ検索 dig.2ch.net(ver 0.04)★3 - 暇つぶし2ch230:dig ★
14/09/18 20:44:52.48
よさげだけど、実況系は入れてもしょうがない気がするのだよなぁ

そうそうスレタイと関連検索だしたかったのよ
URLリンク(dig.2ch.net)

231:動け動けウゴウゴ2ちゃんねる
14/09/18 20:51:54.19 2HeJG8Uf
>>230
> よさげだけど、実況系は入れてもしょうがない気がするのだよなぁ
URLリンク(dig.2ch.net)
「あの日のスナップショット」も全板のは実況板で埋まってしまったのでしたね…

>>89の線でBbsを複数指定できるようにするついでに除外もできるようにすると良いかもしれません
たとえばBbs=all+-U_liveとすれば「実況系を除く全板」で検索できるようになります

これで「あの日」も改善できますし
これから実装されるであろうPV系機能を組み合わせれば>>230も実現できるかな、と

232:動け動けウゴウゴ2ちゃんねる
14/09/18 20:56:26.93 2HeJG8Uf
ラブライブ!
URLリンク(hope.2ch.net)

U_liveはこの板が問題になるので
Bbs=U_live-lovelive という指定で実況板だけにしたり
Bbs=all+-U_live+lovelive という指定で復活できるようになっていたりするとなお良いですね
# Bbsで思い出しましたがG_newsは元気でしょうか

233:dig ★
14/09/18 21:03:46.55
G_news の追加は今週末の予定でーす

234:動け動けウゴウゴ2ちゃんねる
14/09/18 21:35:23.49 sIANhziz
CMさんのヘッドラインポータルのPV順位も、レスの多すぎる実況系の補正や、のんびりなAAカテゴリをうまく拾うのが難しく、そこはまだ詰めているところでした
「PV / レス数」や「PV / すずめ」だと人気板逆差別になってしまいますし
「pow(PV, 2) / レス数」とかでしょうか…なかなか一筋縄ではいかないところですね

235:動け動けウゴウゴ2ちゃんねる
14/09/19 19:17:17.04 CB6+oIKN
>>233
次に改良する時にでも、以下の変更をお願いします
位置は各検索項目の出力部分でスレタイとURLの間に位置します
現在:</a><br><div class="tab1em" >
提案:</a><div class="tab1em" >

現状だとスレタイとURLをブラウザでコピーしようとした時、無駄な改行が入ってます
 >ID砲丸投げ in ラウンジ 16投目 (829)
 >
 >スレリンク(entrance板)

間に入る改行が、DIVの前のbrで起きているためで、
URLをコピペ引用する時に改行削除する手間もアレなので

236:動け動けウゴウゴ2ちゃんねる
14/09/19 19:17:44.45 rC6MgeKQ
括弧の中身が長すぎる時は関連検索に出なくなったかな?
いい感じなようです


そろそろ「今日の言葉」などに「勢いランキングスナップショット」へのリンクを取り付けてもいいかもですね
URLリンク(dig.2ch.net)
> 2014-09-18 149256 回
> スナップショット  全板, 実況, +, ゲーム, ピンク [勢いランキング]
> 検索語句Top5 エボラ(223) 中川翔子(203) ヘタリア(145) スマブラ(141) 昼顔(135)

ただ実況板のテレビ実況スレが大半を占めてしまっていて代わり映えがしないので
やっぱり実況系抜きのランキングが必要かもしれません
# こうして見るとなんだかんだいってテレビというメディアはまだまだ強いのですねえ

>>234
スマートなアルゴリズムを考えて独自の「人気順」を実装するのも夢がありますね

237:動け動けウゴウゴ2ちゃんねる
14/09/19 22:02:55.74 rC6MgeKQ
>>235が反映されたのかもしれませんが
> 1[懐アニ昭和] 板絞 2014/07/21 21:37:01(立) 2 分前 (勢 8)ミ☆★ うる星やつらを語り合おう 71 ★☆彡 (477)
> スレリンク(ranime板)
> 関連検索
このような表示になっています

たぶん
> (勢<font color=green>  8</font>)
この後の<br>は必要で

> <a href="スレリンク(ranime板)l5">ミ☆★ うる星やつらを語り合おう 71 ★☆彡 (477)</a><br><div class="tab1em" >
ここの<br>が不要だと>>235さんは仰りたいのかな?

238:動け動けウゴウゴ2ちゃんねる
14/09/19 22:12:55.01 rC6MgeKQ
なおったー!


>>223で当たり前のように触れましたが
> # ちなみに「-583472408」を検索すればこのBEのスレだけ弾けるので
「マイナスだけの検索」は以前は出来なかったのがいつの間にか出来るようになってました
見えないところでもどんどん改良されているのですねえ

簡易NGにしたり「カテゴリがついてないスレ」を検索できたり
URLリンク(dig.2ch.net)
「マイナスだけ検索」は工夫次第で結構応用が効きます

239:dig ★
14/09/19 22:16:31.79
ちょこちょこ気がついたら触ってます
今日の主題はガラケー画面ですが、

240:動け動けウゴウゴ2ちゃんねる
14/09/20 16:01:57.56 jiYXz+N3
URLリンク(dig.2ch.net)
シンプルですね。
ガラケーから見てみたところ、上下のmarginは無し、文字は全体的に小さくしても大丈夫な気がしました
1画面に何スレくらい入るとちょうどいいのだろう…

241:動け動けウゴウゴ2ちゃんねる
14/09/20 16:52:09.79 r/r2Lwl2
ためしにガラケーのサイズで(PCで)表示してみました

VGA 480 x 640px
URLリンク(upup.bz)
URLリンク(upup.bz)

WVGA 480 x 800px
URLリンク(upup.bz)
URLリンク(upup.bz)

FWVGA 480 x 854px
URLリンク(upup.bz)
URLリンク(upup.bz)

242:動け動けウゴウゴ2ちゃんねる
14/09/20 19:22:58.19 70kagK8n
なんか変な文字列が出るっす@P905i
URLリンク(mup.2ch-library.com)

243:動け動けウゴウゴ2ちゃんねる
14/09/20 20:19:23.89 r/r2Lwl2
iモードHTMLシミュレータⅡ (v8.4) っていうので見てみました
もう少し情報量増やせると…
URLリンク(dig.2ch.net)
URLリンク(upup.bz)
URLリンク(upup.bz)

>>242
<script>GoogleAnalytics</script>
ってなってるので
<script type="text/javascript">GoogleAnalytics</script>
ってすれば直るかもしれないです

244:動け動けウゴウゴ2ちゃんねる
14/09/20 20:29:05.95 r/r2Lwl2
調べるとガラケーのブラウザ表示サイズは

ドコモ: QVGA(横幅240px程度) / VGA(480px)
→<meta name="disparea" content="vga">と指定すればVGAモードに
au: QVGA(240px)
→ほぼ同じ
ソフトバンク: QVGA(240px) / VGA(480px)
→端末の画面サイズにより異なる

とキャリアによって違うようですね
>>243の画像はQVGAモードです

245:dig ★
14/09/20 21:04:46.44
>>242-243
<script type="text/javascript"> にした

246:動け動けウゴウゴ2ちゃんねる
14/09/20 21:31:20.23 70kagK8n
リロードしてみたけど>>242のままでした
もしかしてjavascript非対応端末だからかな

247:dig ★
14/09/20 21:49:39.54
コメント入れればいいんだっけ?

<!---
--->
で囲う

248:dig ★
14/09/20 22:00:12.42
こうかしてみた

<script type="text/javascript">
<!--
document.write("Hello");
// -->
</script>

249:動け動けウゴウゴ2ちゃんねる
14/09/20 22:31:25.02 70kagK8n
だいぶスッキリしました
URLリンク(mup.2ch-library.com)

250:dig ★
14/09/20 22:53:05.23
そこが残っていたか、入れてくるだ

251:動け動けウゴウゴ2ちゃんねる
14/09/20 22:57:09.58 70kagK8n
表示直りました、ありがとうございました

252:動け動けウゴウゴ2ちゃんねる
14/09/20 23:44:06.22 y81VeuNx
URLリンク(dig.2ch.net)
> <a href=".">top</a>を参考にformの中身を記述してネ<br>
というのがありますが、これだと「top」をクリックしても URLリンク(dig.2ch.net) に飛んでしまうので
フルパスで
> <a href="URLリンク(dig.2ch.net)を参考にformの中身を記述してネ<br>
と書いた方が良さそうですネ


これのトップページへの「dig お奨め人気サイト」表示、
上位のメンツがびんたん、べっかんこ、Yahoo、google、ドコモ、auと身内と超大手で固まってしまって全く面白くないので
トップ3の固定表示の代わりに20~30位ぐらいまでからランダムで3つ表示にしてみてはいかがでしょう
絶対に喰い込めそうにないのでは設置のモチベーションにもならないでしょうし

253:dig ★
14/09/21 00:54:18.74
まずはその上位三つ削るみとにしよう

254:動け動けウゴウゴ2ちゃんねる
14/09/21 01:46:09.73 IbNoR/Kw
>>253
有名どころはごめんなさいしてそれ以外で上位にすれば
まだ変化やチャンスがあるかもしれませんね

ランダムの代わりに「上位100位のうち一番最後に使われたもの3つ」というのも面白いかもしれません



ところで、グループの残りを一気に作りましたのでご検討よろしくお願いします
これでほぼ全域がカバーされたと思うので入れて頂けましたら追って機能性が上がるよう調整していきたいです
URLリンク(www.dotup.org)
# 次のレスに簡単な紹介を書きますだ

255:動け動けウゴウゴ2ちゃんねる
14/09/21 01:49:16.22 IbNoR/Kw
G_hobby.txt
  趣味G(G_hobby)
  G_game, G_entame, G_subcalなどにあるものは基本的に除いた「その他の趣味」といったグループです
G_life.txt
  暮らしにかかわる板を集めた生活G(G_life)
  G_femaleと少しかぶります
G_socio.txt
  社会、経済、労働(、政治)…世の中のカタい話の社会G(G_socio, G_social)
  ニュース系は控え目になっています
G_sport.txt
  見るスポーツとやるスポーツのスポーツG(G_sport)
  分かり易いグループですが実況系の調整が必要になるかも
G_talk.txt
  溜まり場的なネタ雑談系を集めた雑談G(G_talk, G_chat)
  実況系は外していますがVIPと狼は入れてみました
G_news.txt
  先日のものに国際情勢カテゴリの板をいくつか追加しました

256:動け動けウゴウゴ2ちゃんねる
14/09/21 20:40:55.05 IbNoR/Kw
グループや鯖検索の発展アイデアです

単独板で絞り込んでいる時に(例:考古学板 URLリンク(awabi.2ch.net)
1. その板を含むグループがあればそのグループ(G_academy)
2. その板を含むサーバ(S_awabi)
3. メニューにその板を含む部分一致があればそのBbs(newsplus→U_plus)
へのリンクを表示するようにはできないでしょうか?

イメージ:
> [考古学板で絞り込み中] 解除 検索語リセット 「学問G」で絞込 awabi鯖で絞込 Topに戻る

「板絞」したり板から飛んで来たりした後で
単板より広く全板より狭い「視野を広げる」絞り込みを実現して回遊性を高める狙いです

257:動け動けウゴウゴ2ちゃんねる
14/09/22 20:12:09.94 qGw7oa1w
「欲しいスレのスレタイがもう分かっていて、スレタイを丸ごと入力して一発で辿り着きたい」
という使い方があるのですが、検索できないことが少なくないようです
以下に2例ほど(URLを略式にしたので「Topに戻る」してから開いてください)


> 【漫画】「HUNTER×HUNTER」休載長期化へ 作者冨樫義博さんの容態回復せず [9/22]
> スレリンク(moeplus板)
「[9/22]」という文字列で検索に失敗するようです
URLリンク(dig.2ch.net)
「9/22]」でも0件で
URLリンク(dig.2ch.net)
「[9/22」なら12件ヒットします
URLリンク(dig.2ch.net)
「[9/22]」(括弧が全角)ならいけます
URLリンク(dig.2ch.net)
# ↑だけこのURL↓だとなぜか URLリンク(www.nttec.com) に飛ばされます
# URLリンク(dig.2ch.net)

258:動け動けウゴウゴ2ちゃんねる
14/09/22 20:13:17.00 qGw7oa1w
>>257 の2例目

> 任天堂の「Wii」、フィリップスの特許を侵害 七審目 (666)
> スレリンク(ghard板)
URLリンク(dig.2ch.net)任天堂の「W
× URLリンク(dig.2ch.net)任天堂の「Wi


原因は特定できていませんが、括弧やスラッシュ周り(>>160 ?)にまだ何かあるのかもしれません

259:動け動けウゴウゴ2ちゃんねる
14/09/22 20:38:21.36 nIecbcuy
%2fをググってみました

URLのパス部分に%2Fを含む時の扱い
URLリンク(mdgw.hateblo.jp)
> Apacheは標準ではパス部分に %2F(/をエスケープしたもの) を含むURLに対して404を返すそうです。

260:動け動けウゴウゴ2ちゃんねる
14/09/22 21:26:50.43 nIecbcuy
>>258
試してみたところ、
URLリンク(dig.2ch.net)
「フィリップス i」でもそのスレと下記のスレがヒットしないようです

【裁判】任天堂「Wii」の特許侵害訴訟、フィリップスが英で勝訴 (12)
スレリンク(gamenews板)

261:動け動けウゴウゴ2ちゃんねる
14/09/23 03:12:22.66 4zRkQc4d
>>259
酷いなそれ…
dig.2ch.netでは/snapIkioi/等のファイルにアクセスする処理で明示的に%2Fをデコードとかしてなければ
AllowEncodedSlashesをONにするだけで問題なさげだけどその記事見るとバージョン次第でアウトなのかな?

262:動け動けウゴウゴ2ちゃんねる
14/09/23 09:17:09.53 C4SZar95
>>261
いや、dig.2ch.net/ のあとにきちんと '?' を入れて
URLリンク(dig.2ch.net) とれば、そのあとに%2Fがあっても通る。
>>257は括弧類の曖昧検索か、あるいは正規表現なりワイルドカードなりの
エンジンをを使っているならその周辺か、どちらかにバグがありそう。

263:動け動けウゴウゴ2ちゃんねる
14/09/23 18:36:14.65 4zRkQc4d
>>262
短縮表記は廃止ってことならそれでいいんだけど。

264:dig ★
14/09/23 21:29:19.64
dig のurl長くなるから
短縮url作った URLリンク(ula.cc)

この検索[たま]のurl = の下にすぐ取得できるようにリンク入れた

265:動け動けウゴウゴ2ちゃんねる
14/09/23 21:48:42.93 weU6noDo
>>264
スレのテンプレ作りが捗ります
今のところ短縮できるURLに制限はないみたいですね

266:dig ★
14/09/23 21:59:17.78
今のところ何の制限(防御?)もないのだ
作り立てだからバグだらけだと思うしネ

267:動け動けウゴウゴ2ちゃんねる
14/09/23 22:13:43.55 xc+dyrer
おー、やたらと長いリンクはいかがなものかと思ってたからこれは助かるかも

短縮を嫌う連中向けに、2chのジャンプ確認ページみたいな
飛び先確認(元の長々としたURL)の表示を出せれば誰も文句は言えまい
どういう風にそのOn/Offを実装するかな、
案1) confirmページの略で URLリンク(ula.cc) みたいにする
案2) URLリンク(ula.cc) のようにリンクを変えて、こっちで登録したら確認ページを出すようにする
案3) 登録自体は同じにして、短縮登録時に「確認画面を出す」チェックボックスを用意しておく。
 また、吐き出す短縮文字列の先頭が「_」ならば、必ず確認画面を出す

268:動け動けウゴウゴ2ちゃんねる
14/09/23 22:15:46.05 xc+dyrer
短縮文字列の先頭に?を入れる手もありますね、
記載例:短縮url = URLリンク(ula.cc)

269:dig ★
14/09/23 22:56:05.44
>>268
それシンプルでいいな

270:動け動けウゴウゴ2ちゃんねる
14/09/23 23:00:32.37 LRjbF7fh
短縮url便利です!

が、dig専用(もしくは2ch公式関係のurl専用)にしないと
「スパムなどの短縮に使われる」→「他の短縮URL同様Rock54でさくらの季節」
ということになってはしまわないでしょうか?

271:dig ★
14/09/23 23:11:57.17
しかしうまくいかんな

272:動け動けウゴウゴ2ちゃんねる
14/09/23 23:23:54.24 LRjbF7fh
>>270
基本的には2ch.net, bbspink.com, ula.cc だけを許可するホワイトリスト方式でいいかなと

それでもjump.2ch.netを使えばスパムを貼れますし
URLリンク(jump.2ch.net)URLリンク(ula.cc)
スパムサイトのURLと文字を「検索」したURLを貼る手口もあります
「スパムサイト見てね! URLリンク(bad.spammer.com)」→URLリンク(ula.cc)

結局は短縮URL一般が抱える問題を抱えてしまうし
2chに貼れなくなるようではあまり意味がない…うーむ


>>271
「確認付き」の方のことですか?
肝心のリンクがまだ出てないようですね
URLリンク(ula.cc)

273:dig ★
14/09/23 23:25:39.31
*にした

URLリンク(ula.cc)

274:動け動けウゴウゴ2ちゃんねる
14/09/23 23:28:30.64 LRjbF7fh
「エボラ」で検索して短縮しようとしたら
> URLmake() 8 回も重複
と怒られましたが、そういう時は
「過去に作成済」の短縮URLをリサイクルして表示するようにはできないでしょうか?
現状では「みんなが欲しい検索結果ほど短縮urlを取得できない」ということになってしまいます

>>273
動きました!

275:dig ★
14/09/23 23:31:22.91
>>274
そんなにかぶるかな
調整してみる

276:dig ★
14/09/23 23:42:30.87
みんなの予想どおり
いろいろ起きるだろうなぁ

起きてから事象を見極めてそれからいろいろ実装しようと思っている

277:動け動けウゴウゴ2ちゃんねる
14/09/23 23:42:56.62 LRjbF7fh
短縮の過程で…

「エボラ WHO」で検索(UTF-8 keywords=%E3%82%A8%E3%83%9C%E3%83%A9+WHO)
URLリンク(dig.2ch.net)

短縮実行(この時点でもUTF-8)
URLリンク(ula.cc)

発行された短縮先はEUC-JP(keywords=%A5%A8%A5%DC%A5%E9%20WHO)
URLリンク(ula.cc)
URLリンク(dig.2ch.net)

と文字コードが変化してしまい、環境によっては文字化けが発生するようです
全てUTF-8で統一できないでしょうか?

なお「確認付き」のURLにするとUTF-8のものが出るようです
URLリンク(ula.cc)

278:Mango Mangüé ★
14/09/23 23:46:48.27 BE:249718815-S★(824703)
sssp://img.2ch.net/ico/mac.gif
URLリンク(9ch.net) っていうのもあるます

279:dig ★
14/09/23 23:48:27.56
>>277
統一したいと思う

DB作り直しかもしれんが
研究するだ

280:動け動けウゴウゴ2ちゃんねる
14/09/23 23:55:15.33 LRjbF7fh
>>277ですが
確認なしのURLだとエンコードしてないURLをそのまま返しているのかもしれません
URLリンク(dig.2ch.net)エボラ+WHO
「短縮url取得」の時点でエンコード済のものを短縮するようにすると良さそうです

>>278
そちらは2chなど以外のurlは弾く仕様なのですね
URLリンク(9ch.net)
ただこちらもjump.2ch.netを使ってスパムを貼ることはできてしまうようですが
# url短っ

281:動け動けウゴウゴ2ちゃんねる
14/09/23 23:58:46.69 LRjbF7fh
>>262

>>257
> URLリンク(dig.2ch.net)
> # ↑だけこのURL↓だとなぜか URLリンク(www.nttec.com) に飛ばされます
> # URLリンク(dig.2ch.net)
これは自分が?を入れ忘れただけでした、失礼しました
[9/22]問題の方だけ見て頂ければ

282:dig ★
14/09/23 23:59:10.41
>>277
ちょっと触ってみた
どうだろか?

283:動け動けウゴウゴ2ちゃんねる
14/09/24 00:18:35.86 ryYXJKOM
>>282
UTF-8, Shift_JIS, CP1252(Latin-1)などの環境なら問題なく
EUJ-JP, ISO-2222-JP, ISO-8859-1(Latin-1)などの環境だと今もうまくないみたいです

284:dig ★
14/09/24 00:32:20.66
難しい~

こうやってやつてるんだけど
ap_set_content_type(r, "text/html; charset=UTF-8") ;
apr_table_set(r->headers_out, "Content-Location", url) ;
apr_table_set(r->headers_out, "Location", url) ;
apr_table_unset(r->headers_out, "Content-Length") ;
r->status = HTTP_TEMPORARY_REDIRECT ; // 307

285:動け動けウゴウゴ2ちゃんねる
14/09/24 00:32:27.81 ryYXJKOM
>>271の時点で「確認付き」のurlを踏むとべっかんこのトップページに飛ばされていましたが
短縮用のドメインはべっかんこと兼用のula.ccでなくそれ専用のものを用意しないと
先々urlが衝突したり規制絡みなどで厄介事が生じたりしないでしょうか
# ula.toとかまだないようです

286:dig ★
14/09/24 00:42:51.03
? だったから、URLリンク(ula.cc)URLリンク(ula.cc)となっちゃったのよ
んで * にしたんだ URLリンク(ula.cc)

287:動け動けウゴウゴ2ちゃんねる
14/09/24 00:51:32.88 HzmU+Ytv
>>284
> apr_table_set(r->headers_out, "Location", url);
この時点でのurlの値が生のUTF-8になってるから不味いのかと…URLエンコードしてください。
アンカータグの中がURLエンコードじゃなくてUTF-8なのもちょっと微妙だけど…大丈夫かな?

288:動け動けウゴウゴ2ちゃんねる
14/09/24 00:59:15.38 ryYXJKOM
>>284
検索した時点で
> この検索[エボラ]のurl = <a href="?maxResult=50&atLeast=1&Link=1&AndOr=0&Sort=5&Bbs=all&924=1&password=dig&keywords=%E3%82%A8%E3%83%9C%E3%83%A9">
とUTF-8にエンコードしたurlを作成できているので、出口でなく入口の段階で
「短縮url取得」する時に「エボラ」に戻さずにエンコード済のurlをDBに保存するようにしては如何でしょう
# あっ、それが「DB作り直し」ですか…

>>286
?の問題は解決しましたが、先々の衝突回避などもあるので
専用ドメインにするなら今のうちかなと思いまして
専用ドメインが大変なら2文字犠牲にして URLリンク(ula.cc) のようなurlでもいいかもしれません

289:動け動けウゴウゴ2ちゃんねる
14/09/24 01:04:09.07 ryYXJKOM
URLリンク(t.ula.cc)
の方が簡単かな?

290:動け動けウゴウゴ2ちゃんねる
14/09/24 01:08:47.74 5IHxFPoe
単に検索パラメーターが長いって問題だけなら
dig.2ch.net配下でパラメーターだけ圧縮しても良いと思うけど。
2chスレ検索結果だってはっきり判るし
手打ち用途じゃなきゃ数バイト削るのはそこまで重要じゃないかと

291:動け動けウゴウゴ2ちゃんねる
14/09/24 01:18:36.89 ryYXJKOM
>>290
たとえばこの検索結果だとしたら
URLリンク(dig.2ch.net)

「?Bbs=ojyuken&maxResult=500&atLeast=5&Link=1&AndOr=0&Sort=5&924=1&password=dig&keywords=%E6%84%9B%E7%9F%A5+%E5%AD%A6%E6%A0%A1」
の部分だけを短縮して
URLリンク(dig.2ch.net)
みたいにするわけですね(sp = Shortend Parameters)

安全なURLであることも一目で分かりますしスパムにも使いにくいから
2chにも引用可能な短いurlを生成するという意味なら確かにその方が合理的かもしれません
一般的な短縮urlサービスだと悪用との戦いになってしまうので

292:動け動けウゴウゴ2ちゃんねる
14/09/24 01:31:09.56 ryYXJKOM
ついでの思い付きですが、「短縮url取得」リンクの隣に
「スナップショット作成」か「魚拓作成」というリンクを作って
検索結果のスナップショットを自分で取れるようにしたら面白いかもしれません

URLリンク(dig.2ch.net)

URLリンク(dig.2ch.net)
のようなurlが生成されて、好きな時点と条件のスナップショットを2chなどに貼れるというわけです

数年後には「エボラ」で検索しても数スレしか出なくなっているでしょうが
「この頃はこんなにエボラが話題になってたんだぞ」みたいな
今は過去スレも普通に読めるので案外実用性は高いかも

293:dig ★
14/09/24 01:39:08.26
>>288
なんとなくわかってきた
そのつもりは無いんだけど
そうなっている

保存したいのは url encode したやつなんだ

294:動け動けウゴウゴ2ちゃんねる
14/09/24 01:39:36.70 ryYXJKOM
>>292
「短縮url取得」は時間がたつと表示されるものが変わってしまいますが
「魚拓取得」は固定された検索結果ページが表示されるというわけです
# スナップショットには「この検索のurl」も含まれるので短縮urlの機能も兼ねられます

前者は動作報告やテンプレでのスレ案内などに
後者は「今見た検索結果はこうなってるぞ」という用途に使えます

295:動け動けウゴウゴ2ちゃんねる
14/09/24 02:40:05.17 DPAVnP6h
転送先確認のステップ追加ご苦労様です
*になりましたか

296:動け動けウゴウゴ2ちゃんねる
14/09/24 03:17:26.64 DPAVnP6h
スナップショットや魚拓ってさ
・スクリプト爆撃喰らったらdig側のストレージがDiskFull起こしそうだ
・1エントリは微小でも、それが四六時中続けばどうなるかDoS。どう制限を加えるべきか
・アイデアとしては悪くない、でも無制限開放は危険な香り。なにか制限を加える必要性のヨカーン

以下ゲラ稿
・有料ユーザなら、アカウント内にエントリを16とか255とか1023個とか持てるようにしておき、
それを外部公開にする(外部からアカウント紐付けはできない仕組みで)とか。
一日に幾つかのエントリを持てるようにする、でもいいか。
これはあっちのアカウントと連動しないといけないし、改造もあっちがメインか
難易度上がるなぁ やりたがらないだろうなぁ

297:dig ★
14/09/24 05:31:29.39
>>277
なおった

298:動け動けウゴウゴ2ちゃんねる
14/09/24 14:08:05.19 DPAVnP6h
短縮リンクで、デバイス指定の提案
処理:伸張処理の際、ターゲットデバイスのフラグを書き換える
機能:短縮文字列の先頭に特定文字列を入れてやれば、リンクがどんなデバイス向けでも
指定デバイス向けに読み替えてリンク生成してくれる。PC、携帯、タブレット・スマホ向けの指定が容易に。

用例:基本の短縮URL例 URLリンク(ula.cc)
PC向け: URLリンク(ula.cc)
携帯用: URLリンク(ula.cc)
Tablet等:URLリンク(ula.cc)

299:動け動けウゴウゴ2ちゃんねる
14/09/24 16:09:14.43 PXRPbnd5
板絞り込みに嫌儲が複数ありません?

300:dig ★
14/09/24 16:18:18.52
たくさん回されている

まだ防御システムとか作ってないから、手動で
deny from .ub-freebit.net
deny from .ablenet.jp
deny from .myvps.jp

301:dig ★
14/09/24 16:25:57.32
なんの意味があるかわからないけど
5 264 -【
6 202 ‡

を検索するbotだ

302:動け動けウゴウゴ2ちゃんねる
14/09/24 16:37:38.18 DPAVnP6h
>>298の補筆
これは短縮リンクがdigのURLだった場合の挙動、ってことで。
外部サイト向けの短縮URLにターゲットデバイスとかワケワカメなので。

もうひとつ提案
機能:転送先が外部サイト向けの場合、確認画面が強制される
説明:短縮URLが2chおよび親族サイト(bbspinkとか)であれば直接ジャンプ(確認画面を省く)も可能にするが
2chおよび親族サイトでない場合は、*指定にかかわらず確認画面を出すようにする

303:動け動けウゴウゴ2ちゃんねる
14/09/24 16:53:54.35 ENvKHc6C
>>301
携帯メニューのぬこが無意味な1文字を検索されまくってよくシステム落とされてた
誰が得するのかは分からないが、多分攻撃だと思う

304:dig ★
14/09/24 17:45:18.39
>>303
防御システムもなんか新しいのこさえっかな
一連の開発で新しいこといろいろ覚えたしライブラリもたくさん作ったし、

>>302
作ってみた
元urlに URLリンク(dig.2ch.net) が含まれていたら
Link=1 の文字を使用しているデバイスによって強制的に置き換え
動いていると思う

305:動け動けウゴウゴ2ちゃんねる
14/09/24 18:01:46.51 DPAVnP6h
>>304
おー即対応ありがとうございます。
アクセスしてきたデバイス向けにLink=nを書き換える実装の方がスマートでしたね、乙です

306:動け動けウゴウゴ2ちゃんねる
14/09/24 19:14:31.65 ryYXJKOM
>>297
よかった
お疲れ様でした!

>>300-301
「-【」は「カテゴリを付けてないスレ」、「‡」はnewsplusの閲覧上位10スレですし
1分に1度程度のようなので攻撃よりは実用的なスクレイピングか
ブラウザの自動リロード機能のような感じがします

jsonにも対応したことですし、完全に禁止するよりも
「どのくらいまでなら許すか」を示していった方が結果は良いかもしれません
・10分に1回(1日に150回)まで
・必ずjson=1
・maxResult=50まで
・自サイトに結果を利用する場合は広告表示とdigへのリンクを設置
ぐらいを満たせば許容範囲、それより激しい取得をしたい場合はビジネスのご相談、みたいな
# 1時間に1度程度のスクレイピングでも充分面白いことが色々できそうです

307:dig ★
14/09/24 19:20:20.02
1分間に100回とかだったのだ、

308:動け動けウゴウゴ2ちゃんねる
14/09/24 19:53:03.86 ryYXJKOM
そりゃいけませんw

>>306で想定したのは
おうちでデータ集めてニヨニヨするアマグラマさんや
文学関係のポータルサイトに1時間に1回2chの文学関係のスレ情報を流したいといったケースです
>>307のようなものだけ咎めたつもりで萎縮させてしまっても面白くないし損かなと

309:dig ★
14/09/24 20:22:47.25
んですなぁ
流石にそんだけ回されるとサーバが落ちるです
でも、また新しい防御システム作ろうかなぁという気になったから
良かったのかも。

それまでは手動で頑張ろう

URLリンク(dig.2ch.net)
1 5557 君野康弘容疑者
2 3545 エボラ
3 718 野々村
4 635 神戸
5 443 君野康弘

1位と2位もありえない数値なわけでして

310:動け動けウゴウゴ2ちゃんねる
14/09/24 20:27:32.86 0M4ax10s
ざっと普段の10~20倍ですな

311:動け動けウゴウゴ2ちゃんねる
14/09/24 21:04:55.35 ryYXJKOM
そういえば負荷対策とは別の話になりますが
検索回数の集計はUUにはできないでしょうか?
明らかに1人で回したっぽいものが多数上位に紛れ込んじゃってるので

URLリンク(dig.2ch.net)
所属事務所(784)
最強+vol(260)
【sop】ドルトムント×マインツ(199)
沢邑享一先生(496)

312:Mango Mangüé ★
14/09/24 21:27:33.80 BE:249718815-S★(824703)
sssp://img.2ch.net/ico/mac.gif
BBC族入れますか?(firewallに入るやつ)

313:動け動けウゴウゴ2ちゃんねる
14/09/24 21:39:42.46 HzmU+Ytv
クローラ規制とプロキシ規制を一緒くたにするような状態を解消してからにして欲しい

314:動け動けウゴウゴ2ちゃんねる
14/09/24 21:41:47.08 HzmU+Ytv
違った、クローラ規制とプロキシ規制と荒らし規制だった

315:動け動けウゴウゴ2ちゃんねる
14/09/25 11:42:04.92 OGyClrOA
うーむ、短縮URLにする必要ありますかね?

各板のトップに造設されたスレタイ検索のフォームだと
(キーワード入力欄のみでその他のパラメータは一切なし)
たとえば
URLリンク(dig.2ch.net)
のようなシンプルなURLになります。
この形であれば、アクセスに来た端末の種類を自動判別して
適切なリンクを張れるように思います。

あと、今はキーワードのほかに色々とプルダウンがありますが、
style="display:none" とかを使って通常はアイコンひとつにしておくと
初心者が深いことを考える必要がなくて宜しいかなと思います。

316:動け動けウゴウゴ2ちゃんねる
14/09/25 11:47:56.78 OGyClrOA
承前

あー、style="display: none" を使うには一工夫必要ですね。
JavaScriptで制御することになると思うのですが、
私のガラケーはJavaScriptもスタイルシートも認識しません。
まあ、ガラケーでは style="display: none" の有無に関わらず
常にそのタグの中身が表示されるので、そのままでいいといえば
いいのですが。

317:動け動けウゴウゴ2ちゃんねる
14/09/25 20:15:18.70 IfiCUiIt
>>315
前半ですが、パラメータの一部を略した場合
過去の設定をcookieで覚えておく仕様が悪さをするみたいです
↓このURLを開いた後で
URLリンク(dig.2ch.net)
>>315のurlを開いてみると…何も出ません
URLリンク(dig.2ch.net)
dig上で連続ナビゲートしている間は全パラメータ入ったurlなので
AndOr(0), AtLeast(1), maxResult(50)は渡されなかった時はクッキー無視してデフォルト値でいい気がします


後半のstyle="display: none"関係は
自分は頻繁に検索したり設定変えたりを繰り返して使っているのであまりうれしくないです
シンプルなフォームは各板の特等席に設置されているので充分でないかと
# Simple=1のような設定があってもいいとは思いますが

318:動け動けウゴウゴ2ちゃんねる
14/09/25 20:22:41.24 IfiCUiIt
ゲームGに抜けらしきものが2つあったので追加お願いします
# 他の方の提案なさったGですが

家ゲーRPG
URLリンク(mastiff.2ch.net)
Minecraft(新板のようです)
URLリンク(wktk.2ch.net)


それと「実況全部」(U_live)なのですが、調べてみると抜けがかなり多く「全部」とは呼び難かったので
グループ(G_live)として再編してみました
URLリンク(www.dotup.org)

# 抜け(フォルダ名にliveを含まない実況板)
実況ch, 番組ch, 議会選挙実況, スポーツch, 五輪実況(女), 五輪実況(男),
芸能ch, お祭りch, streaming実況, ネトゲ実況, ネトゲ実況2, ネトゲ実況3
# 誤混入(liveを含む非実況板)
家庭(live), ラブライブ!(lovelive)

319:動け動けウゴウゴ2ちゃんねる
14/09/25 20:26:28.22 IfiCUiIt
>>254-255を更新して上述のものも含めたものを上げ直します。他の方が提案されたものも一緒に入っています
隠し板やメニューにあるが実在しない板を除く全ての板が最低1つのグループに属すようにしました
URLリンク(www.dotup.org)

作業なさりやすいように、全板を並べたCSVと
1ファイルでグループ別に板を全部並べたテキストファイルも作成同梱しました(以下は閲覧用リンク)
URLリンク(www.dotup.org)
URLリンク(www.dotup.org)
# これらを適宜加工して頂ければ>>256のような「板からグループを逆引きする」系統の処理もしやすいかなーと


将来的に>>85-92や>>256のようなナビゲーション機能が揃えば
メニューからは項目の大半を削れるかもしれません(all、+全部、実況全部、bbspinkの4つと自動追加)
あとは各板トップから開くのと「板絞」「G絞」で対応というわけです

320:HDI ◆hbVYHgubO6hK
14/09/26 12:24:39.18 umnJSCwR
>>317
> パラメータの一部を略した場合
> 過去の設定をcookieで覚えておく仕様が悪さをするみたいです

なるほど、そういう仕様なのですね。
板に持ち帰って報告してきます。
…つーても、うちの自治スレは閑古鳥が鳴いているのですが(泣)

321:動け動けウゴウゴ2ちゃんねる
14/09/26 21:36:03.44 rQ0Vance
digちゃんも拡張しようと思えば果てしなくやることはありますが
既にもう立派な実用物に育ちましたので、何か他のタスクをなさる余裕があるようでしたら
別サービスになる「過去ログ検索」や「全文検索」を建設してみるのもいいかもしれませんね

過去ログ(スレタイ)検索の方は、一度過去ログのメタ情報だけ全部持って来てインデックスを作ってしまえば
後はやることはdigと全く同じになると思います
これを実装してdigと統合した時点で「ログ速」はクロール対策をするまでもなく過去の遺物となります。名前はdug?

全文検索の方は、手作りでは明らかに莫大すぎて無理なので
dat全部持って来て MySQL + mroonga といった道具立てになると思います
digのようなきめの細かい文字列検索を提供するのは難しいでしょう
それならば…今は2ch.netで全過去ログをhtml公開しているので
「全文検索フォーム」と称して「site:2ch.net」をぐぐるフォームを付けておけばそれで足りるという話もありますw
# CMさん待ちでもいいですがdigでも散々遭遇したように
# 日本語はとにかく特殊処理が多いので非話者による開発は限界があるかもです…

322:動け動けウゴウゴ2ちゃんねる
14/09/27 01:21:51.69 WBuYNXUA
今更ですが
> 短縮url = URLリンク(ula.cc) 拡張子はなんでもok
> 短縮url = URLリンク(ula.cc) 好きなフォルダもok
> 短縮url = URLリンク(ula.cc) もっとフォルダもok
これらってdigの検索結果を貼る上では全く不要ですし
悪用ばかり思い付いてしまうのですが何のためにあるのでしょう…

323:HDI ◆hbVYHgubO6hK
14/09/27 18:42:41.65 8RzfT3hI
以前に要望していた、XGAの画面にタイトルから検索結果の最初のいくつかまでを
おさめてほしいという件ですが、サンプルコードを書いてみました。

URLリンク(www.hdi-psycho.com)
に結果の画像とソースコードとを置いておきましたので、
お時間のある時にでも御高覧いただければ幸いです。

324:HDI ◆hbVYHgubO6hK
14/09/27 18:44:16.96 8RzfT3hI
すみません、フォルダ名に @ を使うと jump.2ch.net が動いてくれないので、
外しました。

URLリンク(www.hdi-psycho.com)
このフォルダ名に変えておきました。

325:動け動けウゴウゴ2ちゃんねる
14/09/28 00:19:06.64 dXhfIpNI
>>323-324
/index1.html は無いかな~

広告が入っている位置のせいかもしれないけど
キーワード用ボックスとスレタイ検索ボタンの関係がわかりにくい
(ラベルで説明しろよって別のツッコミされるかもだけど)

PCもガラケーもスマホも同じHTMLソース使ってるのなら
この配置順で横が狭いガラケーなんかだと
広告の下に検索ボタンが追い出されそうな気もするし
(縮小率にもよるだろうけど縦向きでスマホも似たような状況になる可能性も?)

326:動け動けウゴウゴ2ちゃんねる
14/09/28 02:32:12.11 G0A9rOBZ
そこはできれば正方形じゃなくて横長のバナーがいいんだけどね
横長のを出稿してもらうのは難しいのかな

327:dig ★
14/09/28 03:53:18.04
wdrain

328:動け動けウゴウゴ2ちゃんねる
14/09/28 09:49:28.27 B9lkQWRK
     ,.──,、
   /○。      \
   / ,′       ',;;;;;;;',  ←PNゲッパリラ(gepparilla) 本名(佐藤光) 通称(昭和ハゲ)
  /ノニ=ュ_ _ェ=ニゝ ;;;;',   新潟県()出身  職業 絵画教師()兼漫画講師()
  / 、‐tッ、,゙ "r‐tッァ  ヽハ  twitter垢 URLリンク(twitter.com)
  |  ''   ノ::::!` `゙   リ     ┼ヽ  -|r‐、. レ |
  |   (o oヽ      ).     d⌒) ./| _ノ  __ノ
  | ..;:;;ノ゙゙べ゙゙ヽ;:;:;..   )     ────
 人 ゙゙゙゙;;;;⌒;;;;;;;゙゙     \    制作・著作 NHK

329:動け動けウゴウゴ2ちゃんねる
14/09/28 11:10:54.63 nqKEwuhQ
数年掛かっても全然いいから過去ログも表示されるそこそこの精度の関連スレ表示や
専門板の過去スレ表示支援みたいなのが2ch本体といい感じにくっついて表示されたら嬉しいな
次スレ検出までは負荷的に難しいのかもしれんが
2ch側でtwitterのリプライみたいな仕組みで次スレ立ててついでに関連付けもしてくれるような機能があればそれが個人的な理想なんだが

330:動け動けウゴウゴ2ちゃんねる
14/09/28 11:24:28.13 G0A9rOBZ
>>329
40万ほどある100文字前後の文字列(スレタイ)から類似度の高いものを捜すお仕事ですね
イチから実装すると本当に数年掛かってしまうので
出来合いのライブラリを有り難く利用させて頂くのがよいかと


SimString - 高速かつシンプルな類似文字列検索ライブラリ
URLリンク(www.chokkan.org)
Para-SimStringシステム
URLリンク(alaginrc.nict.go.jp)

331:dig ★
14/09/29 05:02:53.14
そんなこんなでこの週末はフィードのお勉強をしていた
成果物
URLリンク(same.ula.cc)
URLリンク(same.ula.cc)
URLリンク(same.ula.cc)

基本形だけだけど作れるようになった
これって何分おきに更新すればいいのかな?
全部のスレじゃなくてたぶん住人の多いスレだけ載せようとしている。

これを dig に搭載するとしたらどんなのがいいかな?

#ちなみにリーダーは何がお奨め? (PC,android)
↑ Perlも // でコメントアウトokにして欲しいものだ

332:動け動けウゴウゴ2ちゃんねる
14/09/29 05:35:33.34 jNrc/bZv
>>331
インデントに全角空白を使うのはアリなの?

333:dig ★
14/09/29 05:36:49.72
どうなんだろか、

334:dig ★
14/09/29 05:41:08.51
ちなみに、ここでは文句言われなかっただ
URLリンク(www.w3.org)

335:動け動けウゴウゴ2ちゃんねる
14/09/29 23:19:17.79 Kv2456Q8
エディタで開くと熱が出そうになるのでインデントは半角スペースがいいですぅ…


>>331
> これを dig に搭載するとしたらどんなのがいいかな?
各板の「勢い順」を配信するということでしょうか?

だとしたらBbsで単独の板(もしくはallやG_gameなどRSSの提供対象)が絞込指定されている時に
「この板(群)のRSS」というのを出現させるとか
他のパラメータは無視してBbsだけ見ます


あと話ずれますが、からすからdigのS_*へのリンクがあるので
すずめからdigの各板へのリンクも設置してはいかがでしょう
全板のBbsにアクセスできる目次的なものが1つは必要だと思うので
# で、すずめから飛んだ先にRSSのフィードが出ていれば>>331の目的も達せられるというわけです

336:動け動けウゴウゴ2ちゃんねる
14/09/29 23:39:26.93 Kv2456Q8
> 全部のスレじゃなくてたぶん住人の多いスレだけ載せようとしている。
これなんですけど、「最新スレ」もまた別にあるといいんじゃないでしょうか
特定の板(群)でどんなスレが立ったかを購読したい人も多いのではないかと

嫌儲やVIPのような過密板ではうるさいだけかもしれませんが
スレ立ての少ないマイナーな板ほど「最新スレ」の情報価値は上がるはず

337:動け動けウゴウゴ2ちゃんねる
14/10/02 17:27:47.65 r0nZqLps
スマホの時なぜびんたん固定で開かせてるんだろう
他のアプリで開きたいのに

338:動け動けウゴウゴ2ちゃんねる
14/10/02 20:58:59.54 qAYZwM7E
itest.2ch.netがうまく動かないからだったかと。
スマホのブラウザには大抵PCモードもあるので、戻して大丈夫だと思う


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch