2ちゃんねるスレタイ検索 dig.2ch.net(ver 0.01)★2at OPERATEX
2ちゃんねるスレタイ検索 dig.2ch.net(ver 0.01)★2 - 暇つぶし2ch347:dig ★
14/08/14 20:59:42.51
サーバの設定をdigに合うように調整たびたび

348:動け動けウゴウゴ2ちゃんねる
14/08/14 21:09:29.74 mpBoIxKg
>>334-337は不治の病?

349:dig ★
14/08/14 21:16:17.65
そんな事はないと思うんだけど
全40万スレッドをなめるのもなんだし・・
と思いいろいろ考え中なんだ
現在は検索条件に合致したもののうち先頭から3000スレッドで打ち切っている
前は60000万スレッドだった

>>347 をやりつつ構想を練っている

350:動け動けウゴウゴ2ちゃんねる
14/08/14 21:29:21.71 mpBoIxKg
優雅な白鳥も水面下では足ジタバタというやつですね…気長に待ちますので頑張ってください


板で絞り込むとメニューに追加されて連続ブラウズできますが
手打ちGETでS_hopeやU_netなどのメニューにないものを指定しても「全ての板」に戻ってしまうようです
S_の時は「***鯖」、U_の時は「***を含む板」がメニューに加わると素敵
URLリンク(dig.2ch.net)
URLリンク(dig.2ch.net)
ついでにここ「[全ての板]板で絞り込み」等となるので後ろの「板」は取った方がいいかも


細かい話ですが…「人気板順」の時、1つの板の中では何順ですか?
もし何順でもないようでしたら投稿・新スレ・勢いどれでもいいですが何らかの順序で並んでいた方が機能的かなと
URLリンク(dig.2ch.net)

351:動け動けウゴウゴ2ちゃんねる
14/08/14 21:39:36.72 mpBoIxKg
新しいグループを考えたのでご検討お願いします
国際・海外に興味のある人のための国際G(G_inter)・世界G(G_world)です
韓国関係ばかりヒットする可能性が想定されたので2バージョン試作しました

全部一緒のバージョン
URLリンク(www.dotup.org)

東亜G(G_fareast)とそれ以外(G_world)で分けたバージョン
G_world URLリンク(www.dotup.org)
G_fareast URLリンク(www.dotup.org)

352:動け動けウゴウゴ2ちゃんねる
14/08/14 22:14:46.66 J+ib17Tw
60000万スレッド?
頭痛がいたくないですか?

353:動け動けウゴウゴ2ちゃんねる
14/08/14 22:19:30.43 mpBoIxKg
過去ログ全部で5000万スレッドちょいらしい

354:動け動けウゴウゴ2ちゃんねる
14/08/14 22:25:48.19 mpBoIxKg
「あの日の2ちゃんねる」というやつのコンテンツに
毎日定時の全板勢い順ソートの結果をスナップショットして蓄積しておくと面白いかも
数年後にはパワフルなタイムカプセルになりそう

355:dig ★
14/08/14 22:30:02.91
>>352
間違った、60000スレッドだった
そしてまた60,000スレッドに戻してみた

>>354
それは面白いかも
何時がいいかな

356:動け動けウゴウゴ2ちゃんねる
14/08/14 22:44:35.71 mpBoIxKg
クエリは1回出すだけなので負荷は問題にならないでしょうし
その日の話題が出揃う22~24時あたりはどうでしょう

「2014日8月14日の2ちゃんねる」と銘打つことを考えると23時頃がいいかも
24時だと14日付けの一覧が実質13日のコンテンツになってしまうので

357:dig ★
14/08/14 23:01:14.78
作ってみよう、そうしよう

358:動け動けウゴウゴ2ちゃんねる
14/08/14 23:30:39.01 mpBoIxKg
「あの日」は現在「歴代よく検索されている言葉」→「2014年」→「08月」→「14日」と4パス必要でツラいので
ゆくゆくはカレンダーや
> [2014]年[07]月[21]日の[2ちゃんねるを見る]
式のインターフェイスもあると良さそうですね

フォームから
> anohi.cgi?year=2014&month=7&day=21
と渡すと URLリンク(dig.2ch.net) にリダイレクトするだけの単純なものでいいかも

359:dig ★
14/08/14 23:47:09.01
そですね、


あとべっかんこにはDATをキャッシュしてるから必死もどきが作れるなぁ
挑戦してみたいものだ

360:動け動けウゴウゴ2ちゃんねる
14/08/14 23:49:59.20 mpBoIxKg
おお、>>1の中検索やスニペットも視野に入ってきますね!
wktkです

361:動け動けウゴウゴ2ちゃんねる
14/08/14 23:54:37.47 psUyqj+l
>>359
マジか
hissiを特別扱いしなくて済むし、datあるなら全文検索も出来るんじゃ?

362:dig ★
14/08/14 23:57:32.06
過去のは貯めてないし、そんなに容量もないし、賢そうな全文検索は
さすがにできないと思うぞ。

363:動け動けウゴウゴ2ちゃんねる
14/08/14 23:59:41.32 pIQ/SLrd
全文は無理でも>>1があれば
・+記者検索(需要有)
・(嫌儲ではもうできるが)スレ立て人BE検索
・話題検索(ゲームならスレタイだけじゃなく>>1の文中に"ゲーム"が含まれるものを含む、とかいくつかプリセットしておく)
ここまではすぐ思いつく

・ソート結果から>>1をつないでフランケンシュタイン状態の疑似板をでっちあげる
こんな真似も…?

364:動け動けウゴウゴ2ちゃんねる
14/08/15 00:03:18.71 mpBoIxKg
そういえばヘッドラインのようにdigの最新投稿順を専ブラで読めるようにすれば
> ・ソート結果から>>1をつないでフランケンシュタイン状態の疑似板をでっちあげる
これを実現できますね(対象の全板が専ブラ上で1つのスレッドフロートのように扱われる)
全板と各グループで用意すると面白そう

速報headline URLリンク(headline.2ch.net)

365:動け動けウゴウゴ2ちゃんねる
14/08/15 00:05:06.85 E1b76wYu
>>362
現存スレだけでも超便利っす

366:動け動けウゴウゴ2ちゃんねる
14/08/15 00:06:30.21 4ohJtz9P
>>364
headline.2ch.net側のアイデアでレイアウトとか使えるもんあったら
どんどんもってってやー

【2ch】ゲームヘッドラインを作ろう (Let's talk about 2ch game headline service)
スレリンク(gamenews板)

367:動け動けウゴウゴ2ちゃんねる
14/08/15 00:06:49.11 AnGKbwR0
>>355
> そしてまた60,000スレッドに戻してみた
運用情報臨時板(ここ)は検索結果に復帰しましたが
地域カテゴリの各板などは依然出ないようです

368:動け動けウゴウゴ2ちゃんねる
14/08/15 00:25:20.72 AnGKbwR0
URLリンク(dig.2ch.net)
> よく検索されている言葉
>
> エボラ 234 回
> 【 186 回
> 金沢 156 回
> 安価 143 回
> 白猫 138 回
> ★ 130 回
「【」と「★」が面白いですね
恐らく「【」は記者が立てたスレ、「★」はパートスレを探しているのでしょう
利用者が使い方を見付けていくものなのですねえ(新機能のヒントにもなります)

369:動け動けウゴウゴ2ちゃんねる
14/08/15 00:47:36.31 sslXKNb6
>>357
その瞬間の勢い順だと勢いが早すぎてすぐに埋まって落ちたスレッドなんかがこぼれてしまうと思うので
埋まったスレの場合は1000いくまでにかかった時間を計算して勢いとする といった形の扱いに出来ないでしょうか

スレリンク(erobbs板:908番)
ここにある勢いデイリーランキングですね
自分が居なかった時間にどんなスレッドが盛り上がっていたか見れると便利だと思うので

370:動け動けウゴウゴ2ちゃんねる
14/08/15 01:07:28.55 AnGKbwR0
実装上、純粋なランキングはCode Monkeyさんの新ヘッドラインの方でやった方がいいんじゃないかな
あちらは「その日の勢いベスト100」「1週間の…」「1ヶ月の…」「2014年の…」と拡張していける

こちらはスナップショット(記念写真)
その日勢いがあったスレなら★1が落ちてても★17とかが写っているからそう問題はないかと
こっちでそこまでやろうとすると5分毎にスナップショットを取ってアグリゲートするような大工事になっちゃう

371:動け動けウゴウゴ2ちゃんねる
14/08/15 01:17:22.80 sslXKNb6
JIM氏は難色を示してますし
なんだかんだで誰もやらないパターンなんじゃないかという感じがしますねえ

372:動け動けウゴウゴ2ちゃんねる
14/08/15 01:19:48.67 AnGKbwR0
これもcode monkeyさん側になるけど、過去ログ検索が実現するなら
1と最終書き込みの日付けからインデックス作れば何でもできるね
意外とどこでも提供されていないのが「立った日付けによる検索」

373:dig ★
14/08/15 02:57:16.22
こんな感じで作り始めてみた

URLリンク(same.ula.cc)

374:動け動けウゴウゴ2ちゃんねる
14/08/15 06:03:52.77 0ekPKbiF
検索拾えていないよな?
近畿 URLリンク(mastiff.2ch.net)
関東 URLリンク(mastiff.2ch.net)

地域カテゴリで東京板だけ使えるのは実験中だからなの?

375:動け動けウゴウゴ2ちゃんねる
14/08/15 09:02:37.50 KB91+4PE
>>372
「inurl:/140713←エポック秒の頭数桁」でググるとかどうだろう?

376:動け動けウゴウゴ2ちゃんねる
14/08/15 09:33:51.36 AnGKbwR0
>>373
おおもうほとんど出来ちゃってますね!
> URLリンク(same.ula.cc)

> URLリンク(same.ula.cc)
のように「newsplus板でID:GZuVp0t30の人」をスレを跨いで調べられるようになればそのまま実用になりそうですね
「ID」をクリックすると板内全スレ、「GZuVp0t30」をクリックするとそのスレ内でのそのIDの書き込みを表示するUIが便利そう
IDの右にそのIDの出現数が(12)のように表示されていれば言う事なし(ログ速と必死の良いとこ取り)

>>374
「+全部」の中では社説+に加え現在SNSニュース+、お詫び+、Walker+も全く検索できなくなりました
他にも古文板なども検索できなくなってますしだんだん範囲が広がっていっているような…

>>375
「date:2013/05 sortby:speed」(2013年5月に立ったスレを勢い順)とか出来ると
過去ランキングが欲しい人にも柔軟に応えられそう

377:dig ★
14/08/15 15:05:23.30
今日はこれに挑戦するのだ

>「newsplus板でID:GZuVp0t30の人」をスレを跨いで調べられるようになれば

378:dig ★
14/08/15 16:38:18.23
へんだな、確かに「社説+」でないな
特定のサーバなのかな、

379:動け動けウゴウゴ2ちゃんねる
14/08/15 16:41:24.69 4ohJtz9P
>>386と変わってなければ
mastiff多いですけど、それだけでもないのか…

380:dig ★
14/08/15 17:01:51.52
こっからデータ取っているんだけど
サーバ名が入っていないのがあるな、

URLリンク(stats.2ch.net)

381:dig ★
14/08/15 17:21:52.59
walker+ ok

URLリンク(dig.2ch.net)

382:dig ★
14/08/15 17:28:48.37
たぶん全部直ったと思う

URLリンク(dig.2ch.net)

383:動け動けウゴウゴ2ちゃんねる
14/08/15 17:32:49.46 4ohJtz9P
社説、近畿、運用臨時行けました

384:動け動けウゴウゴ2ちゃんねる
14/08/15 18:23:48.35 NO028Jr1
地域カテの板 確認しました 乙!

385:動け動けウゴウゴ2ちゃんねる
14/08/15 18:40:34.56 //tZVWYB
URLリンク(dig.2ch.net)

386:dig ★
14/08/15 18:50:34.69
どう?

387:動け動けウゴウゴ2ちゃんねる
14/08/15 19:00:49.35 E8xRemmb
>>385
「スクリプト実効を防止するためこのページは変更されました」

388:動け動けウゴウゴ2ちゃんねる
14/08/15 19:03:35.90 //tZVWYB
>>387
IEだとご丁寧に実行しないでくれるけど火狐だと実行されちゃうな
直ってはないね

389:動け動けウゴウゴ2ちゃんねる
14/08/15 19:07:43.62 //tZVWYB
「(検索ワード)」の検索結果 <a href="/">Topに戻る</a><br>
の(検索ワード)の部分をhtmlspecialcharsでエスケープしておけば大丈夫だと思うぞ

390:dig ★
14/08/15 20:07:37.18
htmlspecialcharsとはなんぞや?

391:dig ★
14/08/15 20:08:52.87
ぐぐったら PHPがたくさん出てきたぞ

392:動け動けウゴウゴ2ちゃんねる
14/08/15 20:12:49.79 //tZVWYB
>>390-391
PHPのXSS対策
危険な文字はエスケープして無害な文字にする関数

393:動け動けウゴウゴ2ちゃんねる
14/08/15 20:15:18.58 //tZVWYB
勝手にPHPで作っていると思ってたがperlで作ってたらすいません

394:dig ★
14/08/15 20:17:19.88
Cなのよ

395:dig ★
14/08/15 20:18:59.21
危険な文字(1)をどうエスケープ(2)するのかな?

(1) (2) がわかれば自作するだ

396:動け動けウゴウゴ2ちゃんねる
14/08/15 20:21:31.69 //tZVWYB
リストにするとしたら
危険文字(置き換え文字)
<(&lt;)
>(&gt;)
&(&amp;)
"(&quot;)

こんなかんじかなあ

397:dig ★
14/08/15 20:21:53.48
> → & gt; とかの話かな?

398:dig ★
14/08/15 20:22:56.92
>>396
そかそか、明日にでもやってみる

399:動け動けウゴウゴ2ちゃんねる
14/08/15 20:24:31.25 NIwROVaR
つうか DSO なら自作しなくても用意されてるでしょう。
ap_escape_* みたいな関数。
URLリンク(svn.apache.org)

400:動け動けウゴウゴ2ちゃんねる
14/08/15 20:24:32.11 //tZVWYB
>>398
なるべく早めにやっとかないと2chだと思って踏んだら他サイト(ブラクラ)に飛ばされるとか考えられると思う
頑張ってください

401:dig ★
14/08/15 20:26:28.48
>>399
おっ そうなのか
ラッキー

402:動け動けウゴウゴ2ちゃんねる
14/08/15 22:44:32.11 AnGKbwR0
検索できない板問題解消ありがとうございました!

用意されているといえば全角⇔半角もmb_convert_kanaで行けるのでは
URLリンク(php.net)

403:動け動けウゴウゴ2ちゃんねる
14/08/15 22:48:57.27 AnGKbwR0
MySQLだと collate utf8_unicode_ci を指定するだけで済むようですね

404:動け動けウゴウゴ2ちゃんねる
14/08/16 02:21:47.72 81mBIZZP
何でシステムが変わったの?

405:動け動けウゴウゴ2ちゃんねる
14/08/16 10:40:00.92 rVt3x0si
β版だからさ

406:dig ★
14/08/16 16:17:31.36
ちょっと不調
いろいろ調整中

407:dig ★
14/08/16 16:20:33.20
googleさんがどびゃっとくると耐えられないのか、

408:動け動けウゴウゴ2ちゃんねる
14/08/16 16:32:18.58 SG6/CwfM
googleさんのクロールは設定で回数制限できるはず

409:動け動けウゴウゴ2ちゃんねる
14/08/16 16:34:00.52 F0yG1rz0
これ?

Googlebot のクロール速度の変更
URLリンク(support.google.com)

410:動け動けウゴウゴ2ちゃんねる
14/08/16 16:42:05.34 8xU5Mb0c
トップページ以外は弾いてしまっても良い希ガス

411:動け動けウゴウゴ2ちゃんねる
14/08/16 16:46:27.55 Z7unARH9
ぐーぐるぼっと用に固定のページを見せてあげるとか

412:dig ★
14/08/16 16:55:06.41
60回/minの検索が今の普通
180回/minのグーくるからのアクセスでサーバがアタフタ
それじゃサーバ弱すぎなので
いろいろな値を調整中

500回/min はこなしたいだ

413:dig ★
14/08/16 20:02:03.84
スレ跨ぎを開始

URLリンク(same.ula.cc)

まだ全部は出ないかもだけど、

414:dig ★
14/08/16 20:03:31.19
IDに/が入ってたら_にしてみてちょうだい

415:動け動けウゴウゴ2ちゃんねる
14/08/16 20:16:39.58 F0yG1rz0
hOkfeX5e0 成功
csA+3E5+0 失敗
IDに他意はありません

416:動け動けウゴウゴ2ちゃんねる
14/08/16 20:23:37.44 9k0WLuc7
dig、4時間前で更新が止まっているような
丁度>>406あたりの時刻です
> 0.1772[秒] 100件見つかりました / 全 415311 スレッド中
> 1[邦楽グループ] 板絞 2014/07/20 12:07:07(立) 4 時間前 ( 32)
>  SOUL'd OUT 総合97 (869)
> 2[アニメ] 板絞 2014/08/14 05:01:09(立) 4 時間前 ( 56)
>  モモキュンソード 5 (147)
> 3[車] 板絞 2014/08/04 08:01:35(立) 4 時間前 ( 74)
>  ☆☆みんカラのイタイ奴について語るスレ7☆☆ (924)

>>413
あとは全スレの中身が出るモードですね!
urlですが2ch・pinkbbs専用なら板名あれば鯖名は不要ですし
スレ番号も省略可だとかなりすっきりしそうです
> URLリンク(same.ula.cc)
UI的にもフォームは<select name="board">と<input name="ID">だけで済みましょう

417:動け動けウゴウゴ2ちゃんねる
14/08/16 20:39:04.54 11FFCuis
URLリンク(same.ula.cc)

うーん
正義で報告するのに使いやすいかどうかというと・・・・

418:動け動けウゴウゴ2ちゃんねる
14/08/16 20:46:05.30 lvGGL0Vu
荒らし報告ってボタンを付けて書式4でだーっと出力する機能

419:動け動けウゴウゴ2ちゃんねる
14/08/16 20:48:15.86 9k0WLuc7
>>417
折角の2ch公式での実装なので
最初から報告用のフォーマットで吐くモードもあっていいかも


こう入れると
> URLリンク(same.ula.cc)
こう吐く
> スレリンク(newsplus板:10番) 2014/08/16 18:51:54.12 ID:PZL7m7510
> スレリンク(newsplus板:18番) 2014/08/16 18:54:32.64 ID:PZL7m7510
> スレリンク(newsplus板:28番) 2014/08/16 18:58:06.05 ID:PZL7m7510
> スレリンク(newsplus板:51番) 2014/08/16 19:05:30.96 ID:PZL7m7510
> ...

420:動け動けウゴウゴ2ちゃんねる
14/08/16 20:53:01.18 9k0WLuc7
普通のWebサービスなら通報ボタンそのものを付けてしまうところですw
ID抽出した状態で[通報]クリック→「理由」を入力して[送信]
浪人持ち限定で利用可能にしてもいいかもしれない

あと1時間に100とか異常な数値になっている場合は通報すら待たず自動検出して荒らし対策もできそうですね

421:動け動けウゴウゴ2ちゃんねる
14/08/16 20:54:05.61 11FFCuis
>>419
こういうソートツールが有るならねぇ
URLリンク(www13.atpages.jp)

ID無しのところとかも考えると・・・
まだそこまでは無理っすかねぇ

422:動け動けウゴウゴ2ちゃんねる
14/08/16 20:56:33.52 11FFCuis
板によって書式違います?
URLリンク(same.ula.cc)

423:動け動けウゴウゴ2ちゃんねる
14/08/16 21:36:13.43 iQCD7n9Y
>>412
このリンクのジャンプ先は見に行かないで~とか
このページにあるリンク全部を辿らないで~とか
お願いするパラメータを仕込まないとアレなのかな?

板絞込みとかよく検索されるワードとかリンク数分
ループバックされてたりするならですけど…

nofollow だったかな??

424:dig ★
14/08/16 22:28:46.70
ちょっとちょっと進んでるんだす
要望は今のうちに書いといてもらえると嬉しい

URLリンク(same.ula.cc)
スレッド内IDランキングが登場した

+ もうまくいかないな、 ?id=xxxx 式にするかな

425:dig ★
14/08/16 22:41:11.00
>>416
あんら
直してくる

426:dig ★
14/08/16 22:43:39.84
直ったはず

427:動け動けウゴウゴ2ちゃんねる
14/08/16 22:44:55.97 F0yG1rz0
直ってますね

428:dig ★
14/08/16 22:45:46.96
>>417-419
書式4modeにも挑戦しよう

429:動け動けウゴウゴ2ちゃんねる
14/08/16 23:11:25.04 5WlfjFT8
XSS対策 >>399
お願いします

430:動け動けウゴウゴ2ちゃんねる
14/08/16 23:26:58.18 iQCD7n9Y
>>424
URL中などに出てくる半角の+ は半角スペースの代替という扱いだった気がするので
半角+ を%エンコードしておかないと半角+ として受信できない予感が…

半角のスペースをそのままだと
コマンドプロンプトにURLを渡した時に別パラメータとして分割されてしまう
とかそんな理由からでしたっけ?(実はよくわかってない…)

431:動け動けウゴウゴ2ちゃんねる
14/08/16 23:36:52.41 +51A/tkA
1人でいいから今どきのwebサービス作ったことのある人をメンバーに入れてくれないかな
データは取得する時に全部utf-8にするとか
jsonでのフォーマットを提供するとか
xss対策するとか
検索のqueryそのまま垂れ流しとか
aタグのhref属性の指定方法とか
色々よろしくないよ

432:dig ★
14/08/17 00:31:22.99
>>385
>と<をエスケープした

433:dig ★
14/08/17 00:35:18.32
必死のほう
またちょっとデータ構造変えたんでデータ集めなおしー
現在5サーバ集めてる

集めるサーバは登録制にした
希望は言ってね~

434:dig ★
14/08/17 00:38:00.99
6サーバだった

if(strstr(server,"daily.2ch.net")) return 1;
if(strstr(server,"fox.2ch.net")) return 1;
if(strstr(server,"viper.2ch.net")) return 1;
if(strstr(server,"orpheus.2ch.net")) return 1;
if(strstr(server,"anago.2ch.net")) return 1;
if(strstr(server,"awabi.2ch.net")) return 1;

435:Mango Mangüé ★
14/08/17 01:19:03.18 BE:249718815-PLT(24509)
sssp://img.2ch.net/ico/mac.gif
phpでも同じかな?
条件文並べるよりも、HASHにした方が断然速いとおもうす。

a. $Entry_Server{daily.2ch.net} = 1;

みたいなのをあらかじめ作っておいて(初期設定)、
本文?中の条件文には抽出した鯖名をkeyに代入する。
登録済み(先に代入済み>>a.)ならば、1が返ってきます。

はんれい: if( $Entry_Server{$sabamei} == 1 ){ やりたいこと }

436:動け動けウゴウゴ2ちゃんねる
14/08/17 01:27:56.24 Ag1f9KGZ
>>435
>>394
Cらしいですよ

437:Mango Mangüé ★
14/08/17 01:29:19.48 BE:249718815-PLT(24509)
sssp://img.2ch.net/ico/mac.gif
退散します(°-°;)

438:dig ★
14/08/17 01:42:55.12
>>419
こんな感じかな?

URLリンク(same.ula.cc)

439:dig ★
14/08/17 01:46:26.00
>>435
一回しか通らないとこだから
多分 ns 以下で終わっていんだと思う
もっと下の単位かな

440:動け動けウゴウゴ2ちゃんねる
14/08/17 01:52:26.63 S5o2kHF/
>>438
規制議論板で質問したところ、大丈夫だそうです

441:動け動けウゴウゴ2ちゃんねる
14/08/17 01:52:27.04 ym7YKk8L
>>438
いい感じですね。
URLリンク(same.ula.cc)

スレリンク(sec2chd板:196番)
参考
スレリンク(sec2chd板:36番)

442:動け動けウゴウゴ2ちゃんねる
14/08/17 01:53:43.39 ym7YKk8L
曜日いらないから参考はこっちかな?
スレリンク(sec2chd板:22番)

443:動け動けウゴウゴ2ちゃんねる
14/08/17 01:55:27.93 ym7YKk8L
あれ?
板ごとに書式違うw

曜日なしのでお願いします。


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch