07/03/12 12:41:31 0 BE:265076-DIA(103258)
過去ログ用に固定テキストをひたすら保存するサーバがあっても
いいような気がしてきました。
つか、memoriesに同居とか。
462:動け動けウゴウゴ2ちゃんねる
07/03/12 12:49:49 Mzo4MlK10
>>461
memoriesそろそろ容量が少なくなってきてるらしいですよ・・・。
まあ、増設できるらしいですが・・・。
前にもらったtigerあまってないんですか?
それとbeのメール機能が時々おかしいので見てもらえるとうれしいです・・・。
463:動け動けウゴウゴ2ちゃんねる
07/03/12 14:54:54 AFyu+OQm0
なんかコストばっか掛かって利が無いような。
datにくっ付けちゃうってのはどうなの?できない?
464:動け動けウゴウゴ2ちゃんねる
07/03/12 20:38:10 rmdcm8FM0
>>460
「次スレ追跡する」ボタンみたいにワンクッションおくとかは?
見たい人だけ使う
465: 株価【960】 △△ ◆cZfSunOs.U
07/03/12 20:51:43 8usXw0FZ0
>>461 なるほど......ただ,memories だと HDD 容量もさることながら
httpd + offlaw.cgi なんかと競合しないかなぁ,とか(MySQL を
ストレスなく動かすには,メモリとかリソース結構食いますし).
>>462 残ってる stiger を専用で使うならリソースの競合とかは心配ないですね.
ただ,そんなに HDD 容量がデカいわけでもないんで...... とはいえ,
単にライブな dat のキーワードをコピーして保存するだけなら,
重要度計算用のデカいテーブル (regwords) は過去ログデータの方では
不要なんで,当面は心配ないかも.中長期的には問題ですが......
もっとも,問題が起きたらその時改めて考えよう,ということにしておけば
2ch らしいかも?w
>>463 dat にそういうデータを付けていいのかどうか,っていう
ポリシーの問題もあるかもですね.あと,dat 落ちを制御してる
F22 はいろいろ亜種ができてるらしいとかで,それぞれの鯖で
個別に F22 を改造しなきゃならないかも,っていうのも......
466: 株価【960】 △△ ◆cZfSunOs.U
07/03/12 20:56:16 8usXw0FZ0
>>464 ワンクッション置いても,データ保存するとすれば
結局データ量が増大することに変わりないですし,
on the fly に生成するにしても,今の p2.2ch.io / c2.2ch.io は
リアルタイムにキーワード抽出する前提で作ってないので
苦しいことには変わりないです.
467:動け動けウゴウゴ2ちゃんねる
07/03/12 21:03:17 AIFnMu+70
難しいかなって思うのもいいけど、がんがん試しちゃうのも吉。
もちろん試すのにいろいろ準備とかあって大変だとは思うけど。
468: 株価【960】 △△ ◆cZfSunOs.U
07/03/12 21:33:42 8usXw0FZ0
試すにしても,ライブ dat のキーワード表示に悪影響を与えると元も子もないんで......
なので,過去ログに対処するなら専用鯖等のリソース投入が前提じゃないかなぁと.
469: 株価【960】 △△ ◆cZfSunOs.U
07/03/12 21:37:20 8usXw0FZ0
まぁ,専用「鯖」でなくとも,今の c2 に過去ログ用にストレージ追加とかでもいいかもですけど.
470:動け動けウゴウゴ2ちゃんねる
07/03/13 20:31:36 rUlVQy5G0
スタートレックをスタートとレックで区切るのやめて欲しい
471: 株価【1250】 △△ ◆cZfSunOs.U
07/03/13 22:58:42 aGhE8Edp0
まぁ,意図してる訳じゃないけど MeCab がそう区切ってるってことで......>>470
472:ひろゆき@どうやら管理人 ★
07/03/14 19:54:38 0 BE:403788-DIA(103258)
過去ログに関しては、関連キーワードが変更されることがないので、
スレッドkeyのテキストファイルを作って置いておくだけでいいと思うのです。
ってことで、mysqlはいらないかと。
473:動け動けウゴウゴ2ちゃんねる
07/03/14 20:08:28 LYxNhfWe0
しんぷるいずべすと、と。
ところで
>>472
なんかネタ落としてってw
ひろゆきを訴えたGJ会社員(35) 今度は毎日新聞を訴えてひろゆき涙目www
スレリンク(news板)
474: 株価【1095】 △△ ◆cZfSunOs.U
07/03/14 20:48:05 e0bdMMl00
>>472 なるほど......となると,あとは memories 等に
どういう形で入れればいいか,またそれをどうやって read.cgi で
表示させるか,ってあたりですか.ぼちぼち考えてみます.
475:ひろゆき@どうやら管理人 ★
07/03/14 21:55:27 0 BE:265267-DIA(103258)
XMLにしてjavascriptでincludeみたいなのって出来ないんでしたっけ?
476: 株価【1000】 △△ ◆cZfSunOs.U
07/03/15 05:01:15 VWGYvz9I0
>>475 XMLHttpRequest だと同一ドメイン(というか実質同一鯖)の制限がありますが,
JSON ならその制限なしで可能です.というか,read.html 用 I/F では今も JSON 的な
やり方でやってます.ただ,read.cgi だとブラウザ側の JavaScript の処理能力の不安があって......
477:root▲▲ ★
07/03/15 13:05:40 0 BE:4104959-PLT(23632)
1台、それ用のサーバを用意するかんじですかね。
memoriesのHDDに常時書き込み負荷をかけるのは、
できれば避けたいかも。
478:動け動けウゴウゴ2ちゃんねる
07/03/15 20:08:32 /5nJizMU0
findたまに重いとか話出るけど冗長化しなくて大丈夫なの
ふらだんすに振るとか
479:動け動けウゴウゴ2ちゃんねる
07/03/15 22:40:12 BMqIkGm60 BE:140782032-2BP(112)
UNIX板のスレをOperaで見ると、今も >>184 の現象
| Operaだと関連キーワードやofuda.ccのあれととスレの一番上の全部や掲示板に戻るが重なって
| 掲示板に戻るがクリックできない。
なのですが、>>375-388 のは pc11 鯖には入ってないんでしょうか?
480:ひろゆき@どうやら管理人 ★
07/03/15 22:58:59 0 BE:151564-DIA(103258)
HDDの速度がはやいハードウェアをどこかから調達するといい感じなんですかね。
T-Bananaサーバーの実験を手伝うって名目でなんとかしてもらうとか、、
481:動け動けウゴウゴ2ちゃんねる
07/03/15 23:01:17 MBGNf4P70
名目て
482:ひろゆき@どうやら管理人 ★
07/03/15 23:04:15 0 BE:126454-DIA(103258)
大義名分ってやつですよ。えぇえぇ。
483:フェンリル ◆Fenrir/gaQ
07/03/15 23:06:54 Sg/SBOFd0 BE:140839632-PLT(15220)
自己板の規制解除しなさい
484: 株価【1000】 △△ ◆cZfSunOs.U
07/03/16 06:49:26 2y/u3Gvi0
>>479 pc11 = T-banana なので >>431 ということで......
# そろそろ スレリンク(operate板:797番) を
# やってもいい頃じゃないか,って気もしないではないですが......
>>480 さっそく スレリンク(operate板:913番) がw
ただ,過去ログ用の HDD でほしいのは速度より容量なんですよね.
# むむむさんの >>477 の真意は,「HDD にダメージを与えず長持ちさせたい」ってことじゃないかと.
T-banana のようにディスク I/O の性能が高く,かつ RAM もたくさん積んであるマシンなら,
むしろ MySQL でデカいデータをがんがん扱う用途の方が向いてそうな気がしますね,個人的には.
485:root▲▲ ★
07/03/16 10:15:40 0 BE:2280555-PLT(23632)
>>484
> # むむむさんの >>477 の真意は,「HDD にダメージを与えず長持ちさせたい」ってことじゃないかと.
ですね。
memoriesはデータ格納時以外はほぼread onlyで使いたいなと。
486:root▲▲ ★
07/03/16 10:17:32 0 BE:2463539-PLT(23632)
>>480
HDDの容量が20G台でいいなら、
今使っていないstigerを1台、それ用に割り当ててみるとかですが、
もっと必要なかんじですかね。
487:ひろゆき@どうやら管理人 ★
07/03/16 12:59:57 0 BE:95235-DIA(103258)
必要なHDD容量の算定からはじめてみますか。
488: 株価【950】 △△ ◆cZfSunOs.U
07/03/16 19:36:54 2y/u3Gvi0
「各スレ単位で必要な容量 x 過去ログ発生速度」で,どれだけの期間持つか,てな感じですか.
データを .js のように直接表示できる形で保存するとサイズは大きくなるが CPU の仕事は少ない,
一方 CSV のような形で保存するとサイズは小さくなるが表示する際の CPU の仕事が増える,と.
まぁ CPU の仕事が増えるといっても,現状 p2.2ch.io 1台で全ライブスレの
getf.cgi 表示させてるぐらいなので,stiger を専用で割り当てるなら問題ないと思いますが.
ただ,各スレ単位でファイル作ると,HDD 消費はバイト単位でなくフラグメントサイズ単位になるんですよね.
HDD スペースの利用効率を向上させるには,1ファイルに複数のスレのデータを書き込んだ方がいいのか.
その代わり,必要なデータを検索する仕事が増えると.1ファイルに書き込みつつ
検索も効率的にするには......結局 MySQL を使うとかなるのかな.
489:ひろゆき@どうやら管理人 ★
07/03/16 22:31:20 0 BE:152238-DIA(103260)
freebsdのフラグメントサイズってどれくらいなんですか?
490:動け動けウゴウゴ2ちゃんねる
07/03/16 22:52:28 神 9GMYZRZqP BE:681723397-PLT(35567)
ひーさん2証なんとか汁><。
491:root▲▲ ★
07/03/16 22:58:22 0 BE:1460328-PLT(23632)
>>489
デフォルトでは16k(16384)ですね。
man newfs
...
-b block-size
The block size of the file system, in bytes. It must be a power
of 2. The default size is 16384 bytes, and the smallest allow-
able size is 4096 bytes. The optimal block:fragment ratio is
8:1. Other ratios are possible, but are not recommended, and may
produce poor results.
4k まで小さくできますが、あんまりおすすめしないかも。
492: ◆Choco52.ko
07/03/16 23:27:05 qjJyqUxr0
専門な話題なので横槍!
フラグメントサイズはブロックサイズを8分の1したものがデフォルトで使われるので 2k(2048)バイト ではないかと。
newfs -b 16384 -f 2048 のように指定されているはずか、オプションなしのどちらかですね。
man newfs
-f frag-size
ファイルシステムのフラグメントサイズをバイト単位で指定します。
blocksize/8 から blocksize までの範囲の、2 のべき乗である必要があります。
デフォルトは 2048 バイトです。
493:root▲▲ ★
07/03/16 23:48:12 0 BE:2463539-PLT(23632)
>>492
確かに、フラグメントサイズとブロックサイズは別物ですね。
ご指摘&補足すみませんです。
494:ひろゆき@どうやら管理人 ★
07/03/17 12:36:35 0 BE:403788-DIA(103270)
過去ログのファイル数ってどれくらいなんすかね。。
495: 株価【960】 △△ ◆cZfSunOs.U
07/03/17 19:55:25 2JLdzq820
各板のライブスレ数は大きく変動しないという前提なら,
過去ログ発生速度≒新スレが立つ速度
なのかなぁ......
496:動け動けウゴウゴ2ちゃんねる
07/03/17 22:31:56 QoCeQg460
これどういうシステムなの?
どうやったら反映されるの?
497:動け動けウゴウゴ2ちゃんねる
07/03/19 11:31:06 DEGsDWtn0
スレ内の全レスから単語抽出、DB化して、一定の条件で最頻と思われる
単語を表示させる。
498:動け動けウゴウゴ2ちゃんねる
07/04/01 17:25:54 azmkmmMB0
>133
多分92のキーワードというのがスレの関連した語句になるので、それの検索は考えています。
自動的に"「74」「SevenFour」"など関連した語句の摘出は、ネタとしては面白いのですが、
難易度が高いというか、スレ名によっては多分バカ検索になるので、やるとしても実験的な機能としての
実装になります。多分正解は134さんが書かれているスレッド検索に正規表現をサポートでしょう。
>135
いろいろ作っていますが、どれも中途半端でして、、、
>136-139
先にも書きましたが、弱いとか、上手くいかないのではなく、元々対応していないというのが正解のようです。
今回版で一応修正しましたので、御報告いただければ助かります。
>141
>●対応って、面倒なの?
有償アカウントが必要なんですよね? いまのところ対応予定無しです。
>それと、まちBBSとかが見れないんだけど
過去ログを見ると2chに完全対応したら対応させる等書かれていましたので、メニューのトップには
表示されていますが、対応していません。対応させたいのですが、他が優先順位が高いので調査等保留状態です。
>142
すみません。ちょっと意味が判りません。
>143
まだ考え中ですが、本体側ではスレへアクセスの時に毎回キーワード取得してデータベースに溜めていきます。
あとキーワードを入力するIFを用意してユーザーからも入力が可能とします。
js側のAPIはデータベースへアクセスするsfSystem.getKeywordsとsfSystem.setKeywordを用意します。
溜められたデーターは検索やスマートボードに使ったり出来ます。
データベース内の削除は必要かなぁ。と 時間がなかなか取れないので、そんな感じで止っています。
499:498
07/04/01 17:29:44 azmkmmMB0
あう、誤爆すまん。
500:動け動けウゴウゴ2ちゃんねる
07/04/01 21:24:12 E7umBdRz0
何で本スレに限って出ないんだろうな
URLリンク(find.2ch.net)
スレリンク(curry板)l50
501:動け動けウゴウゴ2ちゃんねる
07/04/06 19:29:06 vyYNJZL70
同じキーで何回も検索するとヒット数がまちまちになるぞ
ヒットしたりしなかったりするスレがある模様
502:nanasi
07/04/07 17:34:36 fHLFxxU/0
>>60
神
503:動け動けウゴウゴ2ちゃんねる
07/04/25 18:23:22 0Clz8p7L0
>>497
スレ内に一度も出てない単語はキーワードとして表示されないの?
504: 株価【900】 △△ ◆cZfSunOs.U
07/04/26 08:35:10 Hogck5gy0
>>503 そういうことになってます.
505:動け動けウゴウゴ2ちゃんねる
07/04/27 18:31:25 3Jd+uTfZ0
これもひでえなあ
ろう じろう しま があってしまじろうがないw
URLリンク(p2.2ch.io)スレリンク(amusement板)l50
506:動け動けウゴウゴ2ちゃんねる
07/04/28 23:33:49 atmqjoj00
ひらがなとカタカナの2字ははじこうぜ
507:動け動けウゴウゴ2ちゃんねる
07/04/30 01:25:58 2vpscozg0
アイコンスレでアイコって酷くね
URLリンク(p2.2ch.io)スレリンク(2chse板:701-800番)
無論無関係なスレばかりヒット&元のスレもヒットせず
リザルトがないのとかあってもまるで関連性のないやつは除外できないんかね
508: 株価【780】 △△ ◆cZfSunOs.U
07/04/30 17:33:19 aNOXlsrQ0
前後の状況によって「アイコン」の区切りはまちまちになるみたいですねぇ<MeCab
【Be】アイコン売買促進スレ★7【icon】
【 記号,括弧開,*,*,*,*,【,【,【
Be 名詞,固有名詞,組織,*,*,*,*
】 記号,括弧閉,*,*,*,*,】,】,】
アイコン 名詞,固有名詞,一般,*,*,*,*
売買 名詞,サ変接続,*,*,*,*,売買,バイバイ,バイバイ
促進 名詞,サ変接続,*,*,*,*,促進,ソクシン,ソクシン
スレ 名詞,一般,*,*,*,*,*
★ 記号,一般,*,*,*,*,★,★,★
7 名詞,数,*,*,*,*,*
【 記号,括弧開,*,*,*,*,【,【,【
icon 名詞,固有名詞,組織,*,*,*,*
】 記号,括弧閉,*,*,*,*,】,】,】
EOS
2ちゃんねる beアイコン サイト
2 名詞,数,*,*,*,*,2,ニ,ニ
ちゃん 名詞,接尾,人名,*,*,*,ちゃん,チャン,チャン
ねる 動詞,自立,*,*,一段,基本形,ねる,ネル,ネル
be 名詞,固有名詞,組織,*,*,*,*
アイコン 名詞,一般,*,*,*,*,*
サイト 名詞,一般,*,*,*,*,サイト,サイト,サイト
EOS
アイコン全リスト、販売者登録所、価格情報ほか
アイコ 名詞,固有名詞,一般,*,*,*,アイコ,アイコ,アイコ
ン 名詞,非自立,一般,*,*,*,ン,ン,ン
全 接頭詞,名詞接続,*,*,*,*,全,ゼン,ゼン
リスト 名詞,一般,*,*,*,*,リスト,リスト,リスト
、 記号,読点,*,*,*,*,、,、,、
販売 名詞,サ変接続,*,*,*,*,販売,ハンバイ,ハンバイ
者 名詞,接尾,一般,*,*,*,者,シャ,シャ
登録 名詞,サ変接続,*,*,*,*,登録,トウロク,トーロク
所 名詞,接尾,一般,*,*,*,所,ショ,ショ
、 記号,読点,*,*,*,*,、,、,、
価格 名詞,一般,*,*,*,*,価格,カカク,カカク
情報 名詞,一般,*,*,*,*,情報,ジョウホウ,ジョーホー
ほか 名詞,副詞可能,*,*,*,*,ほか,ホカ,ホカ
EOS
アイコンショッパー
アイコンショッパー 名詞,固有名詞,組織,*,*,*,*
EOS
他板のアイコンスレ(2ちゃんねる検索)
他 接頭詞,名詞接続,*,*,*,*,他,タ,タ
板 名詞,一般,*,*,*,*,板,イタ,イタ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
アイコンスレ 名詞,一般,*,*,*,*,*
( 記号,括弧開,*,*,*,*,(,(,(
2 名詞,数,*,*,*,*,2,ニ,ニ
ちゃん 名詞,接尾,人名,*,*,*,ちゃん,チャン,チャン
ねる 動詞,自立,*,*,一段,基本形,ねる,ネル,ネル
検索 名詞,サ変接続,*,*,*,*,検索,ケンサク,ケンサク
) 記号,括弧閉,*,*,*,*,),),)
EOS
509:動け動けウゴウゴ2ちゃんねる
07/05/03 16:13:12 X+h1qUif0
カタカナやひらがなで直後にンが来る語句は
ンの直前で区切っちゃいけないんじゃないの
510:動け動けウゴウゴ2ちゃんねる
07/05/13 23:52:21 MYLVfRHs0
あと拗音とか促音の直前で区切るのも
スレリンク(anime3板)l50
511: 株価【900】 △△ ◆cZfSunOs.U
07/05/14 00:28:23 m8V1KKDb0
まぁ,単語の区切りは URLリンク(mecab.sourceforge.net) に依存してますからねぇ......
512:p3084-ip01kyoto.kyoto.ocn.ne.jp
07/05/15 16:20:44 lac4/GYb0
syosinsya
513:動け動けウゴウゴ2ちゃんねる
07/05/16 02:45:21 hDvpyprTO
とまと
514:動け動けウゴウゴ2ちゃんねる
07/07/03 00:54:54 jUIBhvnj0
また拗音で始まるのが
URLリンク(p2.2ch.io)スレリンク(dog板)l50
スレリンク(dog板)l50
515:動け動けウゴウゴ2ちゃんねる
07/07/11 19:21:02 YcnBJDt20
メンテ予告とかメンテ中の表示とかすこしは工夫すればいいのに
516: ◆0Two/OnDrg
07/07/19 06:18:32 oNNrBCU9O
だね
517:'
07/07/26 13:46:00 SSKwDJ+BO
ぴろゆきどこにいるんですか??
518:動け動けウゴウゴ2ちゃんねる
07/09/18 01:02:17 iAwGFgtR0
あのさクリックされたのとか実際に検索で使われてるやつの優先度あげない?