自然言語処理スレッド その3at TECH自然言語処理スレッド その3 - 暇つぶし2ch■コピペモード□スレを通常表示□オプションモード□このスレッドのURL■項目テキスト100:デフォルトの名無しさん 09/11/23 11:04:56 ファイル群の特徴ベクトル抽出に一時間掛かったとしても ほぼ無視出来るほどの時間だろう。 これに比べて分類は数倍-数十倍掛かるだろうから。 あと、クラスタリングより類似画像抽出のほうが困難と思った。 大きな分類だけではなく、ひとつひとつの対応まで必要だから。 これを高速で行えれば言語でも使える。 101:デフォルトの名無しさん 09/11/23 11:10:51 基底となるベクトルを3つ、4つなど数個を設定して それとの類似度を計算して3次元、4次元座標に移し替えれば クラスタリングしやすいと思った。 これを計算量は3n、 4nで分類に比べた無視出来る程度。 これで距離が近い物は元々似ている可能性があり 離れていれば、元々似ていないことが決定する。 102:デフォルトの名無しさん 09/11/27 00:39:26 わかち書きってどのようなアルゴリズムでやるんですか。 辞書は与えられたとして最長一致にしたいのですが。 103:102 09/11/27 05:21:43 簡単かと思っていたら、LZH ZIPなど圧縮法と関係あるみたいですね。 圧縮は辞書から最長一列を求めることなので。 次ページ最新レス表示レスジャンプ類似スレ一覧スレッドの検索話題のニュースおまかせリストオプションしおりを挟むスレッドに書込スレッドの一覧暇つぶし2ch