自然言語処理スレッド その3at TECH自然言語処理スレッド その3 - 暇つぶし2ch39:デフォルトの名無しさん 09/03/08 15:11:53 ほとんど空白ばかりの文書、JPGの中身をコピペした文書は重要でありません。 エントロピーが適度で、人間が先を予測出来る文書が重要らしいと思うのですが厳密にはわかりません。 そこでまず人間に重要らしいと思わせられる文書を自動生成されてみようと思いました。 >>37 トン。 サイモン・シン読んでみます。 もともとの目標が全文検索エンジンを作る事なので、知識0のままで高速にindexを作りたいんです。 次ページ最新レス表示レスジャンプ類似スレ一覧スレッドの検索話題のニュースおまかせリストオプションしおりを挟むスレッドに書込スレッドの一覧暇つぶし2ch