形態素解析と日本語処理at TECH
形態素解析と日本語処理 - 暇つぶし2ch231:デフォルトの名無しさん
06/04/27 18:42:23
>>230
圧縮ソフトのアルゴリズムが利用できるかも?
辞書式ってのは、よくでてくるビット列に短い符号を割り当てるんだから、
そのあたりを応用すれば、単語としてよくあるものが抽出されると思う。
ただし品詞タグ付は無理だろうけど。

このアイデアはどう?

で、めかぶや茶筌が動くコーパスはどの位の大きさが必要なのかなぁ?
だれか知ってる人いない?


次ページ
続きを表示
1を表示
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch