07/03/30 20:58:14 +R/E9vMj0
1.に近づけるためには
意味のある言葉:無意味な言葉 の比率が、なるべく意味のある言葉よりになることが必要。
>>17の方式は多少無意味な言葉が入ってしまう恐れはあるが、意味のある言葉を逃すことはないので
人手による修正操作が加わることで比較的簡単に意味のある言葉の数を増やせると思われる。
4.のny方式のみだと意味のある言葉:無意味な言葉 の比率がよくなることはありえないので
「クラスターワード」というものが必要になったんだろう。でもクラスターワードは分類が大まかで、
細かな嗜好や階層的な分類は一切考慮されない。
結局のところ、3.でも4.でも人の操作で関連性に関するなんらかの入力をしていることになるので、
どうせならその方向で人の入力をいかに簡単に反映させるかでこだわったのが2.>>17の方式。