10/09/19 19:18:04 oW+tLAig0
>>772
2行目はその通りだけど、1行目はどうだろう。
たとえば「付きあう」で検索すると「付き合う」とか「つきあう」なんかもヒットするだろ?
Googleに限らず他の(サジェスト機能のない)検索エンジンでも。
てことはWebデータだけあれば、「付きあう」「付き合う」「つきあう」なんかが
同じ事を表してる("表記の揺れ"という)ってのを、機械的に認識できるわけだ。
ここから全部平仮名の「つきあう」を読みとして、残りを変換候補にすれば辞書ができる。
手元に表記揺れデータベースがある人たちなら、わざわざぶっこぬきシステムなんて作らないんじゃないかな。