+ JavaScript の質問用スレッド vol.126 +at HP
+ JavaScript の質問用スレッド vol.126 + - 暇つぶし2ch719:Name_Not_Found
24/08/21 12:30:31.08 .net
ひらがな化APIだと「昨日の夜も暑かった」は「さくじつの よるも あつかった」に変換される
形態素解析APIの結果とも整合性が取れてるから中で使ってるのは同じものだと思われる
昨日の夜も暑かった
[ "昨日", "名詞", "サクジツ" ]
[ "の", "格助詞", "ノ" ]
[ "夜", "名詞", "ヨル" ]
[ "も", "連用助詞", "モ" ]
[ "暑", "形容詞語幹", "アツ" ]
[ "かった", "形容詞接尾辞", "カッタ" ]
で平仮名オンリーのテキストを形態素解析にかけると下の出力が得られるので
これ使えば漢字の読み方の修正も可能
きのうのよるもあつかった
[ "きのう", "名詞", "キノウ" ]
[ "の", "格助詞", "ノ" ]
[ "よる", "名詞", "ヨル" ]
[ "も", "連用助詞", "モ" ]
[ "あつ", "形容詞語幹", "アツ" ]
[ "かった", "形容詞接尾辞", "カッタ" ]
ただこういうのって100%じゃないから
配列比較して単純な読み方違い以外の齟齬があるなら
要人力修正ということで記録しておいて後で対応すれば?


次ページ
続きを表示
1を表示
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch