24/08/21 12:30:31.08 .net
ひらがな化APIだと「昨日の夜も暑かった」は「さくじつの よるも あつかった」に変換される
形態素解析APIの結果とも整合性が取れてるから中で使ってるのは同じものだと思われる
昨日の夜も暑かった
[ "昨日", "名詞", "サクジツ" ]
[ "の", "格助詞", "ノ" ]
[ "夜", "名詞", "ヨル" ]
[ "も", "連用助詞", "モ" ]
[ "暑", "形容詞語幹", "アツ" ]
[ "かった", "形容詞接尾辞", "カッタ" ]
で平仮名オンリーのテキストを形態素解析にかけると下の出力が得られるので
これ使えば漢字の読み方の修正も可能
きのうのよるもあつかった
[ "きのう", "名詞", "キノウ" ]
[ "の", "格助詞", "ノ" ]
[ "よる", "名詞", "ヨル" ]
[ "も", "連用助詞", "モ" ]
[ "あつ", "形容詞語幹", "アツ" ]
[ "かった", "形容詞接尾辞", "カッタ" ]
ただこういうのって100%じゃないから
配列比較して単純な読み方違い以外の齟齬があるなら
要人力修正ということで記録しておいて後で対応すれば?