+ JavaScript の質問用スレッド vol.126 +at HP+ JavaScript の質問用スレッド vol.126 + - 暇つぶし2ch■コピペモード□スレを通常表示□オプションモード□このスレッドのURL■項目テキスト716:Name_Not_Found 24/08/21 10:51:54.70 .net それは確かにそうだね じゃ漢字交じり文字列①を形態素解析で分割して読みを当てればいいんじゃない? [ '昨日', 'の', '夜', 'も', '暑かっ', 'た' ] [ 'きのう', 'の', 'よる', 'も', 'あつかっ', 'た' ] ‘暑かっ’みたいに形態素解析後の要素で仮名漢字交じりのやつは 対応する平仮名読みと比較して [‘暑’, ‘かっ’]と[‘あつ’, ‘かっ’]に分割しながらルビをふる 717:Name_Not_Found 24/08/21 11:18:24.60 zDcbUO74.net >>716 分割してからAPIに送ると 単語によってはうまくひらがな化されんのですよ 音読み訓読みが 718:Name_Not_Found 24/08/21 11:57:29.70 .net >>717 うまくできないという例をいくつか出してみて 719:Name_Not_Found 24/08/21 12:30:31.08 .net ひらがな化APIだと「昨日の夜も暑かった」は「さくじつの よるも あつかった」に変換される 形態素解析APIの結果とも整合性が取れてるから中で使ってるのは同じものだと思われる 昨日の夜も暑かった [ "昨日", "名詞", "サクジツ" ] [ "の", "格助詞", "ノ" ] [ "夜", "名詞", "ヨル" ] [ "も", "連用助詞", "モ" ] [ "暑", "形容詞語幹", "アツ" ] [ "かった", "形容詞接尾辞", "カッタ" ] で平仮名オンリーのテキストを形態素解析にかけると下の出力が得られるので これ使えば漢字の読み方の修正も可能 きのうのよるもあつかった [ "きのう", "名詞", "キノウ" ] [ "の", "格助詞", "ノ" ] [ "よる", "名詞", "ヨル" ] [ "も", "連用助詞", "モ" ] [ "あつ", "形容詞語幹", "アツ" ] [ "かった", "形容詞接尾辞", "カッタ" ] ただこういうのって100%じゃないから 配列比較して単純な読み方違い以外の齟齬があるなら 要人力修正ということで記録しておいて後で対応すれば? 次ページ最新レス表示レスジャンプ類似スレ一覧スレッドの検索話題のニュースおまかせリストオプションしおりを挟むスレッドに書込スレッドの一覧暇つぶし2ch