【文字認識】OCRソフト【 自炊 】at SOFTWARE【文字認識】OCRソフト【 自炊 】 - 暇つぶし2ch■コピペモード□スレを通常表示□オプションモード□このスレッドのURL■項目テキスト150:名無しさん@お腹いっぱい。 19/06/23 10:49:31.56 RXmepqIZ0.net まぁtesseractは精度悪くはないけど 実用には値しないよなぁ 151:名無しさん@お腹いっぱい。 19/06/23 11:32:22.27 cmA3lp6Y0.net 何を持って実用というかによると思うが tesseractエンジンのCapture2Textにはずいぶんお世話になってる 152:名無しさん@お腹いっぱい。 19/06/23 15:55:40.30 oeEPZCVa0.net tesseractって認識精度はともかく校正はどうやんの? なんかいいツールある? 153:名無しさん@お腹いっぱい。 19/06/24 00:53:07.52 GF5eEgcd0.net テキストエディタで認識結果のファイルを開いて、 誤認識している文字列を肉眼で拾ったら、 Grepツールに渡してフォルダごと全ページを正規表現検索して、 ヒットしたら正しい文字列に置換。 の繰り返しが基本。 最初にやるのは、まず一行の文字数を揃えること。 一行40文字で組まれているのに、それ以上あればその行はどこか 間違っている。 例:一行41文字以上で行末が句読点ではない文字列を検索する正規表現 ^(.{41,}[^、。]$ 次ページ最新レス表示レスジャンプ類似スレ一覧スレッドの検索話題のニュースおまかせリストオプションしおりを挟むスレッドに書込スレッドの一覧暇つぶし2ch