07/11/19 06:29:23 dxATtoSi
>>232
何冊かの専門書で試してみたけど透明化テキストは使いものにならない、とい
うのが実感だけどね。ページの背景が真っ白ならまだマシなんだけど、例え
ば図版の中にキャプションの文字列が入っていたり、プログラムコードの断
片などが灰色などの背景色で強調されていたりするともうガタガタ。いくつ
かのOCRソフトで試してみたけど、こればっかりはまだまだ発展途上って感じ
だねぇ。。。
現段階では誤認識の訂正にかかる時間と労力がかかり過ぎるので、目次(余力
があれば索引も)だけをOCR+目で確認して訂正、データ化して検索用に当てて
る。
>単に全文検索用のキーワードにする程度ならば
>全自動で変換したほったらかしのままでも実用に耐えるので
実用に耐えるって、OCRソフトは何を使ってるの? あと、どういった専門の
書籍が対象なの? 嫌味で聞いてるわけじゃなくて、素直に知りたい。