【ADF】スキャナで連続取り込み010.jpg【OCR】at PRINTER
【ADF】スキャナで連続取り込み010.jpg【OCR】 - 暇つぶし2ch79:名無しさん@お腹いっぱい。
06/11/09 01:14:31 FvRG1vm8
必ずしもスキャンと関係ないのですが、PDF画像とOCRの関係について質問です。
(前スレ870以降あたりでも話題になっていました)

OCRのためにページをラスタライズするのはわかるのですが、その後透明テキスト付きPDFを
出力するのに、なぜどの製品も「出力解像度オプション」みたいなのがあるのかが、理解できません。
「出力解像度」もなにも、元のPDFに透明テキストを貼り付けるだけで一件落着なんではないでしょうか?

私的には、元ファイルの見てくれを完全に保ったまま、テキスト情報も含まれているのが理想です。
試したのは、Acrobat 7 Standard、読んde Ver.12、読取革命 Ver.10、e.Typist Ver.11の体験版で、いずれも微妙でした。
どなたか、良いソフトを紹介して頂けないでしょうか?

# 結果を別途テキストファイルで保存するのはいい感じですが、ページ内の位置情報が含まれないのがイヤです。
# また、読んde Ver.12の「元画像の解像度を使う」オプションだと見てくれは保たれる(ただしjpegのノイズっぽいのは乗る)
# のですが、ファイルサイズが膨れ上がる(例えば英文PDF 12ページで 1.8MB => 34.4MBだった)のが残念・・・



次ページ
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch