07/10/28 11:10:53 Zvj7kMPf
>>144
Acrobatの透明テキスト操作は非常に使いにくい。
軽く修正する程度を想定しているような気がする。
>仮に、(スキャン画像+透明テキスト付加済み).pdfが大量にあったとします
>・透明テキストのみを削除して上書き保存できるか?
可能なはずなんだけど一括で全ページに対して指定する方法が見つからない。
>・エクスプローラ、またはAcrobatから、複数の.pdfを選択して一括処理できるか?
前記の通り単一ファイルに対してさえやり方不明。複数はたぶん無理。
>・または、コマンドラインでスクリプト一括処理に対応しているか?
Acrobat自体にスクリプト機能がない。と思う。
>仮に、(スキャン画像のみ).pdfが大量にあったとします
>・.pdfをOCRにかけて透明テキストを付加できるか?
複数の手段で可能。
ex.市販OCRソフト、ScanSnapOrganizer(多少の工夫必要)、Acrobat
ただし試してみたいくつかの市販OCRソフトはJPG→OCR→PDFはそこそこ快適だが
PDF→OCR→PDFはすげー遅かった。
>・エクスプローラ、またはAcrobatから、複数の.pdfを選択して一括処理できるか?
「一括処理」の内容にもよる。スクリプト相当の複雑な処理機能はない。
複数PDFを一つにまとめる等の機能はある。
>・他社のOCRエンジンを別途購入してAcrobatから選択、使用できるか?
読んでココなどAcrobatプラグインのあるソフトならできる。
透明テキストの更新作業は俺も興味ある。
けどScanSnap付属ツールが楽ちんなのと、OCR結果そのものがあまり目に触れないので
(透明テキスト付PDFではテキスト属性は「透明」なので検索やコピペするときくらいしか見えない)
OCR精度はさほど気にならないので放置状態。現状の認識精度もそう悪くないし。