06/11/10 16:23:47 MDTG6YKi
>>80
>>81
お返事ありがとうございます。事例大変参考になります。
頂いたヒントをもとに、なんかいい方法ないかなーと考えておったのですが、
既存PDFをOCRする場合には、読んde Ver.12のAcrobatプラグインがいい感じのようなのでご報告します。
(常識だったらごめんなさい)
これは、Acrobatで開いたPDFを、読んdeのAcrobatプラグインメニューからOCRをかけるものです。
「認識の設定」から「元画像の解像度」を選んでおくと、仕上がったPDFはもとの見てくれを保っています。
読んde単体の「元画像の解像度」処理と違い、JPEGのモスキートノイズのようなものも見えていません。
で、ファイルサイズの増加もほとんどありませんでした。1.8MB => 1.9MB程度です。(英文12ページ)
「手動」だと、認識結果の修正などが読んde上で行えますが、各ページで同じ作業の繰り返しになるのがやや面倒。
よくわからんのですが、PDFの解釈まわりをAcrobatに任せることで、読んdeが「認識と透明テキスト貼付」に専念できた、
っつう感じ??実際、プラグインは「アドインからのPDFファイル読込はできません。Acrobatから読み込んで下さい」
なんてメッセージを出していました。