20/01/05 00:03:08.67 8D3ry83X0.net
すまぬ、dllがいくつか足らないようです。
チョット調べてみます。
182:名無しさん@お腹いっぱい。
20/01/05 00:11:55.50 8D3ry83X0.net
ちなみにWinで動かした時、ウインドウは出ますか?
WSLの時は、モジュールが足らないのでpip installが必要かもです。
183:名無しさん@お腹いっぱい。
20/01/05 00:22:37.06 8D3ry83X0.net
実行するのは4つexeがあるうち、makepdfgui.exeです。これをダブルクリックしてみてください。
184:名無しさん@お腹いっぱい。
20/01/05 00:28:58.36 zsNxjzf10.net
プロンプトとボタンが3つあるGUIが別窓で出てます
WSLではghostscriptとhocr-toolsが使ってるライブラリ(Pillow / lxml / reportlab)はインストールしましたが
後は何が必要か分からなくて入れてないです
185:名無しさん@お腹いっぱい。
20/01/05 00:37:03.33 8D3ry83X0.net
ありがとうございます。
今dllを全部入れたのを作ってますのでしばしお待ち下さい。
186:名無しさん@お腹いっぱい。
20/01/05 00:44:00.95 8D3ry83X0.net
再アップしました。お試しいただければ幸いです。
URLリンク(1drv.ms)
187:名無しさん@お腹いっぱい。
20/01/05 01:00:42.23 8D3ry83X0.net
Linux版はこちらです。WSLで動くかもしれません。
URLリンク(1drv.ms)
188:名無しさん@お腹いっぱい。
20/01/05 21:43:56.51 zsNxjzf10.net
>>183
修正ありがとうございます 無事動きました
makepdfgui.exeは簡易的なフロントエンドという感じですが
gcv2hocr / gcvocr / hocr-pdf をそれぞれexe化されたものが同梱されているので
各プログラムのコマンドライン解説があればバッチ処理で連続実行させられそうですね
あと個人的には出力パス(PDFファイル名)と中間ファイルのテンポラリパスも指定して画像ソースできればいいなと思いました
まあそのあたりはせっかくソース同梱ですし.pyが動かせれば自分で改変できるので
おま環で実行環境づくりに試行錯誤してました
WSLはPython2.7のままだったのでTkinterでハマって一旦断念
dosプロンプト+miniconda でパッケージにrequestsを足してなんとか
```
conda create -n makepdf python=3.7 Pillow lxml reportlab requests
conda activate makepdf
python makepdfGUI.py
```
なお os.path.dirname(__file__) は os.path.dirname(os.path.abspath(sys.argv[0])) に書き換える必要がありました
189:名無しさん@お腹いっぱい。
20/01/05 21:46:07.12 zsNxjzf10.net
×画像ソースできればいいなと思いました
〇画像ソースと分離できればいいなと思いました
190:名無しさん@お腹いっぱい。
20/01/05 22:01:04.34 8D3ry83X0.net
ありがとうございます!
動いてよかったです。
来週にでもgithubに上げますのでforkするなりなんなり宜しくお願いします。
Windows版は.pyファイルのコンパイルにnuitkaを使ってます。コンパイルオプションが長いのでそれも併せてアップします。
Windowsで使えれば少し拡がるかな、と思ってますw
191:名無しさん@お腹いっぱい。
20/01/05 22:19:24.41 8D3ry83X0.net
python由来のexeファイル(gcvocr.exe, hocr-pdf.exe)は単体での起動ができなくて、一緒にたくさん入っている
共有ライブラリが必要になります。
gcv2hocrはMingw64でコンパイルしているので、単体で動作すると思います。
大したものでもないですが、誰かに使ってもらえると嬉しいものです。
ありがとうございます。
192:名無しさん@お腹いっぱい。
20/01/05 22:43:03.98 zsNxjzf10.net
こちらこそ有用なものを上げていただいてありがとうございます
自分もgcv2hocrをexe化できないかなあと思って弄ってた時期もあったんですがニワカ知識だとなかなか
winだとサーチャブルPDFをスキャン時ではなく後から作ろうと思うと
いまだにAcrobatか旧来の有料OCRソフトかみたいな感じでなかなか歯がゆいとこあります
193:名無しさん@お腹いっぱい。
20/01/06 11:35:46.65 d6RRHgpx0.net
とりあえずGithubにあげました。
URLリンク(github.com)
194:名無しさん@お腹いっぱい。
20/01/06 22:22:51.95 Bwv2TAsT0.net
★入れときました
195:名無しさん@お腹いっぱい。
20/01/07 05:50:46.58 iiqYEYaM0.net
ありがとうー
196:名無しさん@お腹いっぱい。
20/01/08 19:11:22.77 c/82od5M0.net
出力pdfを任意の場所に置けるようにしました。
上のgithubのページにダウンロードのリンクがあります。
中間ファイルは別フォルダに置くようにしました。
197:名無しさん@お腹いっぱい。
20/01/09 10:44:21 92Qt7qR00.net
実行時にコンソールウインドウが出ないようにしました。
198:名無しさん@お腹いっぱい。
20/01/09 23:57:29.83 +fFF3jY40.net
改良乙
199:名無しさん@お腹いっぱい。
20/01/10 00:17:04.04 omx2TQEU0.net
乙
200:名無しさん@お腹いっぱい。
20/02/04 10:31:25.64 /JmtElp90.net
Googleドライブに入れてGoogleドキュメントで開いて…のOCRって、使用量に
何か制限があるのかねえ?
1枚に2000文字程度書かれたビットマップファイルを1800枚ほどOCRしてたら、
途中なぜかGoogleに繋がらなくなった。(googleトップページにも繋がらない・
Google以外は問題なく繋がるので回線の問題では無い)
怪しい利用者と思われ、ロックアウトされたのかねえ?
色々やってたら(20分ぐらい?)復活したが・・・
最初e.TypistOneを使ったが、誤認識があまりにも多く断念。
プログラミングのスキルがあれば Google Cloud Vision API を使うアプリ
を作るのだが、無いのでGoogleドライブ経由で利用。
一旦全てのビットマップをGoogleDriveに入れ、ブラウザ上で、
(1) ビットマップファイルをGoogleドキュメントで開く
(2) 書式無しテキストでダウンロード&閉じる
(3) 処理の終わったファイルをDriveから削除
という一連のマウス操作を、UWSCというアプリを使って記録、繰り返し再生し
てる。(1枚約1分)
201:名無しさん@お腹いっぱい。
20/02/04 12:00:35.26 vX8l0M8h0.net
Google DriveでのOCRで上限を感じたことはない。
でも1800枚は時間なり量なりの制限にかかるのかもね。
同じ作業をPowershellのスクリプトで行っているが、
無料のGoogle Driveと有料のCloud VisionAPIとでは
認識結果が異なり、精度は意外にも前者が高く、
処理速度は後者が速い。ゆえに使い分けている。
202:名無しさん@お腹いっぱい。
20/02/04 13:11:16.64 /JmtElp90.net
>>198
>無料のGoogle Driveと有料のCloud VisionAPIとでは
>認識結果が異なり、精度は意外にも前者が高く、
これは意外&嬉しい情報です。 ありがとうございます。
まだ細かくは見ていませんが、Google DriveでのOCR結果は満足いく物のようです。
203:名無しさん@お腹いっぱい。
20/02/04 20:20:23 vX8l0M8h0.net
UWSCは自分も使っている。良いソフトだね。
でもUWSCのスクリプトが組めるならば、
PythonなりPowershellなりへの移行も容易では?
速度が当社比10倍にはなると予想。
204:名無しさん@お腹いっぱい。
20/02/04 21:22:14.83 q1VdwANZ0.net
OK
205:名無しさん@お腹いっぱい。
20/02/04 22:00:57 PXcUvqQM0.net
この辺?
URLリンク(qiita.com)
206:名無しさん@お腹いっぱい。
20/02/04 22:06:17 PXcUvqQM0.net
URLリンク(github.com)
207:名無しさん@お腹いっぱい。
20/02/05 11:23:36 XnWtIzCm0.net
>>200
とりあえず今回は、Google-Drive+UWSCでTEXT化を終えました。
次回があればCloud VisionAPIも検討します。
(何もインストールせずに使えるということで、とりあえずPowerShellで
「Hallo World!」を表示させてみた)
参考に教えて頂きたいのですが、>>198でGoogle Driveより精度が低かっ
たと書かれているCloud VisionAPIは DOCUMENT_TEXT_DETECTION か
TEXT_DETECTION のどちらでしょうか?
208:名無しさん@お腹いっぱい。
20/02/06 15:41:42 6cev/IWh0.net
Foxit PDF は英語と日本語を混ぜてスキャンするとエラーになる?
209:名無しさん@お腹いっぱい。
20/02/16 22:18:12 jLFeBzYu0.net
>>190
ありがとうございます
1200dpiのスキャナー欲しくなりましたw
210:名無しさん@お腹いっぱい。
20/02/29 06:41:24 JcjcxIj30.net
昭和40年頃の手書き青焼きのコピー(A4 23行×100P以上)をテキスト化したいんですが
そういう悪条件につよいソフトって家庭用で存在しますか。
ゴミ、旧漢字、略字・・・ 「多」の上が「ヨ」だったり
211:◆JAVA/drQNg
20/02/29 08:46:14 zMAPSh9k0.net
Adobe Acrobat はバージョンが上がるごとにOCR精度は向上しますか?
212:名無しさん@お腹いっぱい。
20/03/04 10:38:36.74 a2j2NwzM0.net
とりあえず「Capture2Text」使ってみたんだけど、まったく使えなかった…
これ常用してる人いる?
213:名無しさん@お腹いっぱい。
20/03/10 07:56:51.41 m0UgLSDQ0.net
そんな使えないの誰もいないでしょ
214:名無しさん@お腹いっぱい。
20/03/10 09:51:38 5unq0kZC0.net
使いこなせないアホなどいないと言いたいのか
使えないから常用者がいないと言いたいのか
215:名無しさん@お腹いっぱい。
20/03/10 18:32:34.56 s+annSAc0.net
Capture2Textはtesseract & Google翻訳のフロントエンドとしては有能だぞ
基本よその国のマンガやゲームのフキダシを母国語に翻訳しながら読む用途向けなので長文は苦手だが
tessdataをtessdata_fastと入れ替え jpn_vert.traineddataも足せばOCR精度は多少マシになる
あとググってたら Capture2TextみたいなのをGoogle OCR でやってるツールもあった
SSTRとかいうの
要GCPキーだがクソ速い
216:名無しさん@お腹いっぱい。
20/04/16 08:24:43 .net
さっきPDF-XChange Editorの最新版(フリー)を入れたんだが、これめっちゃ機能多いな
無料版だから殆ど使えないけど、こんな機能豊富なアプリ見せられたら買いたくなってくるんだが、
実際はどうなんかな?
5000円ぐらい何だが、買う価値ある?
自炊愛好家にとっては画像圧縮とOCRの機能がどの程度なんかが超重要なんだが、有料版使ってる奴居たら意見聞きたい
217:名無しさん@お腹いっぱい。
20/04/18 09:56:41.39 GR24ABzs0.net
あるある。絶対買うべし
218:名無しさん@お腹いっぱい。
20/04/20 18:31:31.52 tcsUxc360.net
小説テキストデータ化の最終工程で
>>78の通りやってるんだけど
スキャンした元画像の行間がいまいち狭くてやり辛い
スキャンしたテキスト画像の「行間だけ』を広げることのできるソフトはないもんだろうか
(当然用紙の横幅が広がるのは問題なし)
メチルでできるかと思って設定をいろいろいじくりまわしてるんだけどうまくできない
219:名無しさん@お腹いっぱい。
20/04/25 22:50:37.58 AhIDEN180.net
( ´・ω・) 民珍♪
220:名無しさん@お腹いっぱい。
20/04/26 15:34:50.65 rCDPnaLP0.net
>>207
昭和44年の手書き謄写版印刷物をスキャンして試してみました。
Googleドライブにアップロードして、Googleドキュメントにすると、認識率9割以上でした。
221:名無しさん@お腹いっぱい。
20/05/06 21:23:20 nnBg0Ieg0.net
スキャン後のPDFファイルに透過ocrテキストを組み込むことや削除をすることはできますか?
スキャン代行600dpi+ocrをつけて依頼しようかと思っています。
透過ocrテキストが不満な場合、後日(~数年後等)に発売されるかもしれないocrソフトやgoogle等のocrでpdfファイルに
透過テキストを組み込みこんだり削除したいです。
やったことがなく、詳しい人いましたら教えてください。
222:名無しさん@お腹いっぱい。
20/06/22 20:49:34.26 2bHPYWAT0.net
自分用に作ってみました。
良かったらどうぞ。
URLリンク(eznavi.net)
223:名無しさん@お腹いっぱい。
20/07/13 21:18:26.68 gPuYxjHp0.net
質問です。
OCR化ソフト:読取革命
音声出力アプリ:EZ PDF reader
1ページのうち複数のパートに分かれたものをOCR化した順にスマホで音声読み上げしたいのですが、
読取革命側で順番を指定してOCR化しても、スマホアプリ側で音声出力の際に最初のパート以外の順番がバラバラになってしまいます。
おそらくアプリ側の問題なのでPDF読み上げの新しいアプリを探しているのですが中々見つからず、おすすめを教えてほしいです。
MOON proは音声出力時にエラーで強制終了でした。。
224:名無しさん@お腹いっぱい。
20/07/14 04:07:13.49 btizt7Lj0.net
>>220
読取革命が読み取った結果をPDFに出力するのは何故?
Textファイルに出力したら?
225:名無しさん@お腹いっぱい。
20/07/14 19:02:18 qgULxFnG0.net
>>221
テキストファイル出力での読み上げアプリも2つ試したのですが、
文字化けや改行の挿入、いったんアプリを閉じて再度開いた際に前回の再生位置から開始が出来ないなど、
文庫サイズのテキストを読む際での不都合が多かったです。
PDFアプリの方も現在使用しているez pdf reader以上に動作の安定したアプリが中々見つからず、
スレチで申し訳ないのですがスマホ端末での音声出力メインでOCR化されてる方がいれば、、と思い質問させて頂いた次第です。
226:名無しさん@お腹いっぱい。
20/07/15 10:23:16.57 +UBXBhCo0.net
>>222
Androidは、使用してないので分かりませんが
iPhoneならVoice Dream Readerがオススメです。個人的に。
227:名無しさん@お腹いっぱい。
20/07/17 10:09:33.44 Lff+9EMv0.net
>>223
試してみます。有難うございます。
228:名無しさん@お腹いっぱい。
20/07/17 19
229::57:43.35 ID:CK7EEHYK0.net
230:名無しさん@お腹いっぱい。
20/07/18 22:53:37.67 VCDm/xwf0.net
qiitaでOCRを検索したら、日本語に対応したオリジナルのOCRが公開されていた。
フリーの日本語OCR(と学習済みのモデル)を公開しています。
URLリンク(qiita.com)
日本語OCRを作ったので解説してみる
URLリンク(qiita.com)
GitHub
URLリンク(github.com)
すげい良さげなのでインストールしてみたのだが、GPUがないせいかどうなのか、
うちの環境ではPytorchとかCUDAのインストールがうまくいかなかった。
Linuxを使える誰か、試してみてはくれまいか。
231:名無しさん@お腹いっぱい。
20/07/18 22:59:29.26 eAsZD6lp0.net
GPUなしでも動かせるみたいだしWSL入れたらwin10でもいけんじゃね
232:名無しさん@お腹いっぱい。
20/07/20 11:49:35.26 ND5jwxL20.net
tegakiとか簡単に開発できるらしいけどフリーだと無いよな
233:名無しさん@お腹いっぱい。
20/07/20 12:23:14.92 zpjC4PpP0.net
一太郎PADはどうなの?
234:名無しさん@お腹いっぱい。
20/07/20 17:58:40.44 3FOd3QJF0.net
>>213
plusだかなんだかつけて使ってます
大満足だけど、日本語ocrはクソ
手持ちの他のソフトを使うしかないです
235:名無しさん@お腹いっぱい。
20/08/06 08:43:22.36 +Ik17kWF0.net
個人向け日本語ocrはここ10年くらい進歩なし?
236:名無しさん@お腹いっぱい。
20/08/06 09:24:03.23 P4KKN9Zk0.net
>>231
読取革命をつかってるけど、そろそろバージョンアップして欲しい
237:名無しさん@お腹いっぱい。
20/08/06 21:43:22 FpfhWXHQ0.net
Shift-JISだけってのはキツいよな。
URLリンク(www.panasonic.com)
【大切なお知らせ】販売終了および今後の読取革命の販売について
2012年9月より販売を行ってまいりました、日本語・英語活字カラーOCRソフト「読取革命Ver.15」に関しまして、誠に勝手ながら2020年8月31日をもちまして、製品版・バージョンアップ版の販売および開発を終了させていただきます。また、2020年9月30日をもちまして、ライセンス版・ダウンロード版の販売も終了させていただきます。
長らくご愛顧いただき、誠にありがとうございました。
読取革命の開発および販売はソースネクスト株式会社へ移管し、2020年10月7日に新バージョンを発売いたします。
238:名無しさん@お腹いっぱい。
20/08/07 06:23:07.23 n5TZuf+60.net
AIOCRが金出せば結構優秀になったしな
239:名無しさん@お腹いっぱい。
20/09/26 01:42:56.36 ysgjBmc10.net
ラノベ自炊して文字認識で全ページテキスト化して有償の美少女声音声読み上げソフト使って
自作のAudibleみたいなのを作るって現実的か?
この方法ならラノベが読めない俺でもラノベの内容追える気がする
作業用BGMが欲しい
240:名無しさん@お腹いっぱい。
20/09/26 05:37:16.00 CGZLoSUz0.net
と或るラノベ7巻、文字認識したことあるが、
認識ミス取りきれてない気がするよ。
もう二度とやらん。めんどくさ過ぎる。
縦書きって誤認識高くね?気のせいか。
設定資料集やりたいのがあるんだけど、気力がわかない。。。
241:名無しさん@お腹いっぱい。
20/09/26 06:35:51.85 ysgjBmc10.net
うーん 即レスで体験談ありがとう
ソフトとアプデ次第でどうにかなってほしいものだ
242:名無しさん@お腹いっぱい。
20/09/26 07:20:30.92 aByTBdbp0.net
校正作業をどれだけ効率的にできるか、そのノウハウを持っているかどうかによる
243:名無しさん@お腹いっぱい。
20/09/26 13:24:06.12 wTRatOkO0.net
自分で読み上げて音声入力してみたことがある
244:名無しさん@お腹いっぱい。
20/09/26 14:06:45.13 6iAINLva0.net
100%完璧にって言ったら泥沼だろうが、ある程度妥協できるなら問題ない
誤認識もパターン決まってるのも多いから、一括で置き換え出来るし
OCR前にChainLPとかで下準備するのも忘れずに。認識精度が全然変わるから
読み上げソフトも読み上げソフトで癖があるから、読み上げソフトでキチンと読めるように修正する必要もあるけどね(これも妥協次第だけど)
245:名無しさん@お腹いっぱい。
20/09/26 22:20:38.16 MWrmVjkB0.net
ブラザーの複合機でスキャンして付属のOCRで売上表を読み取ってるけど
数字だけなら99%読み取れてるよ。
表には合計値もあるんでExcelで合計計算して合計値が一致してれば全部読み取れてるってチェックができる。
合計値が合わないときはExcelの読み上げボタンで読み上げつつ紙の表に目を通してチェック。
ミスは大体ゴミを小数点として読み取ったり、
ゴミのせいで6が8になったり
かすれて8が6になったり
スペースが入って分割されたり。
スキャン前にゴミを除去するのが重要。
スキャン後は空白の固まりにマウスで矩形領域作ってタブを挿入した後で全ての空白を置換で除去。
これでほぼ正しくタブ区切りになるんでExcelにぺたっと貼り付け。
スキャンの設定は300dpiのグレー諧調で読み取ることが重要。
カラーで保存したい場合は画像用にカラーでスキャンしてOCR用にグレーでスキャンするとかしたらいいと思う。
カラーをうまく処理できるOCRソフトならカラーの方がいいと思うけど
レシートの赤いやつがあると読み取ってくれないレシーピってアプリもある。最近赤い奴に対応したっけな。
246:名無しさん@お腹いっぱい。
20/09/26 22:30:50.03 MWrmVjkB0.net
書き忘れ。
数字の表を読み取るときは英数で読み取るんで日本語はめちゃくちゃ。
日本語だと表を表として読み取ってくれないし、数字もまともに読み取れない。
英数でも表として読み取ってるわけじゃないけど、間に空白がたくさん入るからなんとなく表っぽくなってる。
OCRの作業はひと手間かかるけど、空白除去とかに慣れれば入力するよりかなり早い。
日本語の場合は読み上げさせつつミスがある部分だけ入力していけばいい。
直接変更するのは追いつかないだろうから別の行に書いておいてあとでくっつけるとか。
〇〇〇〇〇〇〇〇〇×〇〇〇〇〇〇〇〇××〇〇〇〇〇〇〇
まる まるまる ←聞きながら入力
↓
〇〇〇〇〇〇〇〇〇まる〇〇〇〇〇〇〇〇まるまる〇〇〇〇〇〇〇 ←あとで合成
マイクロソフトのINKとか言うソフトで蛍光色で色をつけられたりするから
ミスってるところに色を塗っておいて後で正しいのを入力するって方法もあるかも。
247:名無しさん@お腹いっぱい。
20/10/07 20:53:42.38 sG0Mx6Ff0.net
読取革命Ver.16が出た
248:名無しさん@お腹いっぱい。
20/10/08 00:38:44.34 oaaQrpI40.net
英語認識に強くなる予定があるのとUIが変わってるらしい?
なんにせよルビ対応してくれないことには個人的な選択肢が増えない
249:名無しさん@お腹いっぱい。
20/10/08 21:58:57.57 pCm7hS0+0.net
e.Typist使ってるけど、ルビは無視する設定だわ
250:名無しさん@お腹いっぱい。
20/10/13 10:17:34.27 1IwVSGYF0.net
読取革命Ver.16
まだ縦書きの文字修正の時
横倒しになるのかな
251:名無しさん@お腹いっぱい。
20/10/18 02:15:16.51 knd4dkpa0.net
読取革命 Ver16 新規機能ひとつもないな。
不具合も直ってなさそう。
252:名無しさん@お腹いっぱい。
20/10/19 00:44:45.61 CyNFZXML0.net
どうせAcrobatのCleanscanしか使わないからいいや
253:名無しさん@お腹いっぱい。
20/11/01 15:10:52.46 OE4w3Cb/0.net
- 電通による日本人民族浄化計画の手口 -
①日本人の精神を腐敗・堕落させ愚民化させろ
②日本人の女を集中的に狙い洗脳しろ
③ネトウヨ、ヘイトスピーチ、レイシスト等の言葉を浸透させ、同胞への批判を封じろ。
④韓国人識者に政治的意見を言わせ、御意見番化させろ
⑤「同性婚・LGBTを全面肯定しない者は差別主義者だ!」という雰囲気を作れ。
⑥海外セレブやハーフモデルをもてはやし、「日本人は劣等人種だ!」と植えつけろ。
⑦「未だにガラケーの奴は笑い者」という雰囲気を作れ。
⑧「LINEに入らない奴は仲間外れ」という雰囲気を作れ。
⑨「日本人の男VS日本人の女」の対立を煽り、分断しろ
⑩日本人同士で恋愛・結婚させない、子供を生ませないよう誘導しろ
⑪日本同士で結婚していたら離婚させる方向に仕向けろ。
⑫女が活躍するドラマばかり作れ。男は無能な役、笑われ役にしろ。
⑬イケメンブームを定着化させ、「男は外見が全てだ!」と洗脳しろ。
- ソース -
電通グループ会長 成田豊は朝鮮半島生まれ
URLリンク(ja.wikipedia.org)
254:名無しさん@お腹いっぱい。
20/11/03 09:13:18.83 rTcXesbq0.net
Win95のときからつかってるけど
ocrソフトなんてなんの進化もしてない
255:名無しさん@お腹いっぱい。
20/11/04 08:06:13.96 2CPZw8590.net
進化の余地はありそうなんだけどね。
個人用途では需要がないか。
そこそこ有名なフリーソフトレベルの操作性や、設定の自由度ぐらいは欲しい。
256:名無しさん@お腹いっぱい。
20/11/04 11:19:49.67 uNywO3dP0.net
Eightとかその他の名刺認識アプリ
グーグルドキュメントで画像を読み込んだときの自動OCR
これらのほうが段違いに認識がスムーズ
奴らはデータを吸い上げようという魂胆なんだろうが
認識が本業の有料ソフトが副業の奴らに負けてどうする
20年以上検索認識エンジン大きな変化なしとか腐っとるな
257:名無しさん@お腹いっぱい。
20/11/29 14:23:46.17 x7aEVFBM0.net
読取革命Ver.16の英語OCR機能が10月下旬から11月下旬に延期になっていたけど、
もう11月も終わるぞ…
こりゃ再延期かな?
258:名無しさん@お腹いっぱい。
20/12/04 10:04:50.76 s2inLNb80.net
さほど高くないソフトで、手書きの数字(文字は読まなくてOK)をOCRで文字起こししたいです。
何かオススメのソフトはございませんでしょうか。
259:名無しさん@お腹いっぱい。
20/12/04 16:08:37.31 aXsiujer0.net
>>254
スマホアプリに手書き認識する奴がある。
ニューラルネットワークが必要だからスマホか M1 MAC 必須。
手入力したあとExcelに読み上げさせつつチェックしたら?
260:名無しさん@お腹いっぱい。
20/12/04 19:35:55.67 6BGtDygO0.net
googleドライブでいけるよ PCからでも使えるし
ググれはしたばGASで自動化する方法も出てくる
261:名無しさん@お腹いっぱい。
20/12/04 19:37:11.18 6BGtDygO0.net
×ググれはしたば
○ググれば
262:名無しさん@お腹いっぱい。
20/12/04 21:25:36.24 BkfJdpxn0.net
Googleドキュメントに声で入力したことはある
263:253
20/12/12 10:52:24.87 /fsKVCa+0.net
Googleドライブ、なかなか良かったです。
アドバイスくださった皆様、ありがとうございました。
264:名無しさん@お腹いっぱい。
20/12/17 15:01:46.09 EmhXqjui0.net
google driveいいんだけど、手間が面倒くさすぎる。
googleエンジンを使ってるパパッとOCRを使ってる人いますか?
265:名無しさん@お腹いっぱい。
20/12/17 15:03:44.41 EmhXqjui0.net
googeは2段組だと左の段と右の段が入り組んでしまうのが困りものだよなあ。
266:名無しさん@お腹いっぱい。
20/12/18 14:30:16.91 lA9GnPM30.net
>>261
OCRHelper使えば、比較的楽。
267:名無しさん@お腹いっぱい。
20/12/28 21:00:44.55 VlqH5s5B0.net
>>154
今ちょうどこれになって検索しまくってる
頻繁に翻訳してるとグーグル側にはじかれるのかな
グーグル翻訳系は駄目だな
268:名無しさん@お腹いっぱい。
21/01/11 19:08:54.94 cCWQR2l/0.net
校正に一番必要なのはデカイモニター
一行をはみ出さずに表示して
間聞開闇ここらが一目で見分けられるやつ
269:名無しさん@お腹いっぱい。
21/01/17 19:34:10.00 QPWOr2470.net
>>60
質問すみません
(--nodraw)のコマンドは、どう使えばいいんですか?
270:名無しさん@お腹いっぱい。
21/01/17 20:29:10.19 p7Uj5Bfi0.net
>>265
そのオプションはフォークされた改造版で追加されてたんだが
本家のプルリクに上がることもなくフォーク先も今は見えなくなってる
(おそらくフォーク主がプライベートリポジトリに変更したんだと思う
MS買収で無料で非公開にできるようになったから)
フォーク版は他にも画像ソースにjpg以外の形式も指定できるようになってたりと
色々便利そうだったんだけどね、残念
271:名無しさん@お腹いっぱい。
21/01/18 16:07:24.44 4aq7gtM60.net
>>266
同じものかわからないけどこっちで開発続いてそう
URLリンク(github.com)
272:名無しさん@お腹いっぱい。
21/01/18 18:23:18.22 lqqeSLpf0.net
>>267
それだわ!
気がついたらリンク切れててそっから先追えなくなってたんだ
ありがとう!
273:名無しさん@お腹いっぱい。
21/01/19 16:59:59.15 nJ0mxE500.net
>>266
>>267
できました
めっちゃくちゃ感謝です
274:名無しさん@お腹いっぱい。
21/01/29 07:49:55.72 wxsf7Wfh0.net
今Acrobat 9 std使ってるけど、
読取革命とかの方が認識率高いとかありますか?
あとマルチスレッド対応でしょうか
Acrobat9はシングルスレッドみたいで、
PCが8コア16スレッドなのに1スレッドしか働いてません
275:名無しさん@お腹いっぱい。
21/01/29 08:24:46.05 1HVM47hB0.net
読取革命を使うのは認識率の高さではなく
校正のしやすさが目的かな
マルチスレッドはわかんね
276:名無しさん@お腹いっぱい。
21/02/11 18:21:51.86 26F+m0Y80.net
突然失礼します。
現在仕事の関係で大量の画像から主要文章を抜き出し、まとめている作業をしているのですが画像がまとめてあるファイルから一括で読みとってくれるOCRソフトは何かないでしょうか?
277:名無しさん@お腹いっぱい。
21/02/11 19:00:46.81 IHq/iUj+0.net
>>272
若干知識が必要だけどGoogleアカウント作れば無料
GDriveのフォルダにほうりこんだファイル全部処理してくれる
【GAS】OCRを使ってスキャンしたい画像の文字取得を自動化する
URLリンク(www.initialsite.com)
278:名無しさん@お腹いっぱい。
21/02/11 20:17:36.01 26F+m0Y80.net
分かりました!やってみます!!
279:名無しさん@お腹いっぱい。
21/02/11 21:36:37.94 26F+m0Y80.net
どうにかコピペしたコマンドを実行しるところまでこぎつけましたが、いまいち使い方が分かりません(泣)
勉強してできるようにしたいと思います。
280:名無しさん@お腹いっぱい。
2021/02/1
281:3(土) 16:42:15.51 ID:ZeIWlZfb0.net
282:名無しさん@お腹いっぱい。
21/02/13 17:58:27.11 IFB3FsXw0.net
OCR で遺伝子は認識しないだろ(ゲノムスキャン?)
283:名無しさん@お腹いっぱい。
21/02/13 18:38:25.90 ZeIWlZfb0.net
医学書です
284:名無しさん@お腹いっぱい。
21/02/14 04:32:22.06 JX8dJfP00.net
>>276、>>278
スキャンが済んでないのならスキャンと同時にOCRしてしまうのが楽。
スキャンが済んでいるのなら読取革命かAcrobatかGoogle。専門用語辞書が充実していそうなのはGoogleだけど全てGoogle任せになってしまうのがストレスフル
285:名無しさん@お腹いっぱい。
21/02/14 06:39:37.00 57AdeLvf0.net
ありがとうございます
286:名無しさん@お腹いっぱい。
21/02/18 14:26:16.02 YBVmHAJp0.net
度々失礼します。
以前教えていただいたGoogleDrive方式を試してみたところ、どうにかファイル内の画像を読み込んでテキストに出力するところまでこぎつけました。
ただ、設定が悪いせいか、せいぜい2 枚を読み込んだところで変換が終了してしまいます。
手っ取り早くソフト購入を考えていますが、そこそこの精度で大量読み込みをしてくれる物を御存知の方がいればぜひ教えてください。
よろしくお願いします。
287:名無しさん@お腹いっぱい。
21/02/18 18:53:15.29 sbM29q5M0.net
ScanSnap買うのが吉かも
288:名無しさん@お腹いっぱい。
21/02/18 19:26:00.10 RZJx4jaI0.net
Kofax Power PDF Standard
URLリンク(www.kofax.jp)
289:名無しさん@お腹いっぱい。
21/02/18 19:39:21.13 PhET5XgP0.net
お金出せるなら ABBYY FineReader あたりがいいんじゃない バッチ処理もあるし
CZERのOCRエンジンがABBYYなんだが認識精度は悪くないよ
デフォルト設定でPDFにすると画像めっちゃ汚くなるけどテキストで抽出するなら関係ないだろうし
290:名無しさん@お腹いっぱい。
21/02/18 21:18:15.99 FuM14PBd0.net
テキスト抽出じゃなくて検索可能なPDFを作りたい場合のおすすめは?
291:名無しさん@お腹いっぱい。
21/02/18 22:04:26.68 /MMQ5ij10.net
画像ファイルから検索可能なPDFに変換するソフトは、いきなりPDFとかJUSTPDFとかあるな、体験版あるかな
292:名無しさん@お腹いっぱい。
21/02/18 22:14:42.16 rFCUPf3V0.net
>>285
OCR機能のついたドキュメントスキャナーでスキャン
293:名無しさん@お腹いっぱい。
21/02/18 23:34:26.27 PhET5XgP0.net
>>285
横書き文書オンリーで仕上がりの良さ最優先なら>190
フリーのツールなんで設定の難しさやUIの面倒さはある
googleにお布施も必要
簡単さで選ぶなら市販のOCRだろうけど詳しくないので分からん
とりあえずwindowsサンドボックスでABBYY試してみたが
MRC圧縮をオフにすれば画質は保たれるぽい
294:名無しさん@お腹いっぱい。
21/02/19 14:18:04.61 /LGznBXV0.net
e.Typist使ってるよ
検索可能PDFにするときのMRC圧縮はPCで見ると汚いのに、タブレットで見ると良く見えるから不思議
PCの画面を範囲指定してOCR出来る機能はふとしたときに便利
画像読み込みが500枚までしか対応しないのはクソ
295:名無しさん@お腹いっぱい。
21/02/19 14:51:13.32 pqe2wozU0.net
e.typistか読取革命で迷う
296:名無しさん@お腹いっぱい。
21/02/19 17:56:41.05 b3qLx0/L0.net
洋書死ぬほどつらい
pdf→ocr→誤字とか改行チェック→自動翻訳→翻訳チェック
297:名無しさん@お腹いっぱい。
21/02/19 18:34:37.99 zfdZU+YJ0.net
>>289の方へ
前から気になっていたのですが、500枚の読み込みというのは一度にですか?それとも上弦ですか?
298:名無しさん@お腹いっぱい。
21/02/20 13:37:22.40 0EiJ9/Or0.net
>>289
タブレットのアプリに画像補正機能があるのでは?
299:名無しさん@お腹いっぱい。
21/02/20 22:00:35.33 Z3ERY2/H0.net
>>292
例えば520枚のフォルダ読み込ませても、500枚までしか画像リストに登録されない。もちろん追加しようとしても出来ない。
分割して認識させて、後からPDFを結合させれば良いだけではあるけど
>>293
PCと違って画面が小さいから文字の輪郭のがたつきが気にならなくなる、一方で、白黒がハッキリするから綺麗に見えるんでないかなと思ってる
普通のPDFビューアアプリだし
300:名無しさん@お腹いっぱい。
21/02/20 22:44:13.29 u7vHQ+N90.net
>>294
え、単純にppiの差だったら不思議でも何でもないじゃん
301:名無しさん@お腹いっぱい。
21/02/24 14:51:12.19 aqSvsfDI0.net
TESSERACT-ocrで 紙読ませたら
「シャンプードレッサー」 が 「にャンプードジったー」 になった
302:名無しさん@お腹いっぱい。
21/02/25 22:13:45.52 cLb3BFZQ0.net
OCR精度が高くて動作が高速なソフトは?
303:名無しさん@お腹いっぱい。
21/02/25 22:25:33.45 ttwjBNUo0.net
adobe acrobat
304:名無しさん@お腹いっぱい。
21/02/25 22:32:06.79 cLb3BFZQ0.net
サブスク以外で頼みます
305:名無しさん@お腹いっぱい。
21/02/25 23:16:42.87 ttwjBNUo0.net
ワープロ打ちした会議資料など、状態が良い原稿からの日本語の横書きと縦書き文章のOCR化を考えているならe.Typist
文章認識の性能は、読取革命と較べた場合、僅かな差ですがこちらの認識性能が上
雑誌や本などレイアウトが複雑なものや、新聞や古い原稿など状態が良くない日本語文章の他、英語文字が入る場合や、小説や雑誌などの2段組の文章などは読取革命が上
306:名無しさん@お腹いっぱい。
21/02/26 10:13:46.63 RR89ZAlv0.net
300
307:名無しさん@お腹いっぱい。
21/05/01 12:22:34.25 wPbgt6E/0.net
tesseract OCRチャレンジ中。プログラミングの技術書PDFを何とか透明PDF付きにしたいという欲求。
飾り文字とか目次とかが壮大にこける。下のような・・・を無視したいんだけど何かうまい方法ないでしょうか。
02 はじめに・・・・・・・2
308:名無しさん@お腹いっぱい。
21/05/01 17:39:13.89 CU4T262z0.net
>>302
トランプのマーク4種を認識させるときにその文字に限定させることでうまく認識したことがあった。
309:名無しさん@お腹いっぱい。
21/05/01 21:39:33.27 wPbgt6E/0.net
>>303
ありがとうございます。300ページオーバーを一気にやるのは駄目ですね。
whitelist使う感じでしょうか。
310:名無しさん@お腹いっぱい。
21/05/02 17:57:02.87 fc3xJsqr0.net
50冊くらいの教科書、手技書等を裁断して、職場の複合機で、スキャンしてPDF化予定です。
検索可能PDFにしたいと考えています。認識率はそこまで厳密に高くなくても、キーワードで該当箇所が分かれば便利かなぁという程度です。テキストで出力などは予定していません。
分厚い表紙などは別でスキャンして中身のPDFと統合できると良いと思っています。
読取革命を第一候補に考えています。いきなりPDFスタンダードというのはOCR絡みのエンジンがパナソニックと書かれていますが、これは読取革命のものとは違うものでしょうか?ほとんど一緒というレベルならいきなりPDFの方が随分安いので良いなぁという感じなのですが、誰かわかりますか?
311:名無しさん@お腹いっぱい。
21/05/02 18:48:29.25 Xx835nqP0.net
読取革命は読取結果を修正できる
いきなりPDFスタンダードはたぶん修正できない
312:名無しさん@お腹いっぱい。
21/05/02 20:26:16.72 lQUzaBSR0.net
>>306
ありがとうございます。修正するつもりがなければいきなりPDFで良さそうですね。
313:名無しさん@お腹いっぱい。
21/05/02 20:55:33.98 ajDJAhT50.net
職場に複合機あるなら機械単体でサーチャブルPDF作れるんじゃない?
画質は高圧縮でだいたい酷いことになるっぽいが
314:名無しさん@お腹いっぱい。
21/05/03 17:07:18.50 WHA1lrAT0.net
>>308
職場の複合機見たけども、OCRっぽい設定がなかったんですよね。
調べてみると拡張モジュールなるものがあれば良いようなのですが。連休明けにまた調べてみます。ありがとうございます。
315:名無しさん@お腹いっぱい。
21/05/03 18:31:46.14 FElEuZiq0.net
読取革命などのOCRソフトは、画像を読み込み、文字認識、修正、PDFや、ワードなどに出力する。
PDFも読み込めるが、新たにPDFとして出力される。
いきなりPDF COMPLETEなどの最上位板のPDFソフトは、PDFの透明テキストを修正できる。
画像の上に、文字色が透明のテキストが貼り付けられてる。
文字を赤に変えてチェックするけど面倒くさい。
もっといい方法があるかも知れない。
316:名無しさん@お腹いっぱい。
21/05/09 01:03:19.05 jmsS93J00.net
いきなりPDFを購入したものの、肝心のスキャンしたPDF→透明テキスト付きPDFの作業でソフトが強制終了してしまいます。問題なくファイル変換できるものと出来ないものがあるみたいです。
Q&Aにはフォントを追加しているとエラー出るかもとか書いてありますが、そもそもフォントを追加なんかした事ないし、どれを消せばいいのかも分からない。というかこれが原因なのかすら分からない。
サポートに問い合わせてみていますが、返事があるのかすら怪しい。。。やはり大人しくAdobeのサブスクリプションにしておくべきだったのか。
愚痴でした。
317:名無しさん@お腹いっぱい。
21/05/09 12:44:48.40 B+KqUkb30.net
スキャナの設定で、ocrをしてるとかあるのではないかな
318:名無しさん@お腹いっぱい。
21/05/10 22:12:57.20 6JH0PhBK0.net
>>311
ストレージの空き容量を確認してみて。こういったアプリは作業ファイルを多量に作るので...
319:名無しさん@お腹いっぱい。
21/05/10 22:38:16.43 4N16DkIp0.net
jpgでスキャンするか、jpgに変換して、jpgを読み込めば大丈夫だろう
320:名無しさん@お腹いっぱい。
21/05/12 21:30:34.59 obNff0Ek0.net
まあ、10ページでエラーが出るのか、100ページでエラーが出るのか、1000ページでエラーが出るのかの場合分けだな
321:名無しさん@お腹いっぱい。
21/05/13 16:38:29.73 SLu4UeqC0.net
色々とありがとうございます。
スキャナにはOCRの機能はありませんでした。ストレージにもかなり余裕がありそうですが、ものによるのでしょうか。
何度やってもダメなPDFは4ページ、3/4の表示のところで文字認識中というところで落ちてしまいます。同じ日にスキャンしたPDF(2-6ページ程度のもの複数)はOCR化出来ました。
150ページくらいの200MB程度のものは2個/21個は変換できましたが他はダメでした。JPG経由はまだ試してませんのでやってみたいと思います。
サポセンから連絡があり、調べてみます的なお返事でした。
322:名無しさん@お腹いっぱい。
21/05/18 18:05:36.41 p+07QIeH0.net
ワクチン接種記録システムの利用者番号読取がOCRで、読取間違いが発生するそうだ
323:名無しさん@お腹いっぱい。
21/05/19 02:26:34.81 HWxuzQfn0.net
フォントはOCRBで共通でタブレットも同一機種を配布らしいけど撮影環境がマチマチで人によって得られる画像が異なってくるのでそう言う結果になるのは仕方がない。
手振れや角度とかの癖でどういう間違いが出易いとかはあると思う。手振れは持ち方でも変わってくる。
タブレットが大きいから影が映りこむけど、照明が適切か分からない。
ライトは使ってないようだったが、ライトをつけた方が認識しやすい。反射する場合はライト無しにする必要がある。
ピント合わせが出来ない場合が多すぎる。マジ糞。ピント合わせに時間かかる。
カメラが複数ついてる奴はピント合わせ速そうだけど、安いのはカメラ1個だから遅い。
撮影台に乗せて使う場合はピント合わせを固定に出来た方が故障しないし撮影一瞬で出来るしいいことづくめのはず。
セルフレジでも読み取りできないことがよくあるけど、一旦しっかり外して再びしっかり読ませれば一秒で読み取ってくれる。
324:名無しさん@お腹いっぱい。
21/05/19 10:32:09.32 JDDtGBtH0.net
フォント共通で数字のみでも読み取り間違い出るなら、100%認識のOCRなんて夢のまた夢だな
325:名無しさん@お腹いっぱい。
21/05/20 04:54:15.76 KDnYz3pE0.net
最近利用しているガソリンスタンドの料金機(セルフの店なんで)が
QRコードで割引とかあって、
まぁ、レシート出すとその季節の割引券が付くんだけど
それの読み込みが遅くてイライラするのよ
QRコードなのにクイックじゃ無い
結局読み取りのところにレシートを押しつけて、
少しずつ遠ざけていくとまぁまぁ(2回目ぐらいで)読み取るぐらいに安定したわ
レシートだから裏が透けたり、角度が付いていたりピントが合わなかったり
そう言うのに強いのがQRコードじゃないんかね?
326:名無しさん@お腹いっぱい。
21/05/20 08:30:39.20 4Fq3eRUr0.net
OCRとQRは別物だし完全にスレ違いなんだが
あえてツッコむとそれカメラがタコなだけだからスマホ変えたほうがいいよ
QRの規格に文句言うのは筋違い
327:名無しさん@お腹いっぱい。
21/05/26 00:13:19.62 kuNfd1Ht0.net
ガソリンスタンドのセルフ給油機を客が交換するってのはどういう発送なんだろうか?
328:名無しさん@お腹いっぱい。
21/05/28 12:05:47.29 P2WCflXp0.net
2000冊分くらいのpdfファイルがあり OCR済みのものとしていないものが混ざっています。これをまとめてOCRしたいのですが安くあげるにはどうしたらいいですか。
バンドル版のacrobatXはこういう目的に使えますか。
URLリンク(m.qoo10.jp)
329:名無しさん@お腹いっぱい。
21/06/18 13:05:44.71 y51nqA8T0.net
官報を機械可読で公開してくれ
330:名無しさん@お腹いっぱい。
21/07/10 11:32:58.13 oCPigeEQ0.net
Abbyy FineReader15 が7,980円
今日が最終日だよ~♪
URLリンク(www.sourcenext.com)
331:名無しさん@お腹いっぱい。
21/07/17 20:46:01.69 Nx+D16Ts0.net
Windows 10上で無料利用できるAI-OCR 認識精度は95% 認識枚数は制限なし
URLリンク(ledge.ai)
332:名無しさん@お腹いっぱい。
21/07/18 02:32:22.76 oQLnYNbx0.net
>>326
認識率95%ってそんなに凄いの。今使ってるの Acrobat の OCR で困ったことないんだけど、それよりもすごいのかな。
333:名無しさん@お腹いっぱい。
21/07/18 09:04:36.93 lnw1fm580.net
> ※ 認識精度は数字に関するもので、条件で左右されます。
数字だけに限定してさえ100文字中5文字は間違うってことでしょ
手書き認識も含むから活字だけならもっと認識率上がるのかも知らんけど
334:名無しさん@お腹いっぱい。
21/07/18 09:15:41.36 P3XK5s350.net
>>327
まじ?
どういう条件で読んでんの?
335:名無しさん@お腹いっぱい。
21/07/18 16:32:03.31 8SefTmjA0.net
無償OCRか。この企業、どうやってマネタイズするんだろ
情報抜いて横流しするのかな
336:名無しさん@お腹いっぱい。
21/07/19 01:07:30.29 F9XeLcaj0.net
>>326
試してみた。インストールにすごく時間かかった。
説明がなくて使いにくい。
認識実行すると文字化けの出力結果。
これは暇な人が色々試して遊ぶソフトと思った。
即、アンインストールした。
337:名無しさん@お腹いっぱい。
21/07/19 05:34:45.46 fvfQWF3L0.net
AIって自主学習して精度上がる問じゃないのん?
338:名無しさん@お腹いっぱい。
21/07/19 07:58:50.76 F9XeLcaj0.net
全ての文字が文字化けだから。コードを選ばなきゃいけないのかね。
自己学習をしなくてもある程度の精度が出なきゃ学習のための動力が大変だよ。
339:名無しさん@お腹いっぱい。
21/07/19 08:28:19.56 fvfQWF3L0.net
全てとなるともう根本的に対応してないのか…?
340:名無しさん@お腹いっぱい。
21/07/19 10:34:39.69 F9XeLcaj0.net
インストールして試してください。約1 GB のアプリです。もしかしたら私の使い方が根本的に間違ってるのかもしれない。
341:名無しさん@お腹いっぱい。
21/07/19 16:42:09.54 3A2XjCut0.net
アクセス集中で大変だったりして
342:名無しさん@お腹いっぱい。
21/07/19 21:27:30.10 8sS8G9mf0.net
アカウント作れがうざすぎ
343:名無しさん@お腹いっぱい。
21/07/19 23:38:16.48 DpU5b5C20.net
やっぱり情報抜く系みたいだな
やめとき
344:名無しさん@お腹いっぱい。
21/07/20 01:05:44.37 LR2/vrCo0.net
きっと背後に中国がいるぞ
345:名無しさん@お腹いっぱい。
21/07/21 01:43:25.56 qQ5Ez8Mv0.net
本を見開きでスキャンしたらできる本の周りの影と真ん中の影を消すソフトないでしょうか?どちらか一つでもいいです。
346:名無しさん@お腹いっぱい。
21/07/21 09:17:53.10 9Y2uwqlR0.net
マルチ乙
347:名無しさん@お腹いっぱい。
21/07/21 09:18:19.15 gZhpeJ+z0.net
さらに歪曲まで修正するのがあったような
348:名無しさん@お腹いっぱい。
21/07/21 13:02:55.40 qQ5Ez8Mv0.net
>>342
是非教えてください
349:名無しさん@お腹いっぱい。
21/07/21 13:04:34.65 qQ5Ez8Mv0.net
自分で調べたけど発見できませんでした。
念のためですがスキャン自体は Acrobat の スキャン機能 を使ってます。スキャン後の PDF の影を取るソフトです。
350:名無しさん@お腹いっぱい。
21/07/21 13:07:50.05 gZhpeJ+z0.net
OCR機能は無い
351:名無しさん@お腹いっぱい。
21/07/21 13:12:00.06 9Y2uwqlR0.net
マルチ乙
352:名無しさん@お腹いっぱい。
21/07/22 16:50:26.47 fGMCvnhV0.net
スマホのOCR、ピントが固定になるようにして使ってるけど
たまに下敷きの量が変わって距離がわずか数ミリずれるだけで認識精度50%とかになる。
レシートがしっかり幅いっぱいになるようにして撮影しなおすと95%くらい認識する。
影ができると精度かなり落ちるから今はスマホのライトOnで撮影している。
353:名無しさん@お腹いっぱい。
21/07/23 11:27:10.26 rD1VLEV50.net
読取革命DL版セールしてんね
354:名無しさん@お腹いっぱい。
21/07/23 14:20:26.16 xlv839tH0.net
まま?
355:名無しさん@お腹いっぱい。
21/07/23 14:33:46.10 8RLvQ8nD0.net
まままーままーまま
356:名無しさん@お腹いっぱい。
21/07/23 18:30:19.88 KFQ0x8UC0.net
読取革命で認識させると文字が少し小さくなるのは何でかな
357:名無しさん@お腹いっぱい。
21/07/29 10:14:59.19 0JzdyqZz0.net
Capture2Text使っていて、>>159 と同じ症状。
どなたか、詳しい人はいませんか?
GUIだと認識できる日本語が、CLIだと化けて出力される。
英語や数字の認識には差異は無さそう。
358:名無しさん@お腹いっぱい。
21/07/31 21:04:10.52 3gNkzigk0.net
URLリンク(qiita.com)
PowerShell で CMD と入力してコマンド実行してもいいかも。
359:351
21/08/01 12:17:19.04 EKgADGMN0.net
>>353
ありがとうございます! お陰様で、解決できました。
コマンドプロンプトからの動作は chcp 65001 で改善したのですが、
実は、UWSCのDOSCMD関数から叩きたくて、これは、何をやっても解決しませんでした。
(レジストリでAutoRun弄ってもダメ)
UWSCにはPOWERSHELL関数もあって、そちらからは文字化けせずに取得することができました。
360:名無しさん@お腹いっぱい。
21/08/03 18:25:28.98 1yBwwluW0.net
スキャンで作成したPDFをOCRで文字認識させました。
表示されている文字で検索してもヒットしませんでした。
当該文字をコピーしてテキストファイルに貼り付けると別の文字になっていました。
OCRに詳しくないので教えてほしいのですが
1、認識後の文字はもとの文字の上に透明のフォントで重ねているのでしょうか?
2.今は、グラフの線が白黒だと判別できないのグレースケールで600DPIでスキャンしています
(300DPIだと文字の周りがにじむので)。認識率を向上させるために注意する設定項目があれば教えて下さい。
361:名無しさん@お腹いっぱい。
21/08/07 08:52:19.64 rqbKqC/20.net
>>355
僕はプリンタ付属のOCRでスキャンしてますが、600dpiより300dpiのグレーが認識率高いです。
文字がにじんだ方が線が分離しなくなるので機械には読み取りやすくなるようです。
僕は数字の表だけ読み取れればいいんで英数で読み取って数字以外は捨ててます。
矩形でタブを入れ、空白を置換で削除することでExcelでも表として認識できます。
昨日は1ページスキャンして1文字だけ認識してませんでした。
もしかすると、矩形の空白を削除するときにその数字だけはみ出していて削除してしまったのかもしれません。
元が英数ならいいんですが、日本語の文字化けでずれが大きくなるので。
ブラザーの複合機ですが、新しいアプリより ControlCenter4 のOCRの方が使いやすかったです。
PDFの方は詳しくありませんが、PDFにはレイヤ機能があって重ね合わせが出来ます。
WORDでもハガキのイメージに合わせて郵便番号や宛先など配置できますよね。
文字が正しく読み取れなかったとしても、その化けた文字が配置されるので検索では本来の文字は出てこないでしょうね。
362:名無しさん@お腹いっぱい。
21/08/07 12:24:46.27 iSVP+I520.net
>>356
コメントありがとうございます。
私もブラザーのプリンターを使ってます。ブラザーの OCR ソフトは使い方がよくわからなかったので日本語の縦書きの認識もそこそこ良かったAcrobat の OCR を使うようになりました。
300 DPI の方が認識率が高いというのは新発見です。
363:名無しさん@お腹いっぱい。
21/08/08 10:01:09.25 kyf68uXo0.net
スキャンした画像をChainLPなどの画像処理ソフトで下処理してからOCRに掛ける
364:名無しさん@お腹いっぱい。
21/08/08 13:44:29.33 7AjcYiKn0.net
>>358
汚れてもないしトリミングの必要もない場合でも CHAIN LP で何かをすれば認識率は上がりますか?
上がる場合はchainLP のどの項目を使えば良いか教えていただけますか
365:名無しさん@お腹いっぱい。
21/08/08 19:14:09.75 0wTn0qmR0.net
自分で仕組、理屈を考えてみろよ
366:名無しさん@お腹いっぱい。
21/08/08 20:38:22.55 IfVfnYiT0.net
OCR前にソフト側で2値画像に変換されてしまうし
事前補正はあんまり意味ないよ
画像をどうこうするよりOCRソフトのユーザー辞書学習カスタマイズして
パターン登録するほうが効果は高い
367:名無しさん@お腹いっぱい。
21/08/09 01:03:41.06 oBYKB49n0.net
>>361
なるほど、そうなんですね。
368:名無しさん@お腹いっぱい。
21/08/09 09:41:20.64 a4Sxnc9w0.net
chainLPで検索したら漫画は16階調が一般的で一括変換出来るツールだと出て来た。
僕が16階調に加工するとき、画像の濃さを細かく調整しないとあちこち消えてなくなる現象があった。
少なくとも256階調はないとOCRには向かない。
256階調のままで600dpiを300dpiにしてくれるなら認識率が上がるかもしれない。
・・・そう言うツールではないようですね。
> V0.37-3
> ChainLPでは、画像を1ピクセルあたり1ポイントとしてPDFに配置します。つまり72dpiです。
> よって、出力サイズとして600×800ピクセルを設定した場合
369:は、PDFのページサイズは約8.3×11.1インチとなります。 > これは、ほぼA4サイズに近い大きさです。 > ChainLP v0.38-2 > ・元画像の解像度(dpi)を引き継ぐようにしました。しかし、あまり意味はないと思います。 https://lifehack-lab.com/chainlp_set1/ > Kindle PaperWhiteで自炊本を読む場合、PDFそのままでは非常に読みにくいです。 > mobiというファイル形式に変換してあげるととても読みやすくなります。 > そこで登場するのが、「ChainLP」というソフトです。 > 各種ファイルに変換できるのですが、画像の補正、トリミングが同時にできるので、Kindle用のmobiファイルをつくるのには重宝します。 > どうやってもきれいにならない場合は、別のツールを試してみましょう。 > >こちらのページを参考に(Xnconvertというソフトです) > Xnconvertできれいにしてから、ChainLPに再挑戦してください。 > XnConvert. 画像のリサイズやフォーマット変換からフィルタ加工まで一括処理
370:名無しさん@お腹いっぱい。
21/08/09 10:23:52.59 OqeDcUJs0.net
色々勘違いしてそうだけどChainLPでも256階調出力は可能
つってもそれだけのためにChainLP使うよりRalphaとかの方が楽だけど
あともし漫画をOCRしようとしてるなら諦めたほうがいい
capture2textみたいにフキダシ抽出の機能のあるアプリか
GCV系のAI型じゃないとほぼほぼ無理
371:名無しさん@お腹いっぱい。
21/08/09 19:56:02.71 V0NxvfPM0.net
>>361
実際やってみたの?
俺は効果ありまくったから毎回下処理してるよ
372:名無しさん@お腹いっぱい。
21/08/09 20:52:04.70 dAASpWa80.net
ドキュメントスキャナの類だとある程度スキャナドライバ側で補正かけられてるから
いうほど効果ない場合もある
機種や設定次第
ノイズの多いスキャン画像なら補正も有効だけど
設定のわかりにくいCainLPより一括処理できる画像ソフトのほうが
シンプルに分かりやすいんではないかとは思う
373:名無しさん@お腹いっぱい。
21/08/10 00:19:46.38 9pRWSzRN0.net
>>365
具体的にどんな元原稿に対してどんな効果があったか言ってくれないと効果ありありと言われてもね。
374:名無しさん@お腹いっぱい。
21/08/12 19:07:27.37 M3IwL1EP0.net
フリーで優れたocrソフトってありますか?
用途は、アマゾンキンドルで実用書読んでるんですけど、
参考になった部分をスクショで撮ってそれをocrで文字起こし、メモ帳にまとめる
ってことがしたいです
375:名無しさん@お腹いっぱい。
21/08/12 19:17:55.60 W1e/W8C/0.net
>>368
>212
URLリンク(twitter.com)
(deleted an unsolicited ad)
376:名無しさん@お腹いっぱい。
21/08/12 19:23:21.80 W1e/W8C/0.net
ああごめん翻訳いらなくてスクショ起こしだけならCopyfishでいいんじゃない?
ブラウザ拡張だけどデスクトップのキャプチャもできたはず
377:名無しさん@お腹いっぱい。
21/08/22 12:15:30.21 InGHoZ6h0.net
衝撃…世界が馬鹿にした日本のFAX、実は米国でもコロナ報告で普通に使っていた
URLリンク(president.jp)
> 北見工業大学教授で公衆衛生分野の情報化に詳しい奥村貴史氏が同サイトに寄稿にした記事によると、
> 同氏からの改善につながる提言に、「OCR(光学文字認識、活字を文字コードに変換するソフト)処理を前提としたフォーマットをFAXで扱う」というものがあります。
> これなら、FAXによる一元的管理機能を担保しつつ、
> アナログでデータを受信しても、
> OCRスキャンすれば直ちにデジタル化できますから、
> 入力する現場の手間を減らすことができます。
OCRでレシートや売上表読み取りしてる身からすると、
数字ですら完全には読み取れないのに
どうしてFAXなんかで送った人名を読み取れるんだと。
せめてQRコード化して送れよと。
工業大学の教授ですらこの程度の事が分からないんだな。
378:名無しさん@お腹いっぱい。
21/08/23 11:49:45.91 OlmLkjoZ0.net
いまだにFAXを使うしかない事情として
> 医療機関、自治体、保健所など複数の関係者で共通のシステムを整える必要があり、そのためには膨大なコストと時間がかかる
つってるのにQRコード化して送れとか無理でしょ
> 数字ですら完全には読み取れないのに
> どうしてFAXなんかで送った人名を読み取れるんだと。
そこはフォントの種類とサイズ次第じゃない?
FAX機が吐き出した紙をスキャンしてOCRかけるイメージなのかも知らんけど
FAX受信した複合機でそのままFax TIFFとして保存すれば
FAX形式データってほぼ G3 FAX(200x200dpi)だから200dpiの白黒データとして確保できる
200dpiあればOCR性能は充分という説もあるし
(それだけあれば完璧にOCRできるということではなく、
それ以上にしてもOCR精度の向上は望めないという意味)
カラーやグレスケでスキャンしてもOCR時は内部的に2値に変換してから処理することになるので
スキャン時に白黒(2値)を選ぶのはコスト減らすためにはあり
保存フォーマットは大体勝手にFax TIFFになるので
> 「OCR(光学文字認識、活字を文字コードに変換するソフト)処理を前提としたフォーマットをFAXで扱う」
というのも正しい
379:名無しさん@お腹いっぱい。
21/08/23 15:49:32.12 fGb2UNbz0.net
>>372
そんな反論は予想通り。
OCRできるんなら送る側が自分でOCRしてQRコードを追加で印字すればいいだろ。
パソコンから直接FAXと電話回線に繋げて送るんなら精度は高いかもしれんが、
一回印刷してからFAXに入れるんなら、読み取るときに字がくずれるしゴミも読み取ってしまう。
仮に直接FAXと電話回線に繋げてたとしても、送信に成功したかどうかってすぐわかるの?
送ったかどうかって履歴に残るの?
PDFに印刷してからメールに添付して送れば履歴残るし
PDFを印刷してスキャンしてOCRもできるし
PDFからOCRできるし
PDFのフォントと文字コードがそのまま使えて検索までできちゃうんですけど?
そもそもFAXと聞いて手書きを想定してない時点でダメだけどね。
380:名無しさん@お腹いっぱい。
21/08/23 15:54:44.90 fGb2UNbz0.net
・QRコードをFAXで送る方法
・PDFファイルをメールで送る方法
この2つだとシステムが専用だとQRコードは難しいかもしれんが
Windows使ってるならPDF印刷は標準機能だから簡単に追加できると思うよ。
そして役所は基本的にメールでやり取りしてる。相手がFAXしか使えないならFAXも使ってるけど。
コロナ補助金申請したけどExcelのファイルをメールでやり取りしたよ。
印刷した奴も郵送したけど。
郵送した理由は「印鑑がないと正式な書類にならないから。」
ようするに技術的な理由じゃなくてルールの問題なんだよ。
381:名無しさん@お腹いっぱい。
21/08/23 19:28:55.86 OlmLkjoZ0.net
>>373
FAX使ったことない人か
送信の成功失敗は履歴から分かる
普通のFAX機なら失敗しても3回なり5回なりの時間置いてリトライする機能も付いてる
現状でFAX廃止できない状況だからそれを活用しましょうってことで
FAX以外は受け付けませんってことではないでしょ
PDFながせるそれでいいだろうしメールはだめですとも書いてない
各関係団体はそれぞれの基幹システムやデータベースで既に管理してるが
そこから出力できる形式にはだいたい制限があるし書式もフォーマットもバラバラ
お役所仕事のようにExcelのこのフォーマット以外はだめです、
送信のためにもう一度体裁整えて新たに入力して下さいとかやってる暇がないので
エクスポートや印刷で出せるものをそのまま流してもらうしかないのがおそらく今の現状
アナログで対応するというのは、そこはそのまま送り手に負担を強いず
どんな書類が来ても受け側で自動でどうにかできるすげえ力技システム組んじゃいましょうってことで
FAXで受けるなら手書き書類も考慮してるだろうし
(手書きOCRの実用性はググればまあまあ出てくる)
リソースは当然必要だろうけど大学ならAI OCR研究やってるとこと提携して
市販の既成OCRソフトとは規模の違う精度のものが組めるアテがあるのかもしれん
382:名無しさん@お腹いっぱい。
21/08/23 20:18:25.89 CYyOePzH0.net
>>375
> (手書きOCRの実用性はググればまあまあ出てくる)
> リソースは当然必要だろうけど大学ならAI OCR研究やってるとこと提携して
> 市販の既成OCRソフトとは規模の違う精度のものが組めるアテがあるのかもしれん
馬鹿だろお前。
大学の無能教授と無能学生になにが作れると思ってんだ?
作ることが可能ならとっくの昔に存在してるし、
今存在してないならこれから先も作ることは不可能なんだよ。
作れる人間が生まれてくるまではな。
383:名無しさん@お腹いっぱい。
21/08/23 21:54:40.53 YrGASWyP0.net
うるせえ
よそでやれ
384:名無しさん@お腹いっぱい。
21/08/23 22:10:01.75 OlmLkjoZ0.net
FAXに続きスマホも使ったことない人なのか
URLリンク(i.imgur.com)
googleのこのOCRエンジンがGCV登録すればAPIで使えるので
個人でも高精度OCRアプリが作れる時代ですよ
お金出せば使えるそこそこ運用実績のあるシステムもググれば出てくる
(存在してる)
URLリンク(www.tegaki.ai)
385:名無しさん@お腹いっぱい。
21/08/23 22:12:17.86 OlmLkjoZ0.net
あっ紙に書いたID 自分のじゃないやん間違えちゃった
痛恨のヒューマンエラー
386:名無しさん@お腹いっぱい。
21/08/23 22:46:53.84 CYyOePzH0.net
俺はGoogle検索しただけで50万円請求されたからね。Googleから。2回ほど。
馬鹿は50万でも一千万でも請求されてろ。
387:名無しさん@お腹いっぱい。
21/08/23 22:53:28.53 CYyOePzH0.net
> Cloud Vision API には画像解析のための各種機能があります。どの場合でも、ご利用いただいた分だけお支払いいただきます。最低料金などは設定されていません。
> TEXT_DETECTION 画像内のテキストに対して光学式文字認識(OCR)を実行します。
> 1,001~5,000,000 ユニット/月
> テキスト検出 $1.50
あら、お安い。
> 1,000 ユニットあたりの料金
5,000,000 ユニットの料金は$7,500
388:名無しさん@お腹いっぱい。
21/08/23 22:54:59.36 CYyOePzH0.net
日本円だと82万円だね。お安いね。
389:名無しさん@お腹いっぱい。
21/08/24 08:18:42.85 6FahnTPL0.net
50万2回請求ってw
規約も読まずにOCRしまくっちゃったの?
> 日本円だと82万円だね。お安いね。
500万ユニットが月に処理する回数として妥当値なのか知らんけど
運用費用としてはありなんじゃないの
日本中のコロナデータ集積して人力入力させてる人件費を考えたら
390:名無しさん@お腹いっぱい。
21/08/24 09:19:52.10 NY7D9FCw0.net
>>383
>Google検索しただけで
字も読めないほど耄碌したの?
OCRする人件費がないから日本中の自治体でワクチンの発注ができなくなったのを忘れたの?
391:名無しさん@お腹いっぱい。
21/08/24 09:58:03.25 6FahnTPL0.net
人に説明するの下手な人か
今更だが触っちゃいけないタイプだったな
ゴメンな?独り言の邪魔しちゃって
392:名無しさん@お腹いっぱい。
21/08/24 12:44:38.28 NY7D9FCw0.net
>>385
「Google検索しただけで」では説明が下手ですか。
Google検索を一日中繰り返していたらブラウザに請求書が表示されてそれが50万円で請求者はGoogleとなっていました。
チャットで交渉出来たので支払いは免れましたが、「今後このようなことがあれば業務利用とみなし、契約を結んでもらいます。」との事。
業務でGoogleの機能を使えば毎月80万円程度のお金がかかることは >>378 も >>383 も認めている。
393:名無しさん@お腹いっぱい。
21/08/24 14:12:24.41 6FahnTPL0.net
???
ごめん何言ってるかサッパリわからない
どういう状況でGoogle検索したら50万も請求が来るのか全く理解できない
> 業務でGoogleの機能を使えば毎月80万円程度のお金がかかることは > >>378 も >>383 も認めている。
Cloud Vision API は Google Cloudプラットフォームにアカウント登録して
クレジット カードまたは銀行口座情報を入力して初めて使えるサービスだぞ
業務か個人ユースかに関係なく使った分だけの従量課金で
手順踏んでAPIキー取得してAPI叩かなきゃ従量カウントは上がらないし
「Google検索しただけで」勝手に請求が来るような代物ではもちろんない
あと80万かかるのは月に500万ユニット使った場合の話でしょ?
処理回数に応じてそれ以上にもそれ以下もなる
こっちは君が言ったからランニングコストはとしてはありじゃない?って返しただけで
500万ユニットがコロナのデータ集積に毎月かける回数として妥当なのかは知らんよ
394:名無しさん@お腹いっぱい。
21/08/24 14:23:54.92 NY7D9FCw0.net
>>387
> ???
> ごめん何言ってるかサッパリわからない
> どういう状況でGoogle検索したら50万も請求が来るのか全く理解できない
一日中Googleのホームページ(URLリンク(www.google.co.jp))のテキストボックスに検索したいテキストを入力して検索ボタンをクリックすることを繰り返したら
ブラウザに請求書が表示されてそれが50万円で請求者はGoogleとなっていました。
395:名無しさん@お腹いっぱい。
21/08/24 14:31:13.96 NY7D9FCw0.net
>>387
> あと80万かかるのは月に500万ユニット使った場合の話でしょ?
> 500万ユニットがコロナのデータ集積に毎月かける回数として妥当なのかは知らんよ
ユニットが何を意味するか分からんけど一つのブロックだと仮定すると
1ページで30くらいのユニットがあると考えられるので
10万枚処理すれば500万ユニットに近い数字になると思われる。
Googleより
> 米国での感染者数は増加傾向にあり、平均で1日147,420人の新規感染者が報告されている。
147,420*30=4,422,600/月
アメリカの感染者数が毎月442万人出てる計算だから
仮に1ページ1ユニットで計算しても500万ユニットは妥当な数字。
日本の感染者数がアメリカより少ないと言うなら、ユニットが1ページ30で計算すればいいんじゃね?
396:名無しさん@お腹いっぱい。
21/08/24 17:32:00.46 6FahnTPL0.net
一日中つったって手動で検索繰り返した程度で50万請求が来るような検索回数になるとはとても思えないんだけど
マルウェアが裏でF5アタック繰り返してたとかじゃないの知らんけど
URLリンク(cloud.google.com)
ユニットは1枚の画像に対し適応する機能タイプ別に発生する
1枚の書類(画像)に対してテキスト検出(OCR)しかしないのであればユニット数は1
結果はjson形式ファイルで画像中にブロックがある場合はで個別に分けて取り出せる
URLリンク(cloud.google.com)
397:名無しさん@お腹いっぱい。
21/08/24 18:53:54.94 U1hPfsKA0.net
うるせえ
よそでやれ
398:名無しさん@お腹いっぱい。
21/08/24 18:57:00.72 NY7D9FCw0.net
>>390
おまえさあ、Google検索してて「私はロボットではありません」って表示出たことある?
その表示が出るまでに何回検索してるか分かる?
そして検索にいくらかかったか分かる?
著作権裁判だと単に製品の代金だけじゃなく懲罰的請求をされるって知ってる?
アメリカだと自分でコーヒーこぼしただけで3億円も請求されるんですよ。
50万円って実質無料でしょ。
399:名無しさん@お腹いっぱい。
21/08/24 19:06:08.39 ubSdBvKx0.net
詭弁 答えのない問題に対して他の場所で出た答えを持ち出して
その答えはあの問題と同じだよと根拠もないのに言い張ってるだけのキチガイ
お前の言ってることは何の答えにもなってない
400:名無しさん@お腹いっぱい。
21/08/24 19:33:29.79 6FahnTPL0.net
何言ってるのかさっぱり分かんない
やっぱ会話無理な人か
>>391
ゴメンねもうやめるわ
401:名無しさん@お腹いっぱい。
21/08/24 19:35:22.71 NY7D9FCw0.net
>>393
答えは最初っから言ってるだろ。Google検索したらGoogleから50万円請求されました。
お前が信じないだけだ。
ソースは出せない。
お前は企業がどういうときに金を請求するか知ってる?
費用が掛かった時だよ。
チンピラがたまたま目の前にいた通行人に金を請求するゆすりたかりとは違うんですよ。
じゃあ、どういう場合に「私はロボットではありません」って表示を出すか分かる?
無駄な費用を抑えるためですよ。
金を請求するのと「私はロボットではありません」と表示するのは目的が同じ。
お金ですよ。
かかった分請求するか、最初からかからないようにするかの違いだけ。
俺が50万円請求された証拠は出せないが、「私はロボットではありません」と表示される問題は無数にソースがある。
どれくらい検索していたかもその証言から推定できる。
そしたら、少なくともどれくらい使ったらGoogleが許容できない費用がかかっているかも推定でき、
50万円を請求するとしたらどれくらいの検索をしたかも推定できるはず。頭のいい人なら。
日本人は、どれだけ使ったらいくら請求と言う計算はできるけど、
いくら請求されたらどれくらい使ったかっていう計算は出来ない。
そう言う典型的日本人が>>393
402:名無しさん@お腹いっぱい。
21/08/24 20:12:01.67 PyFmfN7N0.net
論点1 QRコード化が可能か不可能か
論点2 人名が読み取れているか否か
論点3 手書きに対してOCRが有効かどうか
論点4 送信に成功したかどうかが分かるか
1 現場にしか分からないが個人単位では不可能ではない
2 現場にしか分からないが個人単位では不可能ではない
3 現場にしか分からないが個人単位では不可能ではない
4 現場にしか分からないが個人単位では不可能ではない
これだけの話なのに論点5のgoogle検索しただけで50万請求された人がいる
が一番どうでもいいし馬鹿らしいんだが 自覚しろよ
403:名無しさん@お腹いっぱい。
21/08/24 20:15:34.99 PyFmfN7N0.net
当然論点6のOCRの活用が現場で可能かどうかも現場にしか分からない
こんな所で無能だなんだ言ってないで現場に連絡取る位の努力しろよカス
404:名無しさん@お腹いっぱい。
21/08/26 22:54:38.68 fktTc4eK0.net
日本語横書きで時々アルファベットの引用を含んでいる文章をAcrobat の OCR で認識させるとアルファベットの一部の認識が失敗します。オプションは日本語文章を選んでおります。アルファベットもうまく認識させる方法はないでしょうか。
405:名無しさん@お腹いっぱい。
21/08/27 20:30:24.89 939FgqXL0.net
この車のナンバーって人工知能で解析できんかね。
URLリンク(himado.in)
406:名無しさん@お腹いっぱい。
21/09/11 09:26:02.33 XEPKqxnl0.net
CloudのAI OCRではGoogleのCloud Visionが優れていたが
最近AzureのCognitive Serviceを試してみたところ
文字の認識誤りの少なさではさらに上回る
ただし課題もあり、右から左へ改行していく縦書き文書を
左から右へ認識するので、行の順序が逆になる
読取順序をbasicからnaturalへ変えても同じ
幸い出力のjsonには座標情報が含まれているので
スクリプトによる後処理で行を並び替え
ついでにルビも削って整えているが
この辺をうまくやってくれるGUIがほしいところ
407:名無しさん@お腹いっぱい。
21/09/11 10:34:50.20 LOlOzN870.net
そのスクリプトは公開してるの?
PythonでGUI作れるかも。
408:名無しさん@お腹いっぱい。
21/09/11 11:06:47.97 XEPKqxnl0.net
>>401
公開するほど大したことない
AzureのAPIとのやりとりはPythonで
後処理はluaでやっている(速いしYAMAHA使いなので)
小ネタで、Google Cloud Visionには
Microsoft Automate Desktop が何気に対応していて
フォルダ内の画像に一括OCRをかける程度なら
ノーコードで簡単にGUI化できる
409:名無しさん@お腹いっぱい。
21/09/11 14:41:17.75 e30+Z8z90.net
e.Typistは終了
読取革命も終了
企業向け帳簿用以外の個人用OCRはもうおしまいだ
410:名無しさん@お腹いっぱい。
21/09/15 20:58:46.28 Vw0PVGR20.net
日本語OCRはくそ
411:名無しさん@お腹いっぱい。
21/09/16 07:00:29.94 oHPqQDLA0.net
ニーズはあるはずなのに程よくまとまったアプリがない
スクリプトでGoogleなりAzureなりのAIを使えば
認識精度は高いけど、求めるのはそれじゃない
画像をクラウドへ送りたくない向き用に
いわば認識エンジンをローカルへダウンロードできる
Docketの仕組みもあるし、
誰か小綺麗にパッケージ化してくれたら買うのにな
412:名無しさん@お腹いっぱい。
21/09/17 00:22:23.73 0acrvs2j0.net
>>405
それ、tesseract以外で作るのなら、エンジンライセンスだけで安くて数十万かかるんじない。買うって法人で買うの?
413:名無しさん@お腹いっぱい。
21/09/17 02:47:20.06 7J187VR90.net
自前で日本語認識エンジン作って遊ぼうとしてるけど、かなり難易度高い。
特に日本語は文字種が多くて、しかも英単語とか普通に混じってくるし。
売り物としたら数十万の売値になるくらい、計算機回してるわ
後半(文字の場所が分かっていて、それをテキストにする)はできたけど、
前半(どこに文字のboxがあるか)を当てるところで苦しんでる
414:名無しさん@お腹いっぱい。
21/09/17 07:14:06.31 pFveJpOG0.net
>>406
それがMicrosoft AzureのDockerなら
目安として1,000枚あたり112円の完全従量制で
個人でも検討範囲に十分入るんだ
エンジンはローカルで、クラウドとは
課金のための小容量の通信が時折発生するくらいで
415:名無しさん@お腹いっぱい。
21/09/17 12:13:11.15 wHT5xdlK0.net
Dockerってそういう使い方できるのか、ちょっと触ってみようかな。
416:名無しさん@お腹いっぱい。
21/09/18 12:21:57.09 q+UM7OU/0.net
>>407
CenterNet を試してみては如何ですか?
物体の中心を特徴点として検出した後、幅・高さのサイズを予測する手法です
417:名無しさん@お腹いっぱい。
21/09/18 14:19:37.46 kRyIOOu20.net
OCRも光学読み取りの精度にこだわりすぎずにBARTなどの文脈推定を入れればトータルの性能が上がる気がする
418:名無しさん@お腹いっぱい。
21/09/18 14:25:05.85 nHCGcW6c0.net
BERTっていうのね これ面白そうだ
小説でpre-trainedなモデルってあるのかな
419:名無しさん@お腹いっぱい。
21/09/18 14:40:51.41 Bzc3NP9C0.net
URLリンク(nlp.ist.i.kyoto-u.ac.jp)日本語Pretrainedモデル
420:名無しさん@お腹いっぱい。
21/09/18 18:05:35.08 eBkRmb3c0.net
>>410
サンクスです。良い手法を教えていただきました
今やってるモデルは、u-net ベースで、CenterNetの中心ヒートマップを使ってる
感じです。
これを参考に改造して作ってます。
URLリンク(github.com)
lossを調整したら、ほぼうまく行くようになってきました。
完成したら公開しますので、また来ます。
421:名無しさん@お腹いっぱい。
21/09/19 08:55:39.56 nf9M18go0.net
>>414
お役に立てたようで良かったです。成果を楽しみにしております。
422:名無しさん@お腹いっぱい。
21/09/30 21:55:51.09 VNbgOTa80.net
>>270
Acrobat pro DC (2015年の製品版)をまだ使ってるんだけど、
横書きの整備マニュアル370Pを
Canonの複合機TR9530のADFで地道にスキャンして(400dpiカラー)
CanonのPDFソフトでPDF化(OCR有)したものと、
それをAcrobatで再OCR化(圧縮無し)したものを比べてみた。
423:名無しさん@お腹いっぱい。
21/09/30 21:56:43.99 VNbgOTa80.net
検索は全て完全一致無しのオプションで。
検索文字「バッテリ」
Canon 286件
Acrobat 262件
検索文字「ボルト」
Canon 290件
Acrobat 270件
検索文字「注意」
Canon 506件
Acrobat 215件
検索文字「交換」
Canon 419件
Acrobat 418件
検索文字「目」
Canon 66件
Acrobat 77件
424:名無しさん@お腹いっぱい。
21/10/22 18:41:13.88 KWvJbojp0.net
キヤノンの優秀だね。自社エンジンなのかなぁ
425:名無しさん@お腹いっぱい。
21/10/22 22:01:30.34 CBrjiuuX0.net
ぺパレス電子化コラム - OCRソフトの比較
URLリンク(pepaless.com)
画像部分とか、網かけ部分とかの認識も優れているかどうかはわからないけどね。
426:名無しさん@お腹いっぱい。
21/10/27 11:37:37.49 UgMif3Au0.net
>>419
コレ三年前の記事かよ。
つってもソフトは当時のバージョンとほとんど同じだから、実害はなしか。
『読取革命』も最新版だからって、とくに画期的に変わった訳でもあるまいに。
427:名無しさん@お腹いっぱい。
21/12/02 01:05:23.86 0IUMVg7L0.net
Tesseract OCRのリリース5.0.0がでたわよ!
URLリンク(github.com)
428:名無しさん@お腹いっぱい。
21/12/11 14:03:43.57 m2OgodYX0.net
読取革命16買って少し使ってみたけど、白抜き文字の認識(日本語)泣けるほど弱い。総合的にみて、Canonスキャナ付属Capture PerfectとOCR精度はあまり変わらない気がする。白ぬき文字については進化が止まっていることを実感させられる。泣けてきた。
429:名無しさん@お腹いっぱい。
21/12/11 14:30:29.15 +ocplaTK0.net
本当の評価ポイントは
校正のしやすさなんだがなあ
430:名無しさん@お腹いっぱい。
21/12/11 16:24:54.51 Q8aFwsdH0.net
以前の読取革命15体験版の感想だけど
読んdeココみたいな認識結果や候補文字を種別ごとに色分け表示する機能が無いからから
外見が似た文字の見分けが付かず
校正に苦労する印象だった
カタカナ「に」と漢数字2、長音符号とハイフンとダッシュと漢数字1、数字1と英字エルとかね
いちいち別ソフトにコピペしてコードポイント確認する作業した記憶ある
16で改善されてますか?
431:名無しさん@お腹いっぱい。
21/12/11 21:50:27.92 m2OgodYX0.net
>>424
認識結果の文字種を色分けすることはできなさそう。ソフトが間違って認識してるかもという文字が赤色になるだけ。認識結果のテキスト表示フォントは変えられる。
HPには認識結果を読み上げる機能があるとなっているが、アイコンがグレイの状態で読み上げられない。ヘルブにも読み上げ方法の記載はないが、ver15応用編のヘルブにはPC talkerがいるように書いてある。もし16にそれがあてはまるなら、優良誤認だろっていう感じ。
あと、話題がずれるが、読み取った結果でpdf出力する場合(透明テキストでなはなく)、フォントが、MS明朝かゴシック(等幅かP)しか選べないのはビックリした。
432:名無しさん@お腹いっぱい。
21/12/11 22:54:22.88 Q8aFwsdH0.net
>>425
返答ありがとうです
とても参考になりました
表示フォント変えられるなら、改善待つより校正用のフォントを自作する方が早いのかもしれないですね
433:名無しさん@お腹いっぱい。
21/12/12 00:58:57.76 flVhFSAg0.net
miguフォントを使ってみな
434:名無しさん@お腹いっぱい。
21/12/12 01:04:33.72 flVhFSAg0.net
読取革命を10年以上使い続けて
それなりのノウハウがたまってきたんで
そのうち小出しに紹介したい
435:名無しさん@お腹いっぱい。
21/12/12 08:42:52.12 DPqdfiih0.net
表を表のままocrできたりしない?
436:名無しさん@お腹いっぱい。
21/12/12 15:02:19.21 6Ne5KHfK0.net
>>429
領域の属性をテキストとか画像とか表とか設定できる。
各行の背景が白、グレイ、白といった表は読取革命16でエクセル出力したら、一つのセルに全部入ってしまってダメだった。Just pdf4ではうまくエクセル出力できたが(一つのセルに表の1要素が入ってくれる)。
実線で区切られる表なら、うまくいくのかもしれないが試してない。427氏に期待したい。
437:名無しさん@お腹いっぱい。
21/12/12 17:38:08.22 flVhFSAg0.net
すまねえ、すまねえ……
得意分野は小説のテキスト化なんだ……
438:名無しさん@お腹いっぱい。
21/12/12 20:38:10.99 HW00Chvv0.net
>>431
話しことばの"いるんだ"などは
どのように処理っされてますか?
etypist使いですが毎回、認識エラー候補になり、確認が面倒です。
439:名無しさん@お腹いっぱい。
21/12/12 21:56:15.22 flVhFSAg0.net
待ってくれ
どうやら俺が持っているノウハウの方向性と、皆の期待している方向性とが違う可能性が高いようだ
実は俺は>>76なんだ
校正作業するのが前提でその効率化のノウハウなんだ
440:名無しさん@お腹いっぱい。
21/12/12 22:53:11.11 VxJSq+w60.net
OpenCVとTesseract-OCRで作る表のOCRツール rev1
URLリンク(ymt-lab.com)
441:名無しさん@お腹いっぱい。
21/12/13 11:36:19.13 jLNnEax80.net
>>433
最近自炊小説をetypistでテキスト化(そのあと合成音声化)を始めたものです
校正作業の効率化ノウハウをぜひ教えてください!
442:名無しさん@お腹いっぱい。
21/12/15 21:24:42.83 dHfR+Ceb0.net
まずはデカいモニタ必須
マクロ登録できるキーボード エレコムのTK-DUX30BKおすすめ 同機能のソフトで代用可
読取革命15 体験版しか使ったことない
Oracle VM VirtualBox等 ごにょごにょ
443:名無しさん@お腹いっぱい。
21/12/17 00:57:11.07 NfrEGe8e0.net
いま流行りの AI を使って認識率を高めるような OCR ソフトはないのかな。業務用じゃなくて個人用で。
Google の OCR ソフトは認識率はいいのかな。Google Docに変換しないと使えないという不自由さはさておいて。
444:名無しさん@お腹いっぱい。
21/12/17 19:30:14.86 gQDiVMg+0.net
>>437
pythonやpowershellなどでスクリプトを組めば
googleなりAzureなりのAIを利用したOCRそのものは
そう高くなく、認識精度もごく高い
(画像1000枚あたり100円台)
現状、見栄えの良いGUIがないだけ
445:名無しさん@お腹いっぱい。
21/12/17 20:45:06.62 NfrEGe8e0.net
>>438
ありがとうございます.
>pythonやpowershellなどでスクリプトを組めば
両方とも経験がないのでこれから勉強しますが,参考になるスクリプトのHPはどこかにないでしょうか?
アクロバットのOCRのようにもとの文字の上に透明文字を配置してくれるのでしょうか.もとの資料上にハイライトや検索が必要なので.
446:名無しさん@お腹いっぱい。
21/12/17 21:15:37.54 CWuXF4+80.net
手前味噌ですがコレなどw
URLリンク(github.com)
447:名無しさん@お腹いっぱい。
21/12/17 21:20:54.87 CWuXF4+80.net
こちらも
URLリンク(remoteroom.jp)
448:名無しさん@お腹いっぱい。
21/12/18 14:14:33.30 dtKgeMNR0.net
>>440,441
ありがとうございます。
440は439の内容は同じですか。
Cは昔使った記憶があるのでうがwindowsの環境で動かす方法を忘れました。
ハードルが高そうです。
目的にOCR処理の前に環境を整え使いこなすまでに時間がか�
449:ゥりそうで、逡巡します。
450:名無しさん@お腹いっぱい。
21/12/18 14:40:57.61 AGBm6fvC0.net
430のgithubの中にwindows用実行プログラムもありますw
451:名無しさん@お腹いっぱい。
21/12/18 14:43:57.28 AGBm6fvC0.net
Google Cloud VisionのAPIキーが必要です。
URLリンク(syncer.jp)
452:名無しさん@お腹いっぱい。
21/12/18 21:04:03.07 dtKgeMNR0.net
>>444
ありがとうございます。
研究してみますね。
453:名無しさん@お腹いっぱい。
21/12/19 01:15:52.64 SmDRr8Ij0.net
ここでヒントもらった、機械学習で文字認識する方法
惜しいところまで来たけど、あともう一声がうまくいかない。
文庫本見開きを与えて、3箇所くらいミスる。特にふりがなとかページ番号
とかのちっさくて近接してるところが鬼門。
Googleとかに投げれば簡単なんだけど、やっぱり自前で解けると
何かと捗るんで是非とも完成させたい
454:名無しさん@お腹いっぱい。
21/12/19 12:59:45.91 rFaLUd6N0.net
>>436
やはり大きなモニターは必須ですよね。。小さいノートPCで作業しているのできついです。
キーボードへのマクロ登録は、どの作業を登録しているのですか?
455:名無しさん@お腹いっぱい。
21/12/19 21:57:43.76 slxgE1fB0.net
校正作業を効率化
>>436の続き
条件は>>76
今回は二段組の場合
URLリンク(light.dotup.org)
スキャン画像をこんな風に作り変える
染みゴミ取り漂白
傾き補正
二段組ページを上下分割余白消し
14ページ分を左右上下に張り合わせて一枚にする
横につなげるときは右から左ね
これ以上ページを増やしたら読取革命で読み込めるけど
テキスト保存したとき字数(行数)?制限で後ろのほうが削られてしまう
たぶん
読取革命の設定こまごま
後述
キーボードマクロ
後述
456:名無しさん@お腹いっぱい。
21/12/19 22:20:59.74 slxgE1fB0.net
1ページづつ校正していたら手間取りすぎる
まとめちゃえ
457:名無しさん@お腹いっぱい。
21/12/20 21:26:34.83 f979t7aJ0.net
e.typist使いの私は、マウスにマクロつけてる。
・単語登録
・次ページ送り+一括置換+全文解析
458:名無しさん@お腹いっぱい。
21/12/21 10:24:13.91 qnmpXEEu0.net
>>448
ノウハウ助かります!
>>450
e.typistでの「次ページ送り」はマウスで次ページをクリックする以外にショートカットキーなどがあるのですか?
459:名無しさん@お腹いっぱい。
21/12/21 20:20:01.46 QXL1RUnR0.net
>>450
alt{la} down return f7
をマウスのボタンに割り当てました。
460:名無しさん@お腹いっぱい。
21/12/21 22:30:27.69 XB9tp3vX0.net
校正作業を効率化
左右上下につなげるソフトはこれ
ImageMerge
読取革命を立ち上げて
オプション環境設定
チェックを入れるもの
一般 未確定・・・
表示 初期 ページ幅
倍率 ページ幅
連動
画像読み込み後
右クリックから属性変更
チェックを入れるもの
認識 文字種 ひらがな カタカナ 漢字第一 数字 ユーザー定義 単語辞書
(漢字第二とアルファベット、記号はチェックしない。必要な文字はユーザー定義欄に入れる)
レイアウト認識 1枚づつやったほうがいいと思う
認識したレイアウトを確認 削除統合で整形
文字認識
一行に一文字とかしかない場合読取ミスがあったりするので確認訂正
空白行等も確認
文章を読むのではなく俯瞰して形で見比べる
行頭の字下げスペースとかは後で
461:名無しさん@お腹いっぱい。
21/12/22 16:55:07.37 mm615h1N0.net
>>452
ありがとうございます!!
読取革命と違って、カーソルキーのみで次の画像に移動できなくて困っていました。
>>453
読取革命も使用しているので参考にさせていただきます。
462:名無しさん@お腹いっぱい。
21/12/22 20:50:42.00 JoFQcdng0.net
>>453
ちょうど数日前からShiftJISの一覧表から使う文字と使わない文字の選別を試していたのですごく納得です
第2水準は見た事ある文字ほとんど無いし
あっても一般的には特定の熟語でしか出現しないものが多い
薔薇、葡萄、林檎、珊瑚、蜘蛛、楕円、琉球…
テキストエディタの正規表現色分け試してる最中でした
463:名無しさん@お腹いっぱい。
21/12/22 22:32:05.67 HGKSXGSe0.net
校正作業を効率化
ここまででいったん作業状態の保存
今度は文字置換(透明テキストが不要な場合のみ)
下記を確認無しで問答無用で最初に置換
例
□は全角スペース
□□ → □
『 → 「
□「 → 「
□( → (
ぱ → ぱ
ぷ → ぶ
ぽ → ぼ
っば → っぱ
っぶ → っぷ
っぼ → っぽ
っだ → った
っで → って
1つ → う
。つ → う
、つ → う
」つ → う
』つ → う
!…… → !…
1…… → !…
ー…… → !…
464:名無しさん@お腹いっぱい。
21/12/22 22:32:44.79 HGKSXGSe0.net
これをキーボードマクロで1ボタン一発置換にしている
600行くらいのマクロ (ショートカットやキー入力を順番にレコード)
表示文字のフォントは前に紹介した Migu 1M が大変便利
(似た形の文字の区別に主眼を置いたフォント)
もっといいのがあったら教えてね
465:名無しさん@お腹いっぱい。
21/12/23 23:18:30.24 OTHMdVZm0.net
ごはんかいじゅう
466:名無しさん@お腹いっぱい。
21/12/25 08:51:53.07 i+O0OTqP0.net
miguフォントを教えていただいた方、
ありがとうございました。
ノートでもパとバが見分けられるようになりました
467:416
22/01/06 21:16:52.24 Ih0Nt3Hq0.net
検索は全て完全一致無しのオプションで。OCR化は圧縮無し。
スキャナはキャノンDR-S130使用(誤差拡散は線の太さ中の設定)
検索文字「バッテリ」
Canon (カラー286件・299件)(誤差拡散244件)(グレー302件)
Acrobat (カラー262件・268件・266件)(誤差拡散283件・279件)(グレー273件・271件)
新型Acro (カラー295件・294件・294件)(誤差拡散276件・276件)(グレー302件・298件)
KOFAX (カラー276件・280件・291件)(誤差拡散286件・295件)(グレー283件・293件)
Eタイピスト (カラー306件・306件)(誤差拡散301件)(グレー307件)
468:名無しさん@お腹いっぱい。
22/01/06 21:17:41.87 Ih0Nt3Hq0.net
検索文字「ボルト」
Canon (カラー290件・296件)(誤差拡散258件)(グレー300件)
Acrobat (カラー270件・271件・272件)(誤差拡散273件・277件)(グレー272件・275件)
新型Acro (カラー261件・272件・276件)(誤差拡散179件・160件)(グレー279件・276件)
KOFAX (カラー291件・303件・302件)(誤差拡散317件・317件)(グレー301件・301件)
Eタイピスト (カラー253件・247件)(誤差拡散247件)(グレー248件)
469:名無しさん@お腹いっぱい。
22/01/06 21:18:28.20 Ih0Nt3Hq0.net
検索文字「注意」(白黒反転文字の注意と、周囲を文字の大きさの長方形の枠で囲まれた注意の2種類)
Canon (カラー506件・490件)(誤差拡散278件)(グレー467件)
Acrobat (カラー215件・217件・215件)(誤差拡散217件・214件)(グレー216件・216件)
新型Acro (カラー214件・216件・216件)(誤差拡散220件・215件)(グレー215件・217件)
KOFAX (カラー429件・431件・422件)(誤差拡散415件・419件)(グレー406件・414件)
Eタイピスト (カラー219件・219件)(誤差拡散217件)(グレー219件)
470:名無しさん@お腹いっぱい。
22/01/06 21:19:37.59 Ih0Nt3Hq0.net
CanonもKOFAXも白黒反転文字の注意は認識できたりできなかったり。
差がついたのは、周囲を文字の大きさの長方形の枠で囲まれた注意を認識できるか、できないかで差がついた。
Canonは誤差拡散(線の太さ中)になると、OCRの精度が落ちました。(文字によっては落ちないものもあった。)
471:名無しさん@お腹いっぱい。
22/01/06 21:33:48.76 Ih0Nt3Hq0.net
KOFAXレポ(OCRは優秀だが癖がある)
〇単独のファイルを開いてOCRした場合
上書きOCRした場合
元々のOCRが消されないで二重にOCRされる。
(検索ヒット数が極端に多くなる。(2倍ぐらいになる)
OCR情報を全て消してからだとOCR可能。
→しかし、どちらのやり方でも上書き保存だと
ファイル容量がなぜか倍ぐらいになる。(大きいファイルのみ)
→対策
KOFAXのエクスポート機能で出力すると原本と殆ど同じ大きさのファイルで出力される。
〇複数PDFファイルを結合してOCRした場合
他ソフトでOCR未処理の処女ファイルはOCR化できる。
他ソフトでOCR処理済みのファイルは、Acrobat等で非表示テキストを削除しても、何故かOCR認識できない。(上書きOCRされない。元のOCRのまま)
KOFAXで非表示テキストを削除して再OCR化した場合は、考えつかなかったので試す前に試用期間が終わってしまった。
472:名無しさん@お腹いっぱい。
22/01/06 21:38:26.46 Ih0Nt3Hq0.net
新型AcrobatとKOFAXとEタイピストは、全て試用verのものです。
473:名無しさん@お腹いっぱい。
22/01/06 21:47:34.36 Ih0Nt3Hq0.net
KOFAX(Power PDF Advanced)
474:名無しさん@お腹いっぱい。
22/01/17 00:21:08.46 4mdkimZz0.net
Canonの複合機のソフト「IJ Scan Utility」(ライトは不可)
の「PDF編集」で画像を読み込んでOCR化PDF作成可能
URLリンク(ij.manual.canon)
URLリンク(ij.manual.canon)
各種制限は上記リンク参照で(いちどに100P迄等)
試してみたら
ビットマップ不可
マルチTIFF不可
圧縮は
他社スキャナー作成の600dpiのTIFF(100Pで10G)
標準圧縮→100Pで200MB弱に
TIFF読み込み3分
PDF保存17分
OCRの結果は
シャドウを増やしてスキャンしたからか、注意の検索結果だけ355件に落ちた。
それ以外の検索結果は変わらず。