【文字認識】OCRソフト【自炊】

【文字認識】OCRソフト【自炊】at SOFTWARE

【文字認識】OCRソフト【自炊】 - 暇つぶし2ch112:名無しさん＠お腹いっぱい。
18/09/24 12:06:18.22 7VNGbKqX0.net
>>105
本当に？じゃあ使ってみるわ。俺はメディアドライブとかAdobeとかXEROXのOCRを使って毎日ゲンナリしています。

113:名無しさん＠お腹いっぱい。
18/09/25 13:21:20.30 1YzzlqqB0.net
>>108
返信ありがとう。
APIキーと課金両方つけるアイディアはいいね。

114:名無しさん＠お腹いっぱい。
18/09/25 20:38:03.49 z28g25+q0.net
良かったら作ったOCRアプリの名前教えてほしい
せっかくだから試してみたい

115:名無しさん＠お腹いっぱい。
18/09/25 21:00:00.34 1YzzlqqB0.net
>>111
興味を持っていただきありがとうございます。
ClipOCRというアプリです
iOSで出してます

116:名無しさん＠お腹いっぱい。
18/09/26 02:36:36.23 Z9NJjTaq0.net
iosかあ残念持ってないや
GCV使用だからって泥アプリとは限んないやね

117:名無しさん＠お腹いっぱい。
18/09/26 15:32:33.40 3VULbJ260.net
Windowsアプリ興味あるんで
OCRアプリ作ってみようかなと思います。
今ゲームアプリ作ってるんで
平行しながらになるとは思いますが。

118:名無しさん＠お腹いっぱい。
18/09/26 15:46:44.32 6shTwqUF0.net
がんばれー

119:名無しさん＠お腹いっぱい。
18/10/18 06:31:56.70 xqmBS9U/0.net
ocrで自炊完全テキスト化なんて幻だろ
自炊本全部リフローにしたい野望はみんな一度は夢見るが現実はまだ無理

120:名無しさん＠お腹いっぱい。
18/10/21 21:47:44.30 J8kL1sRl0.net
「できらあ！」
と言いたいところだけど、現実は
「（時間と手間さえかければ）できらあ……」
くらいしか言えないけど、それじゃイヤなんだよね？
スキャンするなり即修正無しで使えるようでないと。

121:名無しさん＠そうだ選挙に行こう！ Go to vote!
18/10/22 08:29:07.17 lKYGaXGm0.net
AI のできしだいだろうなぁ

122:名無しさん＠お腹いっぱい。
18/10/22 11:56:35.83 9+FR8jVB0.net
結局のところ､googleのエンジンが一番優秀ということ？
そうなら､googleエンジンを組み込んでる市販ソフト買えば使えるね。

123:名無しさん＠お腹いっぱい。
18/10/29 16:05:36.04 URrtjB+G0.net
Google様でも手書き文字は全然ダメだね。
国内メーカーの企業向けのOCRって月ん百万取ってるけど、
Googleエンジンより出来が良いのだろうか？

124:名無しさん＠お腹いっぱい。
18/10/29 17:58:02.72 cRbXFyKJ0.net
>>120
そんな事はないが、Googleだって企業向けは当たり前に金取るから。
一日中検索してたらGoogleから50万円だったか請求する画面出て来たよ。免除してもらったが。

125:名無しさん＠お腹いっぱい。
18/11/05 18:13:32.12 18FQZOi80.net
業務向け（BtoB）で高額でも、出来が良いとは限らない
 >>112　が無料でリリースしてるOCRにも劣る大手企業のソフトなんて普通に有りそう

126:名無しさん＠お腹いっぱい。
18/11/05 18:17:14.26 0FMJmniL0.net
すげー処理が遅くなると思うけど、レイアウト認識・文字の切り取り・文字認識　等、各プロセスで得た複数の候補を（結果的に膨大な候補になる）、すべて辞書と照らし合わせるみたいな、
ディープラーニング（自分門外漢なので言葉の使い方に不安）みたいな事をやってくれるソフトは無いものか。
計算資源をバカ食いする点以外は、技術的にはそれほど難しくないとおもうけど。

127:名無しさん＠お腹いっぱい。
18/11/05 18:21:01.26 0FMJmniL0.net
連投すまない。補足。既存の技術の組み合わせで出来るのではという意味。

128:名無しさん＠お腹いっぱい。
18/11/05 18:28:05.57 /T2ZmVqB0.net
>>123
レイアウト認識と文字の切り出しを別のステップに分けるのが案外、難しい。
人間なら簡単に認識できるけど機械には難しい画像を利用したのがCAPTCHA

129:名無しさん＠お腹いっぱい。
18/11/05 20:57:32.60 0FMJmniL0.net
>>125
返信ありがとう。
レイアウト認識の段階で誤りがあるとその次のステップに進んでも答えに辿り着けないという事でしょうか?
自分もそれについては全く同意見なのですが、前段階での認識候補を複数出し、その次でのステップでも、前段階で上がった複数候補を愚直にすべて処理し、各候補ごとに更に複数候補を‥というのを続け、
ネズミ算的に膨れ上がった候補から辞書を使って答を探る事は出来ないのかなと思ってます。
そうではなくて言葉通り”レイアウト認識と文字の切り出しを別のステップに分けるのが難しい”という意味でしたらすみません。

130:名無しさん＠お腹いっぱい。
19/01/24 02:28:33.48 q/RnbuRc0.net
喰いが止まってるので投下。
校正作業効率化　その５
「ScanTailor」
えるち某みたいなのがLinux陣営にも欲しいものだと思っていたら
ちゃんとあった。Windows版も。
画像フォルダを丸ごと読み込んで、
　・見開き画像を左右に分割
　・傾きを補正
　・トリミング
　・余白付加
　・ゴミ取り
　・dpi変更
　・濃度調整
上記を複数頁に対して一括自動実行して、新たな画像が作られる。
使ってみたがOCRのヒット率は向上したような気がするし、少なくとも
生スキャン画像にありがちな上下左右への偏りを除去できるから、
ビュアーでペラペラめくるときに同じ位置に揃うので見やすくはなる。
惜しむらくはノンブルを自動除去できないのと、上下に分割はできない
こと（二段組の小説とかで）だな。

131:名無しさん＠お腹いっぱい。
19/01/24 18:19:29.58 ltsIJbyU0.net
>>127
なかなか良さそう。帰ったら試してみる。
もっとも、本当に欲しい機能は、
GoogleのOCRの前処理で
1. ノンブルを含む余白の自動カットと、
2. 縦複数段組の自動分割なので、
かゆいところには手が届かない、かな。

132:名無しさん＠お腹いっぱい。
19/01/24 20:58:14.74 oC0eBe300.net
エチル、読取革命時代からなんも進歩してないじゃねえか

133:名無しさん＠お腹いっぱい。
19/01/28 19:33:43.72 YbE5uvwR0.net
ScanTailorはだいぶ前から全然アップデートされてないと思ってたら、別の所にScanTailor Advancedなんてのが出てるんだな。
まだ普通に検索しても一発で出てこない。
ScanTailor Advanced
URLﾘﾝｸ(github.com)

134:名無しさん＠お腹いっぱい。
19/04/22 13:29:43.28 EQQ1i8Cu0.net
LINE(PC版とAndroid版)の新機能がOCRの文字起こし機能をいつのまにか搭載してたようだよ
Googleやtesseractと比べてどうなのかな？
こうなってくるとLINEの友達にOCR変換投げつけ用アカウントの人が必要だｗ

135:名無しさん＠お腹いっぱい。
19/04/23 03:18:57.23 f3SIBRKk0.net
レシート読み取りに関してはレシーピが最高。
グラム（ｇ）を９と読み取るためにおかしくなる以外は濁音半濁音を間違う程度で正確に読み取る。
濁音半濁音は出来るだけ画面いっぱいで手振れ無しで撮らないとよくミスる。
グラム（ｇ）とか数字＋改行とかは修正ペンで消してから撮影すれば、金額はほぼ１００％正確に読み取ってくれるんで修正が必要ない。
割引もマイナス値で読み取ってくれる。

136:名無しさん＠お腹いっぱい。
19/04/24 17:27:12.85 H2ck4f350.net
OCRする前に、原稿が上下逆かどうかを自動判別する手法、何か無いですか？
Linuxで使える物で

137:名無しさん＠お腹いっぱい。
19/04/24 23:45:13.63 3bEMxS/C0.net
普通に考えて「OCRする前に」は無理だろう。

138:名無しさん＠お腹いっぱい。
19/04/26 21:22:29.83 AqpcAtpT0.net
そのままOCRをして。上下逆にしてOCRして、
2種類の日本語の単語数を数えて、(どんな方法かは分からない)
多い方を正解にするとかは？

139:名無しさん＠お腹いっぱい。
19/04/29 11:28:12.88 0UVs2aXB0.net
>>133
ドキュメントスキャナには上下を自動的に判別する機能があるよね｡ドライバを解析すればわかるかもね｡

140:名無しさん＠お腹いっぱい。
19/05/01 07:14:36.04 ACgFkkVG0.net
>>133
領域を9等分して、明るさを数値化する。明るい区画は空白が多いという事だから、下になる。
領域を細かく分ければ精度が上がる。

141:名無しさん＠お腹いっぱい。
19/05/04 09:49:33.30 G0ocSySL0.net
>>137
なるほど。ありがとうございます。
これだと、言語を問わず判定出来そう。

142:名無しさん＠お腹いっぱい。
19/05/04 15:42:35.53 mwZ9gCOS0.net
>>138
横書きなら右に空白が増え、
縦書きなら下に空白が増え、
同じ横書きでもアラビア語みたいに右から書くと左に空白が増える。
この方法を使うためには、縦書きか横書きかを決めておく必要があるのでは？

143:名無しさん＠お腹いっぱい。
19/05/08 21:36:16.90 mvroD7C30.net
>>76　に追加
読取革命でほとんどのエラー（フリーズ、エンドレス処理など）は
属性変更→認識→文字種→
で「記号」のチェックを外すことで回避できる
必要な記号は「ユーザー定義」欄に入れる
「」『』（）、。ー…・！？々　など
ようやく気付けた・・・
私の環境だけ？

144:名無しさん＠お腹いっぱい。
19/05/29 07:43:25.13 AmFhZwjQ0.net
tesseractでそれぞれの文字の一致率が何％だったのか取得することってできない？
もしくは高性能なOCRソフトで一致率が何％だったのか取得できるものない？

145:名無しさん＠お腹いっぱい。
19/05/29 17:19:09.12 b/cfiGBx0.net
論理矛盾と言うか哲学的な質問だな

146:140
19/06/01 06:03:42.02 i2RMvlxm0.net
わかりにくくてすまん　　tesseractにある字体データと対象の文字の一致率って意味　
URLﾘﾝｸ(tesseract.patagames.com)
このサイトにある　↓0.125って数字は一致率0.875以上だった場合、Good Matchを返すって意味だと思う　
matcher_good_threshold 0.125 Good Match (0-1)
matcher_perfect_threshold 0.02 Perfect Match (0-1)
やりたいことはこの一致率が指定した値以下だった場合、テキストファイルになにも書き込まないという処理をしたい　読み込む画像はすべて１行
一致率を取得できればほかのプログラムと組み合わせてできるようになる
もしくはこのサイトの関数をうまく使えばできそう
それっぽいのをいじってみたけどうまくいかなかった

147:名無しさん＠お腹いっぱい。
19/06/23 10:49:31.56 RXmepqIZ0.net
まぁtesseractは精度悪くはないけど
実用には値しないよなぁ

148:名無しさん＠お腹いっぱい。
19/06/23 11:32:22.27 cmA3lp6Y0.net
何を持って実用というかによると思うが
tesseractエンジンのCapture2Textにはずいぶんお世話になってる

149:名無しさん＠お腹いっぱい。
19/06/23 15:55:40.30 oeEPZCVa0.net
tesseractって認識精度はともかく校正はどうやんの？
なんかいいツールある？

150:名無しさん＠お腹いっぱい。
19/06/24 00:53:07.52 GF5eEgcd0.net
テキストエディタで認識結果のファイルを開いて、
誤認識している文字列を肉眼で拾ったら、
Grepツールに渡してフォルダごと全ページを正規表現検索して、
ヒットしたら正しい文字列に置換。
の繰り返しが基本。
最初にやるのは、まず一行の文字数を揃えること。
一行40文字で組まれているのに、それ以上あればその行はどこか
間違っている。
例：一行41文字以上で行末が句読点ではない文字列を検索する正規表現
^(.{41,}[^、。]$

151:名無しさん＠お腹いっぱい。
19/06/26 20:48:52.13 VPvPk7G50.net
仕事で手書きのファックスがバンバンきて、金額いれて計算して合計送り返す昭和なことしてるんだけど、
pc.スマホでスキャンしてエクセルで自動計算するには何が良いですかね？pc買い替え？タブレット購入？
ちなみに得意先のファックスの連打はパソコン持ってない奴らがほとんどでそちらの改善はほぼ無理

152:名無しさん＠お腹いっぱい。
19/06/28 09:45:39.33 WMaziBi/0.net
最近の手書きOCRは優秀らしいぞ。
でも､ソリユーション価格だから数百万円とかなんだろうな

153:名無しさん＠お腹いっぱい。
19/07/05 13:04:14.42 8rCNDdqb0.net
C2Tの翻訳結果に変な文字列↓が挟まるようになったけど、何ぞこれ
ce4eb3e12fa6d7940ab33a38d4d816ab
文章の終端にくっついてるみたいだから、改行記号か何かが化けてるんだろうか

154:名無しさん＠お腹いっぱい。
19/07/17 14:53:00.47 fjEXnK4S0.net
>>150
tesseract-ocrでOCRすると、たしかテキストの末尾に何か挟まってることが多いね。
Meryだと一文字の記号で[FF]と表示されるけど、同じものかしら。
検索/置換で真っ先に削除するから実害は感じないけど。

155:名無しさん＠お腹いっぱい。
19/09/15 22:59:06.77 KlCpzq3m0.net
MicrosoftのLensを使って、FAXで送られた書類をスマホで撮影して取り込んだけど
文字小さいから全然読み込めなかったわ

156:名無しさん＠お腹いっぱい。
19/09/15 22:59:40.51 KlCpzq3m0.net
あげ

157:名無しさん＠お腹いっぱい。
19/09/23 22:23:53.52 E/6na/zQ0.net
Capture2Text使ってたら突然翻訳されなくなりました
英語と日本語で上下に別れていた枠が上の英語のみ
再翻訳のボタンも消えました
設定見直してもまったく変わっておらず
対処方検索してみてもみつからないです

158:名無しさん＠お腹いっぱい。
19/10/16 04:14:51.41 v6/B1Ui70.net
>>144
tesseractの最大の欠点は、認識できなかった文字を無かったことにして何も出力しないこと。
認識できなかったら変な文字でよいから出力すべき。これだと後から目で見て気付きやすい。

159:名無しさん＠お腹いっぱい。
19/10/16 04:18:09.12 v6/B1Ui70.net
>>147
おっしゃるとおり。
この方法の最大の欠点は、少しずつOCRに掛けながら校正出来ないこと。
最初に全部をOCRに掛けてから、全部を校正するしかない。

160:B
19/10/16 07:25:42.98 v6/B1Ui70.net
>>155
tesseract --print-parameters
A list of useful control parameters
URLﾘﾝｸ(github.com)
認識に自信が無くても何かの文字を出力するようなパラメータが見つけられません。

161:名無しさん＠お腹いっぱい。
19/10/16 08:24:23.64 LNV65aKZ0.net
いつまでたっても小説テキスト化位では
eTilTran　読取革命の組み合わせが最強だな
進歩なし
winでは

162:名無しさん＠お腹いっぱい。
19/11/05 18:14:11.50 cSgW8apd0.net
Capture2TextのCLI版で日本語をスキャンして結果をコマンドプロンプトに出力すると
文字化けするのですが対処法はありませんでしょうか
オプションで--clipboardをつけてクリップボードを経由すると文字化けなしで結果が取得出来るのですが
クリップボードを汚したくないので文字化け無しで出力したいです
OCR実行前にコマンドプロンプトの文字コードを変えても効果がありませんでした

163:名無しさん＠お腹いっぱい。
19/12/10 01:29:48 sT0hUZAS0.net
つい最近OCRソフト探し始めたんだけど、日本じゃ結構前から開発してるとこ無いと知って唖然。
ネットで検索すると丁寧に比較解説してるサイトがすぐ見つかるけど、そこによるとパナの読取革命が一番高性能みたいだね。
ただ長らくバージョンアップしてないしこれからもする事はないみたいだ。
その点アドビは性能面ではパナに劣るけどこれからも開発続けてくし何よりOCR化した時のサイズが小さい。
パナのほうは最大10倍近く膨れ上がるしどうにかならんかの

164:名無しさん＠お腹いっぱい。
19/12/10 03:32:57.63 UgLmsfEi0.net
>>160
読取革命でOCR透明テキストを足してからAcrobatで圧縮

165:名無しさん＠お腹いっぱい。
19/12/10 03:36:47 UgLmsfEi0.net
>>160
DeepLearningに期待しよう。まず手書き文字認識と、版木本の古文書文字認識から始めて、手書き古文書文字認識が目標。

166:名無しさん＠お腹いっぱい。
19/12/10 06:54:24 tVn6fHFe0.net
Adobeの認識エンジンは自社開発ではなかったような。
今は違うのかな。

GoogleのAPIが実用的になってきている。
あとフロントエンドのGUIさえあれば良いのだが。

167:名無しさん＠お腹いっぱい。
19/12/11 06:28:23.68 XqwDZL500.net
PDFelementtってやつ買おうと思ってるんだが、これも結局パナソニックのシステム利用してるんかね。
買い切りでPDFも編集も出来るからいいのかなって思って。

168:名無しさん＠お腹いっぱい。
19/12/11 08:50:49.67 djMuwAyz0.net
>>161
横からだけどこれで圧縮可能なのか
試してみるわ
ありがとね

169:名無しさん＠お腹いっぱい。
19/12/13 14:39:43.81 9aicjBgH0.net
結局のところ修正作業がしやすいのが一番
なんなら必ず同じ読み取りミスをするならそのほうがいいくらい
あとルビ対応が少なすぎる

170:名無しさん＠お腹いっぱい。
19/12/22 14:43:51.13 ri547sjN0.net
e.Typist使ってるが
透明テキストPDFにするなら修正しないし、
txt化するなら良くある読み取りミスを一括で置き換えてそれだけになっちまうわ
ルビはレイアウトを誤認識することがあるから無視してる
高圧縮のPDFの出来がAcrobatより良いんでそこは良い

171:名無しさん＠お腹いっぱい。
19/12/25 11:59:05.90 w0pZX05+0.net
縦書きの透明テキスト付きpdfで
読取革命超える認識率のOCRって無いんかな？
Google Cloud Visionで出来れば最高なのになぁ

172:名無しさん＠お腹いっぱい。
20/01/04 06:33:55.83 oSFqms1b0.net
正月休みでGoogle Compute VisionのOCRで透明テキスト付pdf作るの作ったけど需要ある？
現状バグあり、Google API Key必要。
Windows用、複数ページは連番のjpgファイルをあらかじめ作ること。
日曜に削除予定。githubに置こうと思う。

URLﾘﾝｸ(1drv.ms)

173:名無しさん＠お腹いっぱい。
20/01/04 06:38:57.88 oSFqms1b0.net
あとpython入ってないと動かないかもしれんw

174:168
20/01/04 20:16:15.28 oSFqms1b0.net
Python入れなくても動くようにした。
URLﾘﾝｸ(1drv.ms)
需要ないのかなｗ

175:160
20/01/04 20:28:29.43 oSFqms1b0.net
バグってたので差し替えｗ
URLﾘﾝｸ(1drv.ms)

176:名無しさん＠お腹いっぱい。
20/01/04 21:08:20.99 a6yqrZ840.net
正月明け土曜じゃリアルが忙しくて5ch見てる暇ない人も多いんじゃない？
見てても今時はスマホの専ブラだし
ていうか家帰ったらPCから落とすからちょっと待って

177:名無しさん＠お腹いっぱい。
20/01/04 21:16:47.30 oSFqms1b0.net
ありがとうー
そっちでも動くといいなw

178:名無しさん＠お腹いっぱい。
20/01/04 23:54:22.70 a6yqrZ840.net
試してみました
gcv2hocrの作者さんですかな、ご苦労様です
win環境でexe実行するもエラーで動かず
WSLでsrcを直接実行してみようとしたけど無理でした。
(なおWSL環境下では従来のgcv2hocrのmakepdf.shからの検索PDFは作成できてます)
WSLでgcvocr.py実行したときのメッセージ
$ python ./gcvocr.py ./page001.jpg "API key"
Traceback (most recent call last):
File "./gcvocr.py", line 8, in <module>
from requests import Request, Session
ImportError: No module named requests
つづく

179:名無しさん＠お腹いっぱい。
20/01/04 23:59:20.20 a6yqrZ840.net
winからmakepdfgui.exeを直接実行したときのメッセージ(長いので1枚分だけ)
google OCR page002.jpg
Traceback (most recent call last):
File "E:\tmp\makepdfGUI\makepdf\urllib3\connectionpool.py", line 588, in urlopen
File "E:\tmp\makepdfGUI\makepdf\urllib3\connectionpool.py", line 248, in _get_conn
File "E:\tmp\makepdfGUI\makepdf\urllib3\connectionpool.py", line 816, in _new_conn
urllib3.exceptions.SSLError: Can't connect to HTTPS URL because the SSL module is not available.
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "E:\tmp\makepdfGUI\makepdf\requests\adapters.py", line 439, in send
File "E:\tmp\makepdfGUI\makepdf\urllib3\connectionpool.py", line 637, in urlopen
File "E:\tmp\makepdfGUI\makepdf\urllib3\util\retry.py", line 399, in increment
urllib3.exceptions.MaxRetryError: HTTPSConnectionPool(host='vision.googleapis.com', port=443):
Max retries exceeded with url: /v1/images:annotate?key="APIキー"
(Caused by SSLError("Can't connect to HTTPS URL because the SSL module is not available."))
During handling of the above exception, another exception occurred:
つづく

180:名無しさん＠お腹いっぱい。
20/01/05 00:00:30.96 zsNxjzf10.net
つづき
Traceback (most recent call last):
File "E:\tmp\makepdfGUI\makepdf\gcvocr.py", line 63, in <module>
File "E:\tmp\makepdfGUI\makepdf\gcvocr.py", line 50, in recognize_image
File "E:\tmp\makepdfGUI\makepdf\requests\sessions.py", line 646, in send
File "E:\tmp\makepdfGUI\makepdf\requests\adapters.py", line 514, in send
requests.exceptions.SSLError: HTTPSConnectionPool(host='vision.googleapis.com', port=443): Max retries exceeded with
url: /v1/images:annotate?key="APIキー" (Caused by SSLError("Can't connect to HTTPS URL because the SSL module is not available."))
Convert page002.jpg to hocr
No input file.
Generating out.pdf
Traceback (most recent call last):
File "E:\tmp\makepdfGUI\makepdf\hocr-pdf.py", line 171, in <module>
File "E:\tmp\makepdfGUI\makepdf\hocr-pdf.py", line 74, in export_pdf
File "E:\tmp\makepdfGUI\makepdf\hocr-pdf.py", line 84, in add_text_layer
File "src\lxml\etree.pyx", line 3469, in lxml.etree.parse
File "src\lxml\parser.pxi", line 1839, in lxml.etree._parseDocument
File "src\lxml\parser.pxi", line 1865, in lxml.etree._parseDocumentFromURL
File "src\lxml\parser.pxi", line 1769, in lxml.etree._parseDocFromFile
File "src\lxml\parser.pxi", line 1163, in lxml.etree._BaseParser._parseDocFromFile
File "src\lxml\parser.pxi", line 601, in lxml.etree._ParserContext._handleParseResultDoc
File "src\lxml\parser.pxi", line 711, in lxml.etree._handleParseResult
File "src\lxml\parser.pxi", line 638, in lxml.etree._raiseParseError
OSError: Error reading file 'E:/tmp\page002.hocr': failed to load external entity "file:/E:/tmp/page002.hocr"
Done!

181:名無しさん＠お腹いっぱい。
20/01/05 00:03:08.67 8D3ry83X0.net
すまぬ、dllがいくつか足らないようです。
チョット調べてみます。

182:名無しさん＠お腹いっぱい。
20/01/05 00:11:55.50 8D3ry83X0.net
ちなみにWinで動かした時、ウインドウは出ますか？
WSLの時は、モジュールが足らないのでpip installが必要かもです。

183:名無しさん＠お腹いっぱい。
20/01/05 00:22:37.06 8D3ry83X0.net
実行するのは4つexeがあるうち、makepdfgui.exeです。これをダブルクリックしてみてください。

184:名無しさん＠お腹いっぱい。
20/01/05 00:28:58.36 zsNxjzf10.net
プロンプトとボタンが3つあるGUIが別窓で出てます
WSLではghostscriptとhocr-toolsが使ってるライブラリ(Pillow / lxml / reportlab)はインストールしましたが
後は何が必要か分からなくて入れてないです

185:名無しさん＠お腹いっぱい。
20/01/05 00:37:03.33 8D3ry83X0.net
ありがとうございます。
今dllを全部入れたのを作ってますのでしばしお待ち下さい。

186:名無しさん＠お腹いっぱい。
20/01/05 00:44:00.95 8D3ry83X0.net
再アップしました。お試しいただければ幸いです。
URLﾘﾝｸ(1drv.ms)

187:名無しさん＠お腹いっぱい。
20/01/05 01:00:42.23 8D3ry83X0.net
Linux版はこちらです。WSLで動くかもしれません。
URLﾘﾝｸ(1drv.ms)

188:名無しさん＠お腹いっぱい。
20/01/05 21:43:56.51 zsNxjzf10.net
>>183
修正ありがとうございます　無事動きました
makepdfgui.exeは簡易的なフロントエンドという感じですが
gcv2hocr / gcvocr / hocr-pdf をそれぞれexe化されたものが同梱されているので
各プログラムのコマンドライン解説があればバッチ処理で連続実行させられそうですね
あと個人的には出力パス(PDFファイル名)と中間ファイルのテンポラリパスも指定して画像ソースできればいいなと思いました
まあそのあたりはせっかくソース同梱ですし.pyが動かせれば自分で改変できるので
おま環で実行環境づくりに試行錯誤してました
WSLはPython2.7のままだったのでTkinterでハマって一旦断念
dosプロンプト+miniconda でパッケージにrequestsを足してなんとか
```
conda create -n makepdf python=3.7 Pillow lxml reportlab requests
conda activate makepdf
python makepdfGUI.py
```
なお os.path.dirname(__file__) は os.path.dirname(os.path.abspath(sys.argv[0])) に書き換える必要がありました

189:名無しさん＠お腹いっぱい。
20/01/05 21:46:07.12 zsNxjzf10.net
×画像ソースできればいいなと思いました
〇画像ソースと分離できればいいなと思いました

190:名無しさん＠お腹いっぱい。
20/01/05 22:01:04.34 8D3ry83X0.net
ありがとうございます！
動いてよかったです。
来週にでもgithubに上げますのでforkするなりなんなり宜しくお願いします。
Windows版は.pyファイルのコンパイルにnuitkaを使ってます。コンパイルオプションが長いのでそれも併せてアップします。
Windowsで使えれば少し拡がるかな、と思ってますw

191:名無しさん＠お腹いっぱい。
20/01/05 22:19:24.41 8D3ry83X0.net
python由来のexeファイル（gcvocr.exe, hocr-pdf.exe)は単体での起動ができなくて、一緒にたくさん入っている
共有ライブラリが必要になります。
gcv2hocrはMingw64でコンパイルしているので、単体で動作すると思います。
大したものでもないですが、誰かに使ってもらえると嬉しいものです。
ありがとうございます。

192:名無しさん＠お腹いっぱい。
20/01/05 22:43:03.98 zsNxjzf10.net
こちらこそ有用なものを上げていただいてありがとうございます
自分もgcv2hocrをexe化できないかなあと思って弄ってた時期もあったんですがニワカ知識だとなかなか
winだとサーチャブルPDFをスキャン時ではなく後から作ろうと思うと
いまだにAcrobatか旧来の有料OCRソフトかみたいな感じでなかなか歯がゆいとこあります

193:名無しさん＠お腹いっぱい。
20/01/06 11:35:46.65 d6RRHgpx0.net
とりあえずGithubにあげました。
URLﾘﾝｸ(github.com)

194:名無しさん＠お腹いっぱい。
20/01/06 22:22:51.95 Bwv2TAsT0.net
★入れときました

195:名無しさん＠お腹いっぱい。
20/01/07 05:50:46.58 iiqYEYaM0.net
ありがとうー

196:名無しさん＠お腹いっぱい。
20/01/08 19:11:22.77 c/82od5M0.net
出力pdfを任意の場所に置けるようにしました。
上のgithubのページにダウンロードのリンクがあります。
中間ファイルは別フォルダに置くようにしました。

197:名無しさん＠お腹いっぱい。
20/01/09 10:44:21 92Qt7qR00.net
実行時にコンソールウインドウが出ないようにしました。

198:名無しさん＠お腹いっぱい。
20/01/09 23:57:29.83 +fFF3jY40.net
改良乙

199:名無しさん＠お腹いっぱい。
20/01/10 00:17:04.04 omx2TQEU0.net
乙

200:名無しさん＠お腹いっぱい。
20/02/04 10:31:25.64 /JmtElp90.net
Googleドライブに入れてGoogleドキュメントで開いて…のOCRって、使用量に
何か制限があるのかねえ？
1枚に2000文字程度書かれたビットマップファイルを1800枚ほどOCRしてたら、
途中なぜかGoogleに繋がらなくなった。(googleトップページにも繋がらない・
Google以外は問題なく繋がるので回線の問題では無い)
怪しい利用者と思われ、ロックアウトされたのかねえ？
色々やってたら(20分ぐらい？)復活したが・・・

最初e.TypistOneを使ったが、誤認識があまりにも多く断念。
プログラミングのスキルがあれば Google Cloud Vision API を使うアプリ
を作るのだが、無いのでGoogleドライブ経由で利用。
一旦全てのビットマップをGoogleDriveに入れ、ブラウザ上で、
(1) ビットマップファイルをGoogleドキュメントで開く
(2) 書式無しテキストでダウンロード＆閉じる
(3) 処理の終わったファイルをDriveから削除
という一連のマウス操作を、UWSCというアプリを使って記録、繰り返し再生し
てる。(1枚約1分)

201:名無しさん＠お腹いっぱい。
20/02/04 12:00:35.26 vX8l0M8h0.net
Google DriveでのOCRで上限を感じたことはない。
でも1800枚は時間なり量なりの制限にかかるのかもね。
同じ作業をPowershellのスクリプトで行っているが、
無料のGoogle Driveと有料のCloud VisionAPIとでは
認識結果が異なり、精度は意外にも前者が高く、
処理速度は後者が速い。ゆえに使い分けている。

202:名無しさん＠お腹いっぱい。
20/02/04 13:11:16.64 /JmtElp90.net
>>198
＞無料のGoogle Driveと有料のCloud VisionAPIとでは
＞認識結果が異なり、精度は意外にも前者が高く、
これは意外＆嬉しい情報です。ありがとうございます。
まだ細かくは見ていませんが、Google DriveでのOCR結果は満足いく物のようです。

203:名無しさん＠お腹いっぱい。
20/02/04 20:20:23 vX8l0M8h0.net
UWSCは自分も使っている。良いソフトだね。
でもUWSCのスクリプトが組めるならば、
PythonなりPowershellなりへの移行も容易では？
速度が当社比10倍にはなると予想。

204:名無しさん＠お腹いっぱい。
20/02/04 21:22:14.83 q1VdwANZ0.net
OK

205:名無しさん＠お腹いっぱい。
20/02/04 22:00:57 PXcUvqQM0.net
この辺？

URLﾘﾝｸ(qiita.com)

206:名無しさん＠お腹いっぱい。
20/02/04 22:06:17 PXcUvqQM0.net
URLﾘﾝｸ(github.com)

207:名無しさん＠お腹いっぱい。
20/02/05 11:23:36 XnWtIzCm0.net
>>200
とりあえず今回は、Google-Drive+UWSCでTEXT化を終えました。
次回があればCloud VisionAPIも検討します。
(何もインストールせずに使えるということで、とりあえずPowerShellで
「Hallo World!」を表示させてみた)

参考に教えて頂きたいのですが、>>198でGoogle Driveより精度が低かっ
たと書かれているCloud VisionAPIは DOCUMENT_TEXT_DETECTION か
TEXT_DETECTION のどちらでしょうか？

208:名無しさん＠お腹いっぱい。
20/02/06 15:41:42 6cev/IWh0.net
Foxit PDF は英語と日本語を混ぜてスキャンするとエラーになる？

209:名無しさん＠お腹いっぱい。
20/02/16 22:18:12 jLFeBzYu0.net
>>190
ありがとうございます
1200dpiのスキャナー欲しくなりましたw

210:名無しさん＠お腹いっぱい。
20/02/29 06:41:24 JcjcxIj30.net
昭和４０年頃の手書き青焼きのコピー（Ａ４　２３行×１００Ｐ以上）をテキスト化したいんですが
そういう悪条件につよいソフトって家庭用で存在しますか。
ゴミ、旧漢字、略字・・・　「多」の上が「ヨ」だったり

211:◆JAVA/drQNg
20/02/29 08:46:14 zMAPSh9k0.net
Adobe Acrobat はバージョンが上がるごとにOCR精度は向上しますか？

212:名無しさん＠お腹いっぱい。
20/03/04 10:38:36.74 a2j2NwzM0.net
とりあえず「Capture2Text」使ってみたんだけど、まったく使えなかった…
これ常用してる人いる？

213:名無しさん＠お腹いっぱい。
20/03/10 07:56:51.41 m0UgLSDQ0.net
そんな使えないの誰もいないでしょ

214:名無しさん＠お腹いっぱい。
20/03/10 09:51:38 5unq0kZC0.net
使いこなせないアホなどいないと言いたいのか
使えないから常用者がいないと言いたいのか

215:名無しさん＠お腹いっぱい。
20/03/10 18:32:34.56 s+annSAc0.net
Capture2Textはtesseract & Google翻訳のフロントエンドとしては有能だぞ
基本よその国のマンガやゲームのフキダシを母国語に翻訳しながら読む用途向けなので長文は苦手だが
tessdataをtessdata_fastと入れ替え jpn_vert.traineddataも足せばOCR精度は多少マシになる
あとググってたら Capture2TextみたいなのをGoogle OCR でやってるツールもあった
SSTRとかいうの
要GCPキーだがクソ速い

216:名無しさん＠お腹いっぱい。
20/04/16 08:24:43 .net
さっきPDF-XChange Editorの最新版(フリー)を入れたんだが、これめっちゃ機能多いな
無料版だから殆ど使えないけど、こんな機能豊富なアプリ見せられたら買いたくなってくるんだが、
実際はどうなんかな?
5000円ぐらい何だが、買う価値ある?
自炊愛好家にとっては画像圧縮とOCRの機能がどの程度なんかが超重要なんだが、有料版使ってる奴居たら意見聞きたい

217:名無しさん＠お腹いっぱい。
20/04/18 09:56:41.39 GR24ABzs0.net
あるある。絶対買うべし

218:名無しさん＠お腹いっぱい。
20/04/20 18:31:31.52 tcsUxc360.net
小説テキストデータ化の最終工程で
 >>78の通りやってるんだけど
スキャンした元画像の行間がいまいち狭くてやり辛い
スキャンしたテキスト画像の「行間だけ』を広げることのできるソフトはないもんだろうか
（当然用紙の横幅が広がるのは問題なし）
メチルでできるかと思って設定をいろいろいじくりまわしてるんだけどうまくできない

219:名無しさん＠お腹いっぱい。
20/04/25 22:50:37.58 AhIDEN180.net
( ´･ω･) 民珍♪

220:名無しさん＠お腹いっぱい。
20/04/26 15:34:50.65 rCDPnaLP0.net
>>207
昭和44年の手書き謄写版印刷物をスキャンして試してみました。
Googleドライブにアップロードして、Googleドキュメントにすると、認識率9割以上でした。

221:名無しさん＠お腹いっぱい。
20/05/06 21:23:20 nnBg0Ieg0.net
スキャン後のPDFファイルに透過ocrテキストを組み込むことや削除をすることはできますか？
スキャン代行600dpi+ocrをつけて依頼しようかと思っています。
透過ocrテキストが不満な場合、後日（～数年後等)に発売されるかもしれないocrソフトやgoogle等のocrでpdfファイルに
透過テキストを組み込みこんだり削除したいです。
やったことがなく、詳しい人いましたら教えてください。

222:名無しさん＠お腹いっぱい。
20/06/22 20:49:34.26 2bHPYWAT0.net
自分用に作ってみました。
良かったらどうぞ。
URLﾘﾝｸ(eznavi.net)

223:名無しさん＠お腹いっぱい。
20/07/13 21:18:26.68 gPuYxjHp0.net
質問です。
OCR化ソフト：読取革命
音声出力アプリ：EZ PDF reader
1ページのうち複数のパートに分かれたものをOCR化した順にスマホで音声読み上げしたいのですが、
読取革命側で順番を指定してOCR化しても、スマホアプリ側で音声出力の際に最初のパート以外の順番がバラバラになってしまいます。
おそらくアプリ側の問題なのでPDF読み上げの新しいアプリを探しているのですが中々見つからず、おすすめを教えてほしいです。
MOON proは音声出力時にエラーで強制終了でした。。

224:名無しさん＠お腹いっぱい。
20/07/14 04:07:13.49 btizt7Lj0.net
>>220
読取革命が読み取った結果をPDFに出力するのは何故？
Textファイルに出力したら？

225:名無しさん＠お腹いっぱい。
20/07/14 19:02:18 qgULxFnG0.net
>>221
テキストファイル出力での読み上げアプリも２つ試したのですが、
文字化けや改行の挿入、いったんアプリを閉じて再度開いた際に前回の再生位置から開始が出来ないなど、
文庫サイズのテキストを読む際での不都合が多かったです。
PDFアプリの方も現在使用しているez pdf reader以上に動作の安定したアプリが中々見つからず、
スレチで申し訳ないのですがスマホ端末での音声出力メインでOCR化されてる方がいれば、、と思い質問させて頂いた次第です。

226:名無しさん＠お腹いっぱい。
20/07/15 10:23:16.57 +UBXBhCo0.net
>>222
Androidは、使用してないので分かりませんが
iPhoneならVoice Dream Readerがオススメです。個人的に。

227:名無しさん＠お腹いっぱい。
20/07/17 10:09:33.44 Lff+9EMv0.net
>>223
試してみます。有難うございます。

228:名無しさん＠お腹いっぱい。
20/07/17 19

229::57:43.35 ID:CK7EEHYK0.net

230:名無しさん＠お腹いっぱい。
20/07/18 22:53:37.67 VCDm/xwf0.net
qiitaでOCRを検索したら、日本語に対応したオリジナルのOCRが公開されていた。
フリーの日本語OCR（と学習済みのモデル）を公開しています。
　URLﾘﾝｸ(qiita.com)
日本語OCRを作ったので解説してみる
　URLﾘﾝｸ(qiita.com)
GitHub
　URLﾘﾝｸ(github.com)
すげい良さげなのでインストールしてみたのだが、GPUがないせいかどうなのか、
うちの環境ではPytorchとかCUDAのインストールがうまくいかなかった。
Linuxを使える誰か、試してみてはくれまいか。

231:名無しさん＠お腹いっぱい。
20/07/18 22:59:29.26 eAsZD6lp0.net
GPUなしでも動かせるみたいだしWSL入れたらwin10でもいけんじゃね

232:名無しさん＠お腹いっぱい。
20/07/20 11:49:35.26 ND5jwxL20.net
tegakiとか簡単に開発できるらしいけどフリーだと無いよな

233:名無しさん＠お腹いっぱい。
20/07/20 12:23:14.92 zpjC4PpP0.net
一太郎PADはどうなの？

234:名無しさん＠お腹いっぱい。
20/07/20 17:58:40.44 3FOd3QJF0.net
>>213
plusだかなんだかつけて使ってます
大満足だけど、日本語ocrはクソ
手持ちの他のソフトを使うしかないです

235:名無しさん＠お腹いっぱい。
20/08/06 08:43:22.36 +Ik17kWF0.net
個人向け日本語ocrはここ10年くらい進歩なし？

236:名無しさん＠お腹いっぱい。
20/08/06 09:24:03.23 P4KKN9Zk0.net
>>231
読取革命をつかってるけど、そろそろバージョンアップして欲しい

237:名無しさん＠お腹いっぱい。
20/08/06 21:43:22 FpfhWXHQ0.net
Shift-JISだけってのはキツいよな。

URLﾘﾝｸ(www.panasonic.com)

【大切なお知らせ】販売終了および今後の読取革命の販売について

2012年9月より販売を行ってまいりました、日本語・英語活字カラーOCRソフト「読取革命Ver.15」に関しまして、誠に勝手ながら2020年8月31日をもちまして、製品版・バージョンアップ版の販売および開発を終了させていただきます。また、2020年9月30日をもちまして、ライセンス版・ダウンロード版の販売も終了させていただきます。
長らくご愛顧いただき、誠にありがとうございました。

読取革命の開発および販売はソースネクスト株式会社へ移管し、2020年10月7日に新バージョンを発売いたします。

238:名無しさん＠お腹いっぱい。
20/08/07 06:23:07.23 n5TZuf+60.net
AIOCRが金出せば結構優秀になったしな

239:名無しさん＠お腹いっぱい。
20/09/26 01:42:56.36 ysgjBmc10.net
ラノベ自炊して文字認識で全ページテキスト化して有償の美少女声音声読み上げソフト使って
自作のAudibleみたいなのを作るって現実的か？
この方法ならラノベが読めない俺でもラノベの内容追える気がする
作業用BGMが欲しい

240:名無しさん＠お腹いっぱい。
20/09/26 05:37:16.00 CGZLoSUz0.net
と或るラノベ７巻、文字認識したことあるが、
認識ミス取りきれてない気がするよ。
もう二度とやらん。めんどくさ過ぎる。
縦書きって誤認識高くね？気のせいか。
設定資料集やりたいのがあるんだけど、気力がわかない。。。

241:名無しさん＠お腹いっぱい。
20/09/26 06:35:51.85 ysgjBmc10.net
うーん　即レスで体験談ありがとう
ソフトとアプデ次第でどうにかなってほしいものだ

242:名無しさん＠お腹いっぱい。
20/09/26 07:20:30.92 aByTBdbp0.net
校正作業をどれだけ効率的にできるか、そのノウハウを持っているかどうかによる

243:名無しさん＠お腹いっぱい。
20/09/26 13:24:06.12 wTRatOkO0.net
自分で読み上げて音声入力してみたことがある

244:名無しさん＠お腹いっぱい。
20/09/26 14:06:45.13 6iAINLva0.net
100%完璧にって言ったら泥沼だろうが、ある程度妥協できるなら問題ない
誤認識もパターン決まってるのも多いから、一括で置き換え出来るし
OCR前にChainLPとかで下準備するのも忘れずに。認識精度が全然変わるから
読み上げソフトも読み上げソフトで癖があるから、読み上げソフトでキチンと読めるように修正する必要もあるけどね（これも妥協次第だけど）

245:名無しさん＠お腹いっぱい。
20/09/26 22:20:38.16 MWrmVjkB0.net
ブラザーの複合機でスキャンして付属のOCRで売上表を読み取ってるけど
数字だけなら99%読み取れてるよ。
表には合計値もあるんでExcelで合計計算して合計値が一致してれば全部読み取れてるってチェックができる。
合計値が合わないときはExcelの読み上げボタンで読み上げつつ紙の表に目を通してチェック。
ミスは大体ゴミを小数点として読み取ったり、
ゴミのせいで６が８になったり
かすれて８が６になったり
スペースが入って分割されたり。
スキャン前にゴミを除去するのが重要。
スキャン後は空白の固まりにマウスで矩形領域作ってタブを挿入した後で全ての空白を置換で除去。
これでほぼ正しくタブ区切りになるんでExcelにぺたっと貼り付け。
スキャンの設定は300dpiのグレー諧調で読み取ることが重要。
カラーで保存したい場合は画像用にカラーでスキャンしてOCR用にグレーでスキャンするとかしたらいいと思う。
カラーをうまく処理できるOCRソフトならカラーの方がいいと思うけど
レシートの赤いやつがあると読み取ってくれないレシーピってアプリもある。最近赤い奴に対応したっけな。

246:名無しさん＠お腹いっぱい。
20/09/26 22:30:50.03 MWrmVjkB0.net
書き忘れ。
数字の表を読み取るときは英数で読み取るんで日本語はめちゃくちゃ。
日本語だと表を表として読み取ってくれないし、数字もまともに読み取れない。
英数でも表として読み取ってるわけじゃないけど、間に空白がたくさん入るからなんとなく表っぽくなってる。
OCRの作業はひと手間かかるけど、空白除去とかに慣れれば入力するよりかなり早い。
日本語の場合は読み上げさせつつミスがある部分だけ入力していけばいい。
直接変更するのは追いつかないだろうから別の行に書いておいてあとでくっつけるとか。
〇〇〇〇〇〇〇〇〇×〇〇〇〇〇〇〇〇××〇〇〇〇〇〇〇
　　　　　　　　　　　　　まる　　　　　　　　　　まるまる　　　　　　　　　　　←聞きながら入力
↓
〇〇〇〇〇〇〇〇〇まる〇〇〇〇〇〇〇〇まるまる〇〇〇〇〇〇〇　　　←あとで合成

マイクロソフトのINKとか言うソフトで蛍光色で色をつけられたりするから
ミスってるところに色を塗っておいて後で正しいのを入力するって方法もあるかも。

247:名無しさん＠お腹いっぱい。
20/10/07 20:53:42.38 sG0Mx6Ff0.net
読取革命Ver.16が出た

248:名無しさん＠お腹いっぱい。
20/10/08 00:38:44.34 oaaQrpI40.net
英語認識に強くなる予定があるのとUIが変わってるらしい？
なんにせよルビ対応してくれないことには個人的な選択肢が増えない

249:名無しさん＠お腹いっぱい。
20/10/08 21:58:57.57 pCm7hS0+0.net
e.Typist使ってるけど、ルビは無視する設定だわ

250:名無しさん＠お腹いっぱい。
20/10/13 10:17:34.27 1IwVSGYF0.net
読取革命Ver.16
まだ縦書きの文字修正の時
横倒しになるのかな

251:名無しさん＠お腹いっぱい。
20/10/18 02:15:16.51 knd4dkpa0.net
読取革命 Ver16 新規機能ひとつもないな。
不具合も直ってなさそう。

252:名無しさん＠お腹いっぱい。
20/10/19 00:44:45.61 CyNFZXML0.net
どうせAcrobatのCleanscanしか使わないからいいや

253:名無しさん＠お腹いっぱい。
20/11/01 15:10:52.46 OE4w3Cb/0.net
- 電通による日本人民族浄化計画の手口 -
①日本人の精神を腐敗・堕落させ愚民化させろ
②日本人の女を集中的に狙い洗脳しろ
③ネトウヨ、ヘイトスピーチ、レイシスト等の言葉を浸透させ、同胞への批判を封じろ。
④韓国人識者に政治的意見を言わせ、御意見番化させろ
⑤「同性婚・LGBTを全面肯定しない者は差別主義者だ！」という雰囲気を作れ。
⑥海外セレブやハーフモデルをもてはやし、「日本人は劣等人種だ！」と植えつけろ。
⑦「未だにガラケーの奴は笑い者」という雰囲気を作れ。
⑧「LINEに入らない奴は仲間外れ」という雰囲気を作れ。
⑨「日本人の男VS日本人の女」の対立を煽り、分断しろ
⑩日本人同士で恋愛・結婚させない、子供を生ませないよう誘導しろ
⑪日本同士で結婚していたら離婚させる方向に仕向けろ。
⑫女が活躍するドラマばかり作れ。男は無能な役、笑われ役にしろ。
⑬イケメンブームを定着化させ、「男は外見が全てだ！」と洗脳しろ。
- ソース -
電通グループ会長成田豊は朝鮮半島生まれ
URLﾘﾝｸ(ja.wikipedia.org)

254:名無しさん＠お腹いっぱい。
20/11/03 09:13:18.83 rTcXesbq0.net
Win95のときからつかってるけど
ocrソフトなんてなんの進化もしてない

255:名無しさん＠お腹いっぱい。
20/11/04 08:06:13.96 2CPZw8590.net
進化の余地はありそうなんだけどね。
個人用途では需要がないか。
そこそこ有名なフリーソフトレベルの操作性や、設定の自由度ぐらいは欲しい。

256:名無しさん＠お腹いっぱい。
20/11/04 11:19:49.67 uNywO3dP0.net
Eightとかその他の名刺認識アプリ
グーグルドキュメントで画像を読み込んだときの自動OCR
これらのほうが段違いに認識がスムーズ
奴らはデータを吸い上げようという魂胆なんだろうが
認識が本業の有料ソフトが副業の奴らに負けてどうする
20年以上検索認識エンジン大きな変化なしとか腐っとるな

257:名無しさん＠お腹いっぱい。
20/11/29 14:23:46.17 x7aEVFBM0.net
読取革命Ver.16の英語OCR機能が10月下旬から11月下旬に延期になっていたけど、
もう11月も終わるぞ…
こりゃ再延期かな？

258:名無しさん＠お腹いっぱい。
20/12/04 10:04:50.76 s2inLNb80.net
さほど高くないソフトで、手書きの数字(文字は読まなくてOK)をOCRで文字起こししたいです。
何かオススメのソフトはございませんでしょうか。

259:名無しさん＠お腹いっぱい。
20/12/04 16:08:37.31 aXsiujer0.net
>>254
スマホアプリに手書き認識する奴がある。
ニューラルネットワークが必要だからスマホか M1 MAC 必須。
手入力したあとExcelに読み上げさせつつチェックしたら？

260:名無しさん＠お腹いっぱい。
20/12/04 19:35:55.67 6BGtDygO0.net
googleドライブでいけるよ PCからでも使えるし
ググれはしたばGASで自動化する方法も出てくる

261:名無しさん＠お腹いっぱい。
20/12/04 19:37:11.18 6BGtDygO0.net
×ググれはしたば
○ググれば

262:名無しさん＠お腹いっぱい。
20/12/04 21:25:36.24 BkfJdpxn0.net
Googleドキュメントに声で入力したことはある

263:253
20/12/12 10:52:24.87 /fsKVCa+0.net
Googleドライブ、なかなか良かったです。
アドバイスくださった皆様、ありがとうございました。

264:名無しさん＠お腹いっぱい。
20/12/17 15:01:46.09 EmhXqjui0.net
google driveいいんだけど､手間が面倒くさすぎる｡
googleエンジンを使ってるパパッとOCRを使ってる人いますか?

265:名無しさん＠お腹いっぱい。
20/12/17 15:03:44.41 EmhXqjui0.net
googeは2段組だと左の段と右の段が入り組んでしまうのが困りものだよなあ｡

266:名無しさん＠お腹いっぱい。
20/12/18 14:30:16.91 lA9GnPM30.net
>>261
OCRHelper使えば、比較的楽。

267:名無しさん＠お腹いっぱい。
20/12/28 21:00:44.55 VlqH5s5B0.net
>>154
今ちょうどこれになって検索しまくってる
頻繁に翻訳してるとグーグル側にはじかれるのかな
グーグル翻訳系は駄目だな

268:名無しさん＠お腹いっぱい。
21/01/11 19:08:54.94 cCWQR2l/0.net
校正に一番必要なのはデカイモニター
一行をはみ出さずに表示して
間聞開闇ここらが一目で見分けられるやつ

269:名無しさん＠お腹いっぱい。
21/01/17 19:34:10.00 QPWOr2470.net
>>60
質問すみません
(--nodraw)のコマンドは、どう使えばいいんですか？

270:名無しさん＠お腹いっぱい。
21/01/17 20:29:10.19 p7Uj5Bfi0.net
>>265
そのオプションはフォークされた改造版で追加されてたんだが
本家のプルリクに上がることもなくフォーク先も今は見えなくなってる
（おそらくフォーク主がプライベートリポジトリに変更したんだと思う
MS買収で無料で非公開にできるようになったから）
フォーク版は他にも画像ソースにjpg以外の形式も指定できるようになってたりと
色々便利そうだったんだけどね、残念

271:名無しさん＠お腹いっぱい。
21/01/18 16:07:24.44 4aq7gtM60.net
>>266
同じものかわからないけどこっちで開発続いてそう
URLﾘﾝｸ(github.com)

272:名無しさん＠お腹いっぱい。
21/01/18 18:23:18.22 lqqeSLpf0.net
>>267
それだわ！
気がついたらリンク切れててそっから先追えなくなってたんだ
ありがとう！

273:名無しさん＠お腹いっぱい。
21/01/19 16:59:59.15 nJ0mxE500.net
>>266
>>267
できました
めっちゃくちゃ感謝です

274:名無しさん＠お腹いっぱい。
21/01/29 07:49:55.72 wxsf7Wfh0.net
今Acrobat 9 std使ってるけど、
読取革命とかの方が認識率高いとかありますか？
あとマルチスレッド対応でしょうか
Acrobat9はシングルスレッドみたいで、
PCが8コア16スレッドなのに1スレッドしか働いてません

275:名無しさん＠お腹いっぱい。
21/01/29 08:24:46.05 1HVM47hB0.net
読取革命を使うのは認識率の高さではなく
校正のしやすさが目的かな
マルチスレッドはわかんね

276:名無しさん＠お腹いっぱい。
21/02/11 18:21:51.86 26F+m0Y80.net
突然失礼します。
現在仕事の関係で大量の画像から主要文章を抜き出し、まとめている作業をしているのですが画像がまとめてあるファイルから一括で読みとってくれるOCRソフトは何かないでしょうか？

277:名無しさん＠お腹いっぱい。
21/02/11 19:00:46.81 IHq/iUj+0.net
>>272
若干知識が必要だけどGoogleアカウント作れば無料
GDriveのフォルダにほうりこんだファイル全部処理してくれる
【GAS】OCRを使ってスキャンしたい画像の文字取得を自動化する
URLﾘﾝｸ(www.initialsite.com)

278:名無しさん＠お腹いっぱい。
21/02/11 20:17:36.01 26F+m0Y80.net
分かりました！やってみます！！

279:名無しさん＠お腹いっぱい。
21/02/11 21:36:37.94 26F+m0Y80.net
どうにかコピペしたコマンドを実行しるところまでこぎつけましたが、いまいち使い方が分かりません（泣）
勉強してできるようにしたいと思います。

280:名無しさん＠お腹いっぱい。
2021/02/1

281:3(土) 16:42:15.51 ID:ZeIWlZfb0.net

282:名無しさん＠お腹いっぱい。
21/02/13 17:58:27.11 IFB3FsXw0.net
OCR で遺伝子は認識しないだろ（ゲノムスキャン？）

283:名無しさん＠お腹いっぱい。
21/02/13 18:38:25.90 ZeIWlZfb0.net
医学書です

284:名無しさん＠お腹いっぱい。
21/02/14 04:32:22.06 JX8dJfP00.net
>>276、>>278
スキャンが済んでないのならスキャンと同時にOCRしてしまうのが楽。
スキャンが済んでいるのなら読取革命かAcrobatかGoogle。専門用語辞書が充実していそうなのはGoogleだけど全てGoogle任せになってしまうのがストレスフル

285:名無しさん＠お腹いっぱい。
21/02/14 06:39:37.00 57AdeLvf0.net
ありがとうございます

286:名無しさん＠お腹いっぱい。
21/02/18 14:26:16.02 YBVmHAJp0.net
度々失礼します。
以前教えていただいたGoogleDrive方式を試してみたところ、どうにかファイル内の画像を読み込んでテキストに出力するところまでこぎつけました。
ただ、設定が悪いせいか、せいぜい2 枚を読み込んだところで変換が終了してしまいます。
手っ取り早くソフト購入を考えていますが、そこそこの精度で大量読み込みをしてくれる物を御存知の方がいればぜひ教えてください。
よろしくお願いします。

287:名無しさん＠お腹いっぱい。
21/02/18 18:53:15.29 sbM29q5M0.net
ScanSnap買うのが吉かも

288:名無しさん＠お腹いっぱい。
21/02/18 19:26:00.10 RZJx4jaI0.net
Kofax Power PDF Standard
URLﾘﾝｸ(www.kofax.jp)

289:名無しさん＠お腹いっぱい。
21/02/18 19:39:21.13 PhET5XgP0.net
お金出せるなら ABBYY FineReader あたりがいいんじゃないバッチ処理もあるし
CZERのOCRエンジンがABBYYなんだが認識精度は悪くないよ
デフォルト設定でPDFにすると画像めっちゃ汚くなるけどテキストで抽出するなら関係ないだろうし

290:名無しさん＠お腹いっぱい。
21/02/18 21:18:15.99 FuM14PBd0.net
テキスト抽出じゃなくて検索可能なPDFを作りたい場合のおすすめは？

291:名無しさん＠お腹いっぱい。
21/02/18 22:04:26.68 /MMQ5ij10.net
画像ファイルから検索可能なPDFに変換するソフトは、いきなりPDFとかJUSTPDFとかあるな、体験版あるかな

292:名無しさん＠お腹いっぱい。
21/02/18 22:14:42.16 rFCUPf3V0.net
>>285
OCR機能のついたドキュメントスキャナーでスキャン

293:名無しさん＠お腹いっぱい。
21/02/18 23:34:26.27 PhET5XgP0.net
>>285
横書き文書オンリーで仕上がりの良さ最優先なら>190
フリーのツールなんで設定の難しさやUIの面倒さはある
googleにお布施も必要
簡単さで選ぶなら市販のOCRだろうけど詳しくないので分からん
とりあえずwindowsサンドボックスでABBYY試してみたが
MRC圧縮をオフにすれば画質は保たれるぽい

294:名無しさん＠お腹いっぱい。
21/02/19 14:18:04.61 /LGznBXV0.net
e.Typist使ってるよ
検索可能PDFにするときのMRC圧縮はPCで見ると汚いのに、タブレットで見ると良く見えるから不思議
PCの画面を範囲指定してOCR出来る機能はふとしたときに便利
画像読み込みが500枚までしか対応しないのはクソ

295:名無しさん＠お腹いっぱい。
21/02/19 14:51:13.32 pqe2wozU0.net
e.typistか読取革命で迷う

296:名無しさん＠お腹いっぱい。
21/02/19 17:56:41.05 b3qLx0/L0.net
洋書死ぬほどつらい
pdf→ocr→誤字とか改行チェック→自動翻訳→翻訳チェック

297:名無しさん＠お腹いっぱい。
21/02/19 18:34:37.99 zfdZU+YJ0.net
>>289の方へ
前から気になっていたのですが、500枚の読み込みというのは一度にですか？それとも上弦ですか？

298:名無しさん＠お腹いっぱい。
21/02/20 13:37:22.40 0EiJ9/Or0.net
>>289
タブレットのアプリに画像補正機能があるのでは？

299:名無しさん＠お腹いっぱい。
21/02/20 22:00:35.33 Z3ERY2/H0.net
>>292
例えば520枚のフォルダ読み込ませても、500枚までしか画像リストに登録されない。もちろん追加しようとしても出来ない。
分割して認識させて、後からPDFを結合させれば良いだけではあるけど
 >>293
PCと違って画面が小さいから文字の輪郭のがたつきが気にならなくなる、一方で、白黒がハッキリするから綺麗に見えるんでないかなと思ってる
普通のPDFビューアアプリだし

300:名無しさん＠お腹いっぱい。
21/02/20 22:44:13.29 u7vHQ+N90.net
>>294
え、単純にppiの差だったら不思議でも何でもないじゃん

301:名無しさん＠お腹いっぱい。
21/02/24 14:51:12.19 aqSvsfDI0.net
TESSERACT-ocrで　紙読ませたら
「シャンプードレッサー」　が　「にャンプードジったー」　になった

302:名無しさん＠お腹いっぱい。
21/02/25 22:13:45.52 cLb3BFZQ0.net
OCR精度が高くて動作が高速なソフトは？

303:名無しさん＠お腹いっぱい。
21/02/25 22:25:33.45 ttwjBNUo0.net
adobe acrobat

304:名無しさん＠お腹いっぱい。
21/02/25 22:32:06.79 cLb3BFZQ0.net
サブスク以外で頼みます

305:名無しさん＠お腹いっぱい。
21/02/25 23:16:42.87 ttwjBNUo0.net
ワープロ打ちした会議資料など、状態が良い原稿からの日本語の横書きと縦書き文章のOCR化を考えているならe.Typist
文章認識の性能は、読取革命と較べた場合、僅かな差ですがこちらの認識性能が上
雑誌や本などレイアウトが複雑なものや、新聞や古い原稿など状態が良くない日本語文章の他、英語文字が入る場合や、小説や雑誌などの2段組の文章などは読取革命が上

306:名無しさん＠お腹いっぱい。
21/02/26 10:13:46.63 RR89ZAlv0.net
300

307:名無しさん＠お腹いっぱい。
21/05/01 12:22:34.25 wPbgt6E/0.net
tesseract OCRチャレンジ中。プログラミングの技術書PDFを何とか透明PDF付きにしたいという欲求。
飾り文字とか目次とかが壮大にこける。下のような・・・を無視したいんだけど何かうまい方法ないでしょうか。
02 はじめに・・・・・・・2

308:名無しさん＠お腹いっぱい。
21/05/01 17:39:13.89 CU4T262z0.net
>>302
トランプのマーク4種を認識させるときにその文字に限定させることでうまく認識したことがあった。

309:名無しさん＠お腹いっぱい。
21/05/01 21:39:33.27 wPbgt6E/0.net
>>303
ありがとうございます。300ページオーバーを一気にやるのは駄目ですね。
whitelist使う感じでしょうか。

310:名無しさん＠お腹いっぱい。
21/05/02 17:57:02.87 fc3xJsqr0.net
50冊くらいの教科書、手技書等を裁断して、職場の複合機で、スキャンしてPDF化予定です。
検索可能PDFにしたいと考えています。認識率はそこまで厳密に高くなくても、キーワードで該当箇所が分かれば便利かなぁという程度です。テキストで出力などは予定していません。
分厚い表紙などは別でスキャンして中身のPDFと統合できると良いと思っています。
読取革命を第一候補に考えています。いきなりPDFスタンダードというのはOCR絡みのエンジンがパナソニックと書かれていますが、これは読取革命のものとは違うものでしょうか？ほとんど一緒というレベルならいきなりPDFの方が随分安いので良いなぁという感じなのですが、誰かわかりますか？

311:名無しさん＠お腹いっぱい。
21/05/02 18:48:29.25 Xx835nqP0.net
読取革命は読取結果を修正できる
いきなりPDFスタンダードはたぶん修正できない

312:名無しさん＠お腹いっぱい。
21/05/02 20:26:16.72 lQUzaBSR0.net
>>306
ありがとうございます。修正するつもりがなければいきなりPDFで良さそうですね。

313:名無しさん＠お腹いっぱい。
21/05/02 20:55:33.98 ajDJAhT50.net
職場に複合機あるなら機械単体でサーチャブルPDF作れるんじゃない？
画質は高圧縮でだいたい酷いことになるっぽいが

314:名無しさん＠お腹いっぱい。
21/05/03 17:07:18.50 WHA1lrAT0.net
>>308
職場の複合機見たけども、OCRっぽい設定がなかったんですよね。
調べてみると拡張モジュールなるものがあれば良いようなのですが。連休明けにまた調べてみます。ありがとうございます。

315:名無しさん＠お腹いっぱい。
21/05/03 18:31:46.14 FElEuZiq0.net
読取革命などのOCRソフトは、画像を読み込み、文字認識、修正、PDFや、ワードなどに出力する。
PDFも読み込めるが、新たにPDFとして出力される。
いきなりPDF COMPLETEなどの最上位板のPDFソフトは、PDFの透明テキストを修正できる。
画像の上に、文字色が透明のテキストが貼り付けられてる。
文字を赤に変えてチェックするけど面倒くさい。
もっといい方法があるかも知れない。

316:名無しさん＠お腹いっぱい。
21/05/09 01:03:19.05 jmsS93J00.net
いきなりPDFを購入したものの、肝心のスキャンしたPDF→透明テキスト付きPDFの作業でソフトが強制終了してしまいます。問題なくファイル変換できるものと出来ないものがあるみたいです。
Q&Aにはフォントを追加しているとエラー出るかもとか書いてありますが、そもそもフォントを追加なんかした事ないし、どれを消せばいいのかも分からない。というかこれが原因なのかすら分からない。
サポートに問い合わせてみていますが、返事があるのかすら怪しい。。。やはり大人しくAdobeのサブスクリプションにしておくべきだったのか。
愚痴でした。

317:名無しさん＠お腹いっぱい。
21/05/09 12:44:48.40 B+KqUkb30.net
スキャナの設定で、ocrをしてるとかあるのではないかな

318:名無しさん＠お腹いっぱい。
21/05/10 22:12:57.20 6JH0PhBK0.net
>>311
ストレージの空き容量を確認してみて。こういったアプリは作業ファイルを多量に作るので...

319:名無しさん＠お腹いっぱい。
21/05/10 22:38:16.43 4N16DkIp0.net
jpgでスキャンするか、jpgに変換して、jpgを読み込めば大丈夫だろう

320:名無しさん＠お腹いっぱい。
21/05/12 21:30:34.59 obNff0Ek0.net
まあ、10ページでエラーが出るのか、100ページでエラーが出るのか、1000ページでエラーが出るのかの場合分けだな

321:名無しさん＠お腹いっぱい。
21/05/13 16:38:29.73 SLu4UeqC0.net
色々とありがとうございます。
スキャナにはOCRの機能はありませんでした。ストレージにもかなり余裕がありそうですが、ものによるのでしょうか。
何度やってもダメなPDFは4ページ、3/4の表示のところで文字認識中というところで落ちてしまいます。同じ日にスキャンしたPDF（2-6ページ程度のもの複数）はOCR化出来ました。
150ページくらいの200MB程度のものは2個/21個は変換できましたが他はダメでした。JPG経由はまだ試してませんのでやってみたいと思います。
サポセンから連絡があり、調べてみます的なお返事でした。

322:名無しさん＠お腹いっぱい。
21/05/18 18:05:36.41 p+07QIeH0.net
ワクチン接種記録システムの利用者番号読取がOCRで、読取間違いが発生するそうだ

323:名無しさん＠お腹いっぱい。
21/05/19 02:26:34.81 HWxuzQfn0.net
フォントはOCRBで共通でタブレットも同一機種を配布らしいけど撮影環境がマチマチで人によって得られる画像が異なってくるのでそう言う結果になるのは仕方がない。
手振れや角度とかの癖でどういう間違いが出易いとかはあると思う。手振れは持ち方でも変わってくる。
タブレットが大きいから影が映りこむけど、照明が適切か分からない。
ライトは使ってないようだったが、ライトをつけた方が認識しやすい。反射する場合はライト無しにする必要がある。
ピント合わせが出来ない場合が多すぎる。マジ糞。ピント合わせに時間かかる。
カメラが複数ついてる奴はピント合わせ速そうだけど、安いのはカメラ1個だから遅い。
撮影台に乗せて使う場合はピント合わせを固定に出来た方が故障しないし撮影一瞬で出来るしいいことづくめのはず。
セルフレジでも読み取りできないことがよくあるけど、一旦しっかり外して再びしっかり読ませれば一秒で読み取ってくれる。

324:名無しさん＠お腹いっぱい。
21/05/19 10:32:09.32 JDDtGBtH0.net
フォント共通で数字のみでも読み取り間違い出るなら、100%認識のOCRなんて夢のまた夢だな

325:名無しさん＠お腹いっぱい。
21/05/20 04:54:15.76 KDnYz3pE0.net
最近利用しているガソリンスタンドの料金機(セルフの店なんで)が
QRコードで割引とかあって、
まぁ、レシート出すとその季節の割引券が付くんだけど
それの読み込みが遅くてイライラするのよ
QRコードなのにクイックじゃ無い
結局読み取りのところにレシートを押しつけて、
少しずつ遠ざけていくとまぁまぁ(2回目ぐらいで)読み取るぐらいに安定したわ
レシートだから裏が透けたり、角度が付いていたりピントが合わなかったり
そう言うのに強いのがQRコードじゃないんかね？

326:名無しさん＠お腹いっぱい。
21/05/20 08:30:39.20 4Fq3eRUr0.net
OCRとQRは別物だし完全にスレ違いなんだが
あえてツッコむとそれカメラがタコなだけだからスマホ変えたほうがいいよ
QRの規格に文句言うのは筋違い

327:名無しさん＠お腹いっぱい。
21/05/26 00:13:19.62 kuNfd1Ht0.net
ガソリンスタンドのセルフ給油機を客が交換するってのはどういう発送なんだろうか？

328:名無しさん＠お腹いっぱい。
21/05/28 12:05:47.29 P2WCflXp0.net
2000冊分くらいのpdfファイルがあり OCR済みのものとしていないものが混ざっています。これをまとめてOCRしたいのですが安くあげるにはどうしたらいいですか。
バンドル版のacrobatXはこういう目的に使えますか。
URLﾘﾝｸ(m.qoo10.jp)

329:名無しさん＠お腹いっぱい。
21/06/18 13:05:44.71 y51nqA8T0.net
官報を機械可読で公開してくれ

330:名無しさん＠お腹いっぱい。
21/07/10 11:32:58.13 oCPigeEQ0.net
Abbyy FineReader15 が7,980円
今日が最終日だよ～♪
URLﾘﾝｸ(www.sourcenext.com)

331:名無しさん＠お腹いっぱい。
21/07/17 20:46:01.69 Nx+D16Ts0.net
Windows 10上で無料利用できるAI-OCR 認識精度は95％認識枚数は制限なし
URLﾘﾝｸ(ledge.ai)

332:名無しさん＠お腹いっぱい。
21/07/18 02:32:22.76 oQLnYNbx0.net
>>326
認識率95%ってそんなに凄いの。今使ってるの Acrobat の OCR で困ったことないんだけど、それよりもすごいのかな。

333:名無しさん＠お腹いっぱい。
21/07/18 09:04:36.93 lnw1fm580.net
＞ ※ 認識精度は数字に関するもので、条件で左右されます。
数字だけに限定してさえ100文字中5文字は間違うってことでしょ
手書き認識も含むから活字だけならもっと認識率上がるのかも知らんけど

334:名無しさん＠お腹いっぱい。
21/07/18 09:15:41.36 P3XK5s350.net
>>327
まじ？
どういう条件で読んでんの？

335:名無しさん＠お腹いっぱい。
21/07/18 16:32:03.31 8SefTmjA0.net
無償OCRか。この企業、どうやってマネタイズするんだろ
情報抜いて横流しするのかな

336:名無しさん＠お腹いっぱい。
21/07/19 01:07:30.29 F9XeLcaj0.net
>>326
試してみた。インストールにすごく時間かかった。
説明がなくて使いにくい。
認識実行すると文字化けの出力結果。
これは暇な人が色々試して遊ぶソフトと思った。
即、アンインストールした。

337:名無しさん＠お腹いっぱい。
21/07/19 05:34:45.46 fvfQWF3L0.net
AIって自主学習して精度上がる問じゃないのん？

338:名無しさん＠お腹いっぱい。
21/07/19 07:58:50.76 F9XeLcaj0.net
全ての文字が文字化けだから。コードを選ばなきゃいけないのかね。
自己学習をしなくてもある程度の精度が出なきゃ学習のための動力が大変だよ。

339:名無しさん＠お腹いっぱい。
21/07/19 08:28:19.56 fvfQWF3L0.net
全てとなるともう根本的に対応してないのか…？

340:名無しさん＠お腹いっぱい。
21/07/19 10:34:39.69 F9XeLcaj0.net
インストールして試してください。約1 GB のアプリです。もしかしたら私の使い方が根本的に間違ってるのかもしれない。

341:名無しさん＠お腹いっぱい。
21/07/19 16:42:09.54 3A2XjCut0.net
アクセス集中で大変だったりして

342:名無しさん＠お腹いっぱい。
21/07/19 21:27:30.10 8sS8G9mf0.net
アカウント作れがうざすぎ

343:名無しさん＠お腹いっぱい。
21/07/19 23:38:16.48 DpU5b5C20.net
やっぱり情報抜く系みたいだな
やめとき

344:名無しさん＠お腹いっぱい。
21/07/20 01:05:44.37 LR2/vrCo0.net
きっと背後に中国がいるぞ

345:名無しさん＠お腹いっぱい。
21/07/21 01:43:25.56 qQ5Ez8Mv0.net
本を見開きでスキャンしたらできる本の周りの影と真ん中の影を消すソフトないでしょうか？どちらか一つでもいいです。

346:名無しさん＠お腹いっぱい。
21/07/21 09:17:53.10 9Y2uwqlR0.net
マルチ乙

347:名無しさん＠お腹いっぱい。
21/07/21 09:18:19.15 gZhpeJ+z0.net
さらに歪曲まで修正するのがあったような

348:名無しさん＠お腹いっぱい。
21/07/21 13:02:55.40 qQ5Ez8Mv0.net
>>342
是非教えてください

349:名無しさん＠お腹いっぱい。
21/07/21 13:04:34.65 qQ5Ez8Mv0.net
自分で調べたけど発見できませんでした。
念のためですがスキャン自体は Acrobat のスキャン機能を使ってます。スキャン後の PDF の影を取るソフトです。

350:名無しさん＠お腹いっぱい。
21/07/21 13:07:50.05 gZhpeJ+z0.net
OCR機能は無い

351:名無しさん＠お腹いっぱい。
21/07/21 13:12:00.06 9Y2uwqlR0.net
マルチ乙

352:名無しさん＠お腹いっぱい。
21/07/22 16:50:26.47 fGMCvnhV0.net
スマホのOCR、ピントが固定になるようにして使ってるけど
たまに下敷きの量が変わって距離がわずか数ミリずれるだけで認識精度50%とかになる。
レシートがしっかり幅いっぱいになるようにして撮影しなおすと95%くらい認識する。
影ができると精度かなり落ちるから今はスマホのライトOnで撮影している。

353:名無しさん＠お腹いっぱい。
21/07/23 11:27:10.26 rD1VLEV50.net
読取革命DL版セールしてんね　

354:名無しさん＠お腹いっぱい。
21/07/23 14:20:26.16 xlv839tH0.net
まま？

355:名無しさん＠お腹いっぱい。
21/07/23 14:33:46.10 8RLvQ8nD0.net
まままーままーまま

356:名無しさん＠お腹いっぱい。
21/07/23 18:30:19.88 KFQ0x8UC0.net
読取革命で認識させると文字が少し小さくなるのは何でかな

357:名無しさん＠お腹いっぱい。
21/07/29 10:14:59.19 0JzdyqZz0.net
Capture2Text使っていて、>>159 と同じ症状。
どなたか、詳しい人はいませんか？
GUIだと認識できる日本語が、CLIだと化けて出力される。
英語や数字の認識には差異は無さそう。

358:名無しさん＠お腹いっぱい。
21/07/31 21:04:10.52 3gNkzigk0.net
URLﾘﾝｸ(qiita.com)
PowerShell で CMD と入力してコマンド実行してもいいかも。

359:351
21/08/01 12:17:19.04 EKgADGMN0.net
>>353
ありがとうございます！　お陰様で、解決できました。
コマンドプロンプトからの動作は chcp 65001 で改善したのですが、
実は、UWSCのDOSCMD関数から叩きたくて、これは、何をやっても解決しませんでした。
（レジストリでAutoRun弄ってもダメ）
UWSCにはPOWERSHELL関数もあって、そちらからは文字化けせずに取得することができました。

360:名無しさん＠お腹いっぱい。
21/08/03 18:25:28.98 1yBwwluW0.net
スキャンで作成したPDFをOCRで文字認識させました。
表示されている文字で検索してもヒットしませんでした。
当該文字をコピーしてテキストファイルに貼り付けると別の文字になっていました。
OCRに詳しくないので教えてほしいのですが
１、認識後の文字はもとの文字の上に透明のフォントで重ねているのでしょうか？
２．今は、グラフの線が白黒だと判別できないのグレースケールで600DPIでスキャンしています
（300DPIだと文字の周りがにじむので）。認識率を向上させるために注意する設定項目があれば教えて下さい。

361:名無しさん＠お腹いっぱい。
21/08/07 08:52:19.64 rqbKqC/20.net
>>355
僕はプリンタ付属のOCRでスキャンしてますが、600dpiより300dpiのグレーが認識率高いです。
文字がにじんだ方が線が分離しなくなるので機械には読み取りやすくなるようです。
僕は数字の表だけ読み取れればいいんで英数で読み取って数字以外は捨ててます。
矩形でタブを入れ、空白を置換で削除することでExcelでも表として認識できます。
昨日は1ページスキャンして1文字だけ認識してませんでした。
もしかすると、矩形の空白を削除するときにその数字だけはみ出していて削除してしまったのかもしれません。
元が英数ならいいんですが、日本語の文字化けでずれが大きくなるので。
ブラザーの複合機ですが、新しいアプリより ControlCenter4 のOCRの方が使いやすかったです。
PDFの方は詳しくありませんが、PDFにはレイヤ機能があって重ね合わせが出来ます。
WORDでもハガキのイメージに合わせて郵便番号や宛先など配置できますよね。
文字が正しく読み取れなかったとしても、その化けた文字が配置されるので検索では本来の文字は出てこないでしょうね。

362:名無しさん＠お腹いっぱい。
21/08/07 12:24:46.27 iSVP+I520.net
>>356
コメントありがとうございます。
私もブラザーのプリンターを使ってます。ブラザーの OCR ソフトは使い方がよくわからなかったので日本語の縦書きの認識もそこそこ良かったAcrobat の OCR を使うようになりました。
300 DPI の方が認識率が高いというのは新発見です。

363:名無しさん＠お腹いっぱい。
21/08/08 10:01:09.25 kyf68uXo0.net
スキャンした画像をChainLPなどの画像処理ソフトで下処理してからOCRに掛ける

364:名無しさん＠お腹いっぱい。
21/08/08 13:44:29.33 7AjcYiKn0.net
>>358
汚れてもないしトリミングの必要もない場合でも CHAIN LP で何かをすれば認識率は上がりますか？
上がる場合はchainLP のどの項目を使えば良いか教えていただけますか

365:名無しさん＠お腹いっぱい。
21/08/08 19:14:09.75 0wTn0qmR0.net
自分で仕組、理屈を考えてみろよ

366:名無しさん＠お腹いっぱい。
21/08/08 20:38:22.55 IfVfnYiT0.net
OCR前にソフト側で2値画像に変換されてしまうし
事前補正はあんまり意味ないよ
画像をどうこうするよりOCRソフトのユーザー辞書学習カスタマイズして
パターン登録するほうが効果は高い

367:名無しさん＠お腹いっぱい。
21/08/09 01:03:41.06 oBYKB49n0.net
>>361
なるほど、そうなんですね。

368:名無しさん＠お腹いっぱい。
21/08/09 09:41:20.64 a4Sxnc9w0.net
chainLPで検索したら漫画は16階調が一般的で一括変換出来るツールだと出て来た。
僕が16階調に加工するとき、画像の濃さを細かく調整しないとあちこち消えてなくなる現象があった。
少なくとも256階調はないとOCRには向かない。
256階調のままで600dpiを300dpiにしてくれるなら認識率が上がるかもしれない。
・・・そう言うツールではないようですね。
> V0.37-3
> ChainLPでは、画像を1ピクセルあたり1ポイントとしてPDFに配置します。つまり72dpiです。
> よって、出力サイズとして600×800ピクセルを設定した場合

369:は、PDFのページサイズは約8.3×11.1インチとなります。 > これは、ほぼA4サイズに近い大きさです。 > ChainLP v0.38-2 > ・元画像の解像度(dpi)を引き継ぐようにしました。しかし、あまり意味はないと思います。 https://lifehack-lab.com/chainlp_set1/ > Kindle PaperWhiteで自炊本を読む場合、PDFそのままでは非常に読みにくいです。 > mobiというファイル形式に変換してあげるととても読みやすくなります。 > そこで登場するのが、「ChainLP」というソフトです。 > 各種ファイルに変換できるのですが、画像の補正、トリミングが同時にできるので、Kindle用のmobiファイルをつくるのには重宝します。 > どうやってもきれいにならない場合は、別のツールを試してみましょう。 > ＞こちらのページを参考に（Xnconvertというソフトです） > Xnconvertできれいにしてから、ChainLPに再挑戦してください。 > XnConvert. 画像のリサイズやフォーマット変換からフィルタ加工まで一括処理

370:名無しさん＠お腹いっぱい。
21/08/09 10:23:52.59 OqeDcUJs0.net
色々勘違いしてそうだけどChainLPでも256階調出力は可能
つってもそれだけのためにChainLP使うよりRalphaとかの方が楽だけど
あともし漫画をOCRしようとしてるなら諦めたほうがいい
capture2textみたいにフキダシ抽出の機能のあるアプリか
GCV系のAI型じゃないとほぼほぼ無理

371:名無しさん＠お腹いっぱい。
21/08/09 19:56:02.71 V0NxvfPM0.net
>>361
実際やってみたの？
俺は効果ありまくったから毎回下処理してるよ

372:名無しさん＠お腹いっぱい。
21/08/09 20:52:04.70 dAASpWa80.net
ドキュメントスキャナの類だとある程度スキャナドライバ側で補正かけられてるから
いうほど効果ない場合もある
機種や設定次第
ノイズの多いスキャン画像なら補正も有効だけど
設定のわかりにくいCainLPより一括処理できる画像ソフトのほうが
シンプルに分かりやすいんではないかとは思う

373:名無しさん＠お腹いっぱい。
21/08/10 00:19:46.38 9pRWSzRN0.net
>>365
具体的にどんな元原稿に対してどんな効果があったか言ってくれないと効果ありありと言われてもね。

374:名無しさん＠お腹いっぱい。
21/08/12 19:07:27.37 M3IwL1EP0.net
フリーで優れたocrソフトってありますか？
用途は、アマゾンキンドルで実用書読んでるんですけど、
参考になった部分をスクショで撮ってそれをocrで文字起こし、メモ帳にまとめる
ってことがしたいです

375:名無しさん＠お腹いっぱい。
21/08/12 19:17:55.60 W1e/W8C/0.net
>>368
>212
URLﾘﾝｸ(twitter.com)
(deleted an unsolicited ad)

376:名無しさん＠お腹いっぱい。
21/08/12 19:23:21.80 W1e/W8C/0.net
ああごめん翻訳いらなくてスクショ起こしだけならCopyfishでいいんじゃない？
ブラウザ拡張だけどデスクトップのキャプチャもできたはず

377:名無しさん＠お腹いっぱい。
21/08/22 12:15:30.21 InGHoZ6h0.net
衝撃…世界が馬鹿にした日本のFAX､実は米国でもコロナ報告で普通に使っていた
URLﾘﾝｸ(president.jp)
> 北見工業大学教授で公衆衛生分野の情報化に詳しい奥村貴史氏が同サイトに寄稿にした記事によると、
> 同氏からの改善につながる提言に、「OCR（光学文字認識、活字を文字コードに変換するソフト）処理を前提としたフォーマットをFAXで扱う」というものがあります。
> これなら、FAXによる一元的管理機能を担保しつつ、
> アナログでデータを受信しても、
> OCRスキャンすれば直ちにデジタル化できますから、
> 入力する現場の手間を減らすことができます。
OCRでレシートや売上表読み取りしてる身からすると、
数字ですら完全には読み取れないのに
どうしてFAXなんかで送った人名を読み取れるんだと。
せめてQRコード化して送れよと。
工業大学の教授ですらこの程度の事が分からないんだな。

378:名無しさん＠お腹いっぱい。
21/08/23 11:49:45.91 OlmLkjoZ0.net
いまだにFAXを使うしかない事情として
＞医療機関、自治体、保健所など複数の関係者で共通のシステムを整える必要があり、そのためには膨大なコストと時間がかかる
つってるのにQRコード化して送れとか無理でしょ

＞数字ですら完全には読み取れないのに
＞どうしてFAXなんかで送った人名を読み取れるんだと。
そこはフォントの種類とサイズ次第じゃない？
FAX機が吐き出した紙をスキャンしてOCRかけるイメージなのかも知らんけど
FAX受信した複合機でそのままFax TIFFとして保存すれば
FAX形式データってほぼ G3 FAX(200x200dpi)だから200dpiの白黒データとして確保できる
200dpiあればOCR性能は充分という説もあるし
（それだけあれば完璧にOCRできるということではなく、
それ以上にしてもOCR精度の向上は望めないという意味）
カラーやグレスケでスキャンしてもOCR時は内部的に2値に変換してから処理することになるので
スキャン時に白黒（2値）を選ぶのはコスト減らすためにはあり
保存フォーマットは大体勝手にFax TIFFになるので
＞「OCR（光学文字認識、活字を文字コードに変換するソフト）処理を前提としたフォーマットをFAXで扱う」
というのも正しい

379:名無しさん＠お腹いっぱい。
21/08/23 15:49:32.12 fGb2UNbz0.net
>>372
そんな反論は予想通り。
OCRできるんなら送る側が自分でOCRしてQRコードを追加で印字すればいいだろ。
パソコンから直接FAXと電話回線に繋げて送るんなら精度は高いかもしれんが、
一回印刷してからFAXに入れるんなら、読み取るときに字がくずれるしゴミも読み取ってしまう。
仮に直接FAXと電話回線に繋げてたとしても、送信に成功したかどうかってすぐわかるの？
送ったかどうかって履歴に残るの？
PDFに印刷してからメールに添付して送れば履歴残るし
PDFを印刷してスキャンしてOCRもできるし
PDFからOCRできるし
PDFのフォントと文字コードがそのまま使えて検索までできちゃうんですけど？
そもそもFAXと聞いて手書きを想定してない時点でダメだけどね。

380:名無しさん＠お腹いっぱい。
21/08/23 15:54:44.90 fGb2UNbz0.net
・QRコードをFAXで送る方法
・PDFファイルをメールで送る方法
この２つだとシステムが専用だとQRコードは難しいかもしれんが
Windows使ってるならPDF印刷は標準機能だから簡単に追加できると思うよ。
そして役所は基本的にメールでやり取りしてる。相手がFAXしか使えないならFAXも使ってるけど。
コロナ補助金申請したけどExcelのファイルをメールでやり取りしたよ。
印刷した奴も郵送したけど。
郵送した理由は「印鑑がないと正式な書類にならないから。」
ようするに技術的な理由じゃなくてルールの問題なんだよ。

381:名無しさん＠お腹いっぱい。
21/08/23 19:28:55.86 OlmLkjoZ0.net
>>373
FAX使ったことない人か
送信の成功失敗は履歴から分かる
普通のFAX機なら失敗しても3回なり5回なりの時間置いてリトライする機能も付いてる
現状でFAX廃止できない状況だからそれを活用しましょうってことで
FAX以外は受け付けませんってことではないでしょ
PDFながせるそれでいいだろうしメールはだめですとも書いてない
各関係団体はそれぞれの基幹システムやデータベースで既に管理してるが
そこから出力できる形式にはだいたい制限があるし書式もフォーマットもバラバラ
お役所仕事のようにExcelのこのフォーマット以外はだめです、
送信のためにもう一度体裁整えて新たに入力して下さいとかやってる暇がないので
エクスポートや印刷で出せるものをそのまま流してもらうしかないのがおそらく今の現状
アナログで対応するというのは、そこはそのまま送り手に負担を強いず
どんな書類が来ても受け側で自動でどうにかできるすげえ力技システム組んじゃいましょうってことで
FAXで受けるなら手書き書類も考慮してるだろうし
（手書きOCRの実用性はググればまあまあ出てくる）
リソースは当然必要だろうけど大学ならAI OCR研究やってるとこと提携して
市販の既成OCRソフトとは規模の違う精度のものが組めるアテがあるのかもしれん

382:名無しさん＠お腹いっぱい。
21/08/23 20:18:25.89 CYyOePzH0.net
>>375
> （手書きOCRの実用性はググればまあまあ出てくる）
> リソースは当然必要だろうけど大学ならAI OCR研究やってるとこと提携して
> 市販の既成OCRソフトとは規模の違う精度のものが組めるアテがあるのかもしれん
馬鹿だろお前。
大学の無能教授と無能学生になにが作れると思ってんだ？
作ることが可能ならとっくの昔に存在してるし、
今存在してないならこれから先も作ることは不可能なんだよ。
作れる人間が生まれてくるまではな。

383:名無しさん＠お腹いっぱい。
21/08/23 21:54:40.53 YrGASWyP0.net
うるせえ
よそでやれ

384:名無しさん＠お腹いっぱい。
21/08/23 22:10:01.75 OlmLkjoZ0.net
FAXに続きスマホも使ったことない人なのか
URLﾘﾝｸ(i.imgur.com)
googleのこのOCRエンジンがGCV登録すればAPIで使えるので
個人でも高精度OCRアプリが作れる時代ですよ
お金出せば使えるそこそこ運用実績のあるシステムもググれば出てくる
（存在してる）
URLﾘﾝｸ(www.tegaki.ai)

385:名無しさん＠お腹いっぱい。
21/08/23 22:12:17.86 OlmLkjoZ0.net
あっ紙に書いたID 自分のじゃないやん間違えちゃった
痛恨のヒューマンエラー

386:名無しさん＠お腹いっぱい。
21/08/23 22:46:53.84 CYyOePzH0.net
俺はGoogle検索しただけで50万円請求されたからね。Googleから。2回ほど。
馬鹿は50万でも一千万でも請求されてろ。

387:名無しさん＠お腹いっぱい。
21/08/23 22:53:28.53 CYyOePzH0.net
> Cloud Vision API には画像解析のための各種機能があります。どの場合でも、ご利用いただいた分だけお支払いいただきます。最低料金などは設定されていません。
> TEXT_DETECTION 画像内のテキストに対して光学式文字認識（OCR）を実行します。
> 1,001～5,000,000 ユニット/月
> テキスト検出　$1.50
あら、お安い。
> 1,000 ユニットあたりの料金
5,000,000 ユニットの料金は＄7,500

388:名無しさん＠お腹いっぱい。
21/08/23 22:54:59.36 CYyOePzH0.net
日本円だと８２万円だね。お安いね。

389:名無しさん＠お腹いっぱい。
21/08/24 08:18:42.85 6FahnTPL0.net
50万2回請求ってｗ
規約も読まずにOCRしまくっちゃったの？
＞日本円だと８２万円だね。お安いね。
500万ユニットが月に処理する回数として妥当値なのか知らんけど
運用費用としてはありなんじゃないの
日本中のコロナデータ集積して人力入力させてる人件費を考えたら

390:名無しさん＠お腹いっぱい。
21/08/24 09:19:52.10 NY7D9FCw0.net
>>383
＞Google検索しただけで
字も読めないほど耄碌したの？
OCRする人件費がないから日本中の自治体でワクチンの発注ができなくなったのを忘れたの？

391:名無しさん＠お腹いっぱい。
21/08/24 09:58:03.25 6FahnTPL0.net
人に説明するの下手な人か
今更だが触っちゃいけないタイプだったな
ゴメンな？独り言の邪魔しちゃって

392:名無しさん＠お腹いっぱい。
21/08/24 12:44:38.28 NY7D9FCw0.net
>>385
「Google検索しただけで」では説明が下手ですか。
Google検索を一日中繰り返していたらブラウザに請求書が表示されてそれが50万円で請求者はGoogleとなっていました。
チャットで交渉出来たので支払いは免れましたが、「今後このようなことがあれば業務利用とみなし、契約を結んでもらいます。」との事。
業務でGoogleの機能を使えば毎月80万円程度のお金がかかることは >>378 も >>383 も認めている。

393:名無しさん＠お腹いっぱい。
21/08/24 14:12:24.41 6FahnTPL0.net
？？？
ごめん何言ってるかサッパリわからない
どういう状況でGoogle検索したら50万も請求が来るのか全く理解できない
＞業務でGoogleの機能を使えば毎月80万円程度のお金がかかることは＞ >>378 も >>383 も認めている。
Cloud Vision API は Google Cloudプラットフォームにアカウント登録して
クレジットカードまたは銀行口座情報を入力して初めて使えるサービスだぞ
業務か個人ユースかに関係なく使った分だけの従量課金で
手順踏んでAPIキー取得してAPI叩かなきゃ従量カウントは上がらないし
「Google検索しただけで」勝手に請求が来るような代物ではもちろんない
あと80万かかるのは月に500万ユニット使った場合の話でしょ？
処理回数に応じてそれ以上にもそれ以下もなる
こっちは君が言ったからランニングコストはとしてはありじゃない？って返しただけで
500万ユニットがコロナのデータ集積に毎月かける回数として妥当なのかは知らんよ

394:名無しさん＠お腹いっぱい。
21/08/24 14:23:54.92 NY7D9FCw0.net
>>387
> ？？？
> ごめん何言ってるかサッパリわからない
> どういう状況でGoogle検索したら50万も請求が来るのか全く理解できない
一日中Googleのホームページ（URLﾘﾝｸ(www.google.co.jp)）のテキストボックスに検索したいテキストを入力して検索ボタンをクリックすることを繰り返したら
ブラウザに請求書が表示されてそれが50万円で請求者はGoogleとなっていました。

395:名無しさん＠お腹いっぱい。
21/08/24 14:31:13.96 NY7D9FCw0.net
>>387
> あと80万かかるのは月に500万ユニット使った場合の話でしょ？
> 500万ユニットがコロナのデータ集積に毎月かける回数として妥当なのかは知らんよ
ユニットが何を意味するか分からんけど一つのブロックだと仮定すると
1ページで30くらいのユニットがあると考えられるので
10万枚処理すれば500万ユニットに近い数字になると思われる。
Googleより
> 米国での感染者数は増加傾向にあり、平均で1日147,420人の新規感染者が報告されている。
147,420*30=4,422,600/月
アメリカの感染者数が毎月442万人出てる計算だから
仮に１ページ１ユニットで計算しても500万ユニットは妥当な数字。
日本の感染者数がアメリカより少ないと言うなら、ユニットが1ページ30で計算すればいいんじゃね？

396:名無しさん＠お腹いっぱい。
21/08/24 17:32:00.46 6FahnTPL0.net
一日中つったって手動で検索繰り返した程度で50万請求が来るような検索回数になるとはとても思えないんだけど
マルウェアが裏でF5アタック繰り返してたとかじゃないの知らんけど
URLﾘﾝｸ(cloud.google.com)
ユニットは1枚の画像に対し適応する機能タイプ別に発生する
1枚の書類(画像)に対してテキスト検出(OCR)しかしないのであればユニット数は1
結果はjson形式ファイルで画像中にブロックがある場合はで個別に分けて取り出せる
URLﾘﾝｸ(cloud.google.com)

397:名無しさん＠お腹いっぱい。
21/08/24 18:53:54.94 U1hPfsKA0.net
うるせえ
よそでやれ

398:名無しさん＠お腹いっぱい。
21/08/24 18:57:00.72 NY7D9FCw0.net
>>390
おまえさあ、Google検索してて「私はロボットではありません」って表示出たことある？
その表示が出るまでに何回検索してるか分かる？
そして検索にいくらかかったか分かる？
著作権裁判だと単に製品の代金だけじゃなく懲罰的請求をされるって知ってる？
アメリカだと自分でコーヒーこぼしただけで３億円も請求されるんですよ。
50万円って実質無料でしょ。

399:名無しさん＠お腹いっぱい。
21/08/24 19:06:08.39 ubSdBvKx0.net
詭弁　答えのない問題に対して他の場所で出た答えを持ち出して
その答えはあの問題と同じだよと根拠もないのに言い張ってるだけのキチガイ
お前の言ってることは何の答えにもなってない

400:名無しさん＠お腹いっぱい。
21/08/24 19:33:29.79 6FahnTPL0.net
何言ってるのかさっぱり分かんない
やっぱ会話無理な人か
 >>391
ゴメンねもうやめるわ

401:名無しさん＠お腹いっぱい。
21/08/24 19:35:22.71 NY7D9FCw0.net
>>393
答えは最初っから言ってるだろ。Google検索したらGoogleから50万円請求されました。
お前が信じないだけだ。
ソースは出せない。
お前は企業がどういうときに金を請求するか知ってる？
費用が掛かった時だよ。
チンピラがたまたま目の前にいた通行人に金を請求するゆすりたかりとは違うんですよ。
じゃあ、どういう場合に「私はロボットではありません」って表示を出すか分かる？
無駄な費用を抑えるためですよ。
金を請求するのと「私はロボットではありません」と表示するのは目的が同じ。
お金ですよ。
かかった分請求するか、最初からかからないようにするかの違いだけ。
俺が50万円請求された証拠は出せないが、「私はロボットではありません」と表示される問題は無数にソースがある。
どれくらい検索していたかもその証言から推定できる。
そしたら、少なくともどれくらい使ったらGoogleが許容できない費用がかかっているかも推定でき、
50万円を請求するとしたらどれくらいの検索をしたかも推定できるはず。頭のいい人なら。
日本人は、どれだけ使ったらいくら請求と言う計算はできるけど、
いくら請求されたらどれくらい使ったかっていう計算は出来ない。
そう言う典型的日本人が >>393

402:名無しさん＠お腹いっぱい。
21/08/24 20:12:01.67 PyFmfN7N0.net
論点1 QRコード化が可能か不可能か
論点2 人名が読み取れているか否か
論点3 手書きに対してOCRが有効かどうか
論点4 送信に成功したかどうかが分かるか
1 現場にしか分からないが個人単位では不可能ではない
2 現場にしか分からないが個人単位では不可能ではない
3 現場にしか分からないが個人単位では不可能ではない
4 現場にしか分からないが個人単位では不可能ではない
これだけの話なのに論点5のgoogle検索しただけで50万請求された人がいる
が一番どうでもいいし馬鹿らしいんだが　自覚しろよ

403:名無しさん＠お腹いっぱい。
21/08/24 20:15:34.99 PyFmfN7N0.net
当然論点6のOCRの活用が現場で可能かどうかも現場にしか分からない
こんな所で無能だなんだ言ってないで現場に連絡取る位の努力しろよカス

404:名無しさん＠お腹いっぱい。
21/08/26 22:54:38.68 fktTc4eK0.net
日本語横書きで時々アルファベットの引用を含んでいる文章をAcrobat の OCR で認識させるとアルファベットの一部の認識が失敗します。オプションは日本語文章を選んでおります。アルファベットもうまく認識させる方法はないでしょうか。

405:名無しさん＠お腹いっぱい。
21/08/27 20:30:24.89 939FgqXL0.net
この車のナンバーって人工知能で解析できんかね。
URLﾘﾝｸ(himado.in)

406:名無しさん＠お腹いっぱい。
21/09/11 09:26:02.33 XEPKqxnl0.net
CloudのAI OCRではGoogleのCloud Visionが優れていたが
最近AzureのCognitive Serviceを試してみたところ
文字の認識誤りの少なさではさらに上回る
ただし課題もあり、右から左へ改行していく縦書き文書を
左から右へ認識するので、行の順序が逆になる
読取順序をbasicからnaturalへ変えても同じ
幸い出力のjsonには座標情報が含まれているので
スクリプトによる後処理で行を並び替え
ついでにルビも削って整えているが
この辺をうまくやってくれるGUIがほしいところ

407:名無しさん＠お腹いっぱい。
21/09/11 10:34:50.20 LOlOzN870.net
そのスクリプトは公開してるの？
PythonでGUI作れるかも。

408:名無しさん＠お腹いっぱい。
21/09/11 11:06:47.97 XEPKqxnl0.net
>>401
公開するほど大したことない
AzureのAPIとのやりとりはPythonで
後処理はluaでやっている（速いしYAMAHA使いなので）
小ネタで、Google Cloud Visionには
Microsoft Automate Desktop が何気に対応していて
フォルダ内の画像に一括OCRをかける程度なら
ノーコードで簡単にGUI化できる

次ページ