【文字認識】OCRソフト【 自炊 】at SOFTWARE
【文字認識】OCRソフト【 自炊 】 - 暇つぶし2ch352:名無しさん@お腹いっぱい。
21/07/22 16:50:26.47 fGMCvnhV0.net
スマホのOCR、ピントが固定になるようにして使ってるけど
たまに下敷きの量が変わって距離がわずか数ミリずれるだけで認識精度50%とかになる。
レシートがしっかり幅いっぱいになるようにして撮影しなおすと95%くらい認識する。
影ができると精度かなり落ちるから今はスマホのライトOnで撮影している。

353:名無しさん@お腹いっぱい。
21/07/23 11:27:10.26 rD1VLEV50.net
読取革命DL版セールしてんね 

354:名無しさん@お腹いっぱい。
21/07/23 14:20:26.16 xlv839tH0.net
まま?

355:名無しさん@お腹いっぱい。
21/07/23 14:33:46.10 8RLvQ8nD0.net
まままーままーまま

356:名無しさん@お腹いっぱい。
21/07/23 18:30:19.88 KFQ0x8UC0.net
読取革命で認識させると文字が少し小さくなるのは何でかな

357:名無しさん@お腹いっぱい。
21/07/29 10:14:59.19 0JzdyqZz0.net
Capture2Text使っていて、>>159 と同じ症状。
どなたか、詳しい人はいませんか?
GUIだと認識できる日本語が、CLIだと化けて出力される。
英語や数字の認識には差異は無さそう。

358:名無しさん@お腹いっぱい。
21/07/31 21:04:10.52 3gNkzigk0.net
URLリンク(qiita.com)
PowerShell で CMD と入力してコマンド実行してもいいかも。

359:351
21/08/01 12:17:19.04 EKgADGMN0.net
>>353
ありがとうございます! お陰様で、解決できました。
コマンドプロンプトからの動作は chcp 65001 で改善したのですが、
実は、UWSCのDOSCMD関数から叩きたくて、これは、何をやっても解決しませんでした。
(レジストリでAutoRun弄ってもダメ)
UWSCにはPOWERSHELL関数もあって、そちらからは文字化けせずに取得することができました。

360:名無しさん@お腹いっぱい。
21/08/03 18:25:28.98 1yBwwluW0.net
スキャンで作成したPDFをOCRで文字認識させました。
表示されている文字で検索してもヒットしませんでした。
当該文字をコピーしてテキストファイルに貼り付けると別の文字になっていました。
OCRに詳しくないので教えてほしいのですが
1、認識後の文字はもとの文字の上に透明のフォントで重ねているのでしょうか?
2.今は、グラフの線が白黒だと判別できないのグレースケールで600DPIでスキャンしています
(300DPIだと文字の周りがにじむので)。認識率を向上させるために注意する設定項目があれば教えて下さい。

361:名無しさん@お腹いっぱい。
21/08/07 08:52:19.64 rqbKqC/20.net
>>355
僕はプリンタ付属のOCRでスキャンしてますが、600dpiより300dpiのグレーが認識率高いです。
文字がにじんだ方が線が分離しなくなるので機械には読み取りやすくなるようです。
僕は数字の表だけ読み取れればいいんで英数で読み取って数字以外は捨ててます。
矩形でタブを入れ、空白を置換で削除することでExcelでも表として認識できます。
昨日は1ページスキャンして1文字だけ認識してませんでした。
もしかすると、矩形の空白を削除するときにその数字だけはみ出していて削除してしまったのかもしれません。
元が英数ならいいんですが、日本語の文字化けでずれが大きくなるので。
ブラザーの複合機ですが、新しいアプリより ControlCenter4 のOCRの方が使いやすかったです。
PDFの方は詳しくありませんが、PDFにはレイヤ機能があって重ね合わせが出来ます。
WORDでもハガキのイメージに合わせて郵便番号や宛先など配置できますよね。
文字が正しく読み取れなかったとしても、その化けた文字が配置されるので検索では本来の文字は出てこないでしょうね。

362:名無しさん@お腹いっぱい。
21/08/07 12:24:46.27 iSVP+I520.net
>>356
コメントありがとうございます。
私もブラザーのプリンターを使ってます。ブラザーの OCR ソフトは使い方がよくわからなかったので日本語の縦書きの認識もそこそこ良かったAcrobat の OCR を使うようになりました。
300 DPI の方が認識率が高いというのは新発見です。

363:名無しさん@お腹いっぱい。
21/08/08 10:01:09.25 kyf68uXo0.net
スキャンした画像をChainLPなどの画像処理ソフトで下処理してからOCRに掛ける

364:名無しさん@お腹いっぱい。
21/08/08 13:44:29.33 7AjcYiKn0.net
>>358
汚れてもないしトリミングの必要もない場合でも CHAIN LP で何かをすれば認識率は上がりますか?
上がる場合はchainLP のどの項目を使えば良いか教えていただけますか

365:名無しさん@お腹いっぱい。
21/08/08 19:14:09.75 0wTn0qmR0.net
自分で仕組、理屈を考えてみろよ

366:名無しさん@お腹いっぱい。
21/08/08 20:38:22.55 IfVfnYiT0.net
OCR前にソフト側で2値画像に変換されてしまうし
事前補正はあんまり意味ないよ
画像をどうこうするよりOCRソフトのユーザー辞書学習カスタマイズして
パターン登録するほうが効果は高い

367:名無しさん@お腹いっぱい。
21/08/09 01:03:41.06 oBYKB49n0.net
>>361
なるほど、そうなんですね。

368:名無しさん@お腹いっぱい。
21/08/09 09:41:20.64 a4Sxnc9w0.net
chainLPで検索したら漫画は16階調が一般的で一括変換出来るツールだと出て来た。
僕が16階調に加工するとき、画像の濃さを細かく調整しないとあちこち消えてなくなる現象があった。
少なくとも256階調はないとOCRには向かない。
256階調のままで600dpiを300dpiにしてくれるなら認識率が上がるかもしれない。
・・・そう言うツールではないようですね。
> V0.37-3
> ChainLPでは、画像を1ピクセルあたり1ポイントとしてPDFに配置します。つまり72dpiです。
> よって、出力サイズとして600×800ピクセルを設定した場合


369:は、PDFのページサイズは約8.3×11.1インチとなります。 > これは、ほぼA4サイズに近い大きさです。 > ChainLP v0.38-2 > ・元画像の解像度(dpi)を引き継ぐようにしました。しかし、あまり意味はないと思います。 https://lifehack-lab.com/chainlp_set1/ > Kindle PaperWhiteで自炊本を読む場合、PDFそのままでは非常に読みにくいです。 > mobiというファイル形式に変換してあげるととても読みやすくなります。 > そこで登場するのが、「ChainLP」というソフトです。 > 各種ファイルに変換できるのですが、画像の補正、トリミングが同時にできるので、Kindle用のmobiファイルをつくるのには重宝します。 > どうやってもきれいにならない場合は、別のツールを試してみましょう。 > >こちらのページを参考に(Xnconvertというソフトです) > Xnconvertできれいにしてから、ChainLPに再挑戦してください。 > XnConvert. 画像のリサイズやフォーマット変換からフィルタ加工まで一括処理



370:名無しさん@お腹いっぱい。
21/08/09 10:23:52.59 OqeDcUJs0.net
色々勘違いしてそうだけどChainLPでも256階調出力は可能
つってもそれだけのためにChainLP使うよりRalphaとかの方が楽だけど
あともし漫画をOCRしようとしてるなら諦めたほうがいい
capture2textみたいにフキダシ抽出の機能のあるアプリか
GCV系のAI型じゃないとほぼほぼ無理

371:名無しさん@お腹いっぱい。
21/08/09 19:56:02.71 V0NxvfPM0.net
>>361
実際やってみたの?
俺は効果ありまくったから毎回下処理してるよ

372:名無しさん@お腹いっぱい。
21/08/09 20:52:04.70 dAASpWa80.net
ドキュメントスキャナの類だとある程度スキャナドライバ側で補正かけられてるから
いうほど効果ない場合もある
機種や設定次第
ノイズの多いスキャン画像なら補正も有効だけど
設定のわかりにくいCainLPより一括処理できる画像ソフトのほうが
シンプルに分かりやすいんではないかとは思う

373:名無しさん@お腹いっぱい。
21/08/10 00:19:46.38 9pRWSzRN0.net
>>365
具体的にどんな元原稿に対してどんな効果があったか言ってくれないと効果ありありと言われてもね。

374:名無しさん@お腹いっぱい。
21/08/12 19:07:27.37 M3IwL1EP0.net
フリーで優れたocrソフトってありますか?
用途は、アマゾンキンドルで実用書読んでるんですけど、
参考になった部分をスクショで撮ってそれをocrで文字起こし、メモ帳にまとめる
ってことがしたいです

375:名無しさん@お腹いっぱい。
21/08/12 19:17:55.60 W1e/W8C/0.net
>>368
>212
URLリンク(twitter.com)
(deleted an unsolicited ad)

376:名無しさん@お腹いっぱい。
21/08/12 19:23:21.80 W1e/W8C/0.net
ああごめん翻訳いらなくてスクショ起こしだけならCopyfishでいいんじゃない?
ブラウザ拡張だけどデスクトップのキャプチャもできたはず

377:名無しさん@お腹いっぱい。
21/08/22 12:15:30.21 InGHoZ6h0.net
衝撃…世界が馬鹿にした日本のFAX、実は米国でもコロナ報告で普通に使っていた
URLリンク(president.jp)
> 北見工業大学教授で公衆衛生分野の情報化に詳しい奥村貴史氏が同サイトに寄稿にした記事によると、
> 同氏からの改善につながる提言に、「OCR(光学文字認識、活字を文字コードに変換するソフト)処理を前提としたフォーマットをFAXで扱う」というものがあります。
> これなら、FAXによる一元的管理機能を担保しつつ、
> アナログでデータを受信しても、
> OCRスキャンすれば直ちにデジタル化できますから、
> 入力する現場の手間を減らすことができます。
OCRでレシートや売上表読み取りしてる身からすると、
数字ですら完全には読み取れないのに
どうしてFAXなんかで送った人名を読み取れるんだと。
せめてQRコード化して送れよと。
工業大学の教授ですらこの程度の事が分からないんだな。

378:名無しさん@お腹いっぱい。
21/08/23 11:49:45.91 OlmLkjoZ0.net
いまだにFAXを使うしかない事情として
> 医療機関、自治体、保健所など複数の関係者で共通のシステムを整える必要があり、そのためには膨大なコストと時間がかかる
つってるのにQRコード化して送れとか無理でしょ

> 数字ですら完全には読み取れないのに
> どうしてFAXなんかで送った人名を読み取れるんだと。
そこはフォントの種類とサイズ次第じゃない?
FAX機が吐き出した紙をスキャンしてOCRかけるイメージなのかも知らんけど
FAX受信した複合機でそのままFax TIFFとして保存すれば
FAX形式データってほぼ G3 FAX(200x200dpi)だから200dpiの白黒データとして確保できる
200dpiあればOCR性能は充分という説もあるし
(それだけあれば完璧にOCRできるということではなく、
それ以上にしてもOCR精度の向上は望めないという意味)
カラーやグレスケでスキャンしてもOCR時は内部的に2値に変換してから処理することになるので
スキャン時に白黒(2値)を選ぶのはコスト減らすためにはあり
保存フォーマットは大体勝手にFax TIFFになるので
> 「OCR(光学文字認識、活字を文字コードに変換するソフト)処理を前提としたフォーマットをFAXで扱う」
というのも正しい

379:名無しさん@お腹いっぱい。
21/08/23 15:49:32.12 fGb2UNbz0.net
>>372
そんな反論は予想通り。
OCRできるんなら送る側が自分でOCRしてQRコードを追加で印字すればいいだろ。
パソコンから直接FAXと電話回線に繋げて送るんなら精度は高いかもしれんが、
一回印刷してからFAXに入れるんなら、読み取るときに字がくずれるしゴミも読み取ってしまう。
仮に直接FAXと電話回線に繋げてたとしても、送信に成功したかどうかってすぐわかるの?
送ったかどうかって履歴に残るの?
PDFに印刷してからメールに添付して送れば履歴残るし
PDFを印刷してスキャンしてOCRもできるし
PDFからOCRできるし
PDFのフォントと文字コードがそのまま使えて検索までできちゃうんですけど?
そもそもFAXと聞いて手書きを想定してない時点でダメだけどね。

380:名無しさん@お腹いっぱい。
21/08/23 15:54:44.90 fGb2UNbz0.net
・QRコードをFAXで送る方法
・PDFファイルをメールで送る方法
この2つだとシステムが専用だとQRコードは難しいかもしれんが
Windows使ってるならPDF印刷は標準機能だから簡単に追加できると思うよ。
そして役所は基本的にメールでやり取りしてる。相手がFAXしか使えないならFAXも使ってるけど。
コロナ補助金申請したけどExcelのファイルをメールでやり取りしたよ。
印刷した奴も郵送したけど。
郵送した理由は「印鑑がないと正式な書類にならないから。」
ようするに技術的な理由じゃなくてルールの問題なんだよ。

381:名無しさん@お腹いっぱい。
21/08/23 19:28:55.86 OlmLkjoZ0.net
>>373
FAX使ったことない人か
送信の成功失敗は履歴から分かる
普通のFAX機なら失敗しても3回なり5回なりの時間置いてリトライする機能も付いてる
現状でFAX廃止できない状況だからそれを活用しましょうってことで
FAX以外は受け付けませんってことではないでしょ
PDFながせるそれでいいだろうしメールはだめですとも書いてない
各関係団体はそれぞれの基幹システムやデータベースで既に管理してるが
そこから出力できる形式にはだいたい制限があるし書式もフォーマットもバラバラ
お役所仕事のようにExcelのこのフォーマット以外はだめです、
送信のためにもう一度体裁整えて新たに入力して下さいとかやってる暇がないので
エクスポートや印刷で出せるものをそのまま流してもらうしかないのがおそらく今の現状
アナログで対応するというのは、そこはそのまま送り手に負担を強いず
どんな書類が来ても受け側で自動でどうにかできるすげえ力技システム組んじゃいましょうってことで
FAXで受けるなら手書き書類も考慮してるだろうし
(手書きOCRの実用性はググればまあまあ出てくる)
リソースは当然必要だろうけど大学ならAI OCR研究やってるとこと提携して
市販の既成OCRソフトとは規模の違う精度のものが組めるアテがあるのかもしれん

382:名無しさん@お腹いっぱい。
21/08/23 20:18:25.89 CYyOePzH0.net
>>375
> (手書きOCRの実用性はググればまあまあ出てくる)
> リソースは当然必要だろうけど大学ならAI OCR研究やってるとこと提携して
> 市販の既成OCRソフトとは規模の違う精度のものが組めるアテがあるのかもしれん
馬鹿だろお前。
大学の無能教授と無能学生になにが作れると思ってんだ?
作ることが可能ならとっくの昔に存在してるし、
今存在してないならこれから先も作ることは不可能なんだよ。
作れる人間が生まれてくるまではな。

383:名無しさん@お腹いっぱい。
21/08/23 21:54:40.53 YrGASWyP0.net
うるせえ
よそでやれ

384:名無しさん@お腹いっぱい。
21/08/23 22:10:01.75 OlmLkjoZ0.net
FAXに続きスマホも使ったことない人なのか
URLリンク(i.imgur.com)
googleのこのOCRエンジンがGCV登録すればAPIで使えるので
個人でも高精度OCRアプリが作れる時代ですよ
お金出せば使えるそこそこ運用実績のあるシステムもググれば出てくる
(存在してる)
URLリンク(www.tegaki.ai)

385:名無しさん@お腹いっぱい。
21/08/23 22:12:17.86 OlmLkjoZ0.net
あっ紙に書いたID 自分のじゃないやん間違えちゃった
痛恨のヒューマンエラー

386:名無しさん@お腹いっぱい。
21/08/23 22:46:53.84 CYyOePzH0.net
俺はGoogle検索しただけで50万円請求されたからね。Googleから。2回ほど。
馬鹿は50万でも一千万でも請求されてろ。

387:名無しさん@お腹いっぱい。
21/08/23 22:53:28.53 CYyOePzH0.net
> Cloud Vision API には画像解析のための各種機能があります。どの場合でも、ご利用いただいた分だけお支払いいただきます。最低料金などは設定されていません。
> TEXT_DETECTION 画像内のテキストに対して光学式文字認識(OCR)を実行します。
> 1,001~5,000,000 ユニット/月
> テキスト検出 $1.50
あら、お安い。
> 1,000 ユニットあたりの料金
5,000,000 ユニットの料金は$7,500

388:名無しさん@お腹いっぱい。
21/08/23 22:54:59.36 CYyOePzH0.net
日本円だと82万円だね。お安いね。

389:名無しさん@お腹いっぱい。
21/08/24 08:18:42.85 6FahnTPL0.net
50万2回請求ってw
規約も読まずにOCRしまくっちゃったの?
> 日本円だと82万円だね。お安いね。
500万ユニットが月に処理する回数として妥当値なのか知らんけど
運用費用としてはありなんじゃないの
日本中のコロナデータ集積して人力入力させてる人件費を考えたら

390:名無しさん@お腹いっぱい。
21/08/24 09:19:52.10 NY7D9FCw0.net
>>383
>Google検索しただけで
字も読めないほど耄碌したの?
OCRする人件費がないから日本中の自治体でワクチンの発注ができなくなったのを忘れたの?

391:名無しさん@お腹いっぱい。
21/08/24 09:58:03.25 6FahnTPL0.net
人に説明するの下手な人か
今更だが触っちゃいけないタイプだったな
ゴメンな?独り言の邪魔しちゃって

392:名無しさん@お腹いっぱい。
21/08/24 12:44:38.28 NY7D9FCw0.net
>>385
「Google検索しただけで」では説明が下手ですか。
Google検索を一日中繰り返していたらブラウザに請求書が表示されてそれが50万円で請求者はGoogleとなっていました。
チャットで交渉出来たので支払いは免れましたが、「今後このようなことがあれば業務利用とみなし、契約を結んでもらいます。」との事。
業務でGoogleの機能を使えば毎月80万円程度のお金がかかることは >>378>>383 も認めている。

393:名無しさん@お腹いっぱい。
21/08/24 14:12:24.41 6FahnTPL0.net
???
ごめん何言ってるかサッパリわからない
どういう状況でGoogle検索したら50万も請求が来るのか全く理解できない
> 業務でGoogleの機能を使えば毎月80万円程度のお金がかかることは > >>378>>383 も認めている。
Cloud Vision API は Google Cloudプラットフォームにアカウント登録して
クレジット カードまたは銀行口座情報を入力して初めて使えるサービスだぞ
業務か個人ユースかに関係なく使った分だけの従量課金で
手順踏んでAPIキー取得してAPI叩かなきゃ従量カウントは上がらないし
「Google検索しただけで」勝手に請求が来るような代物ではもちろんない
あと80万かかるのは月に500万ユニット使った場合の話でしょ?
処理回数に応じてそれ以上にもそれ以下もなる
こっちは君が言ったからランニングコストはとしてはありじゃない?って返しただけで
500万ユニットがコロナのデータ集積に毎月かける回数として妥当なのかは知らんよ

394:名無しさん@お腹いっぱい。
21/08/24 14:23:54.92 NY7D9FCw0.net
>>387
> ???
> ごめん何言ってるかサッパリわからない
> どういう状況でGoogle検索したら50万も請求が来るのか全く理解できない
一日中Googleのホームページ(URLリンク(www.google.co.jp))のテキストボックスに検索したいテキストを入力して検索ボタンをクリックすることを繰り返したら
ブラウザに請求書が表示されてそれが50万円で請求者はGoogleとなっていました。

395:名無しさん@お腹いっぱい。
21/08/24 14:31:13.96 NY7D9FCw0.net
>>387
> あと80万かかるのは月に500万ユニット使った場合の話でしょ?
> 500万ユニットがコロナのデータ集積に毎月かける回数として妥当なのかは知らんよ
ユニットが何を意味するか分からんけど一つのブロックだと仮定すると
1ページで30くらいのユニットがあると考えられるので
10万枚処理すれば500万ユニットに近い数字になると思われる。
Googleより
> 米国での感染者数は増加傾向にあり、平均で1日147,420人の新規感染者が報告されている。
147,420*30=4,422,600/月
アメリカの感染者数が毎月442万人出てる計算だから
仮に1ページ1ユニットで計算しても500万ユニットは妥当な数字。
日本の感染者数がアメリカより少ないと言うなら、ユニットが1ページ30で計算すればいいんじゃね?

396:名無しさん@お腹いっぱい。
21/08/24 17:32:00.46 6FahnTPL0.net
一日中つったって手動で検索繰り返した程度で50万請求が来るような検索回数になるとはとても思えないんだけど
マルウェアが裏でF5アタック繰り返してたとかじゃないの知らんけど
URLリンク(cloud.google.com)
ユニットは1枚の画像に対し適応する機能タイプ別に発生する
1枚の書類(画像)に対してテキスト検出(OCR)しかしないのであればユニット数は1
結果はjson形式ファイルで画像中にブロックがある場合はで個別に分けて取り出せる
URLリンク(cloud.google.com)

397:名無しさん@お腹いっぱい。
21/08/24 18:53:54.94 U1hPfsKA0.net
うるせえ
よそでやれ

398:名無しさん@お腹いっぱい。
21/08/24 18:57:00.72 NY7D9FCw0.net
>>390
おまえさあ、Google検索してて「私はロボットではありません」って表示出たことある?
その表示が出るまでに何回検索してるか分かる?
そして検索にいくらかかったか分かる?
著作権裁判だと単に製品の代金だけじゃなく懲罰的請求をされるって知ってる?
アメリカだと自分でコーヒーこぼしただけで3億円も請求されるんですよ。
50万円って実質無料でしょ。

399:名無しさん@お腹いっぱい。
21/08/24 19:06:08.39 ubSdBvKx0.net
詭弁 答えのない問題に対して他の場所で出た答えを持ち出して
その答えはあの問題と同じだよと根拠もないのに言い張ってるだけのキチガイ
お前の言ってることは何の答えにもなってない

400:名無しさん@お腹いっぱい。
21/08/24 19:33:29.79 6FahnTPL0.net
何言ってるのかさっぱり分かんない
やっぱ会話無理な人か
>>391
ゴメンねもうやめるわ

401:名無しさん@お腹いっぱい。
21/08/24 19:35:22.71 NY7D9FCw0.net
>>393
答えは最初っから言ってるだろ。Google検索したらGoogleから50万円請求されました。
お前が信じないだけだ。
ソースは出せない。
お前は企業がどういうときに金を請求するか知ってる?
費用が掛かった時だよ。
チンピラがたまたま目の前にいた通行人に金を請求するゆすりたかりとは違うんですよ。
じゃあ、どういう場合に「私はロボットではありません」って表示を出すか分かる?
無駄な費用を抑えるためですよ。
金を請求するのと「私はロボットではありません」と表示するのは目的が同じ。
お金ですよ。
かかった分請求するか、最初からかからないようにするかの違いだけ。
俺が50万円請求された証拠は出せないが、「私はロボットではありません」と表示される問題は無数にソースがある。
どれくらい検索していたかもその証言から推定できる。
そしたら、少なくともどれくらい使ったらGoogleが許容できない費用がかかっているかも推定でき、
50万円を請求するとしたらどれくらいの検索をしたかも推定できるはず。頭のいい人なら。
日本人は、どれだけ使ったらいくら請求と言う計算はできるけど、
いくら請求されたらどれくらい使ったかっていう計算は出来ない。
そう言う典型的日本人が>>393

402:名無しさん@お腹いっぱい。
21/08/24 20:12:01.67 PyFmfN7N0.net
論点1 QRコード化が可能か不可能か
論点2 人名が読み取れているか否か
論点3 手書きに対してOCRが有効かどうか
論点4 送信に成功したかどうかが分かるか
1 現場にしか分からないが個人単位では不可能ではない
2 現場にしか分からないが個人単位では不可能ではない
3 現場にしか分からないが個人単位では不可能ではない
4 現場にしか分からないが個人単位では不可能ではない
これだけの話なのに論点5のgoogle検索しただけで50万請求された人がいる
が一番どうでもいいし馬鹿らしいんだが 自覚しろよ

403:名無しさん@お腹いっぱい。
21/08/24 20:15:34.99 PyFmfN7N0.net
当然論点6のOCRの活用が現場で可能かどうかも現場にしか分からない
こんな所で無能だなんだ言ってないで現場に連絡取る位の努力しろよカス

404:名無しさん@お腹いっぱい。
21/08/26 22:54:38.68 fktTc4eK0.net
日本語横書きで時々アルファベットの引用を含んでいる文章をAcrobat の OCR で認識させるとアルファベットの一部の認識が失敗します。オプションは日本語文章を選んでおります。アルファベットもうまく認識させる方法はないでしょうか。

405:名無しさん@お腹いっぱい。
21/08/27 20:30:24.89 939FgqXL0.net
この車のナンバーって人工知能で解析できんかね。
URLリンク(himado.in)

406:名無しさん@お腹いっぱい。
21/09/11 09:26:02.33 XEPKqxnl0.net
CloudのAI OCRではGoogleのCloud Visionが優れていたが
最近AzureのCognitive Serviceを試してみたところ
文字の認識誤りの少なさではさらに上回る
ただし課題もあり、右から左へ改行していく縦書き文書を
左から右へ認識するので、行の順序が逆になる
読取順序をbasicからnaturalへ変えても同じ
幸い出力のjsonには座標情報が含まれているので
スクリプトによる後処理で行を並び替え
ついでにルビも削って整えているが
この辺をうまくやってくれるGUIがほしいところ

407:名無しさん@お腹いっぱい。
21/09/11 10:34:50.20 LOlOzN870.net
そのスクリプトは公開してるの?
PythonでGUI作れるかも。

408:名無しさん@お腹いっぱい。
21/09/11 11:06:47.97 XEPKqxnl0.net
>>401
公開するほど大したことない
AzureのAPIとのやりとりはPythonで
後処理はluaでやっている(速いしYAMAHA使いなので)
小ネタで、Google Cloud Visionには
Microsoft Automate Desktop が何気に対応していて
フォルダ内の画像に一括OCRをかける程度なら
ノーコードで簡単にGUI化できる

409:名無しさん@お腹いっぱい。
21/09/11 14:41:17.75 e30+Z8z90.net
e.Typistは終了
読取革命も終了
企業向け帳簿用以外の個人用OCRはもうおしまいだ

410:名無しさん@お腹いっぱい。
21/09/15 20:58:46.28 Vw0PVGR20.net
日本語OCRはくそ

411:名無しさん@お腹いっぱい。
21/09/16 07:00:29.94 oHPqQDLA0.net
ニーズはあるはずなのに程よくまとまったアプリがない
スクリプトでGoogleなりAzureなりのAIを使えば
認識精度は高いけど、求めるのはそれじゃない
画像をクラウドへ送りたくない向き用に
いわば認識エンジンをローカルへダウンロードできる
Docketの仕組みもあるし、
誰か小綺麗にパッケージ化してくれたら買うのにな

412:名無しさん@お腹いっぱい。
21/09/17 00:22:23.73 0acrvs2j0.net
>>405
それ、tesseract以外で作るのなら、エンジンライセンスだけで安くて数十万かかるんじない。買うって法人で買うの?

413:名無しさん@お腹いっぱい。
21/09/17 02:47:20.06 7J187VR90.net
自前で日本語認識エンジン作って遊ぼうとしてるけど、かなり難易度高い。
特に日本語は文字種が多くて、しかも英単語とか普通に混じってくるし。
売り物としたら数十万の売値になるくらい、計算機回してるわ
後半(文字の場所が分かっていて、それをテキストにする)はできたけど、
前半(どこに文字のboxがあるか)を当てるところで苦しんでる

414:名無しさん@お腹いっぱい。
21/09/17 07:14:06.31 pFveJpOG0.net
>>406
それがMicrosoft AzureのDockerなら
目安として1,000枚あたり112円の完全従量制で
個人でも検討範囲に十分入るんだ
エンジンはローカルで、クラウドとは
課金のための小容量の通信が時折発生するくらいで

415:名無しさん@お腹いっぱい。
21/09/17 12:13:11.15 wHT5xdlK0.net
Dockerってそういう使い方できるのか、ちょっと触ってみようかな。

416:名無しさん@お腹いっぱい。
21/09/18 12:21:57.09 q+UM7OU/0.net
>>407
CenterNet を試してみては如何ですか?
物体の中心を特徴点として検出した後、幅・高さのサイズを予測する手法です

417:名無しさん@お腹いっぱい。
21/09/18 14:19:37.46 kRyIOOu20.net
OCRも光学読み取りの精度にこだわりすぎずにBARTなどの文脈推定を入れればトータルの性能が上がる気がする

418:名無しさん@お腹いっぱい。
21/09/18 14:25:05.85 nHCGcW6c0.net
BERTっていうのね これ面白そうだ
小説でpre-trainedなモデルってあるのかな

419:名無しさん@お腹いっぱい。
21/09/18 14:40:51.41 Bzc3NP9C0.net
URLリンク(nlp.ist.i.kyoto-u.ac.jp)日本語Pretrainedモデル

420:名無しさん@お腹いっぱい。
21/09/18 18:05:35.08 eBkRmb3c0.net
>>410
サンクスです。良い手法を教えていただきました
今やってるモデルは、u-net ベースで、CenterNetの中心ヒートマップを使ってる
感じです。
これを参考に改造して作ってます。
URLリンク(github.com)
lossを調整したら、ほぼうまく行くようになってきました。
完成したら公開しますので、また来ます。

421:名無しさん@お腹いっぱい。
21/09/19 08:55:39.56 nf9M18go0.net
>>414
お役に立てたようで良かったです。成果を楽しみにしております。

422:名無しさん@お腹いっぱい。
21/09/30 21:55:51.09 VNbgOTa80.net
>>270
Acrobat pro DC (2015年の製品版)をまだ使ってるんだけど、
横書きの整備マニュアル370Pを
Canonの複合機TR9530のADFで地道にスキャンして(400dpiカラー)
CanonのPDFソフトでPDF化(OCR有)したものと、
それをAcrobatで再OCR化(圧縮無し)したものを比べてみた。

423:名無しさん@お腹いっぱい。
21/09/30 21:56:43.99 VNbgOTa80.net
検索は全て完全一致無しのオプションで。
検索文字「バッテリ」
Canon  286件
Acrobat  262件
検索文字「ボルト」
Canon  290件
Acrobat  270件
検索文字「注意」
Canon  506件
Acrobat  215件
検索文字「交換」
Canon  419件
Acrobat  418件
検索文字「目」
Canon  66件
Acrobat  77件

424:名無しさん@お腹いっぱい。
21/10/22 18:41:13.88 KWvJbojp0.net
キヤノンの優秀だね。自社エンジンなのかなぁ

425:名無しさん@お腹いっぱい。
21/10/22 22:01:30.34 CBrjiuuX0.net
ぺパレス電子化コラム - OCRソフトの比較
URLリンク(pepaless.com)
画像部分とか、網かけ部分とかの認識も優れているかどうかはわからないけどね。

426:名無しさん@お腹いっぱい。
21/10/27 11:37:37.49 UgMif3Au0.net
>>419
コレ三年前の記事かよ。
つってもソフトは当時のバージョンとほとんど同じだから、実害はなしか。
『読取革命』も最新版だからって、とくに画期的に変わった訳でもあるまいに。

427:名無しさん@お腹いっぱい。
21/12/02 01:05:23.86 0IUMVg7L0.net
Tesseract OCRのリリース5.0.0がでたわよ!
URLリンク(github.com)

428:名無しさん@お腹いっぱい。
21/12/11 14:03:43.57 m2OgodYX0.net
読取革命16買って少し使ってみたけど、白抜き文字の認識(日本語)泣けるほど弱い。総合的にみて、Canonスキャナ付属Capture PerfectとOCR精度はあまり変わらない気がする。白ぬき文字については進化が止まっていることを実感させられる。泣けてきた。

429:名無しさん@お腹いっぱい。
21/12/11 14:30:29.15 +ocplaTK0.net
本当の評価ポイントは
校正のしやすさなんだがなあ

430:名無しさん@お腹いっぱい。
21/12/11 16:24:54.51 Q8aFwsdH0.net
以前の読取革命15体験版の感想だけど
読んdeココみたいな認識結果や候補文字を種別ごとに色分け表示する機能が無いからから
外見が似た文字の見分けが付かず
校正に苦労する印象だった
カタカナ「に」と漢数字2、長音符号とハイフンとダッシュと漢数字1、数字1と英字エルとかね
いちいち別ソフトにコピペしてコードポイント確認する作業した記憶ある
16で改善されてますか?

431:名無しさん@お腹いっぱい。
21/12/11 21:50:27.92 m2OgodYX0.net
>>424
認識結果の文字種を色分けすることはできなさそう。ソフトが間違って認識してるかもという文字が赤色になるだけ。認識結果のテキスト表示フォントは変えられる。
HPには認識結果を読み上げる機能があるとなっているが、アイコンがグレイの状態で読み上げられない。ヘルブにも読み上げ方法の記載はないが、ver15応用編のヘルブにはPC talkerがいるように書いてある。もし16にそれがあてはまるなら、優良誤認だろっていう感じ。
あと、話題がずれるが、読み取った結果でpdf出力する場合(透明テキストでなはなく)、フォントが、MS明朝かゴシック(等幅かP)しか選べないのはビックリした。

432:名無しさん@お腹いっぱい。
21/12/11 22:54:22.88 Q8aFwsdH0.net
>>425
返答ありがとうです
とても参考になりました
表示フォント変えられるなら、改善待つより校正用のフォントを自作する方が早いのかもしれないですね

433:名無しさん@お腹いっぱい。
21/12/12 00:58:57.76 flVhFSAg0.net
miguフォントを使ってみな

434:名無しさん@お腹いっぱい。
21/12/12 01:04:33.72 flVhFSAg0.net
読取革命を10年以上使い続けて
それなりのノウハウがたまってきたんで
そのうち小出しに紹介したい

435:名無しさん@お腹いっぱい。
21/12/12 08:42:52.12 DPqdfiih0.net
表を表のままocrできたりしない?

436:名無しさん@お腹いっぱい。
21/12/12 15:02:19.21 6Ne5KHfK0.net
>>429
領域の属性をテキストとか画像とか表とか設定できる。
各行の背景が白、グレイ、白といった表は読取革命16でエクセル出力したら、一つのセルに全部入ってしまってダメだった。Just pdf4ではうまくエクセル出力できたが(一つのセルに表の1要素が入ってくれる)。
実線で区切られる表なら、うまくいくのかもしれないが試してない。427氏に期待したい。

437:名無しさん@お腹いっぱい。
21/12/12 17:38:08.22 flVhFSAg0.net
すまねえ、すまねえ……
得意分野は小説のテキスト化なんだ……

438:名無しさん@お腹いっぱい。
21/12/12 20:38:10.99 HW00Chvv0.net
>>431
話しことばの"いるんだ"などは
どのように処理っされてますか?
etypist使いですが毎回、認識エラー候補になり、確認が面倒です。

439:名無しさん@お腹いっぱい。
21/12/12 21:56:15.22 flVhFSAg0.net
待ってくれ
どうやら俺が持っているノウハウの方向性と、皆の期待している方向性とが違う可能性が高いようだ
実は俺は>>76なんだ
校正作業するのが前提でその効率化のノウハウなんだ

440:名無しさん@お腹いっぱい。
21/12/12 22:53:11.11 VxJSq+w60.net
OpenCVとTesseract-OCRで作る表のOCRツール rev1
URLリンク(ymt-lab.com)

441:名無しさん@お腹いっぱい。
21/12/13 11:36:19.13 jLNnEax80.net
>>433
最近自炊小説をetypistでテキスト化(そのあと合成音声化)を始めたものです
校正作業の効率化ノウハウをぜひ教えてください!

442:名無しさん@お腹いっぱい。
21/12/15 21:24:42.83 dHfR+Ceb0.net
まずはデカいモニタ必須
マクロ登録できるキーボード エレコムのTK-DUX30BKおすすめ 同機能のソフトで代用可
読取革命15 体験版しか使ったことない
Oracle VM VirtualBox等 ごにょごにょ

443:名無しさん@お腹いっぱい。
21/12/17 00:57:11.07 NfrEGe8e0.net
いま流行りの AI を使って認識率を高めるような OCR ソフトはないのかな。業務用じゃなくて個人用で。
Google の OCR ソフトは認識率はいいのかな。Google Docに変換しないと使えないという不自由さはさておいて。

444:名無しさん@お腹いっぱい。
21/12/17 19:30:14.86 gQDiVMg+0.net
>>437
pythonやpowershellなどでスクリプトを組めば
googleなりAzureなりのAIを利用したOCRそのものは
そう高くなく、認識精度もごく高い
(画像1000枚あたり100円台)
現状、見栄えの良いGUIがないだけ

445:名無しさん@お腹いっぱい。
21/12/17 20:45:06.62 NfrEGe8e0.net
>>438
ありがとうございます.
>pythonやpowershellなどでスクリプトを組めば
両方とも経験がないのでこれから勉強しますが,参考になるスクリプトのHPはどこかにないでしょうか?
アクロバットのOCRのようにもとの文字の上に透明文字を配置してくれるのでしょうか.もとの資料上にハイライトや検索が必要なので.

446:名無しさん@お腹いっぱい。
21/12/17 21:15:37.54 CWuXF4+80.net
手前味噌ですがコレなどw
URLリンク(github.com)

447:名無しさん@お腹いっぱい。
21/12/17 21:20:54.87 CWuXF4+80.net
こちらも
URLリンク(remoteroom.jp)

448:名無しさん@お腹いっぱい。
21/12/18 14:14:33.30 dtKgeMNR0.net
>>440,441
ありがとうございます。
440は439の内容は同じですか。
Cは昔使った記憶があるのでうがwindowsの環境で動かす方法を忘れました。
ハードルが高そうです。
目的にOCR処理の前に環境を整え使いこなすまでに時間がか�


449:ゥりそうで、逡巡します。



450:名無しさん@お腹いっぱい。
21/12/18 14:40:57.61 AGBm6fvC0.net
430のgithubの中にwindows用実行プログラムもありますw

451:名無しさん@お腹いっぱい。
21/12/18 14:43:57.28 AGBm6fvC0.net
Google Cloud VisionのAPIキーが必要です。
URLリンク(syncer.jp)

452:名無しさん@お腹いっぱい。
21/12/18 21:04:03.07 dtKgeMNR0.net
>>444
ありがとうございます。
研究してみますね。

453:名無しさん@お腹いっぱい。
21/12/19 01:15:52.64 SmDRr8Ij0.net
ここでヒントもらった、機械学習で文字認識する方法
惜しいところまで来たけど、あともう一声がうまくいかない。
文庫本見開きを与えて、3箇所くらいミスる。特にふりがなとかページ番号
とかのちっさくて近接してるところが鬼門。
Googleとかに投げれば簡単なんだけど、やっぱり自前で解けると
何かと捗るんで是非とも完成させたい

454:名無しさん@お腹いっぱい。
21/12/19 12:59:45.91 rFaLUd6N0.net
>>436
やはり大きなモニターは必須ですよね。。小さいノートPCで作業しているのできついです。
キーボードへのマクロ登録は、どの作業を登録しているのですか?

455:名無しさん@お腹いっぱい。
21/12/19 21:57:43.76 slxgE1fB0.net
校正作業を効率化
>>436の続き
条件は>>76
今回は二段組の場合
URLリンク(light.dotup.org)
スキャン画像をこんな風に作り変える
染みゴミ取り漂白
傾き補正
二段組ページを上下分割余白消し
14ページ分を左右上下に張り合わせて一枚にする
横につなげるときは右から左ね
これ以上ページを増やしたら読取革命で読み込めるけど
テキスト保存したとき字数(行数)?制限で後ろのほうが削られてしまう
たぶん
読取革命の設定こまごま
後述
キーボードマクロ
後述

456:名無しさん@お腹いっぱい。
21/12/19 22:20:59.74 slxgE1fB0.net
1ページづつ校正していたら手間取りすぎる
まとめちゃえ

457:名無しさん@お腹いっぱい。
21/12/20 21:26:34.83 f979t7aJ0.net
e.typist使いの私は、マウスにマクロつけてる。
 ・単語登録
 ・次ページ送り+一括置換+全文解析

458:名無しさん@お腹いっぱい。
21/12/21 10:24:13.91 qnmpXEEu0.net
>>448
ノウハウ助かります!
>>450
e.typistでの「次ページ送り」はマウスで次ページをクリックする以外にショートカットキーなどがあるのですか?

459:名無しさん@お腹いっぱい。
21/12/21 20:20:01.46 QXL1RUnR0.net
>>450
alt{la} down return f7
をマウスのボタンに割り当てました。

460:名無しさん@お腹いっぱい。
21/12/21 22:30:27.69 XB9tp3vX0.net
校正作業を効率化
左右上下につなげるソフトはこれ
ImageMerge
読取革命を立ち上げて
オプション環境設定
チェックを入れるもの 
 一般 未確定・・・
 表示 初期 ページ幅
    倍率 ページ幅
    連動
画像読み込み後
右クリックから属性変更
チェックを入れるもの
認識 文字種 ひらがな カタカナ 漢字第一 数字 ユーザー定義 単語辞書
(漢字第二とアルファベット、記号はチェックしない。必要な文字はユーザー定義欄に入れる)
レイアウト認識 1枚づつやったほうがいいと思う
認識したレイアウトを確認 削除統合で整形
文字認識
一行に一文字とかしかない場合読取ミスがあったりするので確認訂正
空白行等も確認
文章を読むのではなく俯瞰して形で見比べる
行頭の字下げスペースとかは後で

461:名無しさん@お腹いっぱい。
21/12/22 16:55:07.37 mm615h1N0.net
>>452
ありがとうございます!!
読取革命と違って、カーソルキーのみで次の画像に移動できなくて困っていました。
>>453
読取革命も使用しているので参考にさせていただきます。

462:名無しさん@お腹いっぱい。
21/12/22 20:50:42.00 JoFQcdng0.net
>>453
ちょうど数日前からShiftJISの一覧表から使う文字と使わない文字の選別を試していたのですごく納得です
第2水準は見た事ある文字ほとんど無いし
あっても一般的には特定の熟語でしか出現しないものが多い
薔薇、葡萄、林檎、珊瑚、蜘蛛、楕円、琉球…
テキストエディタの正規表現色分け試してる最中でした

463:名無しさん@お腹いっぱい。
21/12/22 22:32:05.67 HGKSXGSe0.net
校正作業を効率化
ここまででいったん作業状態の保存
今度は文字置換(透明テキストが不要な場合のみ)
下記を確認無しで問答無用で最初に置換

□は全角スペース
□□ → □
『 → 「
□「 → 「
□( → (
ぱ → ぱ
ぷ → ぶ
ぽ → ぼ
っば → っぱ
っぶ → っぷ
っぼ → っぽ
っだ → った
っで → って
1つ → う
。つ → う
、つ → う
」つ → う
』つ → う
!…… → !…
1…… → !…
ー…… → !…

464:名無しさん@お腹いっぱい。
21/12/22 22:32:44.79 HGKSXGSe0.net
これをキーボードマクロで1ボタン一発置換にしている
600行くらいのマクロ (ショートカットやキー入力を順番にレコード)
表示文字のフォントは前に紹介した Migu 1M が大変便利
(似た形の文字の区別に主眼を置いたフォント)
もっといいのがあったら教えてね

465:名無しさん@お腹いっぱい。
21/12/23 23:18:30.24 OTHMdVZm0.net
ごはんかいじゅう

466:名無しさん@お腹いっぱい。
21/12/25 08:51:53.07 i+O0OTqP0.net
miguフォントを教えていただいた方、
ありがとうございました。
ノートでもパとバが見分けられるようになりました

467:416
22/01/06 21:16:52.24 Ih0Nt3Hq0.net
検索は全て完全一致無しのオプションで。OCR化は圧縮無し。
スキャナはキャノンDR-S130使用(誤差拡散は線の太さ中の設定)
検索文字「バッテリ」
Canon (カラー286件・299件)(誤差拡散244件)(グレー302件)
Acrobat (カラー262件・268件・266件)(誤差拡散283件・279件)(グレー273件・271件)
新型Acro    (カラー295件・294件・294件)(誤差拡散276件・276件)(グレー302件・298件)
KOFAX (カラー276件・280件・291件)(誤差拡散286件・295件)(グレー283件・293件)
Eタイピスト (カラー306件・306件)(誤差拡散301件)(グレー307件)

468:名無しさん@お腹いっぱい。
22/01/06 21:17:41.87 Ih0Nt3Hq0.net
検索文字「ボルト」
Canon (カラー290件・296件)(誤差拡散258件)(グレー300件)
Acrobat (カラー270件・271件・272件)(誤差拡散273件・277件)(グレー272件・275件)
新型Acro (カラー261件・272件・276件)(誤差拡散179件・160件)(グレー279件・276件)
KOFAX (カラー291件・303件・302件)(誤差拡散317件・317件)(グレー301件・301件)
Eタイピスト (カラー253件・247件)(誤差拡散247件)(グレー248件)

469:名無しさん@お腹いっぱい。
22/01/06 21:18:28.20 Ih0Nt3Hq0.net
検索文字「注意」(白黒反転文字の注意と、周囲を文字の大きさの長方形の枠で囲まれた注意の2種類)
Canon (カラー506件・490件)(誤差拡散278件)(グレー467件)
Acrobat (カラー215件・217件・215件)(誤差拡散217件・214件)(グレー216件・216件)
新型Acro (カラー214件・216件・216件)(誤差拡散220件・215件)(グレー215件・217件)
KOFAX (カラー429件・431件・422件)(誤差拡散415件・419件)(グレー406件・414件)
Eタイピスト (カラー219件・219件)(誤差拡散217件)(グレー219件)

470:名無しさん@お腹いっぱい。
22/01/06 21:19:37.59 Ih0Nt3Hq0.net
CanonもKOFAXも白黒反転文字の注意は認識できたりできなかったり。
差がついたのは、周囲を文字の大きさの長方形の枠で囲まれた注意を認識できるか、できないかで差がついた。
Canonは誤差拡散(線の太さ中)になると、OCRの精度が落ちました。(文字によっては落ちないものもあった。)

471:名無しさん@お腹いっぱい。
22/01/06 21:33:48.76 Ih0Nt3Hq0.net
KOFAXレポ(OCRは優秀だが癖がある)
〇単独のファイルを開いてOCRした場合
上書きOCRした場合
元々のOCRが消されないで二重にOCRされる。
(検索ヒット数が極端に多くなる。(2倍ぐらいになる)
OCR情報を全て消してからだとOCR可能。
→しかし、どちらのやり方でも上書き保存だと
ファイル容量がなぜか倍ぐらいになる。(大きいファイルのみ)
→対策
KOFAXのエクスポート機能で出力すると原本と殆ど同じ大きさのファイルで出力される。
〇複数PDFファイルを結合してOCRした場合
他ソフトでOCR未処理の処女ファイルはOCR化できる。
他ソフトでOCR処理済みのファイルは、Acrobat等で非表示テキストを削除しても、何故かOCR認識できない。(上書きOCRされない。元のOCRのまま)
KOFAXで非表示テキストを削除して再OCR化した場合は、考えつかなかったので試す前に試用期間が終わってしまった。

472:名無しさん@お腹いっぱい。
22/01/06 21:38:26.46 Ih0Nt3Hq0.net
新型AcrobatとKOFAXとEタイピストは、全て試用verのものです。

473:名無しさん@お腹いっぱい。
22/01/06 21:47:34.36 Ih0Nt3Hq0.net
KOFAX(Power PDF Advanced)

474:名無しさん@お腹いっぱい。
22/01/17 00:21:08.46 4mdkimZz0.net
Canonの複合機のソフト「IJ Scan Utility」(ライトは不可)
の「PDF編集」で画像を読み込んでOCR化PDF作成可能
URLリンク(ij.manual.canon)
URLリンク(ij.manual.canon)
 
各種制限は上記リンク参照で(いちどに100P迄等)
試してみたら
ビットマップ不可
マルチTIFF不可
圧縮は
他社スキャナー作成の600dpiのTIFF(100Pで10G)
標準圧縮→100Pで200MB弱に
TIFF読み込み3分
PDF保存17分
OCRの結果は
シャドウを増やしてスキャンしたからか、注意の検索結果だけ355件に落ちた。
それ以外の検索結果は変わらず。

475:名無しさん@お腹いっぱい。
22/01/17 07:30:34.87 4mdkimZz0.net
複合機=プリンター複合機

476:名無しさん@お腹いっぱい。
22/01/24 00:38:20.88 F2x9Gu0W0.net
読取革命買ったのに期待通りの性能じゃなくてがっかり。
scansnapで読み取った後に行うOCR処理よりも優れてると思ったけど寧ろ劣ってるわ。
読取革命買った時のためにOCR処理せずに読み取ってたのがなんか無駄だったな

477:名無しさん@お腹いっぱい。
22/01/24 05:30:43.70 a7AiMsCc0.net
悲しいなあ

478:名無しさん@お腹いっぱい。
22/01/24 23:01:40.72 v/V7BEgB0.net
KOFAXもOCR会社買収してたりするから、
プリンター会社もOCRソフトウェア経験者引き抜いたりしてるんでは?
OCRソフトは、試用版を使った感じでは、
表形式の文書をスキャンしてエクセルに変換するのは
原本に応じて、色々認識範囲を任意に変更できたりして得意そうな気がしたけどね。
ビジネス向きかもしれんね。

479:名無しさん@お腹いっぱい。
22/01/24 23:52:10.63 v/V7BEgB0.net
PDF同士の結合は、たぶん結合前じゃなく結合後の総ファイル容量だと思うんだけど、
Acrbatは2G迄
KOFAXは3G迄
だった。それ以上だと何回か繰り返したけどエラーが出た。
画像を結合して変換する場合はわからん。

480:名無しさん@お腹いっぱい。
22/02/19 03:56:35.97 1i5A+HZD0.net
おまいらありがとう
ここで教えてもらった手法を元に
機械学習でOCRするやつの前段が完成した
URLリンク(i.imgur.com)
後段は文字の連結を拾ってutf8とかで符号化するんだけど
これは事前に確認したところではいけてるので、もうちょい

481:名無しさん@お腹いっぱい。
22/02/19 06:41:57.66 EHOGoR7G0.net
>>473
文字の切り出しの手法は、何を使いましたか?

482:名無しさん@お腹いっぱい。
22/02/19 15:59:36.83 1i5A+HZD0.net
>>474
CenterNetの手法で、バックボーンにEfficientNet v2を使っています。
文字の中心位置とボックスと縦横を出すのと同時に、
中心位置まわりに384次元の特徴量を取得してます。
プレ学習として、384次元の特徴量を文字コードに1対1で変換してます。
後段では、特徴量を連続させて、文脈依存で文字コードに変換させるのを予定してます。

483:名無しさん@お腹いっぱい。
22/02/20 07:54:02.16 lLW2TQdp0.net
>>475
頑張りましたね。
手書き文字だと、どんな感じに抽出できますか?

484:名無しさん@お腹いっぱい。
22/02/20 15:26:54.12 YPHg717Q0.net
>>476
URLリンク(i.imgur.com)
URLリンク(i.imgur.com)
これくらい
手書きは学習データを用意するのがめっちゃ大変なので、
十分学習はできてない気がする。いまのところおまけ程度の
精度しか出てません。
手書きは文字が分裂して認識しやすいので、相当たくさんの
手書きデータを元に学習させないと上手くいかないと思われます。
やり方としては今の延長線上でいけそうな気配はしてます。

485:名無しさん@お腹いっぱい。
22/02/21 06:41:18.52 mGEzXi/K0.net
>>477
良い感じで抽出できてますね。GitHubにソースなどを上げて欲しいです

486:名無しさん@お腹いっぱい。
22/02/21 11:29:34.65 e3F9aiKE0.net
>>473
すばらしい。
リリースの暁は、日本語文書き出しの行頭一文字空白も認識させてください。

487:名無しさん@お腹いっぱい。
22/02/22 23:37:13.04 KG6iI0vy0.net
>>478
まだ前半だけだけどとりあえずソース
URLリンク(github.com)
学習済み重みはreleaseのところにリンクがあるです
文字の大きさは、20pixel-200pixel位で覚えさせてるので
見かけの大きさがそのくらいになる様にリサイズするとよいです。
カラーは適当に処理するはずですが、上手くいかない場合は
コントラストとかいじる必要があるかも。

488:名無しさん@お腹いっぱい。
22/02/25 01:47:43.46 oU6IT1Qa0.net
神アプリ誕生の予感...

489:名無しさん@お腹いっぱい。
22/02/26 02:15:28.14 d9ue173/0.net
>>480
のモデルで、iPhoneとかiPadで推論できるようにしました
URLリンク(testflight.apple.com)
iPhone13とかの最新デバイスだとまともに動くと思うのですが
昔のデバイスだと微妙かも。落ちる場合はCPU onlyにしたら
遅いながらも落ちなくはなります。

490:名無しさん@お腹いっぱい。
22/02/27 01:31:27.11 Zp2vBZkX0.net
>>482
Android しか持っていないので試せないです。残念。
>>477
文字のある領域を示すのに IIIF manifest の形式を使うのが標準的なようですが、対応してますか?

491:名無しさん@お腹いっぱい。
22/02/27 23:10:43.63 1WOIRC0G0.net
>>483
IIIF manifestの形式は知りませんでした。どこかよい説明のリンクありますでしょうか。
Androidでも機械学習モデルが簡単に動けばいいのですが。iPhoneの最近のやつは
推論エンジン積んでるのでかなり速く認識できます。

492:名無しさん@お腹いっぱい。
22/03/05 01:38:16.55 iWInWTln0.net
いまだによくロシア企業のOCR使えるな

493:名無しさん@お腹いっぱい。
22/03/06 22:12:54.20 p5crT8Gx0.net
AcrobatでOCRした透明テキストの修正ってどうしてます?
Acrobat上だとやりづらすぎて

494:名無しさん@お腹いっぱい。
22/03/10 08:35:47.81 cWyR5z8H0.net
漫画翻訳再加工でおすすめのありますかね
グーグルのカメラ翻訳みたいなのが一番なんだけどさすがに無理か
これしか見つからない
URLリンク(www.imagetranslate.com)<)

495:名無しさん@お腹いっぱい。
22/03/30 19:16:25.05 aBrCbYCH0.net
>>469
ありゃダメだよ
ま、値段を考えたら自ずと理解できると思うけどね

496:名無しさん@お腹いっぱい。
22/03/31 19:28:57.72 0TmFtm2N0.net
読取革命を経理業務で使ってる人いる?
領収書や請求書なんかの文字認識や精度はどの程度なのか気になってます

497:名無しさん@お腹いっぱい。
22/03/31 20:59:05.31 gur9KTQl0.net
認識させた後どうやって使うつもりなの?

498:名無しさん@お腹いっぱい。
22/04/03 10:55:17.93 AGhKdTzD0.net
読取革命を業務で使ってる人なんていないと思う
そのレベルのOCRだから

499:名無しさん@お腹いっぱい。
22/04/03 14:38:33.39 OgQuX8lP0.net
まさに革命やな。

500:名無しさん@お腹いっぱい。
22/04/03 20:05:43.65 Jsg5j8K40.net
そもそも、読取革命みたいなレベルのソフトを法人が使うわけないやろw

501:名無しさん@お腹いっぱい。
22/04/03 21:08:08.14 rMkt3H120.net
それこそ革命やで。

502:名無しさん@お腹いっぱい。
22/04/03 22:51:40.78 TpRPDKza0.net
滑り芸か?

503:名無しさん@お腹いっぱい。
22/04/04 06:49:29.29 YzNd9QN20.net
ごめんなさい。ふざけすぎました。

504:名無しさん@お腹いっぱい。
22/04/21 20:39:05 vYl46slD0.net
streamed高いからなあ
自分で出納帳読み込んで仕訳作成できれば
streamedなんか使う必要ないんだけど
そんな優れた市販のOCRソフトが無いんだよね

505:名無しさん@お腹いっぱい。
22/04/22 12:05:06.71 xT58YArZ0.net
まあ出納帳Excelで作ればOCR化なんて挟む必要もないんだけどな

506:名無しさん@お腹いっぱい。
22/04/23 12:38:43 SDF278rq0.net
Google の OCR 使いたかったらPDF ファイルを Google ドライブにあげてGoogle ドキュメントで開けばいいと思ってたんだけど文字認識していない
どうすれば使えるんだったっけ?
誰かわかる人教えてください

507:名無しさん@お腹いっぱい。
22/04/23 12:39:18 SDF278rq0.net
この PDF はスキャンしただけの画像です

508:名無しさん@お腹いっぱい。
22/04/23 13:39:01 vfksCYOj0.net
>>499
PDFではやった事ない
自分はPNGでやってる

509:名無しさん@お腹いっぱい。
22/04/23 15:47:28.78 SDF278rq0.net
>>501
URLリンク(support.google.com)
Google の説明では PDF ファイルも文字認識するのでなんだけど

510:名無しさん@お腹いっぱい。
22/04/23 16:29:35.50 SDF278rq0.net
>>501
498だけそ,1ページだけ抽出してpng形式変換した後,Google ドキュメントで開いたけどやっぱ文字認識してない.

511:名無しさん@お腹いっぱい。
22/04/23 18:16:25 vfksCYOj0.net
>>503
特に問題無くできるけどなあ・・・
URLリンク(i.imgur.com)
設定見てもOCRを阻害しそうな項目は見当たらないし・・・

ごめん、わからん

512:名無しさん@お腹いっぱい。
22/04/23 18:33:13.03 wmkK3m2e0.net
ヘルプに書いてあるいくつかの条件は確認してるのですね

513:名無しさん@お腹いっぱい。
22/04/23 19:28:16 SDF278rq0.net
>>504
URLリンク(imgur.com)
これなんですがそちらの環境で文字認識しますか?

514:名無しさん@お腹いっぱい。
22/04/25 21:32:24.29 /wxbOJYz0.net
そういや、読取革命16を買って、ほとんど使ってないわw
修正面倒臭いから

515:名無しさん@お腹いっぱい。
22/05/05 02:00:37 MOkzV1Bk0.net
PDF エレメントプロの OCR はアクロバットのOCRに比べてどうでしょうか
経験がある方がいれば教えてください

516:名無しさん@お腹いっぱい。
22/05/07 14:36:40 UgcE4ImC0.net
国会図書館、OCR処理プログラム及び学習用データセットを公開
URLリンク(srad.jp)

517:名無しさん@お腹いっぱい。
22/05/07 14:41:33 UgcE4ImC0.net
モルフォAIソリューションズが国立


518:国会図書館の最新AI技術を活用したOCR処理プログラムの開発を完了 https://www.jiji.com/jc/article?k=000000053.000064140&g=prt



519:名無しさん@お腹いっぱい。
22/05/09 08:09:09.82 zcEHCKRp0.net
Google の OCR が優秀でもスキャンした画像の上に非表示の文字を載せてくれないので自炊用には使えないと思う。
自分は自炊用にはAcrobat の OCR を使っているけどこれよりも 認識率が高いOCR ってありますか?

520:名無しさん@お腹いっぱい。
22/05/23 11:27:12 7qUjQCGH0.net
読取り革命14を使用しています.PDFに透明テキストで出力していますが,デフォルト(自動)ではフォントサイズが小さくて選択したときに表示文字列よりも小さくななります.
メニューの「結果」で領域ごとの設定できますが300頁の専門書の自炊では領域ごとの設定ですと手間がかかりすぎます.

手動でPDFに出力する透明テキストのフォントサイズを全ページ一括で変更したいのですが,そのような設定は可能でしょうか.

521:名無しさん@お腹いっぱい。
22/05/23 17:39:34 AEOqr8aw0.net
読取革命はマジで使えない
あれはめちゃくちゃ評判悪いぞ

522:名無しさん@お腹いっぱい。
22/05/23 20:52:29 7qUjQCGH0.net
>>513
お言葉ですけど自分はスキャナー 添付の OCR ソフト、アクロバット 添付の OCR ソフト、Google の OCR ソフト、e.Typist、本格読み取りなども全部試して縦書きのアルファベット 混在、図表混在のOCR 認識は読取革命が群を抜いてるという結論に落ち着きました。読取革命の強みは1ページを領域ごとに認識方法をカスタマイズできることです。読取革命 の評価が低い人はマニュアルが分かりにくいためにおまかせ設定だけで使って性能を100%引き出してないのだと思います。

私の質問の解決方法が見つかればほぼ完璧です。

523:名無しさん@お腹いっぱい。
22/05/23 21:03:06 7ETshV7p0.net
スキャンスナップとどっちがいい?

524:名無しさん@お腹いっぱい。
22/05/23 21:03:45 AEOqr8aw0.net
あれは、手直しに手間暇がかかりすぎて使えないという評価が定着してるのだが
文字だけならともかく、図表や表に記入された文字などの読み取りはまったくダメダメで手直しに苦労する

525:名無しさん@お腹いっぱい。
22/05/23 21:24:15 7qUjQCGH0.net
>>515
ScanSnap は試したことがないので分かりません

526:名無しさん@お腹いっぱい。
22/05/23 21:29:16 7qUjQCGH0.net
>>516
領域に分けてそれぞれずっとか表とか横書き縦書きとか指定すればかなり認識精度は高いです。簡単認識設定で標準の領域設定を使い、図表が混在しているページだけ手で領域を複数に分割して設定すれば割合効率的にできます。自動レイアウト機能で認識させるとおっしゃるように手直しが大変ですね。

他のソフトは読取革命臍のカスタマイズの機能がないので縦書きのアルファベット図表混在は使い物になりませんでした

横書きの英語はアクロバットが一番いいです
Google のは認識はいいのですがレイアウトがぐちゃぐちゃになるのと元の PDF の上に非透明テキストを重ねる機能がないのでつかえないです

527:名無しさん@お腹いっぱい。
22/05/24 00:11:00 nP066gSa0.net
>>518
そんなことしてられんわ
メンくさい

528:名無しさん@お腹いっぱい。
22/05/24 00:54:53 cADfl0Dk0.net
>>519
だから君には無理なの

529:名無しさん@お腹いっぱい。
22/05/24 10:52:15 nP066gSa0.net
>>520
そんなんだから読取革命は顧客が離れてるのに
バカだねぇ、あんたもw

530:名無しさん@お腹いっぱい。
22/05/24 13:35:33 cADfl0Dk0.net
>>521
顧客が離れてるのは事実だと思うが、顧客離れとソフトの可能な事は同じじゃない。

縦書き、アルファベット混在、図表混在という条件で認識率の高い別のソフトがあげることができるか?
できたらあなたの意見を認めよう

531:名無しさん@お腹いっぱい。
22/05/24 13:59:59 KekWsjEY0.net
横だけど、OCRソフトってのはできる限り修正の必要がないものでないと実用的ではない
俺は読取革命を使ってみたことがあるが、図表混在の文字の修正がハンパなく手間だった
もうスクショでいいわって思った

532:名無しさん@お腹いっぱい。
22/05/24 14:41:38.54 cADfl0Dk0.net
>>523
> 横だけど、OCRソフトってのはできる限り修正の必要がないものでないと実用的ではない
→それは 使用目的によるんじゃない。めんどくさいならスクショ でもいいや、という目的ならあなたの言う通りだろ。
自分の場合は絶対に文字起こし が必要なんで読取革命程度の手間だったらOCR を使う。と言うか それ以外に選択肢がない。
> 俺は読取革命を使ってみたことがあるが、図表混在の文字の修正がハンパなく手間だった
→ちゃんと複数の領域を設定して、各領域毎に最適な属性設定やった?
ぶっちゃけた話、読取革命はマニュアルが使いにくいんで俺も6~7年前に紙のカード明細のExcel への取り込みようにひと月ほど集中的に使ってからはずっと使わんかった。
昨年から専門書の自炊始めたんだけどAcrobat の OCR で十分だと思ってた。
だけど透明のテキスト 文字をコピペして使わなきゃいけない事情になって誤認識の多さに閉口した。それで色々調べて読取革命の性能 引き出す使い方を紹介しているネットの記事を見てこういう風に使うのかというのがわかった。

533:名無しさん@お腹いっぱい。
22/05/24 15:35:09.82 aJH4exft0.net
目指すところが違うんだろうな
完璧なテキスト化を目指すためには多少の手間は惜しまないか
少しでも手間をかけるくらいなら完璧とまではいかなくてもいいか

534:名無しさん@お腹いっぱい。
22/05/24 16:03:36.35 cADfl0Dk0.net
透明のテキスト 文字をコピペして使うことが必須なんで、認識用設定時に手間を惜しんでコピーした後に修正に手間をかけるか、それとも認識用設定に手間をかけてコピペした後は修正なしにできるかの選択。認識用の設定の手間というのもそんなに大したことない。

535:名無しさん@お腹いっぱい。
22/05/24 16:50:45.74 5b9IkS690.net
>多少の手間は惜しまないか
多少なんてもんじゃないのがミソなw
まぁ暇人には使えるソフトってことでしょ

536:名無しさん@お腹いっぱい。
22/05/24 17:56:05.13 cADfl0Dk0.net
>>527
暇?
暇ではないぞ、仕事で使ってるから
君は漫画小僧だな

537:名無しさん@お腹いっぱい。
22/05/24 18:35:40.13 aJH4exft0.net
論理的合理的思考ができるかどうかだな

538:名無しさん@お腹いっぱい。
22/05/24 19:47:58.91 5b9IkS690.net
それができない奴が使うんだろうな

539:名無しさん@お腹いっぱい。
22/05/24 20:10:20.97 cADfl0Dk0.net
>>530
プッ、君が出来てないよ

540:名無しさん@お腹いっぱい。
22/05/24 22:01:22 uwTIOOOb0.net
ID:cADfl0Dk0
こいつ、朝から晩まで張り付いてるみたいだけど単なるキチガイか?
プっとか言ってるけど、オツムやられてるっぽいw

541:名無しさん@お腹いっぱい。
22/05/24 23:54:55 cADfl0Dk0.net
>>532
朝じゃないよ,昼からだよ(笑)

542:名無しさん@お腹いっぱい。
22/05/25 07:20:56 W3iKtSQ90.net
どっちでもいいけど、頭おかしい自覚はしておいた方が 笑

543:名無しさん@お腹いっぱい。
22/05/25 10:29:01 wWoQec/h0.net
ID:5b9IkS690、uwTIOOOb0、W3iKtSQ90
こいつらは悪口しか言えないやつだな。

社会問題になってる、ネットで攻撃衝動を発散するしかない御可哀想な奴らだ(笑)

544:名無しさん@お腹いっぱい。
22/05/25 11:57:42 i/AJgx3d0.net
どっちもバレバレだよ

545:名無しさん@お腹いっぱい。
22/05/25 13:13:20 f5GblV+t0.net
>>535
性格悪そう

546:名無しさん@お腹いっぱい。
22/05/25 13:14:26 3nRqErRs0.net
>>512
で、
>手動でPDFに出力する透明テキストのフォントサイズを全ページ一括で変更したいのですが,そのような設定は可能でしょうか.
は解決したの??

547:名無しさん@お腹いっぱい。
22/05/25 13:17:26 wWoQec/h0.net
>>538
してません(:_;)
悪口書き込むやつと、それへのレスだけです。
トホホですね(´;ω;`)

548:名無しさん@お腹いっぱい。
22/05/29 09:17:29 dezXzM1d0.net
これが革命って奴やな。

549:名無しさん@お腹いっぱい。
22/05/29 13:00:28 qWf9pQE10.net
革命詐欺w

550:名無しさん@お腹いっぱい。
22/06/01 12:57:24 ktMvq3Ub0.net
511です。
バージョン16にアップデートするとフォントサイズが小さすぎる問題は解決していました。表示上のサイズと透明テキストのサイズはほぼ一致してます。

551:名無しさん@お腹いっぱい。
22/06/18 20:26:54 2jCbEwjL0.net
>>498
そりゃ当たり前
PCなんて使えない高齢者がいっぱいいるんだから
そのためのOCRだよ

552:名無しさん@お腹いっぱい。
22/06/19 06:08:07 nQI82VN80.net
手書きを補正してあってんのかあってないのかわかんないデータが完成するより普通に入力した方が早いと思う

553:名無しさん@お腹いっぱい。
22/06/19 08:00:38 SMFRVfVR0.net
普通に入力してもtypoはあるし
校正抜けは自分で入力したもののほうが起こりやすいという罠もある

554:名無しさん@お腹いっぱい。
22/06/22 20:32:48 aWOqOAmW0.net
仕事で手書きの帳票の入力をしているのでOCRを使って自動化したく、いくつか無理のものを試してみたのですが上手くいきませんでした
入力内容は型番と数字だけなので、型番の登録とかができれば精度も上がると考えているのですが、いいOCRツールがあれば教えてください

555:名無しさん@お腹いっぱい。
22/06/22 22:38:51 cbR9tsx10.net
ないんだな、これが(画像略)
ほんとにみんなそれを欲しがってると思うよ

556:名無しさん@お腹いっぱい。
22/06/23 07:46:57 F2BXam9K0.net
>>546
>>480 のリンク先はみた?

557:名無しさん@お腹いっぱい。
22/06/25 00:23:31 M5gx6zVR0.net
>>546
ソリューションとして何百万円で売ってるようなものだからなあ。

558:名無しさん@お腹いっぱい。
22/06/25 03:38:17 0PVpsHFx0.net
>>546
手書き文字は、かなり難易度が高い。
字体に個人差が大きいのと、文字ごとの区切りが取りづらい
型番がアルファベットなら、学習データを用意すれば可能性はあるけど、
本質的に1とかIとかlを手書き文字から読み取るのは無理ゲーなので
近い登録型番を引っぱってくるとかの方がよさそう。

559:名無しさん@お腹いっぱい。
22/06/25 11:36:36 XawCiBfQ0.net
達筆こと汚い殴り書きすら判読できるOCRキボンヌ

560:名無しさん@お腹いっぱい。
22/06/26 00:59:41 u0oZCNU/0.net
20年くらい前に
東芝が郵便局に納入してる手書き宛名OCRが有能という話聞いたのを思い出したので
ぐぐてみたらこんなのでてきた
www.it-innovation.c
o.jp/wordpress/wp-content/uploads/2021/08/Session6_AAcon2_2021
0827_tdslj.pdf
手書き「IOデータ」がエロデータに変換される恐怖・・・

561:名無しさん@お腹いっぱい。
22/06/26 13:06:43 MrxyXubs0.net
郵便局でバイトしてたときの、宛名OCRの精度の感覚は
フォントだと100%、手書きで95%くらい当たってた
手書きだと3-10とかを漢数字で縦書きされると辛い様子(三が12と見分け付かない)
あと、達筆は無理なので弾かれてたな

562:名無しさん@お腹いっぱい。
22/08/06 23:14:15.46 KxBYYb3L0.net
>>480 の後半部分がだいぶ進んだ
URLリンク(i.imgur.com)
もうちょい1とかが認識できるといいんだけど

563:名無しさん@お腹いっぱい。
22/11/11 16:50:50.83 wJwec+Hh0.net
ユーザーローカルの無償のOCRはどうですか?

564:名無しさん@お腹いっぱい。
22/11/11 18:04:01.27 rp6GMXxX0.net
手書き文字をgoogle driveにアップしてドキュメントに変換するとOCRされる
わりと認識されるようだ

565:名無しさん@お腹いっぱい。
22/11/16 01:13:33.38 S5so+53A0.net
凸版印刷、明治期から昭和初期の手書き文字を
解読するAI-OCRを日本で初めて開発
URLリンク(www.toppan.co.jp)
URLリンク(www.toppan.co.jp)

566:名無しさん@お腹いっぱい。
22/11/26 08:06:32.03 D8kis3AF0.net
>>557
どうせソリューション�


567:ナ1000万円以上



568:名無しさん@お腹いっぱい。
22/12/22 04:52:11.23 D7BYsnDs0.net
OCRかけたPDFで、Googleドライブで閲覧するときは、文字選択も検索もできるんだけど、ドライブから他のiPadアプリへインポートすると、文字選択も検索もできなくなります。

対応策知ってる方いたら教えてもらえないでしょうか。

569:名無しさん@お腹いっぱい。
22/12/25 14:05:23.99 UNDWLpRR0.net
バージョンが違うとかじゃね?

570:名無しさん@お腹いっぱい。
23/01/05 23:31:26.85 /v8QR8d30.net
>>509
URLリンク(twitter.com)
NDLOCRについては国立国会図書館月報2022年11月号の特集記事でも紹介しています。
(deleted an unsolicited ad)

571:名無しさん@お腹いっぱい。
23/01/08 20:04:39.43 5uNVO8JT0.net
スマホのグーグルレンズだとかなり正確なのに
PCの画像取り込みでグーグルドキュメントだとまったく認識できないのはなぜかわかりますか?

572:名無しさん@お腹いっぱい。
23/01/09 20:16:16.65 2gSKg0450.net
>>561
>>509
自炊技術総合スレでこれに関していろんな人が議論しているけど、結局外部の人間が使いこなすのは至難であると言う状況
日本の it 開発に関する公金の使い方は最悪

573:名無しさん@お腹いっぱい。
23/01/09 20:31:05.78 +xJlSjJo0.net
余計なGUI作っで金と取るより、遥かにいいよ。
Python あれば コマンドラインで動くんでしょ。
十分だよ。

574:名無しさん@お腹いっぱい。
23/01/09 20:47:53.13 2gSKg0450.net
>>564
Python でも動かし方がわからないみたいよ

動かし方であーだこーだ時間を使うよりは有料でも使いやすいインターフェースがあった方がいい
こういうのは所詮道具だから

575:名無しさん@お腹いっぱい。
23/01/11 20:40:11.59 RZPLrb1r0.net
規制された?

576:名無しさん@お腹いっぱい。
23/01/15 15:43:45.29 d/Jt3FpO0.net
>>562
多分AIチップの有無

577:名無しさん@お腹いっぱい。
23/01/16 10:13:41.53 ARaKc39v0.net
制限された?

578:名無しさん@お腹いっぱい。
23/01/17 08:02:43.09 JLVUHZYJ0.net
制限きつくなった

579:名無しさん@お腹いっぱい。
23/01/19 20:26:45.79 WqtzRSbq0.net
TEST

580:名無しさん@お腹いっぱい。
23/01/21 01:51:12.94 OCOnSa520.net
>>562
スマホのカメラのレンズは顔認識にはじまり、そのレンズ通して画像(映像)からフォントやらワンタップで楽々と認識+特定できるようになるかもしれない。
既にある気もするけど。googleとかやりそうだし。
AIと言うと、KRITA Paintって無料(フリーウェア)のペイントアプリで超簡単お手軽に消したい任意の人や車をこの画像みたいに消せるのがなんだかすごい。
コラージュには欠かせないツールかもしれない。
URLリンク(i.imgur.com)
GIGAZINEで知った。

581:名無しさん@お腹いっぱい。
23/01/23 09:06:58.16 IEgo6gO30.net
test

582:名無しさん@お腹いっぱい。
23/01/23 18:07:45.55 uTX11U8P0.net
非破壊型ScanSnapに添付のソフトでPDFに透明テキストを付けていたが性能が悪いので
読取革命の体験版を入手して試してみた
テキストは大体正しく読み取れているが不満点2つ
・ページの枠等でゴミ文字が大量に発生
・元のPDFの画像を再エンコしてしまっている

583:名無しさん@お腹いっぱい。
23/01/23 20:37:55.46 uDMkpynR0.net
>>573


> ・ページの枠等でゴミ文字が大量に発生
たぶんページ番号とか上の方にある見出しとかを言ってると思うんだけど本文だけを領域に指定したテンプレートを使って、それを簡単認識という一種のマクロで読み込ませればいい

> ・元のPDFの画像を再エンコしてしまっている
これは何とかしてほしいよね

584:名無しさん@お腹いっぱい。
23/01/24 14:53:20.86 pgLtZU8s0.net
レスありがとうございます。「簡単認識」というのは何ですか?
読取革命15の体験版を使っています

585:名無しさん@お腹いっぱい。
23/01/24 14:55:11.57 pgLtZU8s0.net
読取革命15の体験版を使ってみて不具合と思うこと

1. 複数のjpgをいれたフォルダーを用意する
2. 「画像ファイルを開く」でそのフォルダーを指定して「画像ファイルを追加して読み込む」に
チェックを付けた上でCtrl+Aで全ファイルを選択して開く
3. 複数ページとして読み込まれる
4. ところが「レイアウト」も「認識」も「保存」も最後のページしか処理できない

現行バージョン16ではどうですか?

586:名無しさん@お腹いっぱい。
23/01/24 20:12:23.68 JDh+ktVS0.net
ちょっと何言ってるかわからない

587:名無しさん@お腹いっぱい。
23/01/24 20:24:39.65 pgLtZU8s0.net
では逆に質問させてもらえますか
1ページが1つのjpgで、ファイル名に連番ついているものが多数ある場合
それらをまとめて読み込んでまとめてOCR処理することはできますか

588:名無しさん@お腹いっぱい。
23/01/24 21:23:07.42 ea8a85HJ0.net
15で、すべてのページを選択して、認識など順番に処理をしてくれている
左に並んでいる取り込まれた画像は選択された状態になっているのか
なっているなら、体験版の制限かもしれない

589:名無しさん@お腹いっぱい。
23/01/24 21:42:05.66 cUHZCYDc0.net
>>578
マニュアル読んでないならとりあえず『かんたんモード』使っとけ
メニューバー>表示>かんたんモードへ>入力>認識>保存

>>575
何処か分からないならF9キー押せ
そこに前もって処理手順を登録しとけば実行ボタン押すだけで全部やってくれる

590:名無しさん@お腹いっぱい。
23/01/24 22:13:55.01 pgLtZU8s0.net
>>579
取り込んだ後左に並んでいる画像は全部選択された状態になっています
Ctrl-Aを使って全部選択し直してもやはり最後のページしか処理できない
制限しているのか体験版だけの不具合かわからないけど動作確認はあきらめた

591:名無しさん@お腹いっぱい。
23/01/24 22:26:30.24 N6mW9c+00.net
>>575
体験版は使ってないんで分からないけど16正規版ならば、メニューで、認識→簡単認識、で設定画面を呼び出せる。
領域をカスタム設定して保存し、それをテンプレートとして簡単認識内に登録すれば後は自動で全てのページをそのテンプレートでやってくれる。
領域ごとの設定ではできるだけ自動認識を使わず、縦書きとか横書きとか半角とか全角とか細かく指定する方が認識が良い

一つの領域内に横書きと縦書きが混在した場合にはテンプレート処理できないので、1回簡単に意識を実行させた後、少数の例外ページだけ手作業でレイアウトを修正する

575の最後のページしか認識しない問題は画像ファイルを読み込ませた後左側のサムネイルページで最後のページしか選択していないことが原因だと思う。読み込み後コントロール A で全選択すれば全てのページの処理をしてくれる

簡単モードじゃなくて標準モードを使うこと

こんなとこですかね

592:名無しさん@お腹いっぱい。
23/01/24 22:28:05.47 N6mW9c+00.net
続き

Amazon のレビューでかんたん認識についての説明がありましたので転載しときますね


五点目は、「かんたん認識」機能です。
文庫本や単行本で、レイアウトが単純なものは、この機能を使うことで、かなりの短時間で文字認識を完了させることができます。
この機能は、ひとつの認識レイアウトをテンプレートとして保存して、「かんたん認識」機能で全ページに適用するというものです。
例えば、通常、文庫本の場合、見開きの上下端の部分に、ページ数や書籍名・章題などの文字情報が含まれています。この部分に関しては、基本的に文字認識する必要がない無駄な情報なのですが、自動で文字認識させると、この部分まで認識してしまいます。
「かんたん認識」機能を使えば、あらかじめ、上下の端の部分を認識しないレイアウトをテンプレートで設定しておいて、そのレイアウトに従って一度、全ページを文字認識してくれます。
もちろん、挿絵や図表があるページに関しては、認識がグチャグチャニなるので、その後で修正が必要になりますが、いちいち、手作業で無駄な認識部分を消す必要がありません。
また、レイアウト認識にテンプレートを使うことによって、レイアウト解析の時間も不要になりますから、文字認識の処理が速くなります。
テンプレートは、書籍ごとに作った方が、精度が高いので、その点はひと手間はかかりますが、それ以上にメリットが大きいと思います。
上手に使えば、精度の高い認識結果を得るのに、300Pの本で30分くらいですみます。(そのうち手作業は10分程度)≫

593:名無しさん@お腹いっぱい。
23/01/24 23:02:35.33 pgLtZU8s0.net
>>582

>576の最後のページしか認識しない問題は画像ファイルを読み込ませた後左側のサムネイルページで最後のページしか選択していないことが原因だと思う。

「標準モード」の「ファイル」の「画像ファイルを開く」を使いました
580に書いたように左側の画像サムネールは全部選択状態になっています
体験版の制限事項にはそんなことは書かれていないので体験版の不具合かな

594:名無しさん@お腹いっぱい。
23/01/24 23:11:41.54 pgLtZU8s0.net
体験版も無いのでバージョン16のメニュー構成がどうなっているのかはわかりませんが、
バージョン15の「標準モード」の「ファイル」の「画像ファイルを開く」と同等の方法で複数ファイルを
一括処理をできるようになっているのでしょうか

595:名無しさん@お腹いっぱい。
23/01/24 23:14:09.31 JDh+ktVS0.net
入門ウィザードの話なのか、かんたん認識の話なのか、画像ファイルを開くからの話しなのか、それら以外なのか

596:名無しさん@お腹いっぱい。
23/01/24 23:17:36.44 JDh+ktVS0.net
画像ファイルを開くからのだったら手順を踏まないと一括の認識変換はできないぞ

597:名無しさん@お腹いっぱい。
23/01/24 23:23:00.30 JDh+ktVS0.net
まずは入門ウィザードでやってみろ

598:名無しさん@お腹いっぱい。
23/01/24 23:26:48.79 N6mW9c+00.net
>>585
それとは違う


アマゾンのレビューはバージョン15のレビューなので、15でも「かんたん認識」はあると思う。レビューで簡単認識の機能は想像できるでしょう

もう少し詳しく知りたかったら15のマニュアルは公開されてると思うんでやり方探してみて

16の場合でも体験版はある筈。私は実際それで試してから購入したから
体験版というより使える期間に制限があるだけで機能制限はなかったと思う

599:名無しさん@お腹いっぱい。
23/01/24 23:35:17.61 pgLtZU8s0.net
どんな方法でもいいですけどバージョン16において、
1ページが1つのjpgで、ファイル名に連番が付いているような多数ファイル(ページ)がある場合
それらをまとめて読み込んでまとめてOCR処理することはできますか
というのが質問です

少なくともバージョン15の体験版ではできない

600:名無しさん@お腹いっぱい。
23/01/24 23:36:01.14 pgLtZU8s0.net
>>589
16の体験版は入手できないでいる
URLリンク(faq.sourcenext.com)

15の体験版はインターネットアーカイブの古いページから何とか見つけ出したもの

601:名無しさん@お腹いっぱい。
23/01/24 23:50:01.11 JDh+ktVS0.net
入門ウィザードだ

602:名無しさん@お腹いっぱい。
23/01/25 00:03:44.68 DyKQ5Whb0.net
入門ウィザードは15の体験版で既にやっているがやはり最後のページしか処理されない

603:名無しさん@お腹いっぱい。
23/01/25 00:12:50.70 GkG6ZGoO0.net
>>590
答えはイエスだよ

バージョン16の体験版はなかった。試用期間というのは私の記憶違いで、返品が可能という条件だった。

私の場合はバージョン14を使っていて不満足なところがあったのでサポートに問い合わせたところバージョン14のサポートは既に終わっており回答できないが、バージョン16を勧められバージョン16でも満足する機能がなければ返品に応じるということだった。バージョン16で満足する機能があったので返品はしなかった。

バージョン16のマニュアルはここにあるよ
URLリンク(ftp.sourcenext.co.jp)

589ができればいいなら購入したほうが早いんじゃない?かんたん認識であなたの不満点は解決されると思うから

604:名無しさん@お腹いっぱい。
23/01/25 00:14:58.98 qoKngNmd0.net
そうか
俺の体験版15では全ページ一括OCR出来てるから何かを間違えてるんだろうな

605:名無しさん@お腹いっぱい。
23/01/25 00:45:52.30 qoKngNmd0.net
そう言えば設定によっては
レイアウトや認識結果を削除とかなんかしたあと
もう一度読み取ろうとしても読み取ない不具合か仕様あったようななかったような

606:名無しさん@お腹いっぱい。
23/01/25 00:46:29.68 qoKngNmd0.net
だいぶ前のあやふやな記憶

607:名無しさん@お腹いっぱい。
23/01/25 02:54:28.10 GkG6ZGoO0.net
>>590
かんたん認識はマニュアルの121ページ

608:名無しさん@お腹いっぱい。
23/01/25 08:45:03.18 DyKQ5Whb0.net
>>594
ありがとう
16のマニュアルを見たが62ページ(PDFの63/177)に「複数ファイルを指定する場合」と
書かれているが15のマニュアルにも同じことが書かれている
本来であればその方法でできるはず
15と16は比較表を見るとスペックにほとんど変更がないから15の体験版でできなければ16でも
怪しいと思い質問したした次第です

609:名無しさん@お腹いっぱい。
23/01/25 09:06:59.69 GkG6ZGoO0.net
できなければ製品として成立しないんだからできる。体験版の機能制限か、アーカイブがこわれているかのどちらかでしょう。

610:名無しさん@お腹いっぱい。
23/01/25 11:24:59.54 DyKQ5Whb0.net
複数のjpgを無劣化で1PDFに作れるから体験版でもOCRに掛けることはできる
しかしJPGを1つ読み込んだ時とそのJPGから作ったPDFを読み込んだ時とで比較すると
透明テキスト付PDFの品質が違っていた(どちらも再エンコであることは同じだったが)

そこで16を注文をした(435のように体験版を使い続けることもできるんだが)

まともな体験版を出せよ

611:名無しさん@お腹いっぱい。
23/01/25 11:36:38.79 6QPp+WbY0.net
パナソニックは15で開発終了してるんだな
ソースネクストにまともな開発能力ないしまあ残当

612:名無しさん@お腹いっぱい。
23/01/25 12:36:18.41 GkG6ZGoO0.net
なんだかんだ言っても日本語縦書きをまともに処理できるOCR ソフトは読取革命しかないように思うんだけど、他にある?あったら教えて

Googleやndlは透明テキスト処理ができないんで対象外ね

613:名無しさん@お腹いっぱい。
23/01/25 15:18:16.75 DyKQ5Whb0.net
>>603
スキャナーに付いて来たPower PDF Standardを今まで使ってきたが縦書きでも取れるし
一応だが実用にはなっていた
「サンプルzip」というファイルをアップしてみた。3つファイルが入っている
URLリンク(20.gigafile.nu)

・某所のOCRテスト用サンプル。元はPNGだが「画像梱包」で無劣化PDF化したもの
・読取革命15体験版で透明文字付PDFに保存したもの
・Power PDF Standardで検索可能化

読取革命は画像を再エンコするのでファイルサイズがかなり大きくなってしまっている
Power PDF StandardはPDF内の画像ファイルを全く変えないのがいいところ

614:名無しさん@お腹いっぱい。
23/01/25 15:46:40.80 GkG6ZGoO0.net
>>604
ファイルサイズが大きくなったらアクロバットのファイルの最適化またはファイルの縮小をかけると劇的にサイズが小さくなるよ。

画質はほとんど劣化しないけれどよく見ると文字のエッジが微妙に変化しているので自分は2種類の方法でファイルサイズを小さくした後実際に目で見てファイルサイズの小ささと画質の良さのバランスが良い方を残している。

615:名無しさん@お腹いっぱい。
23/01/25 16:08:45.17 DyKQ5Whb0.net
PDFが対応している画像についてはそれを勝手に書き換えないのがベスト
技術的に難しいことではないはず

しかしパナソニックからソースネクストに変わってしまったら今後あるかもしれないバージョンアップでも
改善されることは絶望的だね

616:名無しさん@お腹いっぱい。
23/01/25 18:10:59.18 nVR442uK0.net
ずっとe.typistの高圧縮PDF(MRC圧縮)にしてるわ
iPadで読むには十分。つか文字のエッジはガタつき気味だけど、クッキリとするから読みやすい。
AcrobatのClearScanにしてたときもあったけど、やたらと読み込みが遅いのが出来たことがあって止めた

617:名無しさん@お腹いっぱい。
23/01/26 12:36:37.20 COtm4ckg0.net
余所でやってください。

618:名無しさん@お腹いっぱい。
23/01/26 17:20:39.24 nsE1OjFq0.net
久しぶりにeTypistとFineReaderを使ったら、あまりのポンコツぶりに驚いた。
PDFなんてAcrobat DCの方が認識率いいぞ。
みんなが知らないと思われるxdw文書もDocuworksの方が認識率が良くて驚いた。

619:名無しさん@お腹いっぱい。
23/01/26 18:29:58.68 bNrtAqo/0.net
テスト

620:名無しさん@お腹いっぱい。
23/01/27 16:14:23.09 2XDvwiTP0.net
読取革命の「PDFを解析して入力」というものは何に使うためにあるんだろうか
透明文字付PDFの誤認識文字を後から直すためかとも思ったが
直して保存すると画像文字と透明文字との位置が違ってしまうし

621:名無しさん@お腹いっぱい。
23/01/27 17:17:29.64 CmzK49I30.net
PDFを入力してもunicode文字が全部下駄文字になってしまうんだよな
20年間unicode化せずにやって来て
今更対応させる体力も無くソースネクストに丸投げして終了

622:名無しさん@お腹いっぱい。
23/01/30 16:10:52.67 HCAjqo0j0.net
読取革命においてPDFから無劣化でJPG等を取り出せる場合にはPDFを開くのではなく
取り出した画像ファイルを(複数)開く方がよいようだ

603の例で言うとサンプルの元のPNGは462x412ピクセル
それを無劣化PDFにして読み込むと1925x1716ピクセルのJPGに変換されてしまう(300dpi
の入力設定の時)
だからOCR後の透明文字付PDFのサイズも大きくなってしまうし2回エンコードされるから
画質も劣化する
どういう計算根拠でそのサイズに拡大しているのかは不明
PDF以外の画像ファイルを開いた時にはサイズが変更されることはない

623:名無しさん@お腹いっぱい。
23/01/31 06:21:19.62 WKam88fi0.net
>>613
単にPDFがweb閲覧用に減量化済みの低解像度なものだからじゃないの?
そのサンプルPDF内のPNGは72dpiだから300dpiに変換するとそのサイズになる
300/72*462 = 1925
300/72*412 = 1716.666…

624:名無しさん@お腹いっぱい。
23/01/31 17:27:31.67 WvcTDH8i0.net
計算はその通りですね

PNG形式ファイル自体にはdpiは指定できずそれを「画像梱包」のデフォルトでPDF化したら
72dpiのPDFが作られたようでした
試しに「画像梱包」で300dpiを指定してPDF化したらそれを開いて読取革命で作成した透明文字付
PDF中にPNGとほぼ同じピクセル数のJPGが作られていた(ファイルサイズも小さい)

625:名無しさん@お腹いっぱい。
23/02/01 10:23:43.08 D6WMl7M10.net
読取革命の不便な点・・・・

dpiが設定されていないファイルを複数まとめて開いた時にページ一覧のCtrl+Aで全部のファイルを選択
してもまとめて「解像度の設定」をできず1ページずつ設定しなければならない

事前に何かツールを使って対象ファイルにまとめてdpiを設定しておけばよいのだけれど

626:名無しさん@お腹いっぱい。
23/02/01 15:46:37.87 NpVHOxya0.net
>>163
オタクは気持ち悪いなら規制してほしいの?寂しいの?

627:名無しさん@お腹いっぱい。
23/02/01 15:46:40.86 o27UQapf0.net
>>415
過度に攻撃的な発言では通らない

628:名無しさん@お腹いっぱい。
23/02/01 15:46:41.50 DGJIob8I0.net
>>159
まだ2回なのに心臓の調子悪いんだがなんで品評会がなんJを自民倒すのが目的の連中がフェミ的な装いでっていう住み分け

629:名無しさん@お腹いっぱい。
23/02/01 15:46:42.46 o27UQapf0.net
>>59
配信者程度なら単なる内輪ノリなんじゃないのノリなんだろ

630:名無しさん@お腹いっぱい。
23/02/01 15:46:42.95 3udZnQSa0.net
>>137
ここの奴らは全方位に喧嘩売るスタイルなん

631:名無しさん@お腹いっぱい。
23/02/01 15:46:43.19 QFgq0UQN0.net
>>186
俺はダッピも叩くし言葉狩りフェミも叩くそして表現の自由を唱える人間�


632:ヘかんたんに政府批判の自由を主張するのはナンセンスだわ



633:名無しさん@お腹いっぱい。
23/02/01 15:46:43.97 pVtVzfob0.net
>>450
明確なスポンサーみたいなのはしゃーないカスが口出して話になる相手じゃない

634:名無しさん@お腹いっぱい。
23/02/01 15:46:45.72 gvbk18Bb0.net
>>21
なんか居着いてるよな???

635:名無しさん@お腹いっぱい。
23/02/01 15:46:49.58 OgAfQ5SI0.net
>>231
ちょっと言いすぎたゴメン~くらいにしか夢見れんクソ雑魚弱者男性煽って女叩きさせてくれ

636:名無しさん@お腹いっぱい。
23/02/01 15:46:52.94 6kKyI80L0.net
>>373
なるたけ正論を言うのはそういう層だよな

637:名無しさん@お腹いっぱい。
23/02/01 15:46:54.44 HQ2yQocM0.net
>>379
それ相手がイケメンじゃないと面白くないっていうセンスがというか育ち悪そう

638:名無しさん@お腹いっぱい。
23/02/01 15:46:56.23 vDh1NJpi0.net
>>304
これが当たり前なんだよな今回こそ自民党負けると本気で思っていることの言ってるだけでおもろないな

639:名無しさん@お腹いっぱい。
23/02/01 15:46:56.61 gAmWCN6a0.net
>>88
重症化はせずワクチン接種者のほうが数字は多くなるかな一個目があってるや

640:名無しさん@お腹いっぱい。
23/02/01 15:46:59.51 6TlAKEg00.net
>>298
なんかあったんだよな

641:名無しさん@お腹いっぱい。
23/02/01 15:47:00.33 6TlAKEg00.net
>>399
その前提条件を共有してねーな

642:名無しさん@お腹いっぱい。
23/02/01 15:47:03.73 kriD7p+W0.net
>>287
当時30代~40代ここ主力層40代~60代ってことは

643:名無しさん@お腹いっぱい。
23/02/01 15:47:04.52 v3rSe3Av0.net
>>79
そいつは言葉をぼやかすことで自分を守ってるだけのインチキだしなんで知恵袋はBBAばっかだと思ってんの?

644:名無しさん@お腹いっぱい。
23/02/01 15:47:06.45 JSwILUjZ0.net
>>196
明らかに女性蔑視的な意識を持っているという点が

645:名無しさん@お腹いっぱい。
23/02/01 15:47:14.31 EiWeQjiH0.net
>>331
前提としてイジリだからいいなどとは言ってんだ?

646:名無しさん@お腹いっぱい。
23/02/01 15:47:16.37 N9eOp+yy0.net
>>24
なんだわたしじゃないの?🤔

647:名無しさん@お腹いっぱい。
23/02/01 15:47:16.41 dxED2bM00.net
>>238
・LGBTは声だけデカい詐欺師紛いのやつが増えすぎたんだよ

648:名無しさん@お腹いっぱい。
23/02/01 15:47:21.36 vD1IRxbb0.net
>>168
どの分野でも素人に毛が生えた程度も知らないなこの男


次ページ
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch