22/02/19 15:59:36.83 1i5A+HZD0.net
>>474
CenterNetの手法で、バックボーンにEfficientNet v2を使っています。
文字の中心位置とボックスと縦横を出すのと同時に、
中心位置まわりに384次元の特徴量を取得してます。
プレ学習として、384次元の特徴量を文字コードに1対1で変換してます。
後段では、特徴量を連続させて、文脈依存で文字コードに変換させるのを予定してます。
483:名無しさん@お腹いっぱい。
22/02/20 07:54:02.16 lLW2TQdp0.net
>>475
頑張りましたね。
手書き文字だと、どんな感じに抽出できますか?
484:名無しさん@お腹いっぱい。
22/02/20 15:26:54.12 YPHg717Q0.net
>>476
URLリンク(i.imgur.com)
URLリンク(i.imgur.com)
これくらい
手書きは学習データを用意するのがめっちゃ大変なので、
十分学習はできてない気がする。いまのところおまけ程度の
精度しか出てません。
手書きは文字が分裂して認識しやすいので、相当たくさんの
手書きデータを元に学習させないと上手くいかないと思われます。
やり方としては今の延長線上でいけそうな気配はしてます。
485:名無しさん@お腹いっぱい。
22/02/21 06:41:18.52 mGEzXi/K0.net
>>477
良い感じで抽出できてますね。GitHubにソースなどを上げて欲しいです
486:名無しさん@お腹いっぱい。
22/02/21 11:29:34.65 e3F9aiKE0.net
>>473
すばらしい。
リリースの暁は、日本語文書き出しの行頭一文字空白も認識させてください。
487:名無しさん@お腹いっぱい。
22/02/22 23:37:13.04 KG6iI0vy0.net
>>478
まだ前半だけだけどとりあえずソース
URLリンク(github.com)
学習済み重みはreleaseのところにリンクがあるです
文字の大きさは、20pixel-200pixel位で覚えさせてるので
見かけの大きさがそのくらいになる様にリサイズするとよいです。
カラーは適当に処理するはずですが、上手くいかない場合は
コントラストとかいじる必要があるかも。
488:名無しさん@お腹いっぱい。
22/02/25 01:47:43.46 oU6IT1Qa0.net
神アプリ誕生の予感...
489:名無しさん@お腹いっぱい。
22/02/26 02:15:28.14 d9ue173/0.net
>>480
のモデルで、iPhoneとかiPadで推論できるようにしました
URLリンク(testflight.apple.com)
iPhone13とかの最新デバイスだとまともに動くと思うのですが
昔のデバイスだと微妙かも。落ちる場合はCPU onlyにしたら
遅いながらも落ちなくはなります。
490:名無しさん@お腹いっぱい。
22/02/27 01:31:27.11 Zp2vBZkX0.net
>>482
Android しか持っていないので試せないです。残念。
>>477
文字のある領域を示すのに IIIF manifest の形式を使うのが標準的なようですが、対応してますか?
491:名無しさん@お腹いっぱい。
22/02/27 23:10:43.63 1WOIRC0G0.net
>>483
IIIF manifestの形式は知りませんでした。どこかよい説明のリンクありますでしょうか。
Androidでも機械学習モデルが簡単に動けばいいのですが。iPhoneの最近のやつは
推論エンジン積んでるのでかなり速く認識できます。
492:名無しさん@お腹いっぱい。
22/03/05 01:38:16.55 iWInWTln0.net
いまだによくロシア企業のOCR使えるな
493:名無しさん@お腹いっぱい。
22/03/06 22:12:54.20 p5crT8Gx0.net
AcrobatでOCRした透明テキストの修正ってどうしてます?
Acrobat上だとやりづらすぎて
494:名無しさん@お腹いっぱい。
22/03/10 08:35:47.81 cWyR5z8H0.net
漫画翻訳再加工でおすすめのありますかね
グーグルのカメラ翻訳みたいなのが一番なんだけどさすがに無理か
これしか見つからない
URLリンク(www.imagetranslate.com)<)
495:名無しさん@お腹いっぱい。
22/03/30 19:16:25.05 aBrCbYCH0.net
>>469
ありゃダメだよ
ま、値段を考えたら自ずと理解できると思うけどね
496:名無しさん@お腹いっぱい。
22/03/31 19:28:57.72 0TmFtm2N0.net
読取革命を経理業務で使ってる人いる?
領収書や請求書なんかの文字認識や精度はどの程度なのか気になってます
497:名無しさん@お腹いっぱい。
22/03/31 20:59:05.31 gur9KTQl0.net
認識させた後どうやって使うつもりなの?
498:名無しさん@お腹いっぱい。
22/04/03 10:55:17.93 AGhKdTzD0.net
読取革命を業務で使ってる人なんていないと思う
そのレベルのOCRだから
499:名無しさん@お腹いっぱい。
22/04/03 14:38:33.39 OgQuX8lP0.net
まさに革命やな。
500:名無しさん@お腹いっぱい。
22/04/03 20:05:43.65 Jsg5j8K40.net
そもそも、読取革命みたいなレベルのソフトを法人が使うわけないやろw
501:名無しさん@お腹いっぱい。
22/04/03 21:08:08.14 rMkt3H120.net
それこそ革命やで。
502:名無しさん@お腹いっぱい。
22/04/03 22:51:40.78 TpRPDKza0.net
滑り芸か?
503:名無しさん@お腹いっぱい。
22/04/04 06:49:29.29 YzNd9QN20.net
ごめんなさい。ふざけすぎました。
504:名無しさん@お腹いっぱい。
22/04/21 20:39:05 vYl46slD0.net
streamed高いからなあ
自分で出納帳読み込んで仕訳作成できれば
streamedなんか使う必要ないんだけど
そんな優れた市販のOCRソフトが無いんだよね
505:名無しさん@お腹いっぱい。
22/04/22 12:05:06.71 xT58YArZ0.net
まあ出納帳Excelで作ればOCR化なんて挟む必要もないんだけどな
506:名無しさん@お腹いっぱい。
22/04/23 12:38:43 SDF278rq0.net
Google の OCR 使いたかったらPDF ファイルを Google ドライブにあげてGoogle ドキュメントで開けばいいと思ってたんだけど文字認識していない
どうすれば使えるんだったっけ?
誰かわかる人教えてください
507:名無しさん@お腹いっぱい。
22/04/23 12:39:18 SDF278rq0.net
この PDF はスキャンしただけの画像です
508:名無しさん@お腹いっぱい。
22/04/23 13:39:01 vfksCYOj0.net
>>499
PDFではやった事ない
自分はPNGでやってる
509:名無しさん@お腹いっぱい。
22/04/23 15:47:28.78 SDF278rq0.net
>>501
URLリンク(support.google.com)
Google の説明では PDF ファイルも文字認識するのでなんだけど
510:名無しさん@お腹いっぱい。
22/04/23 16:29:35.50 SDF278rq0.net
>>501
498だけそ,1ページだけ抽出してpng形式変換した後,Google ドキュメントで開いたけどやっぱ文字認識してない.
511:名無しさん@お腹いっぱい。
22/04/23 18:16:25 vfksCYOj0.net
>>503
特に問題無くできるけどなあ・・・
URLリンク(i.imgur.com)
設定見てもOCRを阻害しそうな項目は見当たらないし・・・
ごめん、わからん
512:名無しさん@お腹いっぱい。
22/04/23 18:33:13.03 wmkK3m2e0.net
ヘルプに書いてあるいくつかの条件は確認してるのですね
513:名無しさん@お腹いっぱい。
22/04/23 19:28:16 SDF278rq0.net
>>504
URLリンク(imgur.com)
これなんですがそちらの環境で文字認識しますか?
514:名無しさん@お腹いっぱい。
22/04/25 21:32:24.29 /wxbOJYz0.net
そういや、読取革命16を買って、ほとんど使ってないわw
修正面倒臭いから
515:名無しさん@お腹いっぱい。
22/05/05 02:00:37 MOkzV1Bk0.net
PDF エレメントプロの OCR はアクロバットのOCRに比べてどうでしょうか
経験がある方がいれば教えてください
516:名無しさん@お腹いっぱい。
22/05/07 14:36:40 UgcE4ImC0.net
国会図書館、OCR処理プログラム及び学習用データセットを公開
URLリンク(srad.jp)
517:名無しさん@お腹いっぱい。
22/05/07 14:41:33 UgcE4ImC0.net
モルフォAIソリューションズが国立
518:国会図書館の最新AI技術を活用したOCR処理プログラムの開発を完了 https://www.jiji.com/jc/article?k=000000053.000064140&g=prt
519:名無しさん@お腹いっぱい。
22/05/09 08:09:09.82 zcEHCKRp0.net
Google の OCR が優秀でもスキャンした画像の上に非表示の文字を載せてくれないので自炊用には使えないと思う。
自分は自炊用にはAcrobat の OCR を使っているけどこれよりも 認識率が高いOCR ってありますか?
520:名無しさん@お腹いっぱい。
22/05/23 11:27:12 7qUjQCGH0.net
読取り革命14を使用しています.PDFに透明テキストで出力していますが,デフォルト(自動)ではフォントサイズが小さくて選択したときに表示文字列よりも小さくななります.
メニューの「結果」で領域ごとの設定できますが300頁の専門書の自炊では領域ごとの設定ですと手間がかかりすぎます.
手動でPDFに出力する透明テキストのフォントサイズを全ページ一括で変更したいのですが,そのような設定は可能でしょうか.
521:名無しさん@お腹いっぱい。
22/05/23 17:39:34 AEOqr8aw0.net
読取革命はマジで使えない
あれはめちゃくちゃ評判悪いぞ
522:名無しさん@お腹いっぱい。
22/05/23 20:52:29 7qUjQCGH0.net
>>513
お言葉ですけど自分はスキャナー 添付の OCR ソフト、アクロバット 添付の OCR ソフト、Google の OCR ソフト、e.Typist、本格読み取りなども全部試して縦書きのアルファベット 混在、図表混在のOCR 認識は読取革命が群を抜いてるという結論に落ち着きました。読取革命の強みは1ページを領域ごとに認識方法をカスタマイズできることです。読取革命 の評価が低い人はマニュアルが分かりにくいためにおまかせ設定だけで使って性能を100%引き出してないのだと思います。
私の質問の解決方法が見つかればほぼ完璧です。
523:名無しさん@お腹いっぱい。
22/05/23 21:03:06 7ETshV7p0.net
スキャンスナップとどっちがいい?
524:名無しさん@お腹いっぱい。
22/05/23 21:03:45 AEOqr8aw0.net
あれは、手直しに手間暇がかかりすぎて使えないという評価が定着してるのだが
文字だけならともかく、図表や表に記入された文字などの読み取りはまったくダメダメで手直しに苦労する
525:名無しさん@お腹いっぱい。
22/05/23 21:24:15 7qUjQCGH0.net
>>515
ScanSnap は試したことがないので分かりません
526:名無しさん@お腹いっぱい。
22/05/23 21:29:16 7qUjQCGH0.net
>>516
領域に分けてそれぞれずっとか表とか横書き縦書きとか指定すればかなり認識精度は高いです。簡単認識設定で標準の領域設定を使い、図表が混在しているページだけ手で領域を複数に分割して設定すれば割合効率的にできます。自動レイアウト機能で認識させるとおっしゃるように手直しが大変ですね。
他のソフトは読取革命臍のカスタマイズの機能がないので縦書きのアルファベット図表混在は使い物になりませんでした
横書きの英語はアクロバットが一番いいです
Google のは認識はいいのですがレイアウトがぐちゃぐちゃになるのと元の PDF の上に非透明テキストを重ねる機能がないのでつかえないです
527:名無しさん@お腹いっぱい。
22/05/24 00:11:00 nP066gSa0.net
>>518
そんなことしてられんわ
メンくさい
528:名無しさん@お腹いっぱい。
22/05/24 00:54:53 cADfl0Dk0.net
>>519
だから君には無理なの
529:名無しさん@お腹いっぱい。
22/05/24 10:52:15 nP066gSa0.net
>>520
そんなんだから読取革命は顧客が離れてるのに
バカだねぇ、あんたもw
530:名無しさん@お腹いっぱい。
22/05/24 13:35:33 cADfl0Dk0.net
>>521
顧客が離れてるのは事実だと思うが、顧客離れとソフトの可能な事は同じじゃない。
縦書き、アルファベット混在、図表混在という条件で認識率の高い別のソフトがあげることができるか?
できたらあなたの意見を認めよう
531:名無しさん@お腹いっぱい。
22/05/24 13:59:59 KekWsjEY0.net
横だけど、OCRソフトってのはできる限り修正の必要がないものでないと実用的ではない
俺は読取革命を使ってみたことがあるが、図表混在の文字の修正がハンパなく手間だった
もうスクショでいいわって思った
532:名無しさん@お腹いっぱい。
22/05/24 14:41:38.54 cADfl0Dk0.net
>>523
> 横だけど、OCRソフトってのはできる限り修正の必要がないものでないと実用的ではない
→それは 使用目的によるんじゃない。めんどくさいならスクショ でもいいや、という目的ならあなたの言う通りだろ。
自分の場合は絶対に文字起こし が必要なんで読取革命程度の手間だったらOCR を使う。と言うか それ以外に選択肢がない。
> 俺は読取革命を使ってみたことがあるが、図表混在の文字の修正がハンパなく手間だった
→ちゃんと複数の領域を設定して、各領域毎に最適な属性設定やった?
ぶっちゃけた話、読取革命はマニュアルが使いにくいんで俺も6~7年前に紙のカード明細のExcel への取り込みようにひと月ほど集中的に使ってからはずっと使わんかった。
昨年から専門書の自炊始めたんだけどAcrobat の OCR で十分だと思ってた。
だけど透明のテキスト 文字をコピペして使わなきゃいけない事情になって誤認識の多さに閉口した。それで色々調べて読取革命の性能 引き出す使い方を紹介しているネットの記事を見てこういう風に使うのかというのがわかった。
533:名無しさん@お腹いっぱい。
22/05/24 15:35:09.82 aJH4exft0.net
目指すところが違うんだろうな
完璧なテキスト化を目指すためには多少の手間は惜しまないか
少しでも手間をかけるくらいなら完璧とまではいかなくてもいいか
534:名無しさん@お腹いっぱい。
22/05/24 16:03:36.35 cADfl0Dk0.net
透明のテキスト 文字をコピペして使うことが必須なんで、認識用設定時に手間を惜しんでコピーした後に修正に手間をかけるか、それとも認識用設定に手間をかけてコピペした後は修正なしにできるかの選択。認識用の設定の手間というのもそんなに大したことない。
535:名無しさん@お腹いっぱい。
22/05/24 16:50:45.74 5b9IkS690.net
>多少の手間は惜しまないか
多少なんてもんじゃないのがミソなw
まぁ暇人には使えるソフトってことでしょ
536:名無しさん@お腹いっぱい。
22/05/24 17:56:05.13 cADfl0Dk0.net
>>527
暇?
暇ではないぞ、仕事で使ってるから
君は漫画小僧だな
537:名無しさん@お腹いっぱい。
22/05/24 18:35:40.13 aJH4exft0.net
論理的合理的思考ができるかどうかだな
538:名無しさん@お腹いっぱい。
22/05/24 19:47:58.91 5b9IkS690.net
それができない奴が使うんだろうな
539:名無しさん@お腹いっぱい。
22/05/24 20:10:20.97 cADfl0Dk0.net
>>530
プッ、君が出来てないよ
540:名無しさん@お腹いっぱい。
22/05/24 22:01:22 uwTIOOOb0.net
ID:cADfl0Dk0
こいつ、朝から晩まで張り付いてるみたいだけど単なるキチガイか?
プっとか言ってるけど、オツムやられてるっぽいw
541:名無しさん@お腹いっぱい。
22/05/24 23:54:55 cADfl0Dk0.net
>>532
朝じゃないよ,昼からだよ(笑)
542:名無しさん@お腹いっぱい。
22/05/25 07:20:56 W3iKtSQ90.net
どっちでもいいけど、頭おかしい自覚はしておいた方が 笑
543:名無しさん@お腹いっぱい。
22/05/25 10:29:01 wWoQec/h0.net
ID:5b9IkS690、uwTIOOOb0、W3iKtSQ90
こいつらは悪口しか言えないやつだな。
社会問題になってる、ネットで攻撃衝動を発散するしかない御可哀想な奴らだ(笑)
544:名無しさん@お腹いっぱい。
22/05/25 11:57:42 i/AJgx3d0.net
どっちもバレバレだよ
545:名無しさん@お腹いっぱい。
22/05/25 13:13:20 f5GblV+t0.net
>>535
性格悪そう
546:名無しさん@お腹いっぱい。
22/05/25 13:14:26 3nRqErRs0.net
>>512
で、
>手動でPDFに出力する透明テキストのフォントサイズを全ページ一括で変更したいのですが,そのような設定は可能でしょうか.
は解決したの??
547:名無しさん@お腹いっぱい。
22/05/25 13:17:26 wWoQec/h0.net
>>538
してません(:_;)
悪口書き込むやつと、それへのレスだけです。
トホホですね(´;ω;`)
548:名無しさん@お腹いっぱい。
22/05/29 09:17:29 dezXzM1d0.net
これが革命って奴やな。
549:名無しさん@お腹いっぱい。
22/05/29 13:00:28 qWf9pQE10.net
革命詐欺w
550:名無しさん@お腹いっぱい。
22/06/01 12:57:24 ktMvq3Ub0.net
511です。
バージョン16にアップデートするとフォントサイズが小さすぎる問題は解決していました。表示上のサイズと透明テキストのサイズはほぼ一致してます。
551:名無しさん@お腹いっぱい。
22/06/18 20:26:54 2jCbEwjL0.net
>>498
そりゃ当たり前
PCなんて使えない高齢者がいっぱいいるんだから
そのためのOCRだよ
552:名無しさん@お腹いっぱい。
22/06/19 06:08:07 nQI82VN80.net
手書きを補正してあってんのかあってないのかわかんないデータが完成するより普通に入力した方が早いと思う
553:名無しさん@お腹いっぱい。
22/06/19 08:00:38 SMFRVfVR0.net
普通に入力してもtypoはあるし
校正抜けは自分で入力したもののほうが起こりやすいという罠もある
554:名無しさん@お腹いっぱい。
22/06/22 20:32:48 aWOqOAmW0.net
仕事で手書きの帳票の入力をしているのでOCRを使って自動化したく、いくつか無理のものを試してみたのですが上手くいきませんでした
入力内容は型番と数字だけなので、型番の登録とかができれば精度も上がると考えているのですが、いいOCRツールがあれば教えてください
555:名無しさん@お腹いっぱい。
22/06/22 22:38:51 cbR9tsx10.net
ないんだな、これが(画像略)
ほんとにみんなそれを欲しがってると思うよ
556:名無しさん@お腹いっぱい。
22/06/23 07:46:57 F2BXam9K0.net
>>546
>>480 のリンク先はみた?
557:名無しさん@お腹いっぱい。
22/06/25 00:23:31 M5gx6zVR0.net
>>546
ソリューションとして何百万円で売ってるようなものだからなあ。
558:名無しさん@お腹いっぱい。
22/06/25 03:38:17 0PVpsHFx0.net
>>546
手書き文字は、かなり難易度が高い。
字体に個人差が大きいのと、文字ごとの区切りが取りづらい
型番がアルファベットなら、学習データを用意すれば可能性はあるけど、
本質的に1とかIとかlを手書き文字から読み取るのは無理ゲーなので
近い登録型番を引っぱってくるとかの方がよさそう。
559:名無しさん@お腹いっぱい。
22/06/25 11:36:36 XawCiBfQ0.net
達筆こと汚い殴り書きすら判読できるOCRキボンヌ
560:名無しさん@お腹いっぱい。
22/06/26 00:59:41 u0oZCNU/0.net
20年くらい前に
東芝が郵便局に納入してる手書き宛名OCRが有能という話聞いたのを思い出したので
ぐぐてみたらこんなのでてきた
www.it-innovation.c
o.jp/wordpress/wp-content/uploads/2021/08/Session6_AAcon2_2021
0827_tdslj.pdf
手書き「IOデータ」がエロデータに変換される恐怖・・・
561:名無しさん@お腹いっぱい。
22/06/26 13:06:43 MrxyXubs0.net
郵便局でバイトしてたときの、宛名OCRの精度の感覚は
フォントだと100%、手書きで95%くらい当たってた
手書きだと3-10とかを漢数字で縦書きされると辛い様子(三が12と見分け付かない)
あと、達筆は無理なので弾かれてたな
562:名無しさん@お腹いっぱい。
22/08/06 23:14:15.46 KxBYYb3L0.net
>>480 の後半部分がだいぶ進んだ
URLリンク(i.imgur.com)
もうちょい1とかが認識できるといいんだけど
563:名無しさん@お腹いっぱい。
22/11/11 16:50:50.83 wJwec+Hh0.net
ユーザーローカルの無償のOCRはどうですか?
564:名無しさん@お腹いっぱい。
22/11/11 18:04:01.27 rp6GMXxX0.net
手書き文字をgoogle driveにアップしてドキュメントに変換するとOCRされる
わりと認識されるようだ
565:名無しさん@お腹いっぱい。
22/11/16 01:13:33.38 S5so+53A0.net
凸版印刷、明治期から昭和初期の手書き文字を
解読するAI-OCRを日本で初めて開発
URLリンク(www.toppan.co.jp)
URLリンク(www.toppan.co.jp)
566:名無しさん@お腹いっぱい。
22/11/26 08:06:32.03 D8kis3AF0.net
>>557
どうせソリューション�
567:ナ1000万円以上
568:名無しさん@お腹いっぱい。
22/12/22 04:52:11.23 D7BYsnDs0.net
OCRかけたPDFで、Googleドライブで閲覧するときは、文字選択も検索もできるんだけど、ドライブから他のiPadアプリへインポートすると、文字選択も検索もできなくなります。
対応策知ってる方いたら教えてもらえないでしょうか。
569:名無しさん@お腹いっぱい。
22/12/25 14:05:23.99 UNDWLpRR0.net
バージョンが違うとかじゃね?
570:名無しさん@お腹いっぱい。
23/01/05 23:31:26.85 /v8QR8d30.net
>>509
URLリンク(twitter.com)
NDLOCRについては国立国会図書館月報2022年11月号の特集記事でも紹介しています。
(deleted an unsolicited ad)
571:名無しさん@お腹いっぱい。
23/01/08 20:04:39.43 5uNVO8JT0.net
スマホのグーグルレンズだとかなり正確なのに
PCの画像取り込みでグーグルドキュメントだとまったく認識できないのはなぜかわかりますか?
572:名無しさん@お腹いっぱい。
23/01/09 20:16:16.65 2gSKg0450.net
>>561
>>509
自炊技術総合スレでこれに関していろんな人が議論しているけど、結局外部の人間が使いこなすのは至難であると言う状況
日本の it 開発に関する公金の使い方は最悪
573:名無しさん@お腹いっぱい。
23/01/09 20:31:05.78 +xJlSjJo0.net
余計なGUI作っで金と取るより、遥かにいいよ。
Python あれば コマンドラインで動くんでしょ。
十分だよ。
574:名無しさん@お腹いっぱい。
23/01/09 20:47:53.13 2gSKg0450.net
>>564
Python でも動かし方がわからないみたいよ
動かし方であーだこーだ時間を使うよりは有料でも使いやすいインターフェースがあった方がいい
こういうのは所詮道具だから
575:名無しさん@お腹いっぱい。
23/01/11 20:40:11.59 RZPLrb1r0.net
規制された?
576:名無しさん@お腹いっぱい。
23/01/15 15:43:45.29 d/Jt3FpO0.net
>>562
多分AIチップの有無
577:名無しさん@お腹いっぱい。
23/01/16 10:13:41.53 ARaKc39v0.net
制限された?
578:名無しさん@お腹いっぱい。
23/01/17 08:02:43.09 JLVUHZYJ0.net
制限きつくなった
579:名無しさん@お腹いっぱい。
23/01/19 20:26:45.79 WqtzRSbq0.net
TEST
580:名無しさん@お腹いっぱい。
23/01/21 01:51:12.94 OCOnSa520.net
>>562
スマホのカメラのレンズは顔認識にはじまり、そのレンズ通して画像(映像)からフォントやらワンタップで楽々と認識+特定できるようになるかもしれない。
既にある気もするけど。googleとかやりそうだし。
AIと言うと、KRITA Paintって無料(フリーウェア)のペイントアプリで超簡単お手軽に消したい任意の人や車をこの画像みたいに消せるのがなんだかすごい。
コラージュには欠かせないツールかもしれない。
URLリンク(i.imgur.com)
GIGAZINEで知った。
581:名無しさん@お腹いっぱい。
23/01/23 09:06:58.16 IEgo6gO30.net
test
582:名無しさん@お腹いっぱい。
23/01/23 18:07:45.55 uTX11U8P0.net
非破壊型ScanSnapに添付のソフトでPDFに透明テキストを付けていたが性能が悪いので
読取革命の体験版を入手して試してみた
テキストは大体正しく読み取れているが不満点2つ
・ページの枠等でゴミ文字が大量に発生
・元のPDFの画像を再エンコしてしまっている
583:名無しさん@お腹いっぱい。
23/01/23 20:37:55.46 uDMkpynR0.net
>>573
> ・ページの枠等でゴミ文字が大量に発生
たぶんページ番号とか上の方にある見出しとかを言ってると思うんだけど本文だけを領域に指定したテンプレートを使って、それを簡単認識という一種のマクロで読み込ませればいい
> ・元のPDFの画像を再エンコしてしまっている
これは何とかしてほしいよね
584:名無しさん@お腹いっぱい。
23/01/24 14:53:20.86 pgLtZU8s0.net
レスありがとうございます。「簡単認識」というのは何ですか?
読取革命15の体験版を使っています
585:名無しさん@お腹いっぱい。
23/01/24 14:55:11.57 pgLtZU8s0.net
読取革命15の体験版を使ってみて不具合と思うこと
1. 複数のjpgをいれたフォルダーを用意する
2. 「画像ファイルを開く」でそのフォルダーを指定して「画像ファイルを追加して読み込む」に
チェックを付けた上でCtrl+Aで全ファイルを選択して開く
3. 複数ページとして読み込まれる
4. ところが「レイアウト」も「認識」も「保存」も最後のページしか処理できない
現行バージョン16ではどうですか?
586:名無しさん@お腹いっぱい。
23/01/24 20:12:23.68 JDh+ktVS0.net
ちょっと何言ってるかわからない
587:名無しさん@お腹いっぱい。
23/01/24 20:24:39.65 pgLtZU8s0.net
では逆に質問させてもらえますか
1ページが1つのjpgで、ファイル名に連番ついているものが多数ある場合
それらをまとめて読み込んでまとめてOCR処理することはできますか
588:名無しさん@お腹いっぱい。
23/01/24 21:23:07.42 ea8a85HJ0.net
15で、すべてのページを選択して、認識など順番に処理をしてくれている
左に並んでいる取り込まれた画像は選択された状態になっているのか
なっているなら、体験版の制限かもしれない
589:名無しさん@お腹いっぱい。
23/01/24 21:42:05.66 cUHZCYDc0.net
>>578
マニュアル読んでないならとりあえず『かんたんモード』使っとけ
メニューバー>表示>かんたんモードへ>入力>認識>保存
>>575
何処か分からないならF9キー押せ
そこに前もって処理手順を登録しとけば実行ボタン押すだけで全部やってくれる
590:名無しさん@お腹いっぱい。
23/01/24 22:13:55.01 pgLtZU8s0.net
>>579
取り込んだ後左に並んでいる画像は全部選択された状態になっています
Ctrl-Aを使って全部選択し直してもやはり最後のページしか処理できない
制限しているのか体験版だけの不具合かわからないけど動作確認はあきらめた
591:名無しさん@お腹いっぱい。
23/01/24 22:26:30.24 N6mW9c+00.net
>>575
体験版は使ってないんで分からないけど16正規版ならば、メニューで、認識→簡単認識、で設定画面を呼び出せる。
領域をカスタム設定して保存し、それをテンプレートとして簡単認識内に登録すれば後は自動で全てのページをそのテンプレートでやってくれる。
領域ごとの設定ではできるだけ自動認識を使わず、縦書きとか横書きとか半角とか全角とか細かく指定する方が認識が良い
一つの領域内に横書きと縦書きが混在した場合にはテンプレート処理できないので、1回簡単に意識を実行させた後、少数の例外ページだけ手作業でレイアウトを修正する
575の最後のページしか認識しない問題は画像ファイルを読み込ませた後左側のサムネイルページで最後のページしか選択していないことが原因だと思う。読み込み後コントロール A で全選択すれば全てのページの処理をしてくれる
簡単モードじゃなくて標準モードを使うこと
こんなとこですかね
592:名無しさん@お腹いっぱい。
23/01/24 22:28:05.47 N6mW9c+00.net
続き
Amazon のレビューでかんたん認識についての説明がありましたので転載しときますね
五点目は、「かんたん認識」機能です。
文庫本や単行本で、レイアウトが単純なものは、この機能を使うことで、かなりの短時間で文字認識を完了させることができます。
この機能は、ひとつの認識レイアウトをテンプレートとして保存して、「かんたん認識」機能で全ページに適用するというものです。
例えば、通常、文庫本の場合、見開きの上下端の部分に、ページ数や書籍名・章題などの文字情報が含まれています。この部分に関しては、基本的に文字認識する必要がない無駄な情報なのですが、自動で文字認識させると、この部分まで認識してしまいます。
「かんたん認識」機能を使えば、あらかじめ、上下の端の部分を認識しないレイアウトをテンプレートで設定しておいて、そのレイアウトに従って一度、全ページを文字認識してくれます。
もちろん、挿絵や図表があるページに関しては、認識がグチャグチャニなるので、その後で修正が必要になりますが、いちいち、手作業で無駄な認識部分を消す必要がありません。
また、レイアウト認識にテンプレートを使うことによって、レイアウト解析の時間も不要になりますから、文字認識の処理が速くなります。
テンプレートは、書籍ごとに作った方が、精度が高いので、その点はひと手間はかかりますが、それ以上にメリットが大きいと思います。
上手に使えば、精度の高い認識結果を得るのに、300Pの本で30分くらいですみます。(そのうち手作業は10分程度)≫
593:名無しさん@お腹いっぱい。
23/01/24 23:02:35.33 pgLtZU8s0.net
>>582
>576の最後のページしか認識しない問題は画像ファイルを読み込ませた後左側のサムネイルページで最後のページしか選択していないことが原因だと思う。
「標準モード」の「ファイル」の「画像ファイルを開く」を使いました
580に書いたように左側の画像サムネールは全部選択状態になっています
体験版の制限事項にはそんなことは書かれていないので体験版の不具合かな
594:名無しさん@お腹いっぱい。
23/01/24 23:11:41.54 pgLtZU8s0.net
体験版も無いのでバージョン16のメニュー構成がどうなっているのかはわかりませんが、
バージョン15の「標準モード」の「ファイル」の「画像ファイルを開く」と同等の方法で複数ファイルを
一括処理をできるようになっているのでしょうか
595:名無しさん@お腹いっぱい。
23/01/24 23:14:09.31 JDh+ktVS0.net
入門ウィザードの話なのか、かんたん認識の話なのか、画像ファイルを開くからの話しなのか、それら以外なのか
596:名無しさん@お腹いっぱい。
23/01/24 23:17:36.44 JDh+ktVS0.net
画像ファイルを開くからのだったら手順を踏まないと一括の認識変換はできないぞ
597:名無しさん@お腹いっぱい。
23/01/24 23:23:00.30 JDh+ktVS0.net
まずは入門ウィザードでやってみろ
598:名無しさん@お腹いっぱい。
23/01/24 23:26:48.79 N6mW9c+00.net
>>585
それとは違う
アマゾンのレビューはバージョン15のレビューなので、15でも「かんたん認識」はあると思う。レビューで簡単認識の機能は想像できるでしょう
もう少し詳しく知りたかったら15のマニュアルは公開されてると思うんでやり方探してみて
16の場合でも体験版はある筈。私は実際それで試してから購入したから
体験版というより使える期間に制限があるだけで機能制限はなかったと思う
599:名無しさん@お腹いっぱい。
23/01/24 23:35:17.61 pgLtZU8s0.net
どんな方法でもいいですけどバージョン16において、
1ページが1つのjpgで、ファイル名に連番が付いているような多数ファイル(ページ)がある場合
それらをまとめて読み込んでまとめてOCR処理することはできますか
というのが質問です
少なくともバージョン15の体験版ではできない
600:名無しさん@お腹いっぱい。
23/01/24 23:36:01.14 pgLtZU8s0.net
>>589
16の体験版は入手できないでいる
URLリンク(faq.sourcenext.com)
15の体験版はインターネットアーカイブの古いページから何とか見つけ出したもの
601:名無しさん@お腹いっぱい。
23/01/24 23:50:01.11 JDh+ktVS0.net
入門ウィザードだ
602:名無しさん@お腹いっぱい。
23/01/25 00:03:44.68 DyKQ5Whb0.net
入門ウィザードは15の体験版で既にやっているがやはり最後のページしか処理されない
603:名無しさん@お腹いっぱい。
23/01/25 00:12:50.70 GkG6ZGoO0.net
>>590
答えはイエスだよ
バージョン16の体験版はなかった。試用期間というのは私の記憶違いで、返品が可能という条件だった。
私の場合はバージョン14を使っていて不満足なところがあったのでサポートに問い合わせたところバージョン14のサポートは既に終わっており回答できないが、バージョン16を勧められバージョン16でも満足する機能がなければ返品に応じるということだった。バージョン16で満足する機能があったので返品はしなかった。
バージョン16のマニュアルはここにあるよ
URLリンク(ftp.sourcenext.co.jp)
589ができればいいなら購入したほうが早いんじゃない?かんたん認識であなたの不満点は解決されると思うから
604:名無しさん@お腹いっぱい。
23/01/25 00:14:58.98 qoKngNmd0.net
そうか
俺の体験版15では全ページ一括OCR出来てるから何かを間違えてるんだろうな
605:名無しさん@お腹いっぱい。
23/01/25 00:45:52.30 qoKngNmd0.net
そう言えば設定によっては
レイアウトや認識結果を削除とかなんかしたあと
もう一度読み取ろうとしても読み取ない不具合か仕様あったようななかったような
606:名無しさん@お腹いっぱい。
23/01/25 00:46:29.68 qoKngNmd0.net
だいぶ前のあやふやな記憶
607:名無しさん@お腹いっぱい。
23/01/25 02:54:28.10 GkG6ZGoO0.net
>>590
かんたん認識はマニュアルの121ページ
608:名無しさん@お腹いっぱい。
23/01/25 08:45:03.18 DyKQ5Whb0.net
>>594
ありがとう
16のマニュアルを見たが62ページ(PDFの63/177)に「複数ファイルを指定する場合」と
書かれているが15のマニュアルにも同じことが書かれている
本来であればその方法でできるはず
15と16は比較表を見るとスペックにほとんど変更がないから15の体験版でできなければ16でも
怪しいと思い質問したした次第です
609:名無しさん@お腹いっぱい。
23/01/25 09:06:59.69 GkG6ZGoO0.net
できなければ製品として成立しないんだからできる。体験版の機能制限か、アーカイブがこわれているかのどちらかでしょう。
610:名無しさん@お腹いっぱい。
23/01/25 11:24:59.54 DyKQ5Whb0.net
複数のjpgを無劣化で1PDFに作れるから体験版でもOCRに掛けることはできる
しかしJPGを1つ読み込んだ時とそのJPGから作ったPDFを読み込んだ時とで比較すると
透明テキスト付PDFの品質が違っていた(どちらも再エンコであることは同じだったが)
そこで16を注文をした(435のように体験版を使い続けることもできるんだが)
まともな体験版を出せよ
611:名無しさん@お腹いっぱい。
23/01/25 11:36:38.79 6QPp+WbY0.net
パナソニックは15で開発終了してるんだな
ソースネクストにまともな開発能力ないしまあ残当
612:名無しさん@お腹いっぱい。
23/01/25 12:36:18.41 GkG6ZGoO0.net
なんだかんだ言っても日本語縦書きをまともに処理できるOCR ソフトは読取革命しかないように思うんだけど、他にある?あったら教えて
Googleやndlは透明テキスト処理ができないんで対象外ね
613:名無しさん@お腹いっぱい。
23/01/25 15:18:16.75 DyKQ5Whb0.net
>>603
スキャナーに付いて来たPower PDF Standardを今まで使ってきたが縦書きでも取れるし
一応だが実用にはなっていた
「サンプルzip」というファイルをアップしてみた。3つファイルが入っている
URLリンク(20.gigafile.nu)
・某所のOCRテスト用サンプル。元はPNGだが「画像梱包」で無劣化PDF化したもの
・読取革命15体験版で透明文字付PDFに保存したもの
・Power PDF Standardで検索可能化
読取革命は画像を再エンコするのでファイルサイズがかなり大きくなってしまっている
Power PDF StandardはPDF内の画像ファイルを全く変えないのがいいところ
614:名無しさん@お腹いっぱい。
23/01/25 15:46:40.80 GkG6ZGoO0.net
>>604
ファイルサイズが大きくなったらアクロバットのファイルの最適化またはファイルの縮小をかけると劇的にサイズが小さくなるよ。
画質はほとんど劣化しないけれどよく見ると文字のエッジが微妙に変化しているので自分は2種類の方法でファイルサイズを小さくした後実際に目で見てファイルサイズの小ささと画質の良さのバランスが良い方を残している。
615:名無しさん@お腹いっぱい。
23/01/25 16:08:45.17 DyKQ5Whb0.net
PDFが対応している画像についてはそれを勝手に書き換えないのがベスト
技術的に難しいことではないはず
しかしパナソニックからソースネクストに変わってしまったら今後あるかもしれないバージョンアップでも
改善されることは絶望的だね
616:名無しさん@お腹いっぱい。
23/01/25 18:10:59.18 nVR442uK0.net
ずっとe.typistの高圧縮PDF(MRC圧縮)にしてるわ
iPadで読むには十分。つか文字のエッジはガタつき気味だけど、クッキリとするから読みやすい。
AcrobatのClearScanにしてたときもあったけど、やたらと読み込みが遅いのが出来たことがあって止めた
617:名無しさん@お腹いっぱい。
23/01/26 12:36:37.20 COtm4ckg0.net
余所でやってください。
618:名無しさん@お腹いっぱい。
23/01/26 17:20:39.24 nsE1OjFq0.net
久しぶりにeTypistとFineReaderを使ったら、あまりのポンコツぶりに驚いた。
PDFなんてAcrobat DCの方が認識率いいぞ。
みんなが知らないと思われるxdw文書もDocuworksの方が認識率が良くて驚いた。
619:名無しさん@お腹いっぱい。
23/01/26 18:29:58.68 bNrtAqo/0.net
テスト
620:名無しさん@お腹いっぱい。
23/01/27 16:14:23.09 2XDvwiTP0.net
読取革命の「PDFを解析して入力」というものは何に使うためにあるんだろうか
透明文字付PDFの誤認識文字を後から直すためかとも思ったが
直して保存すると画像文字と透明文字との位置が違ってしまうし
621:名無しさん@お腹いっぱい。
23/01/27 17:17:29.64 CmzK49I30.net
PDFを入力してもunicode文字が全部下駄文字になってしまうんだよな
20年間unicode化せずにやって来て
今更対応させる体力も無くソースネクストに丸投げして終了
622:名無しさん@お腹いっぱい。
23/01/30 16:10:52.67 HCAjqo0j0.net
読取革命においてPDFから無劣化でJPG等を取り出せる場合にはPDFを開くのではなく
取り出した画像ファイルを(複数)開く方がよいようだ
603の例で言うとサンプルの元のPNGは462x412ピクセル
それを無劣化PDFにして読み込むと1925x1716ピクセルのJPGに変換されてしまう(300dpi
の入力設定の時)
だからOCR後の透明文字付PDFのサイズも大きくなってしまうし2回エンコードされるから
画質も劣化する
どういう計算根拠でそのサイズに拡大しているのかは不明
PDF以外の画像ファイルを開いた時にはサイズが変更されることはない
623:名無しさん@お腹いっぱい。
23/01/31 06:21:19.62 WKam88fi0.net
>>613
単にPDFがweb閲覧用に減量化済みの低解像度なものだからじゃないの?
そのサンプルPDF内のPNGは72dpiだから300dpiに変換するとそのサイズになる
300/72*462 = 1925
300/72*412 = 1716.666…
624:名無しさん@お腹いっぱい。
23/01/31 17:27:31.67 WvcTDH8i0.net
計算はその通りですね
PNG形式ファイル自体にはdpiは指定できずそれを「画像梱包」のデフォルトでPDF化したら
72dpiのPDFが作られたようでした
試しに「画像梱包」で300dpiを指定してPDF化したらそれを開いて読取革命で作成した透明文字付
PDF中にPNGとほぼ同じピクセル数のJPGが作られていた(ファイルサイズも小さい)
625:名無しさん@お腹いっぱい。
23/02/01 10:23:43.08 D6WMl7M10.net
読取革命の不便な点・・・・
dpiが設定されていないファイルを複数まとめて開いた時にページ一覧のCtrl+Aで全部のファイルを選択
してもまとめて「解像度の設定」をできず1ページずつ設定しなければならない
事前に何かツールを使って対象ファイルにまとめてdpiを設定しておけばよいのだけれど
626:名無しさん@お腹いっぱい。
23/02/01 15:46:37.87 NpVHOxya0.net
>>163
オタクは気持ち悪いなら規制してほしいの?寂しいの?
627:名無しさん@お腹いっぱい。
23/02/01 15:46:40.86 o27UQapf0.net
>>415
過度に攻撃的な発言では通らない
628:名無しさん@お腹いっぱい。
23/02/01 15:46:41.50 DGJIob8I0.net
>>159
まだ2回なのに心臓の調子悪いんだがなんで品評会がなんJを自民倒すのが目的の連中がフェミ的な装いでっていう住み分け
629:名無しさん@お腹いっぱい。
23/02/01 15:46:42.46 o27UQapf0.net
>>59
配信者程度なら単なる内輪ノリなんじゃないのノリなんだろ
630:名無しさん@お腹いっぱい。
23/02/01 15:46:42.95 3udZnQSa0.net
>>137
ここの奴らは全方位に喧嘩売るスタイルなん
631:名無しさん@お腹いっぱい。
23/02/01 15:46:43.19 QFgq0UQN0.net
>>186
俺はダッピも叩くし言葉狩りフェミも叩くそして表現の自由を唱える人間�
632:ヘかんたんに政府批判の自由を主張するのはナンセンスだわ
633:名無しさん@お腹いっぱい。
23/02/01 15:46:43.97 pVtVzfob0.net
>>450
明確なスポンサーみたいなのはしゃーないカスが口出して話になる相手じゃない
634:名無しさん@お腹いっぱい。
23/02/01 15:46:45.72 gvbk18Bb0.net
>>21
なんか居着いてるよな???
635:名無しさん@お腹いっぱい。
23/02/01 15:46:49.58 OgAfQ5SI0.net
>>231
ちょっと言いすぎたゴメン~くらいにしか夢見れんクソ雑魚弱者男性煽って女叩きさせてくれ
636:名無しさん@お腹いっぱい。
23/02/01 15:46:52.94 6kKyI80L0.net
>>373
なるたけ正論を言うのはそういう層だよな
637:名無しさん@お腹いっぱい。
23/02/01 15:46:54.44 HQ2yQocM0.net
>>379
それ相手がイケメンじゃないと面白くないっていうセンスがというか育ち悪そう
638:名無しさん@お腹いっぱい。
23/02/01 15:46:56.23 vDh1NJpi0.net
>>304
これが当たり前なんだよな今回こそ自民党負けると本気で思っていることの言ってるだけでおもろないな
639:名無しさん@お腹いっぱい。
23/02/01 15:46:56.61 gAmWCN6a0.net
>>88
重症化はせずワクチン接種者のほうが数字は多くなるかな一個目があってるや
640:名無しさん@お腹いっぱい。
23/02/01 15:46:59.51 6TlAKEg00.net
>>298
なんかあったんだよな
641:名無しさん@お腹いっぱい。
23/02/01 15:47:00.33 6TlAKEg00.net
>>399
その前提条件を共有してねーな
642:名無しさん@お腹いっぱい。
23/02/01 15:47:03.73 kriD7p+W0.net
>>287
当時30代~40代ここ主力層40代~60代ってことは
643:名無しさん@お腹いっぱい。
23/02/01 15:47:04.52 v3rSe3Av0.net
>>79
そいつは言葉をぼやかすことで自分を守ってるだけのインチキだしなんで知恵袋はBBAばっかだと思ってんの?
644:名無しさん@お腹いっぱい。
23/02/01 15:47:06.45 JSwILUjZ0.net
>>196
明らかに女性蔑視的な意識を持っているという点が
645:名無しさん@お腹いっぱい。
23/02/01 15:47:14.31 EiWeQjiH0.net
>>331
前提としてイジリだからいいなどとは言ってんだ?
646:名無しさん@お腹いっぱい。
23/02/01 15:47:16.37 N9eOp+yy0.net
>>24
なんだわたしじゃないの?🤔
647:名無しさん@お腹いっぱい。
23/02/01 15:47:16.41 dxED2bM00.net
>>238
・LGBTは声だけデカい詐欺師紛いのやつが増えすぎたんだよ
648:名無しさん@お腹いっぱい。
23/02/01 15:47:21.36 vD1IRxbb0.net
>>168
どの分野でも素人に毛が生えた程度も知らないなこの男
649:名無しさん@お腹いっぱい。
23/02/01 15:47:23.29 10zhXYvF0.net
>>199
まぁお互い様だなネット社会に引きこもって日本時間に合わせて生活しているジェームスですよろしく
650:名無しさん@お腹いっぱい。
23/02/01 15:47:24.44 JlDpbEP+0.net
>>294
ワイも昔突き落とされたわいやそんなのどうでもいいわけないでしょ
651:名無しさん@お腹いっぱい。
23/02/01 15:47:26.85 ho4QJzAV0.net
>>61
加藤純一とかコレコレ好きですっていってるようなフェミって大概ツイフェミのことだ
652:名無しさん@お腹いっぱい。
23/02/01 15:47:42.44 bzKu1I5H0.net
>>6
天動説が採用されたから大丈夫だと思ったんだよ
653:名無しさん@お腹いっぱい。
23/02/01 15:47:42.59 JBvqyuSy0.net
>>228
なんでここを政治板だと思ってないとここまで言えんぞ
654:名無しさん@お腹いっぱい。
23/02/01 15:47:44.24 m3VsX+2R0.net
>>140
俺が名前聞いた事がない
655:名無しさん@お腹いっぱい。
23/02/01 15:47:48.72 p6zCo2Ok0.net
>>154
少しくらい仲良くするのはナンセンスなように虚カスでは?
656:名無しさん@お腹いっぱい。
23/02/01 15:47:53.06 Ib9D+sCE0.net
>>241
鏡を見ろと言いたい所だがこいつは認めんうえにしつこく蒸し返すからゴミクズなんやな
657:名無しさん@お腹いっぱい。
23/02/01 15:47:59.64 4E6fDqc/0.net
>>445
どれがいけなかったんじゃ?
658:名無しさん@お腹いっぱい。
23/02/01 15:48:00.44 4E6fDqc/0.net
>>92
今の30~50代ってことかな
659:名無しさん@お腹いっぱい。
23/02/01 15:48:02.55 J5ZTk60q0.net
>>399
キャンプ場じゃなくてハゲだったらセーフやったな
660:名無しさん@お腹いっぱい。
23/02/01 15:48:04.23 EOKCtPbw0.net
>>431
ソシャゲ界隈で使われてんだよなあ
661:名無しさん@お腹いっぱい。
23/02/01 15:48:07.36 SGCUtWas0.net
>>114
駄目だ虚カスは何屋さんなんですね
662:名無しさん@お腹いっぱい。
23/02/01 15:48:09.42 I/ZsHeKR0.net
>>14
なめやがってというAAを添えていたのか?
663:名無しさん@お腹いっぱい。
23/02/01 15:48:21.61 gQBMZXO00.net
>>377
肌の色が一番わかりやすい例ではあるけど今はよりナイーブ
664:名無しさん@お腹いっぱい。
23/02/01 15:48:23.29 jHhBizY20.net
>>293
岡村がモテないと思ってたのが原因だな
665:名無しさん@お腹いっぱい。
23/02/01 15:48:32.11 Br8Pge1y0.net
>>435
無職でもホームレスでも人権はあるから大丈夫だよ
666:名無しさん@お腹いっぱい。
23/02/01 15:48:35.42 7ufN3WsU0.net
>>263
そんなことを言っても確実に大問題になるw
667:名無しさん@お腹いっぱい。
23/02/01 15:48:47.81 gUSwtnEL0.net
>>166
これが正しさの議論から逃げようとしてる
668:名無しさん@お腹いっぱい。
23/02/01 15:49:12.69 KtHgkpSV0.net
>>113
その延長線上で使ったんだろうが配信で言ってたから核廃棄に同意したけどそんなタマじゃないか?今や唯の犯罪者やもんな
669:名無しさん@お腹いっぱい。
23/02/01 15:49:20.68 lcfdBlwS0.net
>>190
世論調査でも立憲共産党の失望離れだろうなぜひ集めてバトルさせてみても
670:名無しさん@お腹いっぱい。
23/02/01 15:49:21.38 9F3rtUd+0.net
>>41
腕前的には規制するに決まってんだろうけど絶対に流されるなよ
671:名無しさん@お腹いっぱい。
23/02/01 15:49:31.76 QHe/8kPD0.net
>>200
ちょっとフェミっぽいこと言ってきたんだ
672:名無しさん@お腹いっぱい。
23/02/01 15:49:32.20 YzA8t+PG0.net
>>233
そのために経済を犠牲にするのが歴史から見ても普通は自衛隊日報偽造やGDP改竄はどうでもいいですわ
673:名無しさん@お腹いっぱい。
23/02/01 15:49:41.34 PYhaGyXX0.net
>>149
APEXは喋りだけじゃ固定つかんが実力があれば違ったのかもしれないじゃない
674:名無しさん@お腹いっぱい。
23/02/01 15:49:49.06 zJIjfKys0.net
>>370
増悪をエネルギーにしてた芸人いたなー
675:名無しさん@お腹いっぱい。
23/02/01 15:49:49.46 KUsdIpu80.net
>>172
めっちゃオコじゃんだいたい小選挙区なんだな
676:名無しさん@お腹いっぱい。
23/02/01 15:49:50.48 38GYP0tU0.net
>>132
今までの発言お咎め無しなのがやたらと持て囃したんだから当たり前
677:名無しさん@お腹いっぱい。
23/02/01 15:50:10.52 pd1YBStZ0.net
>>253
自民党への求心力を高める為に敵を設定してそれを日本社会が受け入れたからとか
678:名無しさん@お腹いっぱい。
23/02/01 15:50:14.35 0hJTLZXO0.net
>>263
腐女子がカッコいいとでも思っていたとか
679:名無しさん@お腹いっぱい。
23/02/01 15:50:15.57 6XrO12ZK0.net
>>435
本人に差別的な意味ではないよ
680:名無しさん@お腹いっぱい。
23/02/01 15:50:24.31 1K7oAtvR0.net
>>311
本当にシャレにならんわあれ
681:名無しさん@お腹いっぱい。
23/02/01 15:50:38.47 20ORKs/x0.net
>>429
何もしててあーそう言えばええやんなんでソロでいくんや?
682:名無しさん@お腹いっぱい。
23/02/01 15:50:47.72 OfWb1xj50.net
>>249
そうしないと明言してるんか?
683:名無しさん@お腹いっぱい。
23/02/01 15:50:48.00 aqverq2H0.net
>>235
昔みたいに趣味の延長線上ならまだ許されてたんだろうな
684:名無しさん@お腹いっぱい。
23/02/01 15:50:52.68 YE2cKFib0.net
>>177
叩いてるのはどうかと思うとダサすぎるな
685:名無しさん@お腹いっぱい。
23/02/01 15:50:54.04 FE21hNAY0.net
>>95
ワクチンのおかげつってるのに契約続けてたのか?
686:名無しさん@お腹いっぱい。
23/02/01 15:51:11.53 SSPmLApD0.net
>>74
動画見たらおばさんがず~っと発狂して長文多レス女叩きしてるから遅いとしか
687:名無しさん@お腹いっぱい。
23/02/01 15:51:12.71 kIeBSugG0.net
>>411
ほんとジャップってのはその手の書き方が
688:名無しさん@お腹いっぱい。
23/02/01 15:51:20.67 5E8q91Yd0.net
>>431
民主党も原発の時の方がいいと思うが
689:名無しさん@お腹いっぱい。
23/02/01 15:51:30.15 UEnGtcux0.net
>>97
悪魔扱いはされてたのに
690:名無しさん@お腹いっぱい。
23/02/01 15:51:32.66 DX6yzGfE0.net
>>421
居心地を悪くして移住してもらうというのが事実なので覚えておいてくださいね
691:名無しさん@お腹いっぱい。
23/02/01 15:51:35.13 rd/L5L3P0.net
>>432
でもそれが前提になってんだろうか
692:名無しさん@お腹いっぱい。
23/02/01 15:51:45.48 QWjxVjOt0.net
>>111
虚カス信者になるようなの左右関係なく誰も相手にしないだろ
693:名無しさん@お腹いっぱい。
23/02/01 15:51:46.33 b6jFe6IQ0.net
>>210
まさか公文書改竄が俺のレスを踏まえるつもりならと書いてんのに
694:名無しさん@お腹いっぱい。
23/02/01 15:51:49.35 v3DjvaMl0.net
>>406
揶揄でも超えちゃいけないのかredbull
695:名無しさん@お腹いっぱい。
23/02/01 15:51:49.90 CkbAKzU30.net
>>156
じゃあ真のフェミニズムとは何も共有できてない
696:名無しさん@お腹いっぱい。
23/02/01 15:51:50.67 1979Ctfv0.net
>>266
プロなんてもうできないだろうと思ったけど
697:名無しさん@お腹いっぱい。
23/02/01 15:51:54.24 Z1aoZoZj0.net
>>140
自分は見た目煽りはしたことないこいつらと同じ臭いのコメント多いんだもん
698:名無しさん@お腹いっぱい。
23/02/01 15:52:25.34 5y5HxiYu0.net
>>366
正しいからと言っているという点が
699:名無しさん@お腹いっぱい。
23/02/01 15:53:01.59 bDNE43hL0.net
>>209
どしたん話聞こうとしないのが当然なのにジャップではなく
700:名無しさん@お腹いっぱい。
23/02/01 15:53:18.93 7ts5835c0.net
>>76
eスポーツ以外のプロスポーツでも差別だから規制するようになってしまってくる狂った状態なんだよ
701:名無しさん@お腹いっぱい。
23/02/01 15:53:21.89 YGtbBamB0.net
>>346
雑音は聞こえないようにして豚が貢ぐんだろ?お前らは勝手に生えてきたし国民もそれに影響されててもリベラルも公文書改竄を悪として徹底調査して
702:名無しさん@お腹いっぱい。
23/02/01 15:53:41.70 blBSOdQO0.net
>>381
パヨクの夢をガンガン叩いて壊してきたんだろうなあ
703:名無しさん@お腹いっぱい。
23/02/01 15:53:53.47 ctKsaNbw0.net
>>281
宙に浮くおじさんいきなりお邪魔してごめんね!しに来る平和的な話の中身を理解できない感じ?
704:名無しさん@お腹いっぱい。
23/02/01 15:53:56.06 1heQF1kH0.net
>>394
誰か4chに投下してきたんだぜ
705:名無しさん@お腹いっぱい。
23/02/01 15:54:07.46 4tkYIuSy0.net
>>379
数日前にスレ立ってたけどなんJコンボで恥晒したせいだろ
706:名無しさん@お腹いっぱい。
23/02/01 15:54:42.74 ntunOmn30.net
>>63
人権ってソシャゲの公式配信でも普通に使っていたけどちゃんと読んだら
707:名無しさん@お腹いっぱい。
23/02/01 15:54:44.12 e0KaGv5M0.net
>>115
で自分が気に入らないだけなんだよなあ
708:名無しさん@お腹いっぱい。
23/02/01 15:54:46.17 EaKn7CCD0.net
>>206
ゲームキャラに使うのがおかしいのではない
709:名無しさん@お腹いっぱい。
23/02/01 15:54:48.79 jGVf7Rh/0.net
>>343
もう30なんだよ俺たちは
710:名無しさん@お腹いっぱい。
23/02/01 15:54:59.52 EvRhPqvY0.net
>>279
そうなのかと
711:名無しさん@お腹いっぱい。
23/02/01 15:55:23.95 DNfHho/40.net
>>432
ネトウヨおっさんがヤフコメの多数派てのはもう関わりがないとか言ってめっちゃ絡んで来られたわな
712:名無しさん@お腹いっぱい。
23/02/01 15:56:14.94 quVzZKO00.net
>>332
弱者男性が日本のヤバさ
713:名無しさん@お腹いっぱい。
23/02/01 15:56:22.92 e3IJkgk80.net
>>214
差別発言するけどさ流石にお仕事中は言わないがいい年こいてぶりっ子で切り抜けるのは無理だろう
714:名無しさん@お腹いっぱい。
23/02/01 15:56:23.00 zDLnkaHX0.net
>>401
入れられねえのかよ無能集団が
715:名無しさん@お腹いっぱい。
23/02/01 15:56:23.78 W75F7W3o0.net
>>167
業界特有のスラングってのはそういう層だよな
716:名無しさん@お腹いっぱい。
23/02/01 15:56:33.49 2s5C3FQp0.net
>>93
性的表現の自由を主張するのはリバティーではなく
717:名無しさん@お腹いっぱい。
23/02/01 15:56:53.62 2i+nMpts0.net
>>141
おっさん一人でぷらぷらしてんなよなってことやで
718:名無しさん@お腹いっぱい。
23/02/01 15:57:09.41 T3VNUqcu0.net
>>76
海外のリベラルはレイシストじゃなくてマニュアルな
719:名無しさん@お腹いっぱい。
23/02/01 15:57:09.92 UVjRgY7F0.net
>>64
その登山家が指してる奴が上から目線なんだい?君たちガイジだろ
720:名無しさん@お腹いっぱい。
23/02/01 15:57:41.24 2l/EihxX0.net
>>10
そもそも手術成功しても問題ないんだよね
721:名無しさん@お腹いっぱい。
23/02/01 15:57:43.12 0DCCqRvf0.net
>>273
迷惑行為しかしてねーな
722:名無しさん@お腹いっぱい。
23/02/01 15:58:21.34 9uuFCMnK0.net
>>40
まだ伸びてんのかよ・・
723:名無しさん@お腹いっぱい。
23/02/01 15:58:23.12 GUg6Dp9o0.net
>>88
野党を支持したん?
724:名無しさん@お腹いっぱい。
23/02/01 15:58:31.76 RqWKft8J0.net
>>213
何やってんだろ
725:名無しさん@お腹いっぱい。
23/02/01 15:59:15.35 UYQtOD7D0.net
>>391
口から出任せをさも当然の事実かのように他人から認められねーわけだわ
726:名無しさん@お腹いっぱい。
23/02/01 15:59:24.87 2s5C3FQp0.net
>>291
躾のなってない前後のつながりぐちゃぐちゃ専門板の糖質のほうが数字は多くなるかな一個目があってるや
727:名無しさん@お腹いっぱい。
23/02/01 15:59:54.63 Cdki6E0N0.net
>>183
会話の姿勢の問題の方がいいわけだし
728:名無しさん@お腹いっぱい。
23/02/01 16:00:20.32 tp3f1IMI0.net
>>69
性格がゴミすぎて脳と体が成長しなかったことを認めても
729:名無しさん@お腹いっぱい。
23/02/01 16:00:20.62 sP2Sm7Kt0.net
>>426
これ外国のまんさんは男相手に何を言っても何にもならないよねつう話でしかない
730:名無しさん@お腹いっぱい。
23/02/01 16:00:48.05 gWSkJcTG0.net
>>59
外からみたらどう見えるかわかってるのに気づかない日本人ヤバい!#ワクワクエイズ
731:名無しさん@お腹いっぱい。
23/02/01 16:00:53.12 V6mgJvap0.net
>>145
日本人の多くは違うんだろうがよ
732:名無しさん@お腹いっぱい。
23/02/01 16:01:05.26 wtm8dhUv0.net
>>155
中国の海水浴場かよゴブリンジャップ女は周りの目を気にしない
733:名無しさん@お腹いっぱい。
23/02/01 16:01:09.59 hrDccShC0.net
>>8
右でも左でもレスバで負けた男やぞ
734:名無しさん@お腹いっぱい。
23/02/01 16:01:13.29 yZHXAyIo0.net
>>286
今更かよ女人禁制なんてのはリベラル固有の話ではなく
735:名無しさん@お腹いっぱい。
23/02/01 16:01:16.79 3iCdZlbF0.net
>>150
てか俺もそこそこゴブリンジャップ女だから甘やかされて育ってきた差別主義者じゃん
736:名無しさん@お腹いっぱい。
23/02/01 16:01:23.10 wtvMeXX10.net
>>411
捉えられる状況でもなければ政治を変えるつもりもないんちゃう
737:名無しさん@お腹いっぱい。
23/02/01 16:01:25.90 O64h9oEI0.net
>>79
とりあえずここの自民工作員の多さやべーなその集団はw
738:名無しさん@お腹いっぱい。
23/02/01 16:01:39.60 uzgr2QNF0.net
>>10
努力したのかな?
739:名無しさん@お腹いっぱい。
23/02/01 16:02:02.67 yfILUwbZ0.net
>>125
俺が名前聞いた事ないくらいだから有名でもないんだろ…検査と隔離しかねぇわ
740:名無しさん@お腹いっぱい。
23/02/01 16:02:04.64 bmjFR3wk0.net
>>405
良い子ばかりいる空間に一人だけ真っ赤になってしまっている
741:名無しさん@お腹いっぱい。
23/02/01 16:02:35.50 7j84zE660.net
>>393
高齢化してるのかと思ってたけど
742:名無しさん@お腹いっぱい。
23/02/01 16:03:19.97 piYvJTNu0.net
>>50
公文書偽造はどうなったんだろ
743:名無しさん@お腹いっぱい。
23/02/01 16:03:32.16 Ne7Lq+RA0.net
>>42
唯一海外というか後輩みたいなもんでしょYouTube個人でやって生きていってんだよ
744:名無しさん@お腹いっぱい。
23/02/01 16:03:43.39 2MuJtZ8S0.net
>>181
やっぱり交差接種の方が絶対まともや
745:名無しさん@お腹いっぱい。
23/02/01 16:03:56.25 Gx3ev6K60.net
>>46
でも30~50代ってことか
746:名無しさん@お腹いっぱい。
23/02/01 16:04:02.21 q8fYzca/0.net
>>308
これ何で無かった事にしてるのが
747:名無しさん@お腹いっぱい。
23/02/01 16:04:35.46 JBhtcBND0.net
>>352
ちびチー牛が社外でもエライと勘違いして調子に乗ったマンコがボコボコにされるネタ作りまくったのが潰れて前までのマニュアル使い回ししかできなくなっちゃったよ
748:名無しさん@お腹いっぱい。
23/02/03 12:28:26.88 QS9ylJCv0.net
工エエェ工エエェ(゚;益;゚(゚;益;゚)゚;益;゚)ェエエ工ェエエ工
749:名無しさん@お腹いっぱい。
23/02/05 11:30:31.75 hZxF6hQl0.net
>>43
おーすげー!
耳読書するようになったら、自炊本のpdf読み上げさせたら読み上げる順番がぐちゃぐちゃなことがわかって、縦書き日本語文章のOCRの限界を知ったとこなので、こんなにうまく抽出できるならやり方知りたい。
750:名無しさん@お腹いっぱい。
23/02/06 22:36:37.31 6SFrwZrD0.net
>>739
42氏とは別者だが
win機ホストでvirtualbox越しlinuxゲスト環境での
tesseract使用の話でよければやり方説明できんでもない
メモリ8MB以上ある?
751:名無しさん@お腹いっぱい。
23/02/07 00:14:18.21 +RHuKHOQ0.net
>43書いたの自分だけど別に無理にlinuxでやる必要ないよ
当時 tesseractエンジン使ってるVietOCRが本家より妙に精度が良くて
Viet通さず本家だけで再現できないかと試行錯誤してただけ
linuxにこだわってたのは単に>40の人がwin環境じゃなかったからでwin版バイナリもある
このときのまとめは>48
当時βテスト中だったtesseract 4.0.0と tessdata_fastの言語データを使うことだった
今はアプデされてるのでもっと楽にセットアップできるのかも知れない
精度について補足すると結構フォントやレイアウト依存というか
ばっちり拾える時もあれば全くあかんときもありました、過信は禁物
752:名無しさん@お腹いっぱい。
23/02/07 12:57:45.69 c8xILm5g0.net
>>741
ありがとう
既にまとめてくれてたのに見逃してた
753:名無しさん@お腹いっぱい。
23/02/07 22:17:53.37 A6YngpKC0.net
このスレにも荒らしが湧いて、もうココもダメかなと
思ってしまったが、まだ出入りする同志がいてしかも
過去のネタも参照されてたのかと思うと、ちょっと感涙。
当時お世話になりました>>43
そんな私は>>40
754:名無しさん@お腹いっぱい。
23/02/13 18:28:43.48 0/m2nEld0.net
NDL試した。意外なことにDocuworksより少し良いくらいだった。
ポンコツのeTypistと同じエンジンだから、ゼロックスは最適化が上手ということなのかなあ?
755:743
23/02/13 18:31:49.99 0/m2nEld0.net
追記
いまみたら、ページ番号にOCR処理をしていない。
これがデフォルトなら画像のトリミング処理を省略できますねえ。
ルビを処理しないという選択できるから、文庫のOCRがはかどるねえ。
756:名無しさん@お腹いっぱい。
23/02/13 19:08:27.43 2WnAMHgF0.net
>>745
ページ番号を OCR 修理をしないくらいなら読取革命でも柱を外した長方形を領域のテンプレートとして設定するだけで対応可能なのでndlのメリットはあまり感じないです
図表が本文と混在していて本文の領域が長方形で設定できない場合でも対応できるというメリットはありますか
クレクレで申し訳ないですが経験者のご意見をお伺いしたいです
757:743
23/02/13 19:16:30.68 0/m2nEld0.net
>>746
一手間省けるだけでも相当楽になると思います。
いま別の画像にOCRかけたら、NDLの完敗だった。
Docuworksは意外に性能が良くて驚いた。
NDLが優れている方が嬉しいので複雑だなあ。
この画像をGoogel Documentで開いてみます。
758:743
23/02/13 19:21:52.22 0/m2nEld0.net
Google Drive上のpdfをGoogle Documentから開いた。
今回もDocuworksの勝ち。
docuworksは7.3でサポートが終わった古いバージョン。
新しいバージョンだともっと優秀なのかなあ?
驚きの大がっかりな結果でした。
Docuworksより誤認識が少ないことを期待したのに、期待外れもいいところでした。
759:743
23/02/13 19:26:56.37 0/m2nEld0.net
冷静に考えれば、たった2枚の画像の比較だったので、一般化はしてはいけないと思う。
文庫本はNDLの勝ち。しかし2カ所!マークを1と誤認識しなかっただけの優位性だから大差ない。
イラスト入りで変則的な段組の専門書はDocuworksの圧勝だった。
文庫ならNDLの方がトリム不要で認識率が少し良い。音声化するときはこの少しの差が大きな作業量の差になるから使う価値はあると思う。
760:743
23/02/13 19:33:22.63 0/m2nEld0.net
ルビを無視出来るというのも海外小説をOCRするときには結構大事だと思う。
761:名無しさん@お腹いっぱい。
23/02/13 21:23:05.17 2WnAMHgF0.net
>>747
私の質問の書き方が悪かったです
図表が本文と同一ページにあって本文の領域が長方形でない場合でも正しくレイアウトを認識しますか?
が正しい質問です。いかがでしょうか?
762:743
23/02/13 21:26:28.86 0/m2nEld0.net
>>751
DocuworksはOCR専門ソフトではないし、操作も簡単な割にはいい結果がでますよ。
今回NDLはデフォルト設定だと段組がメチャクチャでした。設定を変えたらOKでしたが、認識結果は今一つでした。
たしか、GoogleもPDFのレイアウト解析は今一つだったように覚えています。
763:名無しさん@お腹いっぱい。
23/02/13 21:28:46.74 2WnAMHgF0.net
>>752
貴重な情報ありがとうございました
DocuWorks はこれまでは全く使う機会のないソフトでしたが今後検討対象のひとつに加えます
764:743
23/02/13 21:39:59.34 0/m2nEld0.net
体験版が2か月くらい使えたと思いますよ。
私のはサポートが切れた古いバージョンなので、最新版とは違うかも知れませんのでご注意下さい。
バージョンアップを改悪という人が多い印象なので、注意が必要ですよ。
765:名無しさん@お腹いっぱい。
23/02/13 22:03:50.31 2WnAMHgF0.net
>>754
ありがとうございました
766:名無しさん@お腹いっぱい。
23/02/25 15:57:52.74 IDt605Yp0.net
LINEレシートのOCRすごい。
でも、レシート分けて買い物したものが「登録済み」とか言われて入力できなかった。
同じ日に同じ店はだめなのかと思ったけど、もう一度買い物し
767:て分は登録してくれた。 間違いなく登録してくれてCSV出力があったら完璧なのになー。
768:名無しさん@お腹いっぱい。
23/02/25 23:34:01.07 wVfTnntF0.net
>>512
自分も14を使ってて同じ悩みをもってサポートに問い合わせたらできないことが分かった
16にアップデートするとフォントサイズに自動調整や透明スペースの挿入で可能な限り原文の1行の長さに合わせてくれる
今はそれで解決してる
14持ってたら16へのアップグレード料金で割安になったよ
769:名無しさん@お腹いっぱい。
23/03/17 13:03:37.44 B7neqiNG0.net
Pict2ePub
縦横→epub, txt
googleのAPI使うやつだけど、設定でルビとかページ番号認識しないようにできる(完璧ではない)。
透明テキストPDFが作れる訳ではないけど市販のより高精度で気に入ってる。
文中に画像とか画像ファイル名が入らないようにしてほしい。
URLリンク(www.vector.co.jp)
770:名無しさん@お腹いっぱい。
23/03/25 18:57:24.94 CPI/O6cm0.net
>>440を参考に透明テキスト付きPDFが作れて、Adobe Acrobatではテキスト検索やハイライトができたけど、KindleにPDFとしてインポートするとテキスト検索やハイライトができません。
この方法で作った透明テキスト付きPDFをKindleに認識させる事はできないのでしょうか?
PDF24って無料アプリのOCR作成ならKindleに取り込んで認識できたんですが精度が良くなくて…両者はOCRの仕組みが違うという事なんですかね?
Google Cloud VisionのOCRは精度が良くて無料分で自炊できるので気に入っているのですが、有料のOCRソフトを買えばKindleでも認識できるのでしょうか。
771:名無しさん@お腹いっぱい。
23/04/10 14:58:29.78 TQn0sL2h0.net
質問です。わかる方いれば。
現在、ScanSnapでOCRかけてるんですが、日本語縦書き本の読み上げ順序がぐちゃぐちゃになります(右から左にスムーズに流れず、飛んだり戻ったりする)
読み上げ順序がスムースに右から左になるソフトや方法はありますか?
AcrobatProに課金すると読み上げ順序を指定し直せるみたいなんですが、修正箇所が多すぎて気が遠くなるので…
772:名無しさん@お腹いっぱい。
23/04/15 20:35:34.10 DHhVcVyw0.net
>>760
もしかして字下げしたところが後回しになるとか?
だとすると段落が別になってて後回しになってるかも。
773:名無しさん@お腹いっぱい。
23/04/16 08:14:25.54 FrWBIkKs0.net
Google Cloud Vision、横書きはほぼ完璧なのに
縦書きは残念な感じですね。縦書き需要ないのかな。
774:名無しさん@お腹いっぱい。
23/04/16 09:40:31.89 UzkJv9/+0.net
>>762
> Google Cloud Vision、縦書きは残念な感じ
縦書き 駄目ですか?縦書き こそ いろんなソフトが今ひとつなんで Google クラウドビジョンを勉強して縦書き用に使おうかと思ってたんですけど、性能が低いなら残念です
775:名無しさん@お腹いっぱい。
23/04/16 22:16:58.25 RsHBMoos0.net
レシート読み取り、LINEレシートはめっちゃいいのにレシーピは全然だめだなー
て思ってたけど、ちょっと解像度見て見たら
レシーピ入れてる 楽天mini は1600万画素しかなくて
LINEレシート入れてる iPhone 5s は 800万画素あった。
・・・ん?手振れ補正の有無かな・・・
楽天Hand 5Gが約6,400万画素でこれが1円だからこれ買うことにする。
手振れ補正ないのが不安だ。
776:名無しさん@お腹いっぱい。
23/04/27 13:13:47.12 ckzKQ9d10.net
透明テキスト付き縦書きPDF作成はvFlatアプリが一番優秀
スキャン機能もかなり良く出来てる
課金で無制限で使えたら良いのに、最近更に改悪された
777:名無しさん@お腹いっぱい。
23/04/27 23:37:35.71 L8E1UE+i0.net
>>765
PC 用の V flatを探しましたけど媒介アプリみたいなのを使う みたいで気味が悪いですね。スマホ用 みたいなのでネイティブではPC 用としては使えないようです。残念
778:名無しさん@お腹いっぱい。
23/04/29 14:06:13.63 1bL6k1jH0.net
>>758
教えてもらったPict2ePubを使ってみた。かなりいいんだけど、エラーが出て止まっちゃったりして動作のクセ? がよくわからない。
サポートはナシとのことなのでここで聞いてみるんだけど、
▼▼ 処理中にエラーが発生しました ▼▼▼
別のプロセスで使用されているため、プロセスはファイル 'container.xml' にアクセスできません。
みたいなエラー出る?
関連しそうなファイルやフォルダを全部閉じてるんだけどエラー出るんだよね。
779:763
23/05/03 02:34:24.28 t2VZlVg+0.net
rakuten Hand 5G で撮影したらめっちゃ読み取れる。
カメラにシールつけたまんまなのに。
ただ、試しにズームで写真撮ったら
肘をしっかり固定したのと普通に持って撮影したのじゃ全く違うから
手振れ対策重要だなと思った。
780:名無しさん@お腹いっぱい。
23/05/05 15:14:17.82 CddQ1lIU0.net
読取革命16でスキャン入力したら、数十ページで異常終了してしまう。
メモリ32GBで、スペック的な問題ではないと思うけど、よくわからん。
781:名無しさん@お腹いっぱい。
23/05/07 17:15:49.03 Kn5oFJWX0.net
横書き日本語文字メインの専門書のpdfをOCR化したい場合、どのソフトが良いですかね
読取革命か、あるいはフリーで何かないかなと探しています
782:名無しさん@お腹いっぱい。
23/05/11 01:10:47.21 9xPVTWRk0.net
>>770
Google Cloud Vision APIが横書きの精度が高くてお勧めですよ
クレジットカードの登録はいりますが、90日使える300ドルのクレジットもらえるし、それ過ぎても毎月1000ユニットまでは無料です
実行プログラムは>>440のやつ使うといいです
783:名無しさん@お腹いっぱい。
23/05/11 01:16:50.39 9xPVTWRk0.net
>>771
あ、この実行プログラムで使うにはpdf をjpgにする必要があるのでそこは手間かも
784:名無しさん@お腹いっぱい。
23/05/11 10:53:00.72 LL2tOwcG0.net
>>771
縦書きの精度はいかがでしょうか?
分かれば教えてください
785:名無しさん@お腹いっぱい。
23/05/11 11:33:22.61 9xPVTWRk0.net
>>773
縦書きは少ししかOCRしてませんが精度は良いと思います。
1ページ当たり500文字ほどの本を処理し、単語検索しましたが抜けはありませんでした。
ただ、ドラッグしてハイライトを付けると文章内で飛んでる所が
786:でます (ハイライトが飛ぶだけでテキストのコピーは飛ばずにちゃんとできます) i.imgur.com/kbM3N3G.png
787:名無しさん@お腹いっぱい。
23/05/11 13:33:09.87 BXO1YqG10.net
写真を見る限り透明文字の位置やサイズの問題のきがします。
Google Cloud Vision APIでは透明もじの張り込みはできないとおもっていたのですができるのですね
788:名無しさん@お腹いっぱい。
23/05/11 19:33:34.69 8ESIxcV30.net
>440の奴は透明テキスト付pdfにするためのライブラリが縦書きに対応していない
GCV自体は縦書きに対応してるのでテキスト抜き出すだけなら問題ないけど
789:sage
23/05/12 08:52:20.43 TaRhIR6z0.net
ブルーレイ映画をパソコンで再生しながら、画面下に表示される字幕を
映画の最初から最後まで連絡して文字認識するソフトを探しています。
そのような機能を持つソフトはありますか?
790:名無しさん@お腹いっぱい。
23/05/12 14:46:35.89 TbN5DIDu0.net
>>776
でも773の画像は縦書きに透明文字が乗ってるよね。
>>774さん、
GCVで透明文字が乗ったのPDF は作れるのですか?
791:名無しさん@お腹いっぱい。
23/05/12 14:57:09.96 wckX7tc+0.net
>>778
773ですがGCVで透明テキスト付きPDF作れてますよ
横書きなら文字検索&ハイライトの問題なし、縦書きはハイライト飛ぶけど検索はほぼ問題なし
792:名無しさん@お腹いっぱい。
23/05/12 16:42:30.72 TbN5DIDu0.net
>>779
ありがとうございます。
Google クラウドビジョン チャレンジしてみます
793:名無しさん@お腹いっぱい。
23/05/12 16:58:09.11 wckX7tc+0.net
>>780
いえいえ~
Google CloudのAPIキーを発行する手順を載せておきますので参考までにどうぞ
zenn.dev/tmitsuoka0423/articles/get-gcp-api-key
794:名無しさん@お腹いっぱい。
23/05/12 19:33:59.40 pxPA5Q3q0.net
>>778
「縦の文字列」ではなく一文字ずつ位置指定して透明テキストを画像に重ねてるんよ
(おそらく横書判定で一文字ごとに改行って処理になってる)
なのでドラッグで範囲選択すると位置ズレで拾えない文字が出てくる
>774の選択範囲は点線上だけど正規の縦書きPDFなら赤の選択範囲が途切れず縦一直線に繋がるはず
このあたりは>440の作者さん自身が>57-58で説明してる
hocr-toolsの作者にもissueで質問してたみたいだけど
相手外人なので縦書き需要が理解されず未解決のまま
795:名無しさん@お腹いっぱい。
23/05/12 21:18:10.00 wckX7tc+0.net
>>782
なるほど、それで縦書きのときのハイライトが途切れてるんですね
自分のPDFではドラッグしたときは行の最後から選択するように操作したり、前後の行を含めるように操作すると選択コピーでけっこう拾えてます、行の最初の文字が抜けたりしますが。
Wordに貼り付けても間に改行が入ったりはないです。
また、単語や文章の検索なら問題ない感じです
このへんはPDFの文字数やサイズにもよりそうですね
796:名無しさん@お腹いっぱい。
23/05/14 00:30:58.96 lh+zcWUZ0.net
>>781
リンク先の”認証情報を開く”まで進んだのですが,そのあとのAPIキーを発行するという画面がでません.
認証情報の作成画面の上からの項目は
?認証情報の種類
②スコープ(省略可)
③OAうthクライアントID
④認証情報
完了
です.そうすればいいでしょうかm(_ _)m
797:名無しさん@お腹いっぱい。
23/05/14 09:42:31.54 SJFcYGZt0.net
>>784
Cloud Vision APIを有効にすれば、APIキー発行のメニューが出ると思うんですが、
APIとサービスの有効化→検索にCloud Vision APIと入力→Cloud Vision APIを選んで「有効にする」はクリックしてますかね?
798:名無しさん@お腹いっぱい。
23/05/14 10:40:20.87 lh+zcWUZ0.net
>>784
>>781
自己レスです.
できました.
お騒がせしましたm(_ _)m
799:名無しさん@お腹いっぱい。
23/05/14 14:18:04.24 lh+zcWUZ0.net
>>781
>>782
試しに439で本の一部65ページくらいを認識させました.
他のそふとよりも正確に認識したので,全部400頁を対象にすると認識処理のあとメッセージ"enerating pdf”がでたまま終わりません.
タスクマネージャーではmakingopdfのリソース消費が0で作業を中断しているようなので諦めて,2回めをやり直しました.しかし状況は同じで終わりません.
ページ数が多くなると失敗するというバグなんかあるんでしょうか.
800:名無しさん@お腹いっぱい。
23/05/15 11:02:52.19 8XRnYinl0.net
>>787
456ページあるPDFをjpgにしmakepdfGUIで透明テキスト付きPDFにしてみましたが、自分の環境下ではエラー無く終わりました
READMEにある画像データサイズやピクセル数の制限に引っかかっている可能性はないでしょうか?
801:名無しさん@お腹いっぱい。
23/05/15 14:37:28.13 bE7ubZrf0.net
>>788
実験していただいてありがとうございます.
私の方の画像の情報を紹介します.
画像ファイルの大きさは,全ページの場合は最大812k,65ページの最大サイズは712KBです.
ピクセル数は,全ページの場合は最大812kの画像で2050×3239B,65ページの712KBの画像で1985×3209Bです.
readmeにある条件「.jpgファイルでサイズが1.5MB以下。縦横のピクセル数が1500以下(?)」のサイズは満たしていますが,ピクセル数は全ページも65頁も満たしていません.ピクセル数の多さ原因なら65ページも失敗しているはずですが.
readmeのピクセルの条件が「1500以下(?)」正確にはわからない,という書き方で判断のしようがないなです.
どこかに正確な情報はないでしょうか.
あと一回OCR認識した情報のファイルがてmpフォルダー内にHOCRやJSORで保存されていますが
これらを再利用する方法はないでしょうか.
試しに有料なので毎回GCVを動かすわけにもいかないので.
802:名無しさん@お腹いっぱい。
23/05/15 17:47:49.34 8XRnYinl0.net
>>789
READMEで使える画像データが(?)になっていて、バグが沢山あるので、と書かれているので作者さん自身でも把握できていないバグがあるのかもしれませんね
過去に他のGoogle Cloudサービスの使用歴があって今はもう初回の無料クレジットが無い状況ですかね?
300ドルの無料クレジットがあるなら90日間は約20万回の画像処理ができますし、もし無料分がないなら月に1000画像までは無料なので、無料の範囲で試行錯誤してみる感じになるのかなと思います
JSONファイルはGoogle Vision APIを介さずにOCRの結果を再利用できます。コマンドの知識がいるので自分は使ったことは無いです。
803:名無しさん@お腹いっぱい。
23/05/15 18:06:25.04 bE7ubZrf0.net
>>790
返信ありがとうございます。
Amazon で次の Kindle を購入して勉強しています。
Google Cloud Vision APIとPythonで文字認識
リナックスユーザー向け ということですが Windows でも応用がきできそうなことを 序文に書いてましたので、乗りかかった船で勉強してみます。うまくいけば 縦書き 透明 文字 も処理できる注意ができるかもしれません。
804:767
23/05/16 02:29:27.85 9oBtOb4r0.net
100回くらい読み取りしないと日本語でOCR出来なくなった。
変なアプリ入れたせいなのかそれともハッキングか分からんが
楽天mini が全然読み取れないのとまったく同じ症状なので
カメラの性能全く関係なかった。
805:名無しさん@お腹いっぱい。
23/06/07 15:53:10.91 4+q27Kb70.net
このスレさらっと読んでみたけど
無料で、ローカルで
っていうことだとwindowsよりlinuxの方が有利っぽいね
透明テキスト付けられると便利だなとか思いながら見ていた
806:767
23/06/17 13:47:44.30 8SIUbIIB0.net
あやしいツールを削除したら日本語認識するようになったけど複雑な字は絶対認識しなかった。
手首を固定するようにしたらだいぶ良くなったから手振れかなと思った。
さらにA4厚紙にスマホを乗せて厚紙を固定して撮影したらかなり正確に認識した。
手振れが問題だったようだが撮影台みたいなのは影ができるからこれも使えん。
アプリによって距離も違うし。
暗い壁を背にして光源を天井と外の2方向からにしてレシートを斜めに置くと影も反射もなく撮影できる。
フラッシュ焚いて反射した部分は読み取れない。
807:名無しさん@お腹いっぱい。
23/07/25 23:59:25.50 h9R08oEW0.net
オープンソースなAI-OCRがちょっとずつ増えてきた?
808:名無しさん@お腹いっぱい。
23/07/27 00:49:10.58 1HHss/Kc0.net
具体的書込所望
809:名無しさん@お腹いっぱい。
23/07/28 12:17:15.85 u6TD1Weu0.net
Windows APIのOCR機能を使ってみたが、まあそこそこって感じ。
パラメーターとかのチューニングの余地がないっぽいので、お試しレベルだな。
810:名無しさん@お腹いっぱい。
23/08/10 23:03:32.19 abq/Rt+90.net
ここで聞いた手法で、機械学習OCR挑戦してたけど、やっと動くようになったので
置いておきます
モデル
URLリンク(github.com)
アプリにしたもの
URLリンク(apps.apple.com)
なんとなくの使い方
URLリンク(lithium03.info)
811:名無しさん@お腹いっぱい。
23/08/20 22:49:52.50 4wU2XFry0.net
>>798
久々に来たら神アプリ誕生してた
試したらなぜかエラーで強制終了したんですけど、かなり期待してます!
812:名無しさん@お腹いっぱい。
23/08/21 03:08:01.91 PbCWsLqe0.net
>>799
まだバグってたか。すまん。
よければ機種と、何した瞬間だったか教えてもらえると助かるです。
もしくは、ディベロッパーにエラーレポート共有するやつで送っておいてもらえると。
813:名無しさん@お腹いっぱい。
23/08/23 21:45:39.05 BZ9LSkyF0.net
iPhone8で落ちてだめだね
814:名無しさん@お腹いっぱい。
23/08/24 04:57:06.45 qTgQhcLI0.net
iPhone8はメモリが2GBか。システムの75%以上取ると落ちるから、メモリが足りないっぽい
815:名無しさん@お腹いっぱい。
23/08/24 04:57:09.06 qTgQhcLI0.net
iPhone8はメモリが2GBか。システムの75%以上取ると落ちるから、メモリが足りないっぽい
816:名無しさん@お腹いっぱい。
23/08/24 05:14:04.09 qTgQhcLI0.net
二重になってた。すまん
こんな感じで、ふりがな付きで認識されるはず
URLリンク(i.imgur.com)
URLリンク(i.imgur.com)
817:名無しさん@お腹いっぱい。
23/09/03 04:56:45.00 dkzlPmWw0.net
>>804
それ何のスキャナ?
そんなに離れたところからでも、今の時代ってそんなに高精細にスキャンできるのか?
818:名無しさん@お腹いっぱい。
23/09/03 07:55:28.61 HPTuewTO0.net
スマホのカメラでしょ
819:名無しさん@お腹いっぱい。
23/09/03 15:29:23.39 XydjHq3Z0.net
iPhone13Proの背面カメラ
焦点距離が150mmの倍率が真ん中のやつだとちょうどの距離
820:名無しさん@お腹いっぱい。
23/09/04 21:26:06.49 fEFnfgzU0.net
台に固定して1ページづつ撮影か
自動でシャッター切るアプリがあったけどキツイな
821:名無しさん@お腹いっぱい。
23/09/04 23:05:06.12 AO5H3uFf0.net
>>80
822:8 DAISOリモコンシャッター用フットスイッチ iPhone用 https://minne.com/items/26569321
823:名無しさん@お腹いっぱい。
23/09/05 10:00:32.81 wxRm1Dem0.net
>>798 のアプリは15秒おきとかに自動シャッター切れるようにしたけど、
小説一冊スキャンしようとしたら45分くらいかかるから結構大変だった。
非破壊でスキャンできるのはよいけど、手間はすごい
824:名無しさん@お腹いっぱい。
23/09/05 11:07:11.26 379iN/3y0.net
アンドロイドのアプリいくつか使った
見開き自動分割とか、自動シャッターとか、指消しとか
OCRは有料だけど
Lens
adob scan
vflat
genius scan
825:名無しさん@お腹いっぱい。
23/09/06 15:15:13.29 wYBqExFW0.net
>>810
しばらく使ってないアプリだけど、スキャンだけvFlat使って、OCRをこの新しいアプリ使ってみたらどうかな?もうちょい速くできそう
826:名無しさん@お腹いっぱい。
23/09/06 15:17:38.01 wYBqExFW0.net
Windows版が出るならスペック高いPCでガンガン使いたい
827:名無しさん@お腹いっぱい。
23/09/06 21:47:47.22 Wt6T7L+k0.net
今、Windows用のに書き換えてるけど、処理した結果の出力ってどんな形式が便利?
とりあえずtxt(ふりがな飛ばす)と、html(rubyタグ)とかで出しておけば何とかなるかしら。
828:名無しさん@お腹いっぱい。
23/09/09 20:21:39.46 ZgEbr9HO0.net
tesseractのhOCR形式、文字(または語)ごとにOCR推定のコンフィデンス値が見られるのがお気に入り
でも文字列検索には不便
定番の出力形式、なかなか定まらない
829:名無しさん@お腹いっぱい。
23/09/09 23:42:26.08 3helahsY0.net
Windows版 bunkoOCR
URLリンク(lithium03.info)
とりあえず作った。nvidiaのGPUが刺さってると速いはず。
CPUでも動くけどかなり時間がかかるので、GPU推奨
830:名無しさん@お腹いっぱい。
23/09/10 04:54:58.83 /02CMD2I0.net
>>816
裏写り除去のルーチン入れ忘れてたので修正版
URLリンク(lithium03.info)
831:名無しさん@お腹いっぱい。
23/09/11 21:25:23.88 gkv7osDa0.net
>>816
ページ作ったので、以後こちらで
URLリンク(lithium03.info)
832:名無しさん@お腹いっぱい。
23/09/12 15:43:11.53 mvsAFLgd0.net
Windows版bunkoOCRをMX-Linux上のWine6.22で実行してみた。
Windows用の .Net Frameworkとかを使っていないのでウィンドウまでは起動したから、「こ、これはイケるかもしれない」と、文庫をひらきにしてスキャンした画像をScanTailorで整形した.tiffと.pngを食わせてみたが、いずれもエラーを吐いてダメ。
惜しいなァと思いつつちょっと試行錯誤したところ、どうも別ドライブにまたがった先のファイルなのがダメだったのか、システムと同ドライブ内に画像ファイルをコピーしてから食わせたら、第9世代のCore i7を全スレッド100%級に使用してましたが、.tiffも.pngからも無事にテキスト化できました!
まだ1ページやっただけですが、誤認識が見当たらないのがスゴイ!
しかも行頭アキのスペースをちゃんと認識している!
今ままで行頭アキを認識しなかったTesseract-ocrで散々苦労していたのがウソのよう。
更に段組み(1ページ内のテキストが上段と下段で折り返す)にも対応していて画像を上下で分割しなくてもテキストは上下で区別されてるし、複数ページを一度に食わせられる!
あなたは神か?
ものすごいものを世に出していただき、自炊者のひとりとして感謝
833:いたします。
834:名無しさん@お腹いっぱい。
23/09/12 20:00:43.48 drt9+3XT0.net
自分も使わせていただきました
読み取り精度は感動的なまでに高いですね
同じファイルを読み取り革命に読み込ませた時は誤字脱字だらけで改行も滅茶苦茶でしたが
このソフトだとほぼ校正はいらない状態で出力されます
ただ、かなりのスペックが必要ですね
5年ほど前のノートPC(corei7 メモリ16GB radeon)だと12コア全て使用率100%近くになり
半分フリーズしたような状態で1時間ほど放置したら100ページほど出来てたので
500ページの文庫を何冊もやるとしたら結構時間かかると思います
読み取り革命ではこのノートで充分でしたが次回はゲーム用のRTX3050を積んだPCでテストしてみます
素晴らしいソフトを公開してくださり本当にありがとうございます
835:名無しさん@お腹いっぱい。
23/09/12 20:39:01.02 fKClROHX0.net
うまく動いたようで何よりです。機械学習をバリバリに使っているので、
GPUマシンで実行することをおすすめします。
RTX3000系のGPUだと実用的な速度になるはずです。
836:名無しさん@お腹いっぱい。
23/09/12 21:35:56.45 mvsAFLgd0.net
続・Windows版bunkoOCRをMX-Linux上のWine6.22で実行してみた。
・ファイルパスは1バイト文字で
システムとは別ドライブ上の画像ファイルを食わせたらエラーになった件、フォルダの名前に日本語を含む多バイト文字が使われているとエラーになるようで、ファイルパスを英数文字だけになるようにしたら、別ドライブ上のファイルでもちゃんと認識しました。
・休み休み冷却しながら
他の方も書いていますが、GPUなしだとマシンへの負担が尋常ではなく、始めると90℃くらいまでコア温度が上昇するので、300ページ弱の文庫本をOCRする場合数十ページ単位で実施したら、コア温度が冷めるまで休ませた方が熱暴走するよりいいと思う。
(ちなみにエディタで文字打ちだとコア温度は35℃くらい)
今回スキャンしてノンブルを削除した以外は段組のままの300DPIのtiff画像を一冊分OCRしたところ、"「"が時折全角SPになっていたくらいで、ホント惚れ惚れする認識精度でした。
今後のためにGPUを搭載したPCが欲しくなります。
837:名無しさん@お腹いっぱい。
23/09/13 13:36:02.38 hhrPEDpp0.net
>>816
すごく良い!ありがとう。一点、空白ページだと落ちるよう。
838:名無しさん@お腹いっぱい。
23/09/13 14:16:40.21 hp6qr6yy0.net
作者様ありがとうございます
青空文庫形式でふりがなまで処理してくれて間違いもほぼない状態で驚きですが
実質Geforce必須といった感じですね
こちらの環境はryzen7、メモリ32Gbですがグラボは応援のためにRadeon6600xt使っているので
GPU支援が効いてくれず16スレッド全てが95~100%使用になり
それでも1分に2枚処理できるかどうかですので何冊もOCRするのは現実的ではないです
そろそろグラボは買い換えようと思ってたのでGeforce使っている方、
例えば100枚処理するのにどれぐらい時間がかかって、温度やCPU使用率がどれぐらいになるのか教えていただけないでしょうか?
839:名無しさん@お腹いっぱい。
23/09/13 16:12:12.68 sbqLPpPJ0.net
>>824
Radeonでも機械学習の推論ができるはずなので、モジュール足してみます。
こちらの手元にはRadeonないので、デバッグに付き合っていただけますか。
840:名無しさん@お腹いっぱい。
23/09/13 19:49:37.49 hp6qr6yy0.net
>>825
作者様返信ありがとうございます
RadeonでもGPU支援が効けば嬉しいです
デバックというのはテストで動かして問題や処理速度などを報告するということでしょうか?
それぐらいならできると思いますが、この過疎スレでRADEONのようなマイナーなボードを使ってるのが
10人ぐらいいるならともかく、�