2013年、最強のOCRは?at EBOOKS
2013年、最強のOCRは? - 暇つぶし2ch40:名無しさん@お腹いっぱい。
13/10/20 12:55:13.97 YgdX2skn.net
一発!OCR Pro7というのもあるんだな
ジャストシステムから発売されているやつ

41:名無しさん@お腹いっぱい。
13/10/20 20:26:22.16 V4Fsd2ph.net
>>40
epub出力ないのかー
いらない

ルビつきのepubが普通に出力できるOCRは出ないのかな
マンガは自炊して処分できたけど、小説がEPUB化できないといつまで経っても捨てられない

42:名無しさん@お腹いっぱい。
13/11/10 00:24:54.73 Ithcb/il.net
e.typistでは駄目なの?
個人的にはルビまで修正の手が回らないから、ルビ出力はオフにしてるけど

43:名無しさん@お腹いっぱい。
13/11/13 20:02:10.42 NS/oNFUe.net
ハードオフに行って、ジャンクのプリンタを買って読取革命Liteを手に入れるのが一番コストが安いな。

500円くらいで買えたもの。

44:名無しさん@お腹いっぱい。
13/11/23 07:21:08.48 O8RWMPBP.net
OCRソフトだけは、俺が作ったほうが良い物がでける。
その自信がある。

てなことを思うほど
これほどイライラする類のソフトも無い。

俺ならまず、そのPCに存在する文書ファイルの語彙チェックから始めるな。

45:名無しさん@お腹いっぱい。
13/11/23 09:02:34.89 hhzb+qNK.net
今のOCRソフトは手書き向けの精度向上にむけたアルゴリズムをアプデしてるからな

小説のような固定レイアウトで、文字も綺麗にスキャンされてる画像からOCRするのには向いてないんだね

46:名無しさん@お腹いっぱい。
13/11/23 23:39:04.77 cxU5qNz+.net
>>44
同感だよな・・・

一番いいと言われている読取革命にしても、不具合多すぎるし。

47:名無しさん@お腹いっぱい。
13/11/24 21:46:08.18 ExxE4Cmc.net
>>46おめー絶対にわざと間違えてんだろ?
って突っ込みたくなることが多い。

95年初めてOCRに出会った頃と比べてほとんど進化してない。
新発売の洗濯洗剤のごとく
バージョンうpのたびに制度が向上とか
もっと凄くなってないとオカシイやろって思う。

ペロペロペロペロペロペロッって
認識が終わるのも腹が立つ
もっとじっくりやれよって

ベローォォォォォォ、ベロッーーーーーーーーーーーんっ?ペロッ
くらいでいいからさ

早く認識終わったって
間違いが多けりゃ意味ねえんだよ。

48:名無しさん@お腹いっぱい。
13/11/24 22:03:39.28 h61DYoc5.net
「つ」と「っ」の違いくらいはしっかり認識してほしいよな
文字の大きさを何で考慮しないんだろ
「間」「問」「聞」の間違いくらいなら大目に見るから

49:名無しさん@お腹いっぱい。
13/11/24 23:38:25.08 PsSyF8PF.net
いくら日本語には半角全角かなカナ漢字数字アルファベットがあるといっても
漢字と漢字の間に一文字半角カナとか記号とかねえだろって思うんだよね。
単純に似た形の文字を持ってくるだけじゃなくて
人間の脳内補正みたく文脈から文字の種類を推定したり熟語のデータベースと照合したりそういうのでOCRの精度あげられないのかね。

50:名無しさん@お腹いっぱい。
13/11/25 00:11:10.13 fMf3+OeP.net
URLリンク(vtns.wordpress.com)
数ヶ月程度で作った(らしい)画像認識でこんだけ絞り込めるんだから、OCRメーカーさんにはもっと頑張ってほしいところ

さすがに「言」が二二口とか洒落にならん

51:名無しさん@お腹いっぱい。
13/11/25 01:47:55.12 ILF0Qk7C.net
>>48
縦書きの漢数字なんかまともに認識してくれないしな。

個人的には読んでココが一番良かったな。

文字の種類によって色分けしてたり、改行コードがわかるようになってたから、
誤変換した後の修正がしやすかったし。

これで第二水準漢字に対応していてくれさえすれば良かったのに。

52:名無しさん@お腹いっぱい。
13/11/25 01:56:28.91 41WAN4fr.net
>>49 インスコするときに、
「このPC内の文書ファイルの単語をデータとして使用する」 はい、いいえ
させるとかしたらええと思う。

そのうちgoogleがっクラウド型OCR作ったら、他のメーカー壊滅やろね。
そういうの得意そうやし
ネット上単語データベース利用して、推測認識。
案外、「この文書の元ネタはこのページです。まるごとコピペした方が早いです。」とか言って来たりして。

イラつく例もう一つ
表認識で、数字が4,000、3,000、1,000と並んでるのに次のセルで「2、CO日。」とか認識しやがんのね。

53:名無しさん@お腹いっぱい。
13/12/09 16:57:57.89 sxshqx1w.net
e.typistのpdf出力の画質って設定で変えられるのね。
使えないと思ってたのが使えるようになったわ。
まったく、何でデフォルトが最低画質なんだか、、、

54:名無しさん@お腹いっぱい。
13/12/09 19:59:41.86 YK1q4d3s.net
e.typist使ってるけど、ルビまでいい感じで読み取るけど?
そのまま青空形式でルビを書き込むようにしてる。

55:名無しさん@お腹いっぱい。
13/12/09 21:40:25.53 nWZ+r3Cm.net
>>54
え、それほんと?
初耳

電子インクの電子書籍端末がいい感じで普及してきたのに、ルビつきのepubが簡単に自炊できるソフトがないことが最大のネックになってた

56:名無しさん@お腹いっぱい。
13/12/10 00:11:47.09 ZC2PoFMy.net
e.typist neoの出荷メール来た
読取と両方試用版試したけど決め手はルビ出力の可否
認識率は本文より低い感じだけど二重山カッコでくくってくれるので
底本参照の校正がはかどるのではないかと思いまして

とは言え認識率が100パーで無い限り底本突合せで間違い探しする訳で根気ないと無理ですねこれは
どうしても残したく且つ電書化の可能性が限りなく低そうな手持ちの本限定…って感じです

57:名無しさん@お腹いっぱい。
13/12/10 00:22:53.69 u4muTkK4.net
青空形式のルビ《 》もルビ開始位置の|も指定できるけど、本文でさえ校正が大変なのにルビまでは出来んわ

58:名無しさん@お腹いっぱい。
13/12/20 19:26:33.98 YWA5PXvs.net
未だにsmartOCRをDLできる国外サイトいっぱいあるけど
あれって英数字だけだと月並み。
結局利用者は大概日本人か

59:名無しさん@お腹いっぱい。
13/12/23 20:43:32.27 c3bY1Jmf.net
OCRは、高圧縮pdfを吐かせるためで
誤認識は気にしない、だいたい認識してくれれば検索も役には立つ
と割り切って無修正で使っている

60:名無しさん@お腹いっぱい。
14/01/28 12:26:31.55 ncWCbP7Q.net
google docsが最強だろjk
しかも無料だし

61:名無しさん@お腹いっぱい。
14/06/01 13:41:10.19 gZHlEIFi.net
>>61
上がるよ、フォトショで背景全部飛ばして文字の太さやらも調整する

62:名無しさん@お腹いっぱい。
14/06/01 13:44:08.20 4XblVqBZ.net
>>61
ホントにホントに?

63:名無しさん@お腹いっぱい。
14/06/05 10:44:39.50 5NUrKheB.net
書籍は画像で保存していて、
OCRかけて検索可能PDFにするのは自分は諦めてるんだけど、
画像内の文字列をちょこっと選択して、
Google検索だけしたいとはよく思う。

64:名無しさん@お腹いっぱい。
14/08/07 08:08:09.99 nQfWpHNh.net
ビューアでそんなの出てほしいな
手動で範囲選択してそこだけOCRかけてweb検索やら辞書検索やらする

65:名無しさん@お腹いっぱい。
14/12/25 21:01:09.03 5hKxSpYV.net
読取革命のアクチベーションはどのバージョンからですか?

66:名無しさん@お腹いっぱい。
15/03/24 00:36:12.86 4AGjMhFZ.net
うちの文鳥は特別に可愛い
たぶん他のところのより可愛い
そうとしか思えないくらい可愛い
でもそう思っている飼い主ってけっこう多い?

67:ギンコ ◆BonGinkoCc
15/05/01 05:36:53.74 iCfLgs4D.net
読んde!!ココ パーソナル(エプソン版)
画像の読み込みは白黒でしか対応していないため、
モノクロビットマップに変換してやる必要がある。
※元ファイルを消してしまわないため、コピーを別ディレクトリに保存した方が安全。
とりあえず光学文字認識をしてしまい、あとは愛用のエディタを用い、
元ファイルの画面を参照しながら手作業で直していく。
自動文章認識機能に頼りきっていては、なめらかな文字認識ができないため、
きめ細かな修正はやはりオペレーター(ユーザー)が行うしか無いのだ。
Google翻訳で日本語から英語へ翻訳する際、長文のニュースサイト、
論文とかは翻訳にあたってのコツはいちいち使えませんよね。
そこで、Google翻訳ツールセットを用い、おかしな翻訳は
ユーザーが手作業で修正する。それと同じ。

68:名無しさん@お腹いっぱい。
15/05/17 21:46:03.08 tp97P1Sy.net
パナソニックの体験版ずっと前に使ったらしく
テスト出来なかったので
とりあえず体験版で上手くいったんでe.Typist NEO買っちゃった。
パナのばか野郎
ちゃんと段落指定しないと文字間にスペースが入ったりするからめんどくさいけど
ルビもしっかり読み取るし
右クリックですぐ検索できて素敵なPDFライフ送ってます
スキャンしたjpgファイルのゴミの山が宝の山に化けたぞ!

69:名無しさん@お腹いっぱい。
15/11/11 15:39:24.99 CAbtX60K.net
2010年購入image scanner CanoScan 5600F付属の読取革命Lite v.1.09。
Web pageにあるJPEGなどの画像表示、つまりそのままテキスト文でcopy&paste
できないものをテキストデータに変換したい時がたまにある。
画面キャプチャ(snipping tool)によるclip boardを入力データとして読み
込んで、文字認識させてテキスト文にする。
最近5年ほどでOCR softwareの文字認識能力が格段に向上したというけど、
私の使っているものは読み間違えが多い。
画数の多い漢字は正確に認識しにくいが、英字などで"i"&"l"&"1", "o"&"0"
などは必ず間違っている。

70:名無しさん@お腹いっぱい。
16/01/19 15:11:19.09 mq3Mk8xh.net
etypistがえらい勢いで良くなってるな
読取はルビ読み取れないが eは読む

71:名無しさん@お腹いっぱい。
16/02/02 12:46:48.20 8rKEDg16.net
etypist15の発売日2013年やないか

72:名無しさん@お腹いっぱい。
16/04/06 20:44:12.53 0vG9P8H4.net
☆ 日本の核武装は早急に必須です。☆
総務省の、『憲法改正国民投票法』、でググってみてください。
日本国民の皆様方、2016年7月の『第24回 参議院選挙』で、日本人の悲願である
改憲の成就が決まります。皆様方、必ず投票に自ら足を運んでください。お願い致します。

73:名無しさん@お腹いっぱい。
16/07/29 17:23:08.48 chwtCP1b.net
etypist、性能はいいんだが
読み込み時にいちいちウインドウがアクティブになるので
他の作業が出来なくなるのがうざい
別にアクティブになる必要ないだろ

74:名無しさん@お腹いっぱい。
16/08/02 21:34:27.65 xQSe+qqJ.net
OCRソフトで、原稿のフォントを指定すると
認識精度が上がる機能があればいいのにな
ゴシックと明朝、フトコロの大小だけでも
だいぶ精度が上がりそうなのに

75:名無しさん@お腹いっぱい。
16/08/13 09:58:07.95 cdpMErTk.net
活字なら文字の大きさも一定だし、フォントとか認識できれば、言偏が分解されたりせずに済みそうだよね

76:名無しさん@お腹いっぱい。
16/09/22 00:19:47.24 ZZVNIQT0.net
認識率98.66%?!たった2ヶ月で手書き日本語のOCRを開発したノンジャパニーズに話を聞いてきた
URLリンク(bita.jp)

77:名無しさん@お腹いっぱい。
16/10/06 14:45:13.21 skZ2qPPb.net
体験版で精度をチェックしたいのに製品版と性能が違うのもあるらしいから困る

78:名無しさん@お腹いっぱい。
16/10/07 09:30:18.61 jp9s72R4.net
FineReader買ったけどいいね。

79:名無しさん@お腹いっぱい。
16/10/07 23:42:03.50 F621ToTQ.net
>>78
学習が日本語対応してないのが痛い

80:名無しさん@お腹いっぱい。
16/10/10 07:22:47.51 xE3A06X4.net
>>79
実質、英文のOCR専用でしょう
日本のOCRソフトで英文OCRやってもグダグダなのと同じだと思う
洋書を電子化するにはなかなか良いソフトだと思う

81:名無しさん@お腹いっぱい。
16/10/10 13:04:37.24 MNrX4hom.net
ホームページ見ると英語なら読取革命もABBYY社製エンジンだね
ちなみにe.typistはNuance社製

82:79
16/10/11 01:30:01.21 eksnS3tm.net
>>81
俺はURLリンク(monomania.sblo.jp)で↓を読んでFineReaderを買うことにした。
>>読取革命は英語の部分はFine Readerという英語圏では最も信頼性が高いOCRを採用していますが、エンジンを上手く生かし切れていません。

83:名無しさん@お腹いっぱい。
17/07/08 18:41:50.55 xQlgvdQ3.net
eTypistは認識中にウィンドウがアクティブになるのを防げんのかね

84:名無しさん@お腹いっぱい。
17/07/09 16:06:20.21 iESi7AYh.net
>>83
確かに。読取革命とは対照的に、処理中はPCを
事実上専有されてしまい困るね。
googleのAPIを試してみたら、認識精度は相当良かった。
今は(たぶん)アプリがないので敷居は少し高いが、
将棋といい、今後はAIの方向性になっていくのかな。

85:名無しさん@お腹いっぱい。
17/07/11 00:20:04.02 EO4izff5.net
パナソニックがすでにAIとかディープラーニングを投入した手書き文字
対応の帳票OCRソフトを発売しています
URLリンク(news.panasonic.com)
お値段もいいっすね。
・帳票OCR Ver.8 クライアント版:398,000円(税抜)

86:名無しさん@お腹いっぱい。
17/07/12 19:51:06.12 yQE9Ft7A.net
>>85
お値段張りますね。個人にはちょっと手が出ません。
個人的にはGoogle cloud visionで満足ですが、
誤認識のフィードバックや学習機能はないですね。

87:名無しさん@お腹いっぱい。
17/08/20 10:04:39.07 2KZZB/L/.net
Google Cloud Vision OCR使って検索可能なpdf作るコマンド昔作ったけど、Googleがjsonの形式変えて後ろに余計なものつけたせいで使えなくなったw
直したいけどヒマないな…
URLリンク(github.com)
Linux用。Bash on Windowsでも使える。

88:名無しさん@お腹いっぱい。
17/08/24 19:50:24.14 m5h5ZsxQ.net
>>87
素のWindows環境なので試せませんが、
検索可能PDFはいい考えですね。
高級言語を何も知らないので、標準のPowershellで
フロントエンド部分のスクリプトを作ってみたら、
Google Cloud Vision、結構いいかも。
文庫本一冊あたり数分でテキスト化できるようになった。

89:名無しさん@お腹いっぱい。
17/08/24 20:11:01.05 mY06hxQc.net
Google Cloud VisonのOCR, いいですよね。
古いカメラ好きで、戦前戦中期のカメラ広告のデータベースを作ろうとしてるのですが、
他のOCRよりかなり良くて重宝してます。
全てが読めるわけではないですが、ものによっては広告の見出しのロゴなども読み取れます。
ちなみにテスト中のサーバーはこちらです。
縦書きがひっくり返ったり、画像が出なかったりとまだうまくいかないのですがw
URLリンク(104.197.98.173)
スクリプトは公開されますか?興味ありますw

90:名無しさん@お腹いっぱい。
17/08/24 20:51:11.80 mY06hxQc.net
Google Cloud Visionを使ったOCRソフトが1480円だそうです。いいかも。
URLリンク(n.shop.vector.co.jp)

91:名無しさん@お腹いっぱい。
17/08/24 21:10:00.64 mY06hxQc.net
すまん、これTesseractベースらしいw

92:名無しさん@お腹いっぱい。
17/09/21 15:18:37.11 oeq2WaFN.net
Googleドライブのサービスが終わることが決まったらしい
てことはOCR民に重宝されていたGoogleドライブを経由して上げたjpgから文字化するあのシステムも失われてしまうのだろうか

93:名無しさん@お腹いっぱい。
17/09/21 15:29:09.54 oeq2WaFN.net
と思ったけど機能発展かなんかの流れで推移して仕組みが変わるだけでそういったシステムが無くなるわけではないのかな
よくわからんね

94:名無しさん@お腹いっぱい。
17/09/26 18:13:31.59 L30pb7J/.net
手書きOCRの記事をよく読むけど、手書きであの精度がでるなら、活字は100%近い精度が得られそうな気がするけど、どうなんだろうね?

95:名無しさん@お腹いっぱい。
17/09/27 16:30:29.45 kyhjOBdx.net
記事のための

96:名無しさん@お腹いっぱい。
17/12/30 01:13:36.18 vWdc5/Pn.net
☆ 私たち日本人の、日本国憲法を改正しましょう。現在、
衆議員と参議院の両院で、改憲議員が3分の2を超えております。
『憲法改正国民投票法』、でググってみてください。国会の発議は
すでに可能です。平和は勝ち取るものです。お願い致します。☆☆

97:名無しさん@お腹いっぱい。
18/01/12 08:46:36.99 OG0vqAvx.net
電子書籍のように無料で稼げる方法
グーグル検索⇒『稲本のメツイオウレフフレゼ
Z9GSY

98:名無しさん@お腹いっぱい。
18/02/28 23:51:50.98 pigZ9q4r.net
Google Cloud Vision APIで透明テキストのPDF作ってみたんだけど、abbyy finereaderとか、e-typist、読み取り革命とか、捨ててもいいレベルですね。
何万も掛けて買って、精度の悪さにがっかりしていたのがバカバカしくなるレベル。
Google Cloud Vision APIのOCRはマジでおすすめ。

99:名無しさん@お腹いっぱい。
18/05/29 15:55:16.34 20k4ukZr.net
IDSP8

100:名無しさん@お腹いっぱい。
18/09/30 02:03:47.28 7yJ8ed3M.net
URLリンク(imgur.com)

101:名無しさん@お腹いっぱい。
19/04/22 13:32:08.24 S+OQcRwJ.net
LINEの新機能がOCR機能を搭載してたようだよ(現在PC版とAndroid版のみの機能)
Googleやtesseractと比べてどうなのかな?
こうなるとLINEの友達にOCR変換投げつけ用アカウントの人をどこかで用意しなきゃならん

102:名無しさん@お腹いっぱい。
22/12/18 21:05:23.59 WQH1nNN9.net
いちおう保守。

103:名無しさん@お腹いっぱい。
23/08/02 23:08:57.76 xN5NT3mHq
また岸田異次元増税憲法ガン無視地球破壊軍国主義文雄が今度は中東にまで丿コノコ莫大な温室効果カ゛スまき散らしながら世界中にハ゛力晒して
しかもと゛の囗て゛脱炭素た゛のとほさ゛いてやか゛んだか.力による━方的な現状変更によって都心まで数珠つなぎて゛鉄道のЗ○倍以上もの莫大な温室
効果カ゛スまき散らすクソ航空機倍増させて気侯変動させて世界中て゛土砂崩れに洪水.暴風、猛暑、干は゛つにと災害連発させて核攻撃の何倍もの
人的物的被害を与えてるクソテロリス├が□シア非難とか笑わせんのもいい加減にしとけや.氣侯変動による世界の難民の数は1億人を超えて
いるわけた゛か゛.日本でも洪水やクソ航空騒音によって住む場所を追われる被害者た゛らけ.豪雨やら灼熱地獄によって被害を受けた連中は被災者
て゛はなく、テロ政府による人為的なテロによって破壊され殺されたんた゛といい加減理解して立ち上か゛れよな、被災者支援た゛のと白々しい増税と
利権のネ夕にされて生命と財産を奪われるマソ゛体質マジキモチワ儿イぞ.プ―チンや金正恩は.このデ夕ラメジェノサヰト゛プ□パガンダテ囗
國家の本質を追求して正当性をアピ━ルすれは゛,世界的な惡者は曰本に原爆落とした世界最惡のならず者国家とその‐味た゛と八ッキリするた゛ろ

創価学會員は.何百万人も殺傷して損害を与えて私腹を肥やし続けて逮捕者まで出てる世界最惡の殺人腐敗組織公明党を
池田センセ─か゛口をきけて容認するとか本気で思ってるとしたら侮辱にもほと゛があるぞ!
hTТps://i,imgur.соm/hnli1ga.jpeg

104:名無しさん@お腹いっぱい。
24/07/09 15:46:59.75 SIpCmcZy.net
これ見ると点がすごかったね

105:名無しさん@お腹いっぱい。
24/07/09 15:54:04.11 0qglUVev.net
もう1人くらい何も問題無ければ正式リリースだろ

106:名無しさん@お腹いっぱい。
24/07/09 15:56:44.18 9CIAptb2.net
>>73
そろそろ全打席四死球で攻めてもええやろ

107:名無しさん@お腹いっぱい。
24/07/09 16:13:20.36 FwwEtR3W.net
>>6
Twitterにあったが

108:名無しさん@お腹いっぱい。
24/07/09 16:28:02.79 3fmMkjs9.net
心と生活に余裕があるからね
URLリンク(i.imgur.com)
URLリンク(i.imgur.com)

109:名無しさん@お腹いっぱい。
24/07/09 16:28:38.22 XzpPblKQ.net
下がるんでしょう
会社の系列と徐々に変わったんやろ?あるか
天地創造とルドラの秘宝やってみたいんやけど

110:名無しさん@お腹いっぱい。
24/07/09 17:15:33.37 nwYpX81p.net
じゃまずいと思ってるおじさんの趣味をやらせるアニメを見てて嫌がる人がエンジニアやるの?
改行ちゃん
どした???
ちょっと立ち直れない
URLリンク(i.imgur.com)

111:名無しさん@お腹いっぱい。
24/07/09 17:46:34.74 eeXvPcN9.net
風間と若手ミリオンデビュー組じゃ違うよね
もうあのコピペ消えた...
たすけえt

112:名無しさん@お腹いっぱい。
24/07/09 18:00:52.95 2omNKMk2.net
皆様、おはぎゃー!

113:名無しさん@お腹いっぱい。
24/07/09 18:07:40.68 VMoCQK8f.net
糖質は全然違うな
乗ってた人数も少ないし

114:名無しさん@お腹いっぱい。
24/08/16 20:56:19.31 ilXKRSG0.net
これ
スターオーシャンとかいう
URLリンク(i.imgur.com)
URLリンク(i.imgur.com)

115:名無しさん@お腹いっぱい。
24/08/16 21:29:58.93 fSXP4R5R.net
ありがとうございました


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch