[OCR] 画像→テキスト化総合at SOFTWARE
[OCR] 画像→テキスト化総合 - 暇つぶし2ch175:名無しさん@お腹いっぱい。
06/05/13 22:16:03 4IAib/kM0
URLリンク(www.filewatcher.com)

176:名無しさん@お腹いっぱい。
06/05/13 23:44:18 9Bw1SrP60
1.07より1.06の方がええのんか?

177:名無しさん@お腹いっぱい。
06/05/14 01:41:08 7kc/t2yq0
filebankのダウソに成功!95はファイルダウソできねーんだって(もー

178:名無しさん@お腹いっぱい。
06/05/14 02:06:41 S6dHpXcb0
103から104で一気にファイルサイズが増えてるな

179:名無しさん@お腹いっぱい。
06/05/14 02:15:01 S6dHpXcb0
試しにゲストのうpを再開

180:名無しさん@お腹いっぱい。
06/05/14 09:52:05 isPuXRoB0
>>155

ただし、3日に一度ログインをしませんと、
保管したデータは削除されますので、ご注意下さい。

181:名無しさん@お腹いっぱい。
06/05/14 11:08:51 csKaAcPS0
>>124 :名無しさん@お腹いっぱい。 :2006/05/11(木) 04:23:51 ID:EEVmh9Wi0
> 民事だろ。しかも親告罪。
> 訴えられて、裁判に負ければ賠償金。

著作権の侵害に対して民事で訴えるのはいつでも可。
親告罪というのは、権利者が告訴すれば3年以下の懲役又は300万円以下の罰金
が、賠償金の他におまけでついてくる可能性があるってこと。


182:名無しさん@お腹いっぱい。
06/05/14 11:28:40 J+wt7Gdo0
なるへそ

183:名無しさん@お腹いっぱい。
06/05/14 19:32:41 S6dHpXcb0
>>180
分かってるよ
やっぱ他のバージョン持ってる人いなさそうなのでゲストうp不可再開

184:名無しさん@お腹いっぱい。
06/05/14 20:45:04 +YL1CFnm0
むしろ、この流れでは、大元のOCRソフトの権利者からの攻撃の方が可能性ある。
(「パクった」っていうのが本当だとして)
詳しい法解釈なんかはそれぞれ調べてみてくだされ。

185:名無しさん@お腹いっぱい。
06/05/14 21:05:26 WrX96/0E0
著作権法嫁



186:名無しさん@お腹いっぱい。
06/05/14 21:19:41 32nAxdZ60
なにもそんなにガツガツしなくても
PCjapan6月号にSmartOCR1.07入ってるで。
しょんぼりして本屋で立ち読みしてたら見つけた。

187:名無しさん@お腹いっぱい。
06/05/14 21:25:19 McYVxA/O0
>>185
読んでるつーの

188:名無しさん@お腹いっぱい。
06/05/14 21:50:40 S6dHpXcb0
>>186
>>100で既出(5月号って言ってるけど

189:186
06/05/14 22:41:34 32nAxdZ60
>>188
今本屋に並んでる6月号にも入ってるってことです。
消えてると思ったんだけど。

190:181
06/05/15 06:34:34 1Va00O5g0
>>184
まぁ142が勇者であろうということは認めるんだが、かなり無謀な感じはする。
スマートリーディングが「資金繰り悪化等」なんて言って突然やめたんだから
なんらかの債権者がいるんでは?
filebank経由で142を民事、刑事の両面で訴えてくる可能性があるんじゃない
かな?


191:名無しさん@お腹いっぱい。
06/05/15 08:57:29 P2UgZpvz0
filebankは著作権違反の対応鈍いからなぁ。

192:142
06/05/15 18:07:03 wtnjcxEq0
>>190
むしろ無謀な勇者は>>56でしょ

193:名無しさん@お腹いっぱい。
06/05/15 19:20:33 A3En0gYA0
今ごろ、パクられた会社の弁護士が、このスレをみてソロバンをはじいているだろう

194:181
06/05/15 20:43:01 1Va00O5g0
今北ですが、たしかに弁護士としては「ラッキー!」てところですかね。

142氏にとって、アンラッキーなのはfilebankが国内(それも弁護士が山ほどいる
東京)で東京地裁から証拠保全命令が出せること。(海外のサイトだと面倒)。
このためこの142氏が簡単に特定できること(不明であれば2chにも請求可)。
filebank からのダウンロード数が明快で、被害額が特定できること。
Liteは無料でも再配布を認めていなかったこと。加えて10日に再配布を
とりやめるように著作権者が要請したことを知っていたのにあえて再配布
していることから刑事での責任も重大…
(著作権法は読んだんだよね?コピー手段を提供したものも同罪って…)

Liteが無料配布だったからって、被害額は特定できるんだよね。それは、
Liteを無料で配布したために製品版もしくは同等品を販売するチャンスが
減ったと言えるから。これは知的財産侵害でよくあるやり方。
僕が弁護士なら36万円×ダウンロード数をとりあえず被害額として請求するかな。
民事で徹底的に争う気なら、刑事もあるからね。(親告罪ってのはそういうこと)

僕の感じでは、56氏の方は免責される可能性は高いかも?
理由は、56氏がスマートリーディングが再配布手段を失ったための配布を代替
するボランティア活動を意図したと解釈し得ること。
さらにスマートリーディング社の10日の広告で直ちに配布を取りやめたことで、
56氏自身が過誤を認めていること。仮に刑事告訴しても起訴猶予か?
これに対して142氏は新たに始めて、こうしてこのスレの一部の意見(助言?)
もあるのに、配布を続けていることは悪質とされ得るわけ。

とりあえず、181としては、どうなってももう知りませんw


195:名無しさん@お腹いっぱい。
06/05/15 20:50:47 wtnjcxEq0
まあそろそろ消すか

196:名無しさん@お腹いっぱい。
06/05/15 21:13:20 1Va00O5g0
>>195
まぁ、142氏が弁護士に駆け込むことはないと思うけど、もしも行けば、
「あ、これはまずいですねぇ…」て言われるかも。

もちろん消した方がいいと思うけど、すでに向こうはこのスレも含めて、
山ほど証拠握っていると思うし、ダウンロード数がゼロってことはない
でしょ?
企業なんて、自分に不利益にならない限り、金が取れれば訴訟はいく
らでもしますからね。


197:名無しさん@お腹いっぱい。
06/05/15 21:18:09 wtnjcxEq0
【ちょっと質問】
具体的にスマートリーディング側の不利益は?

198:181
06/05/15 21:26:44 1Va00O5g0
>>195
おまけ: FILEBANKのアナウンスだけど…(先に書いておけばよかったかも?スマソ)

URLリンク(www.filebank.co.jp)
・著作権違反ファイル

また、著作権違反ファイルは著作権者より莫大な損害賠償を課せられる可能性がございます、
ファイルバンクを利用した著作物の公開や交換はくれぐれも行わないようにお願い申し上げます。

URLリンク(www.filebank.co.jp)
4、個人情報の第三者提供について

・ お客様が公共良俗、法令、当社利用規約などに反し、第三者や当社の権利・サービスを保護するために、必要と認められる場合。
・ 裁判所、検察庁、警察、弁護士会、消費者センターまたはこれらに準じた権限を有している機関から、個人情報についての開示を求められた場合。


199:名無しさん@お腹いっぱい。
06/05/15 21:52:43 64hVoFYs0
パクリ疑惑をまとめれば、公然と配布しても誰にも文句は言えない。
著作権法がそれを認めてるから。

200:名無しさん@お腹いっぱい。
06/05/15 22:37:57 YSr5bO120
>181=194=196=198

ちょっと粘着気味だな。
「過誤」という用語の使い方が少し変で、
法律屋であるかも疑問。

201:名無しさん@お腹いっぱい。
06/05/15 23:46:36 oTIzafs60
再うp頼みます

202:名無しさん@お腹いっぱい。
06/05/16 06:50:09 t049jPgS0
>>181
こんなパクリソフトの再配布に文句垂れる位なら
新メモリ最適化ツールのガキにでも粘着してこいよ

203:名無しさん@お腹いっぱい。
06/05/16 07:09:56 i/HGobXL0
ファイルバンクオワタ\(^o^)/
だれか再うpお願いしますorz

204:名無しさん@お腹いっぱい。
06/05/16 10:26:52 Xerb6WEC0
うわ、乗り遅れた…
URLリンク(newsstation.info)

流れにくいからここでのうp頼む・・・

205:名無しさん@お腹いっぱい。
06/05/16 15:24:13 SG1pZd620
うぉ、自分もまにあわんかった。
どなたか、たのんます。


206:名無しさん@お腹いっぱい。
06/05/17 15:34:18 MNLj8JSA0
p2pを利用したらいいじゃない

207:名無しさん@お腹いっぱい。
06/05/17 17:20:35 b3vuFwJq0
>>206
ダウン厨はダウン板に帰れ

208:名無しさん@お腹いっぱい。
06/05/17 19:11:54 Knze7zea0
>作者
チラチラ見てんじゃねーよw

209:名無しさん@お腹いっぱい。
06/05/19 20:33:06 DnybOIRW0
付録のDVDに入ってる雑誌買えよ。

210:名無しさん@お腹いっぱい。
06/05/19 22:50:54 xNufcQXS0
smartOCRアップローダーで頂けないでしょうか?

211:名無しさん@お腹いっぱい。
06/05/20 00:21:42 316S079V0
PCJapan・・・高い雑誌だな。しかもソフトバンク。。。
雑誌買わせる方向に誘導してるような気もしないでもない。
やっぱ雑誌売るための罠かな。俺は買わないな。

パソコン系の雑誌って買わなくても困らないんだよね。
買わなくなって5年位は経ってるなぁ。

212:名無しさん@お腹いっぱい。
06/05/20 02:47:10 zc//6BGm0
立ち読み最強

213:名無しさん@お腹いっぱい。
06/05/20 06:01:10 46cvk59m0
>>212
付録抜き取るのは万引きですよ

214:名無しさん@お腹いっぱい。
06/05/20 08:49:35 DrsH0FrP0
>203,204,205,210

海外のアップローダーで26MBのzipファイルをアップで
きて、アップされたことがわるうようにリストに載るところを
教えろ。
「○○にアップした」と言った時点で2chのログからアシが
ついてしまうから、慎重になるんだよ。
といっても、俺はアップしないけどなw


215:名無しさん@お腹いっぱい。
06/05/20 09:50:54 yf1cFYUN0
>>214
URLリンク(rapidshare.de)

216:名無しさん@お腹いっぱい。
06/05/20 14:12:04 Uy3vyKaU0
FreeFileHosterかMEGAUPLOADの方がよさそう

217:名無しさん@お腹いっぱい。
06/05/20 14:49:04 DrsH0FrP0 BE:54205474-
URLリンク(www.filecache.de)

URLリンク(www.filecache.de)
がリストになっている。ダウンロードは要登録。

218:名無しさん@お腹いっぱい。
06/05/20 16:39:57 Uy3vyKaU0
h抜いとけ

219:名無しさん@お腹いっぱい。
06/05/21 01:52:32 wYeqtwox0
\(^o^)/オワタ

220:名無しさん@お腹いっぱい。
06/05/21 03:20:10 aBNJIbFm0
ユー ザーネ ームもパ スワー ドもメー ルアドレ スも適当に入力でダウンロードできそうだな



221:名無しさん@お腹いっぱい。
06/05/21 14:44:16 pKkiP3YB0
p2p?

222:名無しさん@お腹いっぱい。
06/05/21 18:39:08 bNNpXvvL0
smartocrのオンラインヘルプを置いていた450mb.com
が消えたので、別のところに置きました。

URLリンク(three.fsphost.com)

223:名無しさん@お腹いっぱい。
06/05/21 19:06:30 PoLDvuzO0
ヘルプファイルの人はいづこへ

224:名無しさん@お腹いっぱい。
06/05/21 20:28:48 kD/GWFiY0
>>222
圧縮してまとめて

225:名無しさん@お腹いっぱい。
06/05/21 22:43:02 bNNpXvvL0
>224
204サソのロダにアップしました。

226:名無しさん@お腹いっぱい。
06/05/21 23:59:02 kD/GWFiY0
サンクス

227:名無しさん@お腹いっぱい。
06/05/23 02:05:43 pBITt6Mx0
URLリンク(newsstation.info)

228:名無しさん@お腹いっぱい。
06/05/24 06:37:26 O9GIlUPh0
>227
GJ

229:名無しさん@お腹いっぱい。
06/05/26 14:14:44 88AUr9SH0
GJ

OCR初体験だったのだが、smartOCRいいね。
今までちょっとしたものを手打ちしてたんだが、
無駄なことをしていたものだとショックを受けた。

230:名無しさん@お腹いっぱい。
06/05/26 16:09:07 9fAOm0gt0
そういえば、水戸黄門ってまだ続いてるの?

231:名無しさん@お腹いっぱい。
06/05/29 01:01:54 idiSaaFc0
>>229
確かにいい感じだな。
どっかこれ権利買い取ってフリーで再公開してくれんかねえ。
広告モデルでも全然構わんから。
これ使ってればいいんだが、公開終了してるのは何か気持ち悪い。
一応、他にもフリーなOCRはまだあるにはあるが、
中華企業の認識率糞、縦書き不可の相当微妙なものしかねぇ。

232:名無しさん@お腹いっぱい。
06/05/29 10:42:57 XLsqYzXY0
危倶 → 危惧
割と良く出る間違いその1
タイピストですが

233:名無しさん@お腹いっぱい。
06/05/29 11:28:43 xRqvGjX70
読取革命が一番良かった。

234:名無しさん@お腹いっぱい。
06/05/29 22:26:40 KMpdN7SB0
読取物語がダントツで一番良かった。

235:sage
06/05/30 01:34:01 HiFzZ9Ao0
うわーん出遅れた
>92をどなたかplz!

236:名無しさん@お腹いっぱい。
06/05/30 01:39:12 HiFzZ9Ao0
235デスガ・・・orz スマソ、忘れて・・
>227トンクスコ!

237:名無しさん@お腹いっぱい。
06/05/30 19:31:09 IQxPnUIo0
>>227
リンク切れでした。
誰か再うpしてください。

238:名無しさん@お腹いっぱい。
06/05/31 09:35:05 /Y6CSn5f0
>>237
次から次へとお前が沸いて永遠に繰り返すことになりそうだなw

239:名無しさん@お腹いっぱい。
06/05/31 12:05:08 K+V34f0CO
>>238
お願いします。
放(ryしてキャッシュ貼りますから。

240:名無しさん@お腹いっぱい。
06/05/31 12:06:57 K+V34f0CO
↑間違った。
放(ryしてハッシュ貼りますから。

241:名無しさん@お腹いっぱい。
06/06/02 16:52:22 jAfS9VzD0
もう雑誌にはいってねーのか?

242:名無しさん@お腹いっぱい。
06/06/03 01:36:12 h8UsTG7k0
227まだあるじゃん

243:名無しさん@お腹いっぱい。
06/06/04 13:18:38 EbDdenWLO
>>227はあるけど、中身の本体のリンクが切れてる。

ということでうpしてくだちゃい

244:名無しさん@お腹いっぱい。
06/06/04 19:25:16 5Ul1i0jX0
>>238
それどころか、
227ヘルプファイルをうp→便乗domが「本体のリンクが切れてるから、誰か下さい」と言い出す
→本体をうp→便乗dom「誰かヘルプファイル下さい」→227の(ry
という、悪夢のスパイラルに陥りそうな悪寒。

245:名無しさん@お腹いっぱい。
06/06/06 00:12:29 3Uhlse6K0
>>243
土曜の時点ではまだ落とせたんだよ

246:名無しさん@お腹いっぱい。
06/06/06 00:13:40 3Uhlse6K0
ああ、中身の本体かよ。PCJAPANでも買っとけ

247:名無しさん@お腹いっぱい。
06/06/06 00:22:27 bbj68jM10
というか、まだちゃんとうpされてるサイトあっただろ。
昨日の時点でまだダウソできたことを確認。
場所が場所だけにすげぇ低速だが。

248:名無しさん@お腹いっぱい。
06/06/06 21:54:14 Y7Ey0sUa0
どなたかSmartOCRうpまたは落とせるところお願いします

249:名無しさん@お腹いっぱい。
06/06/06 22:35:56 3Uhlse6K0
SmartOCR Lite Edition 等を許可無く再配布しないよう、お願いいたします。



2006 年 5 月 10 日
スマートリーディング







250:名無しさん@お腹いっぱい。
06/06/12 00:58:24 EfgArGT30
なくなった会社の許可がいるの?

251:名無しさん@お腹いっぱい。
06/06/12 01:03:44 i54ORezZ0
>>250
会社が無くなっても、著作権が無くならないよ。
借金取りが権利を借金の肩に持っていってるかもしれんし、
そうで無ければ、会社が持ってた権利が開発者に戻ってくるだけ。
特に、こいつら金に困ってるみたいだし、いらんこと配布してると
ハイエナのように金をたかってきそうw

252:名無しさん@お腹いっぱい。
06/06/12 19:11:05 46jEfGwo0
いつの間にか配布終了。出遅れた。orz

253:名無しさん@お腹いっぱい。
06/06/12 22:25:29 Z9cW+VzM0
パクリソフトってことがバレたから配布停止したんだろ

254:名無しさん@お腹いっぱい。
06/06/13 21:10:38 RiLCtO0J0
>>251
はあ?

255:名無しさん@お腹いっぱい。
06/06/13 22:23:52 xJ5atJ3m0
>>250
倒産しててもいるんじゃないかな。
ちょっと違うけどさ、作曲の著作権とかも、
本人の死後50年まで保護されるしさ。


256:名無しさん@お腹いっぱい。
06/06/13 22:25:55 lSx3pfSS0
会社じゃないだろ。対応とかどう見ても個人。

会社なら登記があるだろ?

257:名無しさん@お腹いっぱい。
06/06/14 00:25:05 gsxqzBqi0
>>256
>会社なら登記があるだろ?
ありますね

対応で個人か会社かなんてどうやって分かるの?

258:名無しさん@お腹いっぱい。
06/06/14 00:58:34 r3oxybTM0
採算性のなさ、2chと連動したタイミングで公開停止&配布禁止掲示・・・
どう見ても厨房の一人芝居です。本当にry

259:sage
06/06/14 11:43:57 YVIbalx90
とりあえずupたのむよ。

260:名無しさん@お腹いっぱい。
06/06/14 19:59:48 ha/FP+ct0
公開停止後にすぐVectorから落とした俺は勝ち組

本気で探してる人のためにMD5書いておく
700e932e22a5060013ca2b813d77479e  27,593,241バイト

261:名無しさん@お腹いっぱい。
06/06/14 21:21:51 Ack3TUTK0
υ

262:名無しさん@お腹いっぱい。
06/06/15 19:24:03 GBp8Hsyn0
>>251

>>そうで無ければ、会社が持ってた権利が開発者に戻ってくるだけ。
・・・?

263:名無しさん@お腹いっぱい。
06/06/15 23:58:55 s41MTfOS0
>>260
今でも落とせるから勝ち組でも何でも無いぉ

264:名無しさん@お腹いっぱい。
06/06/16 01:12:05 IAenTxiq0
>>263
どこ?

265:名無しさん@お腹いっぱい。
06/06/16 12:00:05 AbA1lTIW0
>>264
つ過去ログ
俺が落としたのは約1週間前だ。
今でも落とせるかは不明。

266:名無しさん@お腹いっぱい。
06/06/16 14:56:53 IAenTxiq0
>>265
今でも落とせた! 直リンでいけるね。
0f8adfc0
700e932e22a5060013ca2b813d77479e
60b786e33d2967852042e407dd2a7e83d905611f
だた。

267:名無しさん@お腹いっぱい。
06/06/16 18:55:52 nUW4iR/L0
>>266
もうどこもリンク切れちゃってますが

268:名無しさん@お腹いっぱい。
06/06/16 19:14:51 5Bc6E8UM0
>>267
>>217 ここに幸あり

269:名無しさん@お腹いっぱい。
06/06/16 19:18:47 nUW4iR/L0
>>268
ありがとう今落とせてる
ホントありがとう感謝するよ

270:名無しさん@お腹いっぱい。
06/06/16 23:35:28 YjKMQuMv0
わからなくてダウンロードできないので他のわかりやすいとこにアップしてくれませんか?

271:名無しさん@お腹いっぱい。
06/06/16 23:49:49 nUW4iR/L0
>>270
わからないことないだろう
>>217のところの下の検索ボックスにOCRでも入力して検索すりゃ出てくるよ
それか翻訳サイト使うか…

272:名無しさん@お腹いっぱい。
06/06/17 00:13:51 j43y7vvu0
>>271
人それぞれなんだからわからない人もいるって。
たぶん登録の仕方がわからないんじゃないかな?

273:名無しさん@お腹いっぱい。
06/06/17 00:37:07 okaBaelN0
このスレ、いい人が多いね。

274:名無しさん@お腹いっぱい。
06/06/17 03:30:12 zfgYpqKm0
>>272
登録?
いやいや何も登録しなくても落とせたんだけど…

275:名無しさん@お腹いっぱい。
06/06/17 03:43:15 Y9+rWGXx0
要登録はうpする場合だけ。
ダウソするときは登録はいらん。
実際、俺はそこから落としたしな。

276:名無しさん@お腹いっぱい。
06/06/17 17:25:39 BOfKv/jX0
>>268
無事落とせました。
㌧です。

277:名無しさん@お腹いっぱい。
06/06/17 21:10:41 x5i1fMpH0
なんでパクりだってわかったの?

278:名無しさん@お腹いっぱい。
06/06/17 21:11:58 P9wYutdB0
バグが同じ

279:名無しさん@お腹いっぱい。
06/06/26 18:23:34 KpardJRH0
どっかでDL出来ない?

280:名無しさん@お腹いっぱい。
06/06/26 20:23:37 YN1HXaSw0
>>279
>>217
URLリンク(www.filecache.de)
URLリンク(www.filecache.de)

281:名無しさん@お腹いっぱい。
06/06/26 20:27:59 YN1HXaSw0
⇒Datei jetzt herunterladen

282:名無しさん@お腹いっぱい。
06/06/29 01:38:39 xZue9U4M0
SmartOCR入れたんだけど、EXCEL形式でファイル保存できない・・・。
特に設定しなくても標準でできますよね?

283:名無しさん@お腹いっぱい。
06/06/29 11:51:45 m/Wzd3s30
エクセルだって所詮ローカルなソフト
標準でもなんでもない。

284:名無しさん@お腹いっぱい。
06/07/06 20:40:42 Br9WNg2Q0
フリーソフトにそんな必死にならなくても
P2Pで普通に流れてますよ

どのOCRソフト使ってもじぇんじぇんちゃんと認識されないんだけど
もうその画像はどんな方法使ってもダメですかね?
拾ったテキスト画像なんですけど

設定変えたりしたら認識率あがりますか?
どのソフトもデフォルトで適当にやって、ってのを次々試してるんだけど

285:名無しさん@お腹いっぱい。
06/07/06 22:11:51 njwgeoZV0
中国人に入力させたらOCR買うより安いよ

286:名無しさん@お腹いっぱい。
06/07/07 19:59:44 1oQDzUTY0
スレ違い

287:名無しさん@お腹いっぱい。
06/07/07 20:17:53 U6Ox1+uK0
>>284
dpiどんぐらいですか?
最低300dpiぐらいはないと実用的な精度はでないと思う。


288:名無しさん@お腹いっぱい。
06/07/08 00:51:40 PQ/pqC020
画像から文字へ変換したいファイルが数百あるのですが、
大抵のOCRソフトが大量変換を意図して作られていないようです。
こうした場合に適切なソフトは何でしょうか。

289:名無しさん@お腹いっぱい。
06/07/08 06:38:57 7QQFsHSO0
>>288
>大抵のOCRソフトが大量変換を意図して作られていないようです。
詳しくヨロ
具体的にどういう機能が大量変換向きなんだ???


290:名無しさん@お腹いっぱい。
06/07/08 19:27:18 PQ/pqC020
んー例えば、OCR側から対象の画像ファイルを手作業で指定させる
ような動作をすると、大量の画像からいちいち対象を指定させる
ことになるため、非常に手間がかかります。

うーん、わかりづらいですね。GUIよりCUI向きなのかな。
仮に、OCRをocr.exeとしてコマンドラインで使用できるとしましょう。

C:\>ocr.exe -i a.jpg -o a.txt

のように実行できればと考えています。

291:名無しさん@お腹いっぱい。
06/07/08 20:38:44 E/7p0F930
>>290
マクロ機能使ってないの?
一万枚くらいなら楽勝だよ。


292:291
06/07/08 20:46:33 E/7p0F930
例えば
読んdeココだったらOCRファクトリーの「画像をテキストファイルに」
で一気に変換できます。

他のソフトでもマクロ機能は用意されてると思いますよ。



293:284
06/07/09 13:33:09 sTcFgSd/0
>>287
72dpiでしたorz
5年前くらいにデジカメで撮られた画像らしいです
これしか画像がなくてこれをテキスト化したいのに…
手動でテキスト作るしかないかな
解像度をあげるソフトってないんですか?
なんか映画とかでよくぼやけた画像をピピっと綺麗になおしてますけど

294:名無しさん@お腹いっぱい。
06/07/09 14:06:18 G+2kfkf50
284 名前:名無しさん@お腹いっぱい。[] 投稿日:2006/07/06(木) 20:40:42 ID:Br9WNg2Q0
フリーソフトにそんな必死にならなくても
P2Pで普通に流れてますよ
284 名前:名無しさん@お腹いっぱい。[] 投稿日:2006/07/06(木) 20:40:42 ID:Br9WNg2Q0
フリーソフトにそんな必死にならなくても
P2Pで普通に流れてますよ
284 名前:名無しさん@お腹いっぱい。[] 投稿日:2006/07/06(木) 20:40:42 ID:Br9WNg2Q0
フリーソフトにそんな必死にならなくても
P2Pで普通に流れてますよ

犯罪者なので通報しておきますね

295:名無しさん@お腹いっぱい。
06/07/09 14:13:39 JIwVYg1M0
>>945
知りませんじゃねえよ。ちったあ考えろ。

296:名無しさん@お腹いっぱい。
06/07/09 14:17:19 JIwVYg1M0
すまん。誤爆。

297:名無しさん@お腹いっぱい。
06/07/14 10:01:36 H2lacOtO0
久しぶりに来たら、smartOCRのダウンロード先が書いてあるじゃないですか。
サンクス。

298:名無しさん@お腹いっぱい。
06/07/16 23:10:46 /eJmwKqQ0
普通OCRソフト使うのはスキャナを使うときでしょ?
んで、スキャナ買うとたいていOCRソフトがバンドルされてるわけだが、それでも
あえて使う価値あんの?>smartOCR

299:名無しさん@お腹いっぱい。
06/07/16 23:26:37 b3Rdho+m0
HPの多言語OCRは恐ろしくタコ

300:名無しさん@お腹いっぱい。
06/07/17 01:43:29 O7xJRJm20
smartOCR使ってみたが、はっきり言って修正するより最初から打ち直したほうが明確に速いレベルだ。
元の原稿はかなり綺麗だったのにOCRソフトってこんなもんなんだろうか。

301:名無しさん@お腹いっぱい。
06/07/17 01:51:05 If/Z+kH40
俺はスキャナ付属のOCRや体験版のOCRと比べてみたが
SmartOCRが一番認識が正確だった。

他のが90%としたらSmartOCRが99%以上ぐらい

302:名無しさん@お腹いっぱい。
06/07/17 08:32:55 78VlHxeJ0
>>301
全く禿同。

303:298
06/07/17 12:10:25 U3CEtzD60
>>299-302
なるほど。
とりあえず試してみる価値はありそう。
パクリとのウワサもあるが、要は出来が良ければよかろうなのだァ

304:名無しさん@お腹いっぱい。
06/07/17 16:38:45 3dDDjcAS0
smartOCRの精度は読取革命以下。読んでここは使ってないからわからん。
本格読取と同じくらいかな~

305:名無しさん@お腹いっぱい。
06/07/18 13:26:38 UgKmiUz70
パクリじゃなくて元社員のソースお持ち帰りだろ
つまり、ソースを同じくする市販製品のどれかと精度は一緒

306:名無しさん@お腹いっぱい。
06/07/18 16:14:05 aB9zgZSk0
お前にはこれが足りないようだ

っ辞書

307:名無しさん@お腹いっぱい。
06/07/18 17:30:47 PNLoSI320
初期のソフト同士を比べても意味ないとおもう
学習と辞書登録しないとどれも使い物になんらし・・・

308:名無しさん@お腹いっぱい。
06/07/19 04:34:20 jdcDRxBu0
SmartOCRスゲー!!! 読んdeココなんか買わなきゃよかった!!!
>>280ガチで㌧


309:名無しさん@お腹いっぱい。
06/07/20 00:34:18 PBqegdpV0
発売中止後の人気が出るなんて
でも、あの価格じゃ売れないよな

310:名無しさん@お腹いっぱい。
06/07/20 00:45:31 3z81PHpX0
売らないつもり→某社が買おうとした→緊急発売停止

311:名無しさん@お腹いっぱい。
06/07/20 21:57:29 x0TH0cFO0
>>310
某社ってLivedoor?

312:名無しさん@お腹いっぱい。
06/07/21 02:07:48 KqBJHYi80
>>301
これホント?
スクリーンショットの場合だと70%くらいの出来だなあ

313:名無しさん@お腹いっぱい。
06/07/21 03:32:47 DOoxQ5qB0
>>312
エロ小説のスキャン認識で、修正なしでもあまり気にならず読めるくらい。

!とか?とか?の誤認識は結構ある

314:名無しさん@お腹いっぱい。
06/07/21 11:09:01 sEY0Mzm40
ルビどうするんだ?

315:名無しさん@お腹いっぱい。
06/07/21 13:56:28 DOoxQ5qB0
()に括って表示させる

316:名無しさん@お腹いっぱい。
06/07/23 22:55:04 clBRhjSd0
誰か>>222のヘルプを纏めてうpきぼん

317:名無しさん@お腹いっぱい。
06/07/23 23:54:18 1wJoQzQe0
>>315
結構手間掛けてるんだ

png読めないんだね

318:名無しさん@お腹いっぱい。
06/07/24 16:24:46 MEL9glNo0
ここ親切なやつが多すぎ





超ありがとう。

319:名無しさん@お腹いっぱい。
06/07/24 18:45:12 5RnBxMUA0
同じく、超ありがとう。

でもインストローラを実行するとスタートアップに何か登録されたお。これ何?俺だけ?
ちなみにインストローラの拡張子をcabに変えてインストすれば無問題でした。

320:名無しさん@お腹いっぱい。
06/07/24 19:00:53 oimwNy810
>>316
URLリンク(www.filecache.de)
で、画面最下部のIndex-Suche:の
ボックスに「smartocr」と記入して
Suchen!

321:名無しさん@お腹いっぱい。
06/07/25 20:45:36 9vYDzWBh0
ありがとう

322:名無しさん@お腹いっぱい。
06/07/27 23:53:02 2bXNehB/0
>>320
ほんまあんがと

323:名無しさん@お腹いっぱい。
06/07/28 16:24:50 Zsc2pEXo0
smartocrも悪くは無いんだが機能制限で連続処理できないから不便だな
スキャンした小説をまとめて読み取るには読んでココとか使うしかないのか

324:名無しさん@お腹いっぱい。
06/07/28 21:21:43 h0H8l2BL0
マウス操作をマクロ化するフリーウェアでどうにか連続処理させてる

325:名無しさん@お腹いっぱい。
06/07/28 21:58:14 UWTSUIWE0
>>323
パッチあてればいいじゃん

326:名無しさん@お腹いっぱい。
06/07/28 22:53:11 WMt54gBJ0
>>325
サンクス、できた

327:名無しさん@お腹いっぱい。
06/07/28 22:56:22 Zsc2pEXo0
>>325
パッチなんてあるの?
すまんが詳しく教えてくれないか?

328:名無しさん@お腹いっぱい。
06/07/30 21:22:12 ubShczZl0
smartOCRでpdfからテキスト化ってできん?

329:名無しさん@お腹いっぱい。
06/07/31 00:05:21 RN8M8o5y0
>>328
マルチウザッ

330:名無しさん@お腹いっぱい。
06/07/31 12:12:20 fmSAcWfY0
パッチ見つけたんだけど
1.07用のしかない・・・
1.06もある?

331:名無しさん@お腹いっぱい。
06/07/31 23:25:40 JetuRet50
パッチを持っている方うpお願いします

332:名無しさん@お腹いっぱい。
06/08/01 08:29:07 2c/9wdgc0
>>330
nyで流れてるpro版(crack)じゃあかんんの?
1.06もあったお

333:名無しさん@お腹いっぱい。
06/08/01 09:00:02 vOY/YVWb0
W2FL回してもLiteしか引っかからん
ハッシュ張ってくれまいか?

334:名無しさん@お腹いっぱい。
06/08/02 13:47:19 jKqSHbs80
パッチをできれば320のサイトにアップしてくれ。
1つのサイトにまとまっていれば使いやすくなるから。

335:名無しさん@お腹いっぱい。
06/08/02 17:34:42 i1Pr84GE0
あー・・・誰か読んDEココの辞書UPしてくれねーかな・・・
修正イチイチやるのにもう疲れた・・・

336:名無しさん@お腹いっぱい。
06/08/02 18:11:38 D7ELxKnZ0
>>330-335
犯罪者死ね

337:名無しさん@お腹いっぱい。
06/08/02 21:42:03 kcCMiG1W0
画像→テキストと聞いて思い浮かんだんだが、ビットマップの画像データを16進数の文字データに変換できたらおもしろそうだね。
#000000から#FFFFFFを使って、HTMLに絵を変換しちゃうかんじの。
もしなかったら作ろうと思ったんだけど、どうかな。

338:名無しさん@お腹いっぱい。
06/08/02 22:35:23 kQooJzkQ0
あほ?
ビットマップはバイナリで同じようなこと実現してるんだから、データ量が増えるだけ。

339:名無しさん@お腹いっぱい。
06/08/02 23:11:26 OcRUZ++g0
ちょっと話を遮ってすまん。

340:名無しさん@お腹いっぱい。
06/08/03 00:00:46 iWn6RE2Q0
用件は?

341:名無しさん@お腹いっぱい。
06/08/03 00:03:21 4MUFkbB30
あほ?

342:蕪木ら某 ◆Googl8RmwA
06/08/03 00:40:18 xzisirSD0
( >>337-338 + URLリンク(www.google.co.jp) )

343:名無しさん@お腹いっぱい。
06/08/06 17:23:12 5mCH8TkK0
>>332
著作権法違反幇助の罪で通報しますた。
少なくとも金子よりは露骨な幇助だな。

344:名無しさん@お腹いっぱい。
06/08/06 17:25:57 5mCH8TkK0
>>312
OCRは使い込む毎に傾向を学習するような機能を実装するのが普通だから
使い込んだSmartOCRが有料商品より優れてても何の不思議はない。
学習済み製品>学習済みSmartOCR>未学習製品>未学習SmartOCR
?%        99%           90%      70%
だったってだけだろ。

345:301
06/08/06 18:17:24 Na9dQa9x0
400文字に4箇所でも1%の誤認識だよ?
認識率99%でも誤認識自体は結構あるわけで特別正確というわけじゃない。

346:名無しさん@お腹いっぱい。
06/08/06 18:59:17 WiVrJ4hk0
アホ?
396文字は正確に認識できてるわけだし

347:名無しさん@お腹いっぱい。
06/08/06 19:05:32 Te5d4kQG0
夏だなぁ

348:名無しさん@お腹いっぱい。
06/08/06 21:06:32 YwNa65u70
>>345
今の時代で1%の誤認識なら
十分正確と言えるよ

349:名無しさん@お腹いっぱい。
06/08/06 21:58:43 Dk7evszD0
>>344
たぶん夏釣りだと思うけど一応レス

学習済みOCR>>未学習SmartOCR≧未学習その他OCR製品

実際こんなもん。
最近のOCRソフトは性能が右肩上がりだから、
少しカスタマイズしたり学習させたりすることで顧客の満足が得られるレベルになるよ


取り合えずOCRがよくわかんねぇ奴は無料のSmartOCRlite使っとけ!
SmartOCR作ってたスマートリーディング社は倒産してるから工作員もいねぇしなw

350:名無しさん@お腹いっぱい。
06/08/07 11:16:43 qZq47fmj0
学習済みSmartOCRpro>>>未学習SmartOCRpro>>学習済みSmartOCR>学習済みOCR>>未学習SmartOCR≧未学習その他OCR製品

351:名無しさん@お腹いっぱい。
06/08/07 12:10:55 qFOTuJog0
OCROCRうざいからOCRをNGワードにした。

352:名無しさん@お腹いっぱい。
06/08/07 14:55:38 zVynDYiY0
SmartOCRは社員の持ち出しな上、読んでここよりちょっといいくらい。辞書だっておそらく流用だろうし。


353:名無しさん@お腹いっぱい。
06/08/07 16:34:14 7pOEwcrp0
>>352、日本人ならもちっと文をまとめようぜ

・SmartOCRは社員の持ち出し(意味不明)
・私はSmartOCRの方が読んde!!ココより僅かに優れてると思っている
・私はSmartOCRで使用されている辞書は流用だと想像している

まず箇条書きでまとめてみた
さて再度一つ一つの文の説明をしてくれ

354:名無しさん@お腹いっぱい。
06/08/07 18:50:37 zVynDYiY0
要するにパクリ製品で、辞書を流用してて、ヘボ商用OCRよりマシってことだ。
説明もなにも、過去ログに書いてあることをまとめたに過ぎない。

355:名無しさん@お腹いっぱい。
06/08/07 23:49:47 Qv4+7ueU0
>>353
日本人なら>>352ぐらい解読しようぜ。よほど文盲じゃない限り意味は分かる。

356:名無しさん@お腹いっぱい。
06/08/08 00:05:58 7pOEwcrp0
単なる皮肉じゃねーの?

357:名無しさん@お腹いっぱい。
06/08/08 02:04:46 t9gg1Fnb0
単なる池沼だろ。
それか中の人がファビョってるのか。

358:名無しさん@お腹いっぱい。
06/08/08 02:10:21 uq6ary4N0
夏だなぁ

359:名無しさん@お腹いっぱい。
06/08/08 08:46:43 t9gg1Fnb0
夏だなぁ厨

360:名無しさん@お腹いっぱい。
06/08/08 17:12:44 3QjCPQSG0
>>352を読んで理解できなかったID:7pOEwcrp0

文を纏めろといいながら「読んでここよりちょっといいくらい」を「読んde!!ココより
僅かに優れてる」と捏造してしまうID:7pOEwcrp0

反論されたので、日にちも変わったことだし他人のふりして擁護しようと自演した
ら、まだIDが切り替わってなかったID:7pOEwcrp0


さて日本語が理解できなくて捏造大好きで自演までしちゃうのは誰でしょう?w

361:名無しさん@お腹いっぱい。
06/08/08 19:51:33 UyzJNkd70
>>360
「僅かに」を「遥かに」と誤認識した、に1票

362:名無しさん@お腹いっぱい。
06/08/08 19:56:01 SlWnD/4h0
>>360
文盲カッコワルイw

363:名無しさん@お腹いっぱい。
06/08/09 00:08:21 amjlGhB40
わかり辛いスレだな。
誰かOCRにかけてくれ。

364:名無しさん@お腹いっぱい。
06/08/09 08:08:32 iYEfwOXm0
わかつナこ

365:名無しさん@お腹いっぱい。
06/08/10 05:43:59 Mw/M2k+w0
SmartOCRのことで、教えてくれ。

どうして1.0.6の需要があるの?
最新版の1.0.7にはない機能があるとか。

教えて君で申し訳ない。

366:名無しさん@お腹いっぱい。
06/08/10 14:26:00 jb2eTzx50
>>365
マルチやめれ
関連スレの過去ログ読むかググれよ

367:名無しさん@お腹いっぱい。
06/08/10 14:37:36 XmxyRxn90
107は精度が落ちてるから

368:365
06/08/10 18:46:25 Mw/M2k+w0
>366
マルチ違う
関連スレも見たぐぐった

>367
教えてくれてありが㌧

お礼に教える君になります。
320のページで検索(Suchen)すると、検索結果が
今までより1個多くなっている。さてなんでしょう(w

369:名無しさん@お腹いっぱい。
06/08/13 08:44:48 eMHMvqto0
何で読取革命が人気ないかわからん。俺の環境だと
読取革命>>e.Typist>読んで   e.Typistは体験版、他は最新版。

今度からランク付けする場合、どんな資料読み取ってるか書いてもらいたい。

俺が読み取ってるのは図形、表、字混合、白黒の資料


370:名無しさん@お腹いっぱい。
06/08/13 09:54:26 GICVZJIQ0
ジャケ画の歌詞画像スキャン結果だと
読取革命>e.typist>読んでここ>SmartOCR
全部体験版の初期状態ね。

371:名無しさん@お腹いっぱい。
06/08/13 14:27:28 yMWJsO350
ヒント:金出して買えない厨房の溜まり場


372:名無しさん@お腹いっぱい。
06/08/13 17:43:34 6jIuQ4Dp0
自覚してるわけですか

373:名無しさん@お腹いっぱい。
06/08/13 22:26:50 yMWJsO350
まあ読取革命は本格読取からの優待で安く買ったけど

374:名無しさん@お腹いっぱい。
06/08/14 02:38:29 2kxjreYM0
初期状態でのOCR精度比べても無意味だろ
学習させないととてもじゃないが使い物にならんよ

375:名無しさん@お腹いっぱい。
06/08/14 10:17:04 sle7CdNN0
段落を取れん場合は、学習機能も無意味。
段落のとり方を学習できる製品はないのかな。

376:名無しさん@お腹いっぱい。
06/08/15 01:41:50 f2VQuwo60
ある

377:名無しさん@お腹いっぱい。
06/08/15 16:09:35 f/D0Xu0a0
OCRを使ってますか?
スレリンク(bsoft板)

378:名無しさん@お腹いっぱい。
06/08/31 18:22:56 bjz28sKf0
SmartOCRのヘルプページのサイトは、URLリンク(three.fsphost.com)から

URLリンク(ocr.rossa.cc)

に移転しました。
多分、今までよりも快適に読むことができると思います。

379:名無しさん@お腹いっぱい。
06/09/06 19:12:26 yw7232fl0
表面的な匿名をいいことにマナーが悪すぎるな

380:名無しさん@お腹いっぱい。
06/09/06 20:18:47 fi4e3w9G0
製品パクってくるよりまし

381:名無しさん@お腹いっぱい。
06/09/09 20:06:25 Zk6MRhKi0
2chでマナーとかいいだしたらキリが無いですよ。ぜんぜん大人しいほう。

382:名無しさん@お腹いっぱい。
06/09/13 16:13:30 8KtJLkVe0
 

383:名無しさん@お腹いっぱい。
06/09/20 16:39:06 T4QOs50J0
Smart OCRを初めて知ったので、今落とせてサンクス。

384:名無しさん@お腹いっぱい。
06/09/26 22:06:44 B0JYe+LK0
>>381
表だっては掲示板内で違法行為働いてることを堂々と書き込んでいるのはあまり見ない。
違法を違法と理解してない風な書き込みは流石に痛い。
そういうのがパクリを叩くのもまた痛い。

385:名無しさん@お腹いっぱい。
06/09/28 03:50:29 y+zC8mrs0
つまりsmartOCRは社員がどこかのocrソフトメーカーからソースぱくってつくたってこと?

386:名無しさん@お腹いっぱい。
06/09/29 00:11:09 Yq1fsyDX0
表の読み取り最強なのはどれ?
ちなみに、表=主に数字と定型的な単語のみで構成され、罫線で囲まれたもの ってことで。

日本語文書読解とかどうでもいいんで、望む機能としては
1.罫線の存在を認識できる = 点線を一や-の連続と思わないこと等
  (ユーザーの設定により罫線ありと明示的に設定できるとなお良)
2.表のテンプレート設定が豊富 = セル・行・列指定で数字のみや記号のみに限定できる等
  (細かく文字を限定できればなお良 例:「\19,800」みたいな価格→「数字 , \」、電話番号→数字と"-"のみ)
3.数十枚~数百枚程度の自動認識機能

387:名無しさん@お腹いっぱい。
06/09/29 00:20:02 Yq1fsyDX0
読取革命の体験版を試してみたんだけど、これって一度作ったテンプレートの融通が利かないんだね。
例えば帳票をADFで連続読み取りしてると、どうしても2~3ミリくらいは上下左右にずれちゃうんだけど
テンプレートを呼び出したあと、ちょっとだけ位置を修正しようと思ってもこれが出来ない。
無理やり移動したり大きさ修正しようとすると、設定したセルや文字種が全部デフォルトに戻るw
表専用OCRじゃないから多くは望めないとはいえ、これはちょっと酷いんじゃないのかな~。

前の職場で使われてた業務用OCRは優秀だったんだよね。
テンプレート位置を、画像上の罫線を参照して自動修正してくれたり
ガチで連続読み取りに特化してた。

388:名無しさん@お腹いっぱい。
06/09/29 02:30:08 90PHlJ6J0
つーかスマートOCR誤字ばっかりでぜんぜん読み込まない
どっかに横文字で書いただけの文字の画像ないかな

つーかこのスレをスクリーンキャプチャしてみるか。

389:名無しさん@お腹いっぱい。
06/09/29 02:37:58 90PHlJ6J0
]9fi:名畑しさん@お腹いっぱい.:2田10∈/ng,'pa(木)0:ifio:四ID:y4■CRTrcO
つよU垢rErtOCRば社員がどこかの阻rソフ1・1其一カーからソースぱく丁て]くた.」てこと?
t
瑚:名無しさん@お腹い]ぱい.:2田10[fn9,'29(k')OO.11.α91DY目1国DXO
却]請み取り最桂なのばど.れ7
ちなみに、表一土に数字と定型AMs単語のみで構成され、罫腺で匝まηたものーてことて.
ヨ本語文書読解とかピうでもいいんで、望む機能としてば
1.…:線の存在菅詔識でぎる一点線を一や一の連続ヒ思わないこと等
(「一サーの設定:「より罫線あり1と明示的「設定できる仁なお良)
■■.表のアンプレー-設定が豊富-セル'fi一列指尼で数字のみ阜記号の捌こ眠定できる等
㈱か(Y字}1狼定できれ1:碍「焉-仲1」:「UIF.Rnfi」みt'1.ln伍格→R歌字.耳」.雪話番岩→?.享t'一'Mh:)
3.数十枝一数百枝程度の目動認識機能
脚:名無しさん@お腹いっぱい.:PfCEIng,'pn(金)OO:20:nP TD:YclkvDXO
読取革命の構験版を証して碍たんだ∪ど、これって一劇乍ったテンプレートの甜動荒不1-VL'td■,んだね.
側えば帳草をA[Fで連続読み取りしてると、どうしても2~3ミリくらいば上下左右にずれちゃうんだけど
アンプレー1-琶呼ぴ山したあと、ちょ訓とだけ位置古修工しようこ思ってもこhhU来奄い.
無哩やり樗動しr一り六芦ざ條[Fしようと丁るk.設定し斤ヤ」しヤ夏字植が全部デフォルトに戻るw
表専用DC屯拝ないから多くば茎めたいとばいえ、こればちょ北酷いんしドtsいの右.な一...
前刃職場で使われてだ茉務用DCRば優秀だ丁だんだよね。
テ?」レート位直を、画像上の罫線を参照して目動修正してくILt[り
ガチで連続読み取リに特化してた.
]SE:名無しさん@お腹いーぱい.:2fmE/ng,.pg(金)D2:田:nETD:叩PHL旧.-ID
つ一研スマートOCR誤字は.・h,りでぜんぜん読み込よない
どっか[こ構夏宰で書.,r一戸'けの又=の由偉煎.巾噴
つ一MILCjxレ芒スクリーノキャプチャし⊂みるか。
.一ワ汀表NnlL,た
ー「「「一一一一一一一三]


390:名無しさん@お腹いっぱい。
06/09/29 08:13:46 0aDHtvHn0
>前の職場で使われてた業務用OCRは優秀だったんだよね。

それが何だったか覚えてないの?それ使えばいいだけだと思うんだけど。

391:名無しさん@お腹いっぱい。
06/09/29 19:12:19 EG4JKPXp0
エプソン、エー・アイ・ソフトを吸収合併
URLリンク(pc.watch.impress.co.jp)

392:名無しさん@お腹いっぱい。
06/09/29 23:03:15 NpqBn/zy0
>>391
創業23年を目前にして、その歴史に幕か・・・。
まあ、「読んde!!ココ V.12」のパッケージに"EPSON"ロゴが入った時にそんな予感はしていた。
あと、EPSON製ソフト「オフィリオ・シナジーウェア」との連携をやたら強調したり・・・。

合併後も、EPSONが積極的に売り出しそうなのは、「読んde!!」等OCR系と「デジカメde!!」シリーズぐらいか?
DiskX、まっぷっぷ、訳せ!!ゴマとかは放置プレーかな・・・。
ひとまず合掌。

393:名無しさん@お腹いっぱい。
06/09/29 23:21:31 qqH6EebL0
WXが・・・

394:名無しさん@お腹いっぱい。
06/09/30 17:07:10 ocwN+jtc0
読んdeみたいなクソソフトは消えても全くどうでもいい

・・・といいたいところだが対抗商品が全くなくなると
e.Typistが手抜きし始めるから形だけでも残ってもらった方がいいな。

395:名無しさん@お腹いっぱい。
06/09/30 17:19:00 nUtd3U1F0
読取革命がある


396:386
06/09/30 18:12:14 ZJPKuVam0
>>390
日立超LSIシステムズのMY-QREADERってやつで\398,000。
ちなみにソフトだけじゃなく専用のPCIボード込みなのでピーコも㍉。
専用ハードによる文字認識でPenII 300MHzが主流の時代の代物なのに高速だった。
もっとも今はCPUが速くなったのでソフトだけでも十分なんだけど。

397:名無しさん@お腹いっぱい。
06/09/30 21:34:12 NBV4N4H80
ダメもとでお聞きしますが、Mac対応でフリーのOCRソフトなんてありませんか。
それが無ければ、1万円を切るソフトはありませんか…?
Mac対応版はWin対応のよりも倍ぐらい高いんですよね、どれも。OTL

398:名無しさん@お腹いっぱい。
06/09/30 21:39:43 iNUp/IlD0
WinReaderProを仕事用に検討していますが、どなたか使われた方いらっしゃいますか?
20万円もするので気楽には買えませんので。。。

399:名無しさん@お腹いっぱい。
06/10/01 03:25:19 6ixnYLr20
>>398
仕事で使うものの情報を
こんなところで集めるのはやめろよ・・・
自分で調べた方が安全

400:名無しさん@お腹いっぱい。
06/10/01 09:53:48 WvMARitI0
>>399
PC関係の情報は2chが一番早いので。
仕事で使っているソフト、ハードの情報はほとんど2chで入手しました。
嘘の情報はそれなりにわかりますしね。2chか価格コムで調べて買うというのが多いですね。

401:名無しさん@お腹いっぱい。
06/10/02 02:32:58 yT4SsxAOO
俺は日立の帳票マスター使ってるよ

402:名無しさん@お腹いっぱい。
06/10/02 05:41:51 ZYOoziFL0
smartが一番

403:名無しさん@お腹いっぱい。
06/10/05 19:57:23 aY7Ko/8j0
SmartOCRってまだどっかから手に入れられたりできない?

404:名無しさん@お腹いっぱい。
06/10/06 14:23:58 ArovS4cU0
>>403

URLリンク(ocr.rossa.cc)

405:名無しさん@お腹いっぱい。
06/10/06 15:56:47 6Bl0QuR70
>>404
リンク切れ?

406:名無しさん@お腹いっぱい。
06/10/07 02:59:04 e9AUhQqs0
うお、レイアウトがw

407:名無しさん@お腹いっぱい。
06/10/07 10:20:48 104t2KLp0
リンクきれてるな

408:名無しさん@お腹いっぱい。
06/10/07 17:19:03 oro3A3sc0
filecache.deあぼーんでsmartocrオワタ\(^o^)/

409:名無しさん@お腹いっぱい。
06/10/07 17:35:15 opPB5pDv0
\(^o^)/


410:名無しさん@お腹いっぱい。
06/10/08 03:51:16 3kDvU2pq0
俺持ってるから関係ないや

411:名無しさん@お腹いっぱい。
06/10/08 18:08:49 N8NhqxEI0
ビジネスソフト板にも尾crすれがあった

412:名無しさん@お腹いっぱい。
06/10/08 18:17:19 LMMEjzcE0
OCRを使ってますか?
スレリンク(bsoft板)

413:名無しさん@お腹いっぱい。
06/10/20 17:49:29 3UV/yuu60
ほすす

414:名無しさん@お腹いっぱい。
06/10/20 19:30:32 XhCLS0YF0
ソース糞ソフトから本格読取2がでるよ

415:名無しさん@お腹いっぱい。
06/10/21 21:32:53 x+s51qZ50
URLリンク(www.sourcenext.com)
読取革命9改か・・・どこを「仕様変更」したか気になるところだ。

416:名無しさん@お腹いっぱい。
06/10/21 21:34:17 oeD+LEUh0
名前とか。
他のソフトが付いてたなら、それも削られてる。辞書も多少削られてるかも。


417:名無しさん@お腹いっぱい。
06/10/22 11:26:53 XHAMoIGg0
読み取り革命体験版インストして、期間が来たからアンインストしたけど
アドイン解除してアンインストしたのに、ワードに読み取り革命のメニューが残ったまま。
どうやって消せばいいの?

418:名無しさん@お腹いっぱい。
06/10/23 00:28:04 geo80Ohm0
C:\Documents and Settings\USER_NAME\Application Data\Microsoft\Word\STARTUPか
C:\Documents and Settings\USER_NAME\Application Data\Microsoft\AddInsに
なんかそれっぽいのあったら消せ

419:名無しさん@お腹いっぱい。
06/10/23 07:14:35 kQ6qEoy70
以前、WinReader PRO(バージョンは6)を使って、高額なソフトでもこれでは実用に
絶えられないなと思って、OCRはまだまだだと思っていたが、最近出た、読んでココ(バージョン12)
を使ってみて、偉いOCRソフトもかなり進化したなというのを感じた。
しかし、既存のPDFの認識精度はかなりのものがあるが、スキャナーから読み込んだもの
に関しては、まだまだ実用の域には達していないと思った。
当方が扱う、法律関係の文章での話しで、通常のビジネス文章なら、そこそこ修正すれば
使えるのかもしれないが。

420:名無しさん@お腹いっぱい。
06/10/23 07:17:04 kQ6qEoy70
>>398
OCRは仕事に使うには、まだまだだと思います。修正する手間を考えると、
大人しくPDFファイルないしは、紙媒体でのコピーが確実です。

421:名無しさん@お腹いっぱい。
06/10/24 09:03:43 f/S+mxkS0
>>419
WinReaderPROていまver10だよね。
どうだろうね?

422:名無しさん@お腹いっぱい。
06/10/25 19:49:57 BG1ZUYK90
今来た過去ログ読んだ

SmartOCR欲しい・・・

423:名無しさん@お腹いっぱい。
06/10/26 07:12:56 GXHptwKo0
>>422
ヒント:ocr.rossa.cc

424:名無しさん@お腹いっぱい。
06/10/26 08:03:57 E4aP431G0
>>422
君性格くらいね
スパイウェアを広めるのはいくない

425:Nomu
06/11/03 22:23:36 iUKc4B5G0
スキャン画像にOCRを掛けて透明テキスト付きPDFを作成するところ
までは出来ています。実際、検索も可能になっています。
さて、元のデータがExcelやWORDなどで、そこから直接PDF化したものは
元の文字をテキスト選択ツールで選択できますが、
OCRで透明テキストの場合は、テキスト選択ツールで選択できるように
するのは無理でしょうか。
なお、TouchUpなどで無理やり透明な文字をかぶせる技もあるでしょうが、
そういう余計な手数は掛けずに、行える範囲での前提とします。

426:名無しさん@お腹いっぱい。
06/11/03 22:45:22 6588JCgI0
>>425
コテハンうざい

427:名無しさん@お腹いっぱい。
06/11/03 23:00:51 z32n03Yy0
PDFの透明テキストとOCRは関係ない
帰れ

428:名無しさん@お腹いっぱい。
06/11/03 23:11:29 tSrIGytR0
やってみてから書き込め、ボケ

429:名無しさん@お腹いっぱい。
06/11/04 00:16:36 ZktZmkOe0
  そういう余計な手数は掛けずに、
  行える範囲での前提とします。
   ̄ ̄ ̄)/ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
     ( ^ω^)       ∧_∧
    /     \    (    )ハァ? 何言ってんだこいつ
.__| |    .| |_ /      ヽ
||\  ̄ ̄ ̄ ̄   / .|   | |
||\..∧_∧    (⌒\|__./ ./
||.  (    )     ~\_____ノ|   ∧_∧
  /   ヽ 氏ねよ      \|   (    )
  |     ヽ           \/     ヽ. オマエ馬鹿だろ
  |    |ヽ、二⌒)        / .|   | |

430:名無しさん@お腹いっぱい。
06/11/05 11:58:49 Bnn8beJe0
  ( ゚д゚)      「そういう余計な手数は掛けずに、行える範囲での前提とします。」・・・
_(__つ/ ̄ ̄ ̄/_
  \/    /
     ̄ ̄ ̄

  ( ゚д゚ )
_(__つ/ ̄ ̄ ̄/_
  \/    /

  ( ゚д゚ ) ガタッ      
  .r   ヾ
__|_| / ̄ ̄ ̄/_
  \/    /

 ⊂( ゚д゚ )
   ヽ ⊂ )
   (⌒)| ダッ
   三 `J

431:名無しさん@お腹いっぱい。
06/11/05 18:39:47 Iiq9SX+t0
>>430
こっち向かって走ってくんなw

432:名無しさん@お腹いっぱい。
06/11/08 20:38:44 3HKpT8rw0
パナソニック、認識精度が向上したOCRソフト「読取革命Ver.11」
URLリンク(pc.watch.impress.co.jp)

433:名無しさん@お腹いっぱい。
06/11/20 02:48:19 UlfEHxa00
読取革命もルビの扱いをなんとかしてくれないことには何とも。

434:名無しさん@お腹いっぱい。
06/11/21 21:16:46 vrsLPcFX0
ライブPDFとsmartOCRって同じ作者じゃね?

435:名無しさん@お腹いっぱい。
06/11/29 11:17:23 zSFqDqCI0
URLリンク(www.sourcenext.com)
入力可能な画像ファイル形式:
ico,

これってアイコンファイルだよな?
これをテキスト化する状況が思い浮かばんのだがw

436:名無しさん@お腹いっぱい。
06/11/29 14:20:16 nreIeUGR0
ライブラリィが対応してるので、わざわざ読めないようにする方が手間かかるだけだろ

437:名無しさん@お腹いっぱい。
06/11/29 16:04:41 lWCW+zBj0
435はケチをつけたいだけでしょ


438:NNN
06/12/09 01:02:01 2/wxd38Y0
読んde!!ココを使っているが認識してワードで表示する際、文字列をいくつかのテキストボックスで
区切って表示するせいでいちいちコピーしなくてはならず余計に手間がかかるのですが
テキストボックスで区切らせない方法orテキストボックスを一気に解除する方法ってないのですか?

439:名無しさん@お腹いっぱい。
06/12/09 13:18:39 u6P8MIbS0
ワードのVBA使え


440:名無しさん@お腹いっぱい。
06/12/09 13:20:36 u6P8MIbS0
マルチかよ・・・

441:名無しさん@お腹いっぱい。
06/12/10 14:57:22 uMaBJc8r0
           -‐-      ,、
       __〃      ヽ lv !
       ヽ\ .ノノノ)ヘ))〉ヽ'   / ̄ ̄ ̄ ̄ ̄
     _!(0.)! (┃┃〈リ /   < はいっ!
   /\ Vレリ、" lフ/ ./ \   \_____
  /  ./l ̄ ̄ ̄ ̄ ̄ ̄ ̄|ヽ
  \/l  |――――! ヽ
      l  | ○ み か ん  |
      l  l――――|
.      \l_______|

442:名無しさん@お腹いっぱい。
06/12/14 10:40:39 7AK0d3kH0
メディアドライブのHP、なんで見られないんでしょうか?

443:名無しさん@お腹いっぱい。
06/12/22 08:26:12 dGNQhmqY0
復活しているよ

444:名無しさん@お腹いっぱい。
07/01/05 00:57:29 EeadamAd0
本格読取2、精度良いね。俺の手持ちのドキュメントでは、読んでココより精度がよかった。
1980円以上の価値はあると思う。

445:名無しさん@お腹いっぱい。
07/01/07 11:58:38 dRvUQxjL0
>>444
読取革命V9そのままらしいからな。対値段比で考えると相当いい。
ただ英文がやたら弱くないか?
日本語だけの文章なら精度いいんだが、英語が混じると悲惨なことになる。

446:名無しさん@お腹いっぱい。
07/01/12 16:11:17 9w4xHvEE0
SmartOCR1.07を常用していたが、透明テキストつきpdfにする場合解像度の設定において勝手に文字の大きさ基準でサイズを変えてしまう。
したがって、(別なソフトで)複数のpdfを連結した場合、元が同じ大きさの原稿でもAdobeReader上では場合によって違う大きさ表示になってしまう。
今までは1画像→1pdfにしていたから問題にはならなかった・・・・・orz

で、とりあえず読んdeココ12無料体験版を使ってみたのだが・・・・・自動認識の認識率が非常に悪い・・・・こうも違うものなのか?
読んdeココは、(白地に黒のただの文書原稿ならどうか知らないが)文字と絵や写真をふんだんに使ったカラフルな画像は苦手のようだ。


447:446
07/01/13 08:13:51 txbwSWm00
>>446のサイズが変わる件、自己解決。
○○○、捨てないでとっておいてよかった。

今回、色々体験版を使ってみたが・・・ずいぶん認識率に差があるな。
今回使った原稿では、S>e>>>>>ry だった。
とくに、ある特定の文章において文字認識(95%以上の認識率)ができるソフトと、どう設定を変えても文字認識できなかったソフトがあるのはびっくりだった。

448:名無しさん@お腹いっぱい。
07/01/13 18:25:01 ZKON0N9L0
英文OCRエンジンを搭載してるかどうか

449:446
07/01/13 20:49:48 txbwSWm00
>>448
>>447に対してかな?
ならば・・・・対象文章の詳細。
現物は、黒に近い灰色の地に縦書き日本語白抜きのゴシック文字で2.2mm角位。
それを360dpi bmpファイルにして読ませた。
この文字の他、カラーを使った図や表が沢山あったのだが、Sとeはそれらの図表中の数字(縦2.5~3mm)も一応読み取ってくれたが、他2はry

もっと高解像度で試せという声が聞こえてきそうだが・・・
印刷の関係上画像ファイルは360dpiでほぼ統一してあり、現物がすでにないファイルも沢山あるので、俺にとっては360dpiでないと意味はない。

450:名無しさん@お腹いっぱい。
07/01/14 22:06:26 gDvAo02g0
デフォルトの精度よりも
使い勝手で選んだ方がいいよ
学習させないとどれも使い物にならないんだし
学習させたらどれも同じレベルになる

たまにしかOCR使わない人ならデフォルトの精度だけで選ぶのも手だけどさ


451:名無しさん@お腹いっぱい。
07/01/14 23:27:20 6UO6XDK00
>>450
最初は何をやっても(注)画像としか認識しないのでも、学習により文字認識可能になるのかね?

(注)自動認識だけではなく縦書き横書き・また認識枠を使って強制的な認識を試した。
もちろん、体験版だからちょろっと触った程度である。
でも、各ソフトのスタートラインが違いすぎる。

452:名無しさん@お腹いっぱい。
07/01/21 11:01:20 If32Oo320
革体験
 傾き補正・自動の精度が悪い。
 傾き補正・手動の操作性が悪い。

453:名無しさん@お腹いっぱい。
07/01/24 17:43:47 ucWpj8mf0
160GB SATAHDDがカッコヨスぎてwarota

キヤンヘ凸-ンはこのFAXを受取られた従業員数1~400名規模の事業者の方が対象となります。
rl ノ     ■=■            伽凹lTl⊇■:≡:l▲へ′lヨJ■_止□∥亡!■lコ′hザdb■■■
 ′つn M      刑同MR月巳の侍仏洞i肌同ロロりし乗lq
 エロまで!(一部を除く場合かあり打9また本フ・ロモーションの適用は、1′29までにこ注文を頂いた場合に剛打※)
AMDCPU搭載PCDimensionC521今週のおすすめ!発注] ̄ド=19788581
・AMDSempronTMプロセッサ3400+
・Windows㊥xpHomeEdition正規版
・5†2〃β(512MBxl)DDR2-SDRAMメモリ
.†6∂GβS∧mJのβ
・サムスン製†タインデ丁打液晶モニタ(フサソク)
・内蔵NVIDIA㊥Ge†0rCeTM6150LEGPUクーラフイツクス
・DVD-ROMドライブ
・1年間引き取り修理サービス(保守ハD-ツ含む)
・12時間テクニカル電話サポートくE・メールサホ■-ト付)
大容量160GBHDD槻
さらに大画面19’モニ附!

454:名無しさん@お腹いっぱい。
07/01/24 18:14:50 ucWpj8mf0
元ネタです。(FAXモデムでダイレクト受信)
URLリンク(www.uploda.org)

みなさんの環境でコレをOCRかけたら、どれだけ正確に取り込めますか?

ちなみに上で試したのは 7年前のソフト 読んdeココVer2.11 全自動です。
いま出回っているソフトを使ったらどれだけ進化してるか興味があります。


455:名無しさん@お腹いっぱい。
07/01/24 21:46:12 LSNalub20
>>454
e.Typist V11。自動認識で453までの文章結果。
範囲指定してやればもう少しマシだとは思うが。

>キャンペーンはこのFAXを受取られた従業員数1-400名規模の事業者の方が対象となります。
>1/29要!
>期間限定お得な特別商品のご案内
>(一部を除く場合があります。また本プロモーションの適用は、1/29までにご注文を頂いた場合に限ります※)
>AMDCPU搭載PCDimensionC521今週のおすすめ!
>発注コード
>・AMDSempronTMフロセッサ3400+
>・Windows回XPHomeEdition正規版
>・512ル擢∋(512MBx1)DDR2-sDRAMメモリ
.>160GBSA7酒HDD
>・サムスン製19"チTFr液晶モニタ(ブラック)
>・内蔵NVIDIA回Ge拍rceTM6150LEGPUゲラフィックス
>・DVD-ROMドライブ
>・1年間引き取り修理サービス(保守パーツ含む)
>・12時間テクニカル電話サボート(E・メールサボ.一ト付〉
>大容量160GBHDD搭載
>さらに大画面19,モニタ付1

456:名無しさん@お腹いっぱい。
07/01/24 23:08:02 ovSgjl0P0
>>454
読んココ12、いきなり認識させて

キヤンヘe-ンはこのFAXを受取られた従業員数1-4m名規模の事業者の方が対象となります。



期間限定お得な特月
商品のご案内
(一部を隙く場合があります。また本プロモーションの適用は、1/29までにこ注文を頂いた場合に限ります※)

・AMDSempronTMプロセッサ3400+
・Windows@xpHomeEd血m正規版
・512MB(512MBxl)DDR2-SDRAMメモリ
.160GβSA7乃11DD
・サムスン製19ルゲm液晶モニタ(ブカク)
・内蔵NVIDLA@GeforceTM6150LEGPUゲラフィックス
・DVD-ROMトうイブ
・1年間引き取り修理サービス(保守バーツ含む)
・12時間テク二カバ電扇滑ボート(Eメールサポート付)
発注コードこ
州田




9

457:名無しさん@お腹いっぱい。
07/01/26 09:32:20 WPLblaIx0
今、読取革命の最新版の体験版使って、縦書きの文章を処理しているんだが。
コピーを繰り返して、人間様は困難があるものの読み取れるが、ソフトの方では判断に迷うような原稿の場合・・・
一括修正で、「首が痛くなる」ぞw

修正前の確認として、縦書きをそのまま左に90度倒したのがたくさん出てくる。
(横書きはそのまま)
個々の似たような文字形を一緒に修正するかどうか選べる。
そこで取捨選択するのは、当然人間様のお仕事。
その確認作業では、文字がかすれていればいるほど、間違いなく読み取るには首を傾ける必要がある。

せめて、どちら向きで表示させるか選べればいいのにな。

458:名無しさん@お腹いっぱい。
07/01/27 23:08:02 t4gJ+ZZy0
s

459:名無しさん@お腹いっぱい。
07/02/01 23:38:35 of0mcj9v0
>>455 に感動し、e.typistを買うことにした。
実際試用版つかってみたけど、全然優秀だったし。
読んでココだと、tiffのカラー版はよめないとか言われたし・・

460:名無しさん@お腹いっぱい。
07/02/02 07:52:29 8CCYdWQc0
e.Typistと読んde!!ココ両方持ってるけど
>459
同意するようなそうでもないような。
誤認識の所を再認識させるのはがやりやすい。
前、試した時は読んde!!ココの方が
元文書のレイアウトに近かった。

461:名無しさん@お腹いっぱい。
07/02/10 17:26:39 7v8Omm3H0
ここでSmartOCR

462:名無しさん@お腹いっぱい。
07/02/11 19:03:49 CU4bnzbg0
e.typist¥2万か・・・もうちっと安くならんかな・・・

463:名無しさん@お腹いっぱい。
07/02/12 01:20:06 ov2QAPy90
>>459
あのまま読み込むのではなく
フィルタかけてからのほうがいいよ
そうすれば広告の認識率に近くなる

464:名無しさん@お腹いっぱい。
07/02/20 17:35:07 R0Pvtepc0
>>404
㌧。これ、Copyじゃない方がいいのかな?

465:名無しさん@お腹いっぱい。
07/02/20 17:45:40 R0Pvtepc0
あ、今気付いた。コピーの3つは落としやすくするためと、予備か

466:名無しさん@お腹いっぱい。
07/03/06 15:17:55 wiKC1IMb0
あげちょる

467:名無しさん@お腹いっぱい。
07/03/11 14:10:41 BmeVkgEa0
現時点で落とせる所キボン

ついでにあげ

468:名無しさん@お腹いっぱい。
07/03/12 11:24:47 rV9/0Wky0
>404で普通に落とせるよ。
ダウンロードのリンクが表示されるまでに時間が掛かるだけ。

469:名無しさん@お腹いっぱい。
07/03/12 13:20:19 NPUsZQVC0
>>468
ちょwマジだw

ありがと&うp主THX!

470:名無しさん@お腹いっぱい。
07/04/03 10:58:15 jcDWAVO40
 

471:名無しさん@お腹いっぱい。
07/04/04 23:47:30 5pEd6gF3O
URLリンク(itpro.nikkeibp.co.jp)

472:名無しさん@お腹いっぱい。
07/04/07 02:59:49 Mb5vzdo40
本格読取2、英語の読み取り精度が悪いと思ったら、辞書自体省かれてたのね・・・
platinum版は初版ベースなの?2ベースなの?

473:名無しさん@お腹いっぱい。
07/04/07 11:26:38 k8qrpDmi0
OCRソフトでテキスト化したデータに、
さらに、これ使えば、読み取りミスを発見できるのでは?!

文章校正支援ツール Just Right!2 オンラインカタログ
URLリンク(www.justsystem.co.jp)

474:名無しさん@お腹いっぱい。
07/04/07 16:10:22 3tCIEtVy0
WinReaderPROの 中古版だと安いし2~3万円のおもちゃより、
認識度はダントツに違う 探せば掘り出し物はある。
図書館から借りてきて、テレビを観ながら自動スキャンして
満員電車の中でパームを使って読んでいる。

 

475:名無しさん@お腹いっぱい。
07/04/07 23:33:39 Tk1ABTk/0
スレ違いだけど借りてきた本を自動スキャンってどうやるの?
裁断できないよね?

476:名無しさん@お腹いっぱい。
07/04/08 00:17:50 iQtddhHD0
文化の荒廃の序章

477:名無しさん@お腹いっぱい。
07/04/08 08:14:55 ilEa/RWS0
>>475
下のどっちか
いずれにしてもお金持ち

URLリンク(atiz.com)
URLリンク(www.kirtas-tech.com)

478:名無しさん@お腹いっぱい。
07/04/08 09:09:31 ISzvp7710
ちょっとしたロボットみたいな感じだね

479:名無しさん@お腹いっぱい。
07/04/08 12:57:03 tTmtr51s0
1冊300円くらいで画像化してくれる所あるし
そういうの利用してるんじゃないかな。

480:名無しさん@お腹いっぱい。
07/04/15 21:45:33 NsGlMjxe0
英文オンリーでOCRソフト使いたいんですが、一番認識率いいのは
どれなんでしょうか。
海外のフリーソフトとかありますかね??

481:名無しさん@お腹いっぱい。
07/04/15 22:24:51 Oyanpx/80
値段によってだいぶ違う。
とっつきやすいのは、本格翻訳 SUPER(\2900)についてくるOCRとか。

482:名無しさん@お腹いっぱい。
07/04/17 01:11:41 UnFTo7Bd0
>>480
FineReader Pro
二ページ続きの画像を自動分割してくれる。本をOCRして
PDF保存するときに便利。
英語だけだと役不足かもしれない。欧文多言語認識につよい。

483:名無しさん@お腹いっぱい。
07/04/22 03:11:18 WC4lxGTB0
縦書きのルビを誤認識しないソフトはありますか?

484:名無しさん@お腹いっぱい。
07/04/22 18:39:06 gRg6gkbq0
>>483
体験版を使って判断したら?
やった上での質問なら使ったことのあるソフト名書いてくれ

扱う原稿の状態などによっても違うし一概には言えないからさ

485:名無しさん@お腹いっぱい。
07/04/22 22:40:54 H0dJsJl6O
>>484
分からないならスルーすりゃいいのに

486:名無しさん@お腹いっぱい。
07/04/22 22:52:32 NTiyhGlr0
つかルビなんて確実に認識できるソフトなんてあるか?

487:名無しさん@お腹いっぱい。
07/04/23 00:37:51 4t8hsufJ0
読取革命の体験版使わせてもらってます。
小説をテキスト化しようとすると、
ページのすみのページ数まで取り込んでしまうため
崩れてしまうので選択範囲で囲んで認識するのですが、
これ毎ページごとにしない方法ってあるでしょうか?
上1cmを読み取らないようにしたいのですが……

とりあえずフォトショップで全部切ってから読み込ませようと思ってますが

488:名無しさん@お腹いっぱい。
07/04/24 19:33:20 GMXFIsi/0
読取革命はわかんないけど、e.Typistなら読み取り範囲設定する機能があるよ。
読み取り範囲を自動じゃなく手動で設定する場所ない?
矩形で範囲指定して順番も任意に変えられるから、頁数が本文に混じったりすることはうちではないな

489:名無しさん@お腹いっぱい。
07/04/24 19:34:13 GMXFIsi/0
補足。一ページごとじゃなくて全ファイルに設定を適用できるという意味

490:名無しさん@お腹いっぱい。
07/04/25 17:47:15 72dBCul00
URLリンク(no722.cocolog-nifty.com)

小説画像再配置ツールのとこ。モバ板で開発されてたけど、公開サイトできた。
画像からOCRするときに、これで先に処理しておくと、本文位置なんかをほぼ正確に
設定できる。
読んde!!ココの枠情報ファイルを使った一括認識でも読み取り枠をかなり精密に
指定できるようになる。

491:名無しさん@お腹いっぱい。
07/04/25 20:56:34 1/DHbGJL0
だれか電話帳からひとりでデータベース作った奴居る?
うちの村は人口少ないけど1ページだけで疲れて諦めた。

492:名無しさん@お腹いっぱい。
07/04/26 01:43:03 GYa4q+ck0
無差別DB化って、なんか金儲け目的でやってるような気が・・・
マトモな人間ならやらんように思うんだけど

493:名無しさん@お腹いっぱい。
07/04/26 01:46:06 aXKryLXTO
>>492
だろうね

494:名無しさん@お腹いっぱい。
07/04/26 07:31:38 hsKdtYm00
>>491
手が後ろに回るぞ!
警察に報告しました、逃げるなよ


495:名無しさん@お腹いっぱい。
07/04/27 05:48:50 qJ7wVrGj0
>>491
nyで流れてる

496:名無しさん@お腹いっぱい。
07/04/27 20:16:56 TyEfRJXl0
>>490
トン
まだ試してないがスクショを見て感動した。
神っているもんだな

497:名無しさん@お腹いっぱい。
07/04/30 01:51:22 sLkYqs0k0
>>487
体験版はどうか知らないけど、
適当なページを手動で範囲指定して「テンプレートに保存」
一括認識で「テンプレートを使う」でいける
ただ、全く融通が利かないので注意

498:名無しさん@お腹いっぱい。
07/04/30 05:59:12 5pL5s8yV0
>497
>490ので処理すると画像内の本文位置を相当正確に統一できるよ。
読んde!!ココもv12まではテンプレ(枠情報ファイル)で設定した認識範囲は固定だったけど、
v13で自動微調整してくれるようになったみたい。


499:名無しさん@お腹いっぱい。
07/05/06 20:41:05 G03gIUz/0
漫画とかの目次の読み取り制度の高いOCRソフトって何?
自炊した漫画に目次とか手打ちしてくの怠過ぎ。


500:名無しさん@お腹いっぱい。
07/05/09 13:57:21 99QB49QB0
tes

501:名無しさん@お腹いっぱい。
07/05/19 17:34:20 MJYxjg3x0
e.typistのエントリーを持っているのですが、製品版にしようか迷っているしだいです。
エントリー版だと精度優先が選択できず、常に速度優先なのですが、
速度優先と、精度優先はどのくらい違うものなのでしょうか?

502:名無しさん@お腹いっぱい。
07/05/19 23:46:09 PB2nZC+o0
スクリプトによる自動読み取りを考えているのですが、
コマンドラインから呼び出せるようなOCRを探してます。

ソフト.EXE < 画像.JPG > 結果テキスト.txt

みたいな感じで読めるソフトありますか?

503:名無しさん@お腹いっぱい。
07/05/20 00:19:18 X0rH5ysl0


504:名無しさん@お腹いっぱい。
07/05/20 01:06:51 1nypUcOf0
>>501
最新版の体験版が公式サイトにあるから
ダウンロードして試せば?

ちなみに最新版だと
速度優先と精度優先の設定自体無かった様な気がする。

505:名無しさん@お腹いっぱい。
07/05/20 01:57:05 fXVBB8f40
>>504
そうしてみます。どうもです。

506:名無しさん@お腹いっぱい。
07/05/24 00:05:13 m6D0J+hE0
スレ汚し申し訳ありません。
私、これまでeTypistをつかっていました。
単にキヤノンスキャナについてたというだけのきっかけで
それなりにつかってきました。

この度WindowsをVista化して、
eTypistがいつまでもVista対応にならないので
見切りをつけて「読んde」か「革命」あたりに
乗り換えねばと考えてます。
が、いろいろググったり本スレの過去のカキコを
読んでみても決め手に欠けて選びかねています。

体験版で試せばいいのかもしれませんが、
極力Windows環境を汚したくない気持ちもあります。

和文・英文ともにOCRします。新聞・雑誌の記事が
中心ですが、PDF化されたものも対象、
というのが私の使用状況です。
ヒントいただければありがたく思います。よろしくお願いします。

507:名無しさん@お腹いっぱい。
07/05/24 00:07:21 JtoWD+i20
eTypist>>>革命>>>>>>>>よめやここ

508:名無しさん@お腹いっぱい。
07/05/24 00:17:03 IP3+408H0
>極力Windows環境を汚したくない気持ちもあります。
あほかw
体験版試したあとOSクリーンインストールでもしろ

509:名無しさん@お腹いっぱい。
07/05/24 00:20:54 JtoWD+i20
↑まちがい

↓正解
RegSeeker

510:名無しさん@お腹いっぱい。
07/05/24 00:27:13 oQsTBG6L0
>>506
つ[Acronis True Image]

511:名無しさん@お腹いっぱい。
07/05/24 00:39:28 2EuU9Ihu0
TotalUninstall

512:名無しさん@お腹いっぱい。
07/05/26 20:26:38 95PnN5Qd0
e.typistの12っていつぐらいに出ると予想されます?
11買おうかとも思うんですが、
11は、結構古いんで、買ってすぐ新しいのでたらやだなと思いまして。

513:名無しさん@お腹いっぱい。
07/05/29 20:35:52 KKC/xjSJ0
URLリンク(plusd.itmedia.co.jp)
「本格読取 2 Deluxe」、6月29日発売。2970円。


なんだかんだ言って、また英文OCRは省かれるんだよな。
英文OCR付きプラチナは、いつ電気屋の店頭に並ぶんだろう・・・
参考: URLリンク(www.google.co.jp)

514:名無しさん@お腹いっぱい。
07/05/30 21:21:07 pTXU8GzB0
読んdeココ for EPSON Ver.4.07の直リンわかる方いませんか?


515:名無しさん@お腹いっぱい。
07/05/31 18:16:10 qsHbord50
>>506
smartお勧め

516:名無しさん@お腹いっぱい。
07/05/31 22:33:58 YxAzCzkf0
>>514
スキャナー付属の物ならまずwebに無いだろう

517:名無しさん@お腹いっぱい。
07/06/03 14:19:19 RWdiD0XW0
>>514
EPSONのHPにあるよ

518:名無しさん@お腹いっぱい。
07/06/07 12:28:22 +k6s2B/y0
>>506
 いま読んでここと、etypsit比べているが、認識制度は日英混在なら読んでここのほうが
ずっといい。etypistはなぜか英語がみんな全角になっちゃうし、単語の切れ目もきちんと
認識できていない。
 読んではインターフェースがイマイチなんだけど、この認識精度の差は埋めがたい。
純英語同士だとあまり差は感じない。

 やっぱり試用して、同じものスキャンしてみるといいよ。

519:名無しさん@お腹いっぱい。
07/06/07 13:32:08 c6qqyJBg0
最初の頃は認識精度で選んでたけど
学習させたらどれも大差なくなってくるから
編集しやすいのを選んだ方がいいとおもう。

520:名無しさん@お腹いっぱい。
07/06/07 15:48:24 rTQM8Q420
英も自我全角になるのは何の問題も無いだろ。
簡単に直せる市。

521:名無しさん@お腹いっぱい。
07/06/07 19:50:55 QT4A944M0
>>518
 自己レス。etypistは、デフォルトの設定から一部変えたら、
英単語がきちんと認識されるようになりました。
これでインターフェースで選んでもOKそうです。

522:名無しさん@お腹いっぱい。
07/06/10 12:44:19 Bn9+OI/80
>>521
後続の者のために、どのように変えたら良くなったか書いてくれ

523:名無しさん@お腹いっぱい。
07/06/10 21:47:17 O+MyPhJK0
>>522

文字認識のメニューから
 言語を:日本語(英語混在)にする。
 そして、空白文字挿入指定を「空白出力」にする。
これは改行コード指定を「ブロック改行」にするとで
きなくなるので、それ以外の改行コード指定にする。

 いろいろいじっていたので、どの設定がデフォかは
忘れたけど、これをやると英単語の間をきちんと認識する。

 とにかく「空白出力」を有効にすることが必須。

 本文が日本語で、要旨や図の説明が英語になっている
技術論文は、この設定を間違ってしまうと悲惨なことに。



524:名無しさん@お腹いっぱい。
07/06/11 22:57:26 fi0mIOzn0
>>523


525:名無しさん@お腹いっぱい。
07/06/12 21:14:17 TmZVwJCw0
縦書きで、英語部分のみ90度回転(本を横にして読む)してる部分を認識する方法ってあるかな?
読み取り範囲に横書き/縦書きどっちを指定しても画像の上が文字の上と一致しなきゃいけないのは変わらないし、、、
一箇所二箇所なら手打ちで何とかできても、一ページ数箇所とかだと途方に暮れる
ちなみに使ってるのはetypist10です

526:名無しさん@お腹いっぱい。
07/06/14 18:16:13 MZzFuaL20
すみません、学術論文をスキャンして、それを画像からテキストに変換したいのですが、
問題は、論文の中にドイツ語やフランス語も入っているということなんですけど、
さすがにドイツ語やフランス語まで認識してくれるOCRソフトはないですよね?

527:名無しさん@お腹いっぱい。
07/06/14 20:02:32 /i8UfP/C0
>>526
> ないですよね?
という問い掛けをいやらしく感じるのは漏れだけ?
URLリンク(www.google.com)

528:名無しさん@お腹いっぱい。
07/06/14 21:57:48 MZzFuaL20
>>527
いやらしいと思いつつも、回答していただきありがとうございます。
本当に悪意はないのでw
非常に助かりました。

529:名無しさん@お腹いっぱい。
07/06/16 00:36:41 d8IXz+hf0
>>525
メジャーな機能じゃないかも
俺が知ってるのは読取革命くらいしか出来ない

>>528
>本当に悪意はないのでw
最後のwもやめたほうがいいよ
「ないですよね?」や「w」が
自然に出てくるようだとちと怖い

530:名無しさん@お腹いっぱい。
07/06/16 01:17:24 VQaiHJ1E0
>>529
読取革命できるんだ! 超さんくす
早速体験版落としてくる
OCRってなかなか一ソフトだけじゃすまないよなー

531:名無しさん@お腹いっぱい。
07/06/16 12:00:27 Mq2PXuOr0
スレリンク(bsoft板)

532:名無しさん@お腹いっぱい。
07/06/18 09:30:58 puvoa998O
URLリンク(p20.fileseek.net)
だれか試して

533:名無しさん@お腹いっぱい。
07/06/20 10:49:02 JlYS+vI+O
>>532ミスってた
URLリンク(ocr.rossa.cc)

534:名無しさん@お腹いっぱい。
07/06/22 14:20:21 7iUFwDnD0
試した。
フツーーーのOCRソフトだった。

532=533は何が聞きたかったのかな?

535:名無しさん@お腹いっぱい。
07/07/08 22:17:19 WDaFYbIE0
聞いてみて

536:名無しさん@お腹いっぱい。
07/07/10 11:00:58 R3FyXrqI0
グーグルブック検索。
検索に使わない数式なども丁寧に直している出版社の方が多いけれど、OCR結果を
全く修正しないで登録している出版社が何社かあるな。「工」と「エ」くらいならかわいい
もので全く意味不明のものもある。著者がかわいそう。

537:名無しさん@お腹いっぱい。
07/07/21 16:18:17 e2ZhIFOP0
最近ocrを始めましたがこれってスキャンの解像度が悪いと
影響大きいですか?私の光学解像度1,200×2,400dpi性能では
ほとんどうまくテキスト化できませんでした。
どの程度の解像度が必要でしょうか???

538:名無しさん@お腹いっぱい。
07/07/21 16:23:32 e2ZhIFOP0
最近ocrを始めましたがこれってスキャンの解像度が悪いと
影響大きいですか?私の光学解像度1,200×2,400dpi性能では
ほとんどうまくテキスト化できませんでした。
どの程度の解像度が必要でしょうか???


539:名無しさん@お腹いっぱい。
07/07/21 16:25:09 e2ZhIFOP0
スレ間違えました。失礼しました。

540:名無しさん@お腹いっぱい。
07/07/21 18:11:53 fXjgR9V20
300dpiあれば十分だろ
あとはコントラストとかの問題

541:名無しさん@お腹いっぱい。
07/07/22 00:46:45 0rh6CBEo0
300dpiでは低いよ。
400dpi以上。試せばわかるはず。

542:名無しさん@お腹いっぱい。
07/07/22 01:00:59 TRo+FmNZ0
文字を拡大すれば問題ない。
マメ本だと400dpiでも無理。

543:名無しさん@お腹いっぱい。
07/07/22 04:29:14 9fsxREmx0
300dpiから上は認識率は変わらないと思う。
200dpiと300dpiでもほとんど差がない。
俺の環境(ScanSnapS500でハードカバーや雑誌スキャン)では少なくともそうだ。

認識率に一番響くのは原稿の状態。
汚れていたり黄ばみが酷かったり印刷が悪かったりすると認識率がガタオチ。

「ほとんどできない」ってのは手書き原稿とか
写真背景に文字が刷り込んであるとか
コミックの吹き出しの中とかかな。

200dpi相当くらいまで縮小しちゃった物で構わないので
スキャン画像のサンプルをアップすれば的確な回答が来るのでは?>質問者

544:名無しさん@お腹いっぱい。
07/07/23 00:57:09 JoRSkVg70
一般的な印刷物って300dpiではなかったっけ?
だったら300dpiで十分だし、400dpiあればより安心って感じでないか。


545:名無しさん@お腹いっぱい。
07/07/23 02:04:22 2Cew43Yn0
よっぽどクセのあるフォントとか文字が小さいとかじゃない限り
300dpiあれば十分

あとは文字がクッキリとコントラスト等が調節できてるかによる

546:名無しさん@お腹いっぱい。
07/07/23 03:45:50 lorVcd360
そんな原稿なら手入力した方が現実的だな。

547:名無しさん@お腹いっぱい。
07/07/27 09:36:49 BD0S29j10
etypist12はどうですか?

548:名無しさん@お腹いっぱい。
07/08/05 01:40:32 5939Ae+P0
Google製の多言語OCRエンジンを搭載した「Softi FreeOCR」
URLリンク(oshiete.new-akiba.com)


でも日本語未対応

549:名無しさん@お腹いっぱい。
07/08/29 20:36:32 HhJFBICD0
ここで大人気のSmartOCRってそんなに性能いい?

試しにLiteを使ってるんだけど、いくら学習させてもXを×と誤認識するし、
段組関係はお話にならないレベル。

X1
ってのが
X一になったりするしw

1を右クリックしてもほかの選択肢が出ないし、そもそもの段組の位置が滅茶苦茶。

せめて学習機能が使い物になればエンロールと割り切って使って、
脳みそ鍛えるんだが。

何かいい方法無いかなあ。

550:名無しさん@お腹いっぱい。
07/08/29 21:15:24 j//B3kLA0
タダなんだからそんなもんだろ
品質に不満ならe-typistでも買った方が早い

バージョンアップ版は大昔に買ったスキャナに
付いてたのでもOKだし安いからオススメ

551:名無しさん@お腹いっぱい。
07/08/29 21:41:29 vQuDIF5d0
ID変わったけど

>>550
e.Typistが一番いい?
読んでココの古いバージョンユーザーなんでうpグレードはこれが一番安いんだが。

質がいいのならそちらに乗り換えます。

メジャー系の全種体験版使って判断すべきだけど、最近のはレジストリ汚しまくりなんで。


552:名無しさん@お腹いっぱい。
07/08/29 22:21:48 ne9cS2rk0
背景に画像があるやつ(CDについてる歌詞)を
デフォ設定でやったら読み取り革命が一番まともだった。
まあ学習させてなんぼのソフトみたいだから初期設定って意味ないんかもね

553:名無しさん@お腹いっぱい。
07/08/30 02:31:45 YMqPcJox0
学習にあんまり期待しない方がいいかと。
デフォルトでは想定されていないような
一文字のスペースに二文字を突っ込んだような文字とか
(句読点とカッコ類を一文字分スペースにまとめてたり)
そんな感じのはあまり遭遇しない類の例外処理の追加でしかないよ。
ごくごく当たり前の原稿の認識率は上がらない。

色つき背景に対応しだしたのは最近のverからだね。
柄つき背景はまだどこのもぜんぜんだめっぽい。

554:名無しさん@お腹いっぱい。
07/08/30 04:17:48 8cX5+Y+i0
背景が英字新聞の場合は?

555:名無しさん@お腹いっぱい。
07/08/30 19:34:15 MBF2Q0dn0
553はまともに使ったことなさそうだな


556:名無しさん@お腹いっぱい。
07/08/31 19:28:40 X8mRf/wg0
>555
縦書きで、本文とルビを混ぜて1文字として認識しているような場合はどう学習させて、どうすれば
次回似たような情況でうまく判定できるようにできるのか教えてくれ。

557:名無しさん@お腹いっぱい。
07/09/01 01:18:08 RaqlnS0/0
>>556
置換すればいいじゃん。

558:名無しさん@お腹いっぱい。
07/09/02 00:04:55 /ShAfiy40
>557はまともにOCR使ったことなさそうだな。


559:名無しさん@お腹いっぱい。
07/09/02 00:31:24 NVGVE2w40
>>556
話変わってるじゃんw


560:名無しさん@お腹いっぱい。
07/09/02 00:33:33 NVGVE2w40
>縦書きで、本文とルビを混ぜて1文字として認識しているような場合
よく分からん
詳しく説明してほしい

561:名無しさん@お腹いっぱい。
07/09/02 02:37:28 kK0TPrWk0
>>558
OCRなど30年前から使ってるが。
ただし真面目には使ってない。

562:名無しさん@お腹いっぱい。
07/09/02 08:36:01 S2LE2C0F0
> OCRなど30年前から使ってるが。

認知症ですか。かわいそうに。

563:名無しさん@お腹いっぱい。
07/09/02 10:02:13 kK0TPrWk0
>>562
URLリンク(inu.ei.meisei-u.ac.jp)

564:名無しさん@お腹いっぱい。
07/09/02 19:22:06 b21q+l2y0
>>562

かわいそうに。

565:名無しさん@お腹いっぱい。
07/09/02 19:46:38 mZ3rWXVo0
>>562
脳内認識エンジンのチューン不足ですか。かわいそうに。

566:名無しさん@お腹いっぱい。
07/09/03 20:33:46 CzULmAqY0
>>562かわいそうに。

567:名無しさん@お腹いっぱい。
07/09/03 22:36:28 PyWafQ3J0
苛めよくない。

568:名無しさん@お腹いっぱい。
07/09/04 06:11:03 UdHs+6dV0
プレイなんだよきっと

569:名無しさん@お腹いっぱい
07/09/08 16:53:07 bG+CAb9F0
預金通帳を拡大コピーせずダイレクトにテキスト変換(エクセル等で使いたい)したいのですがうまくいきません。
預金通帳をトライした人いますか?
ちなみに使用ソフトは「読取革命」、スキャナーは300dpiです。

570:名無しさん@お腹いっぱい。
07/09/08 19:33:58 6fbD8CNm0
解像度を上げて試してみようと思わないのかねぇ……

571:名無しさん@お腹いっぱい。
07/09/08 20:25:51 mRd7ARAC0
>スキャナーは300dpi
って書いてあるからハードウェアの光学解像度上限が300dpiなのでは?
ならばそんなゴミは窓から投げ捨てて新しいスキャナ買え! としか言えない。

572:名無しさん@お腹いっぱい。
07/09/08 21:03:57 bG+CAb9F0
>>570,571
レス、サンキュー
正解です。300dpiが限度なのです。
どの位ならいいのでしょうか?

573:名無しさん@お腹いっぱい。
07/09/08 21:31:28 qzHioSaW0
画像の前処理が必要なんだと思う。

通帳って紙の地に模様が刷り込んであるよな。
灰色とか黄色とか薄い赤とかで。銀行のマークなんかが。

あれがOCRに読み取られてしまうと滅茶苦茶になるので
その模様をうまく消す画像のレタッチが必要なんだろう。
例えば背景が赤系の模様ならばRGBのRチャンネルだけ真っ白に飛ばしてから
残りの色だけで白黒化し、記帳されている数字だけ残るようにしてやる。

自分で思いつけない人は↑もちんぷんかんぷんかもしれんが
用は画像レタッチの知識が必要です、ということ。

スキャン解像度は300dpiあれば十分だと思うよ。

574:名無しさん@お腹いっぱい。
07/09/08 22:21:40 9kXomqHo0
・減色するとき閾値を上げる
・特定チャネルだけを使う(Rが入ってるならBだけとか)


575:名無しさん@お腹いっぱい。
07/09/09 04:18:08 Wayz4dwa0
OCRよりお前の目で見た方が遥かに認識能力が高い。
なにもわざわざコンピュータにたよらなくとも
お前にはそれだけの能力があるんだ。
自分にもっと自信をもちなさい。

576:名無しさん@お腹いっぱい。
07/09/09 04:25:08 YeApTPNwP
tesseract、3を5と見間違えるんですが
トレーニングで何とかなりますか

577:名無しさん@お腹いっぱい。
07/09/09 10:37:07 TJ6TdM9A0
>>573
職業がら200通位×ページ数
データ入力を目視、手入力では、時間が掛かり、転記ミスも発生。
人を雇うほど余裕はない。
画像レタッチ使用すれば黒と白のみと要らないデータは消せる。
しかし必要なデータと同じ色ならその部分のカットしかないし、時間が掛かりそう。
しばらく、考えて見ます。レス、サンキューです。






578:名無しさん@お腹いっぱい。
07/09/09 11:32:57 nU6AA3X+0
仕事で継続的にやることがわかってるんならネットバンギング登録すれば?
今時は都市銀でもやってるんだしアグリッパなりなんなり使えばExcelへの流し込みも簡単だろ

579:名無しさん@お腹いっぱい。
07/09/09 12:20:35 p37oIG6b0
banging?

580:名無しさん@お腹いっぱい。
07/09/09 12:38:40 TJ6TdM9A0
顧客すべてにネットバンキング入れる?
IT弱者の事も考えないのかなぁ?
ソフト使い方、セキュリティとかいろんな問題が出るでしょ。
よけいに手間が掛かるし老人や障害者もいるのでね。
ところでアグリッパ(PDF?)てなんでしょうか?ヒントになるかもしれない。




581:名無しさん@お腹いっぱい。
07/09/09 14:08:06 b4CWqVib0
> 顧客すべてにネットバンキング入れる?
> IT弱者の事も考えないのかなぁ?
> ソフト使い方、セキュリティとかいろんな問題が出るでしょ。
> よけいに手間が掛かるし老人や障害者もいるのでね。
> ところでアグリッパ(PDF?)てなんでしょうか?ヒントになるかもしれない。

おまいさんが廃業すればいいんじゃねーの?

582:名無しさん@お腹いっぱい。
07/09/09 14:27:05 nU6AA3X+0
スマソ、バンキングね。

>>580
客をネットバンクに入れさせる必要がどこにあるの?
要は取引明細をテキスト化できりゃいいんでしょ?
アンタが使ってる銀行で、アンタの口座をネットでも使えるように登録しとけば
ログインしてPCから明細見れるようになるんだからコピペでExcelに貼っつければいい
相手がどんな方法で振込んでこようが関係ない。

アグリッパは複数の金融機関の明細を一度に参照できるシステムだが
上の手順で済ませるのなら別に必要ない。知りたかったらググって調べろ

583:名無しさん@お腹いっぱい。
07/09/09 14:28:52 pF0za8zm0
画像レタッチしなくてもたいがい取り込み時の設定で
カラーバランスやコントラスト弄れるでしょ

必要なデータと背景の色が似てようが濃度や色味
違えば設定でどうにでもなるだろうし

あとはOCRで一番大事なスキャン品質を一定に保つ為
スキャナのパネルに枠貼り付けたりして位置ズレを徹底
してなくす努力だけ

584:名無しさん@お腹いっぱい。
07/09/09 15:58:38 6WtPLdEA0
システム作るなら、最初からocrエンジンを借りてきて、画像処理くらい自前で用意するだろ
犯罪のにおいしかしない

585:名無しさん@お腹いっぱい。
07/09/09 16:09:19 TJ6TdM9A0
あ、スマン、
顧客の日々の取引(入金、出金 残高、相手先)
のデータ作成を請け負っている仕事なので
ぜんぜん自分の口座と関係ないので乙。
カラーバランス、コントラスト いろいろやってみますね。
レス ありが㌧。




586:名無しさん@お腹いっぱい。
07/09/09 21:00:43 XLgeQDJm0
URLリンク(www.sii.co.jp)

587:名無しさん@お腹いっぱい。
07/09/09 22:55:58 0TmXydc30
既存の会計ソフトで通帳や出納簿に特化したOCRができるものもあるみたいだぞ。
ってかプロなのかyo
ドシロウトの俺が「会計 通帳 OCR」と検索してあたりがつけられるようなことを
知らないのってやばいんでねーの。

588:名無しさん@お腹いっぱい。
07/09/09 23:20:35 TJ6TdM9A0
これでしょ。
実際に拡大コピーしないとダメだったのですが・・・。
URLリンク(www.z-irazu.jp)

589:名無しさん@お腹いっぱい。
07/09/10 23:46:17 tLXqJKXQ0
>>588
>>571

590:名無しさん@お腹いっぱい。
07/09/11 08:00:32 Homl5X9v0
> 顧客の日々の取引(入金、出金 残高、相手先)
> のデータ作成を請け負っている仕事なので
> ぜんぜん自分の口座と関係ないので乙。

頭足りてないなら、とっとと廃業するべきだ。

591:名無しさん@お腹いっぱい。
07/09/22 12:38:33 IN/2021F0
e.typist12.0で ルビを文中に挿入を選択して文庫本をスキャン>認識すると
一部の行が左端の最後の行に重複して表示されてしまうのですが
どう対処したらよいのでしょうか?

592:名無しさん@お腹いっぱい。
07/09/25 17:38:23 Pnv4wn/K0
>591
たぶん傍点なんかで起きる現象と同じじゃないかな。結果のテキスト見ると複数の文章が混ざって
しまってる状態。
認識時に文章が赤くマークされるけど、こういうのが起きるときは赤いところが反転して白くなる。
それを見て、ファイル名をメモしておいて、あとから修正モードで傍点を削除してから別途認識
してる。それしか対処の方法はなさそう。
傍点が大量になければ、テキストになった段階で修正するだけ。

傍点以外でも、一部のルビ、ゴミ、……なんかで起きることもあるみたい。
ルビなしで傍点が大量にあるんなら、ルビは無視してしまうと思う。e.Typistの傍点挿入位置は
いつでもずれてるから。

593:名無しさん@お腹いっぱい。
07/09/28 00:49:01 kO0WhpSR0
>>575
んまあ、人間の脳って余分な作業も多いのか基本的に遅いからね
OCRに関してはまだ信頼性が微妙だからどの道人目チェックは必要だが
それでも手入力で全部やるよりはOCR+人手チェックの方が早い

と、マジレスしてみる

594:名無しさん@お腹いっぱい。
07/09/28 02:22:27 FG/hllZY0
>>593
お前は自分の能力に自信を無くしている。
しばらく山へ篭って自分を取り戻すべきだ。

595:名無しさん@お腹いっぱい。
07/09/28 06:42:17 JinZJTny0
ダイバダッダの魂宿りますた。
世界平和のために無償労働するっす。

596:名無しさん@お腹いっぱい。
07/09/30 05:12:31 fVlDcJAE0
>職業がら200通位×ページ数

これ見ると、ふつうの稼業じゃあないな
かたぎなら弁護士、司法系、税務・会計系か
やばいのなら斗一か事務所だな、と考えてみる。
だが、>>585か 税務資料か

「読取革命」、スキャナーは300dpiです → 最新版にする、解像度は最低400dpi(最新本ソフトの最低要件)でスキャン


597:ご参考まで
07/09/30 05:50:09 fVlDcJAE0
旧ヴァージョン アップデート(以下からたどる):
URLリンク(panasonic.co.jp)

最新版(V1.1.1)の特長:
・FAX文書などのかすれ文字にも強い日本語OCRエンジン
・レイアウトをそのまま再現
・縦書き・横書きテキスト、画像、図などが混在した原稿も、レイアウトをそのままに再現
・複雑な表の罫線やセルの背景色も、再現、また、認識結果で得た数字を数値としてExcelに出力でき、そのまま計算式に使用可
・英数字の一行手書き文字にも対応し、品番やメモ書きなどの手書き文字を認識

解像度 50~2,400dpi(400dpiを推奨)
>>596を一部訂正

URLリンク(panasonic.co.jp)
体験版(10日間)DL:
URLリンク(panasonic.co.jp)

598:名無しさん@お腹いっぱい。
07/10/01 23:00:54 ZJSIv2Sr0
記帳代行で乙。

599:名無しさん@お腹いっぱい。
07/10/03 02:48:08 lW4nXSBZ0
>>598
ご本人は正にその仕事をされているように思うのだがw

600:名無しさん@お腹いっぱい。
07/10/03 03:30:28 5xTbDZcD0
名簿データ取り込み?

601:名無しさん@お腹いっぱい。
07/10/03 04:51:39 9DUfmmoQO
URLリンク(imepita.jp)

602:名無しさん@お腹いっぱい。
07/10/03 05:07:51 ZwtirfFY0
下は簡単なCaptcha画像ですが、
URLリンク(ja.wikipedia.org)
ランダムな線が入っていたり、色が違っていても認識出来るような
ソフトは無いでしょうか?

603:名無しさん@お腹いっぱい。
07/10/03 07:43:43 nJglqY7H0
犯罪者乙!

604:名無しさん@お腹いっぱい。
07/10/03 09:58:49 lW4nXSBZ0
>>600
んや、税務会計関係

605:名無しさん@お腹いっぱい。
07/10/03 13:07:59 La1Wx76N0
>>602
スパム業者死ね

606:名無しさん@お腹いっぱい。
07/10/03 23:56:14 H4AdpPJY0
キャプチャってcaptureじゃなかったっけ

607:名無しさん@お腹いっぱい。
07/10/03 23:59:02 H4AdpPJY0
あー、全然別もんなんだ。俺が悪かった

608:名無しさん@お腹いっぱい。
07/10/12 22:47:53 SrJh6grm0
office2003に入ってる「microsoft office image document」が、
すごく使いやすかったんだけど、office2007になったら無くなってるね。
2003から持ってくることは出来ないのかな。

609:名無しさん@お腹いっぱい。
07/10/13 17:16:36 nepRO5lX0
読取革命だが、2つの文字を1つと間違えてしまう問題を学習機能によって解決できるの?
解決できるソフトはある?

610:名無しさん@お腹いっぱい。
07/10/13 17:39:44 GAhJKdKe0
学習機能は文字だけでしょ


611:名無しさん@お腹いっぱい。
07/10/14 06:29:53 VQe2G2hR0
間違えるのも認識するのも全て文字だけだが?

612:名無しさん@お腹いっぱい。
07/10/19 13:49:13 Ziv6Jg4J0
SmartOCR liteeditionのヘルプキャッシュってどこかにない?
com経由で利用したいんだけどまったく資料がなくてイミフ。
よろしくたのんます。

613:名無しさん@お腹いっぱい。
07/10/21 12:42:36 YC+r/lRo0
今現在 読取革命のVer.7を使って 英文と画像しかない物をスキャンかけてるんだけど
大体ミスが1ページにつき10文字位あるんだけどこれってVer.11 にすればもう少し改善される?
あとVer.11の方はアクティベーションあったりする?

614:名無しさん@お腹いっぱい。
07/10/21 13:20:42 zf4XBilV0
>>613
原稿の精度に左右される。
[K]ものだなw
悪知は無かったと思う(あってもクリア)
検証後DELしてしまったので

615:名無しさん@お腹いっぱい。
07/10/21 17:28:13 YC+r/lRo0
>>614
一般的な英語のテキストに対して使ってます
[K]もの? 体験版?それともクラックのことでしょうか?


616:名無しさん@お腹いっぱい。
07/10/24 10:50:55 S7BJ2he10
613
10文字ぐらいだったら、たいした手間じゃないからそのままでいいんじゃないの
それが5文字になったとしてもあまり変わらないような気がする



次ページ
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch