[OCR] 画像→テキスト化総合at SOFTWARE
[OCR] 画像→テキスト化総合 - 暇つぶし2ch863:KYjGIJJNILUJsLT
09/01/13 15:38:01 ZVGLIrsS0
URLリンク(naierrybou.awardspace.com) tna victory road stream
URLリンク(ontoned.awardspace.com) rumer willis photo


864:名無しさん@お腹いっぱい。
09/01/14 01:19:58 L5omtrlo0
こんなスレに天才君がごろごろしてるとは・・・・・



865:名無しさん@お腹いっぱい。
09/01/14 02:10:19 0z5ueTXF0
>>862
scanした原稿とかは無理だよ。

866:名無しさん@お腹いっぱい。
09/01/15 03:47:41 ooQikYrc0
透明テキスト付きPDFの話なんてどうでもいいんだけど。
透明テキスト付きPDFで、テキストに変換した内容をチェックする馬鹿はいないんだから。
ここでは議論が成り立たない。

867:名無しさん@お腹いっぱい。
09/01/15 08:28:25 pt+iPJxK0
>>866
出たな、天才。

868:名無しさん@お腹いっぱい。
09/01/15 11:27:58 U2eiW9BI0
学術論文データベースでダウンロードできるファイルは
ほとんどが透明テキスト付きPDFでございますw

869:名無しさん@お腹いっぱい。
09/01/15 12:58:17 Coc/BK/S0
>>868
医学論文はスキャンされたPDFが郵送とFAXとかダウンロードできるだけというのが全てかも。
俺が入会している論文屋はそうだね。日本では業界最大手だと思うけど。
それに本をばらしてscanしまくっているから透明テキストは自分でつけないといけない。

870:名無しさん@お腹いっぱい。
09/01/15 13:31:32 /jTW0YpK0


871:名無しさん@お腹いっぱい。
09/01/15 18:17:23 ooQikYrc0
>>868
だからスレ違いじゃん。
論文作った人がPDFにしてテキストつけてるのに画像→テキスト化のこのスレに何の関係あるんだよ?

872:名無しさん@お腹いっぱい。
09/01/15 18:38:34 TDkR8k5P0
たしかに(DAIGO)
論文書いたならワードとかだろうからそこからpdfに変換したら
文字化けもなにもないな
最初から文字としてpdfに埋め込まれてるだろう

873:名無しさん@お腹いっぱい。
09/01/15 21:52:56 0k7MXLGD0
論文データベースで提供される最近の論文なら学術誌の
ページまんまの普通にフォント込みのPDF
昔のものはスキャンされて透明テキスト付きPDF

同じように自分でスキャンした論文や本も透明テキスト付きで
残しておいて管理したいってわけ

しつこく透明テキスト付きPDFを排除しようとしてる人は
こういう用途を理解できないのかな?自分に関わりのない
用途だからって排除するってのはどうかと思うよ

874:名無しさん@お腹いっぱい。
09/01/15 23:51:54 pTl37oBI0
2名くらいが言い合ってるんだろうが
そろそろメールででもやれw

875:名無しさん@お腹いっぱい。
09/01/16 02:04:18 o0QiI79a0
読んでここと読み取り革命とe.typist
全部使ってみたけど
読んでここが一番まともだった

876:名無しさん@お腹いっぱい。
09/01/16 04:31:05 j5jbP+DhP
一番妙な名前のが一番まともっぽいんだよな。
でもどこも煮詰ってきちゃって停滞してる感じもする。

877:名無しさん@お腹いっぱい。
09/01/16 07:10:00 kAwCRT9v0
>>873
うざいからPDFスレでやれ。

878:名無しさん@お腹いっぱい。
09/01/16 07:13:05 YFgvyqNy0
よんでここ良いかあ?
typistだろ

879:名無しさん@お腹いっぱい。
09/01/16 08:54:17 KNjWFBiV0
>>878
中の人、乙

880:名無しさん@お腹いっぱい。
09/01/16 12:34:31 ar3mUcAl0
で、WinReaderProを使った奴はいるか?おれはxdwでscanした文章が20Gくらいあるんだよ。
DocuWorks内蔵のOCRも悪くないけど、更に精度が上がるなら20万出してもいいかなと思うのだが。
俺が人柱になるしかないのか?

881:名無しさん@お腹いっぱい。
09/01/16 19:19:39 u6xluZvZ0
そうだね

882:名無しさん@お腹いっぱい。
09/01/17 12:03:50 q4cOoTS30
構って君登場w


883:名無しさん@お腹いっぱい。
09/01/17 13:22:33 8LomD8UX0
くそ。
お前らがそういう態度なら絶対に書いてやらない。
WinReaderProで得た経験を誰にも教えないぞ。

884:名無しさん@お腹いっぱい。
09/01/17 13:36:24 ajPyCMtQ0
精度なんて似たり寄ったり。重要なのは確認、修正作業のし易さ。

885:名無しさん@お腹いっぱい。
09/01/17 13:44:11 8LomD8UX0
まじかよ。そんなことしていられないよ。
検索で引っ掛けるのが目的だし。
20万円の価値は無いのか。

886:名無しさん@お腹いっぱい。
09/01/17 17:14:11 3jWVocFV0
買えば済むのに

887:名無しさん@お腹いっぱい。
09/01/17 21:05:47 q4cOoTS30
URLリンク(ssl.mediadrive.jp)
ほんとに買う気なら体験版をとりあえず申し込むべし。

888:名無しさん@お腹いっぱい。
09/01/20 16:59:05 Ez5R3CRM0
読取革命大好き

889:名無しさん@お腹いっぱい。
09/01/21 02:20:01 nux6CWbW0
>>887
申し込みます。DocuWorksのVer6とVer7と比較してよければ買います。
全文検索は行方不明書類を捜す唯一の手段だからな。
行方不明書類ってどうしても発生するんだよね。
Scan時の重送で検出漏れもあるしね。

890:VdTyVIXmByCFJdJ
09/01/21 02:28:08 27CcxXma0
3ofhNQ <a href="URLリンク(jicyqypxfieh.com)">jicyqypxfieh</a>, [url=URLリンク(tdeqcqoimwwk.com) [link=URLリンク(qykftmbejfxg.com) URLリンク(nriidvmyuevw.com)

891:名無しさん@お腹いっぱい。
09/01/21 17:02:44 1Yv8qxGD0
>>873
>同じように自分でスキャンした論文や本も透明テキスト付きで
>残しておいて管理したいってわけ

同じく。最新のAcrobatでも表があるページだと表部分だけでなく本文部分
の透明テキスト化も玉砕するんで困ってます。表が入っててもそこそこの
OCR化をしてくれて透明テキストとして出力してくれるソフトってあるの
でしょうか?




892:名無しさん@お腹いっぱい。
09/01/21 21:37:36 NwoVvKSk0
E.TYPISTでいいんじゃないの?

893:名無しさん@お腹いっぱい。
09/01/21 21:40:41 ze4pJbzr0
企業内でスキャンしたい対象ってどんなのがあるかな?

894:名無しさん@お腹いっぱい。
09/01/21 21:47:38 nux6CWbW0
>>893
FAXやら報告書、見積書、請求書、領収書。

895:名無しさん@お腹いっぱい。
09/01/21 21:50:24 ze4pJbzr0
わかるわ

896:名無しさん@お腹いっぱい。
09/01/21 23:36:46 VPMtNf1U0
>>891
つ ScanPaper for PDF
絶賛絶版中
残念。....Ver. up待ってたのに...orz

897:名無しさん@お腹いっぱい。
09/01/22 14:57:17 hloqxcjl0
>>891
スレ違い。

898:YLwdkzJwQk
09/01/22 14:59:20 XZya3rFK0
comment3, URLリンク(cxlkueu.tripod.com) us immigration and naturalization servic, 41903,

899:名無しさん@お腹いっぱい。
09/01/26 14:02:08 B6gIH/Ys0
>>897
そっか?ここ「画像→テキスト化総合」スレだぞ。


900:名無しさん@お腹いっぱい。
09/01/27 01:41:17 upxCQJ3+0
WinReaderProの試用版ダウソしたぞ。
結構いいな。でも、DocuWorks文章だとファイル1枚ごとの取り込みだから気が遠くなるくらい遅い。、東南アジアとか中南米で仕事をするくらいのスローペース。
全く実用にならない。


901:名無しさん@お腹いっぱい。
09/01/27 07:41:36 htkl5rYY0
精度がいいんだったらそれくらいの時間我慢しろ

902:名無しさん@お腹いっぱい。
09/01/27 11:33:20 upxCQJ3+0
>>901
一枚一枚手作業できるかよw

903:名無しさん@お腹いっぱい。
09/01/28 00:27:11 7RPnoVYN0
結局、Docuworksからエンジンを呼び出して使う方法しかないね。でも、デモ版ではこの機能が使えない。。。
300dpiで取り込んだ書類の8pointの文字をきちんと認識したのはさすがだった。
DocuworksはVer6でもVer7でも誤認識したのに。
買うかな。。。でも、実売15万か。。。


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch