Linux対応のスキャナとOCRat LINUX
Linux対応のスキャナとOCR - 暇つぶし2ch2:login:Penguin
06/08/23 15:20:06 yQ0uk8S8
Linuxで使えるプリンタ/スキャナ
スレリンク(printer板)
プリンタの設定ができずに困っている人々
スレリンク(linux板)

3:login:Penguin
06/08/23 17:09:23 bY5+tAvL
日本語OCR 激しく欲する

4:login:Penguin
06/08/24 00:28:06 7+bi93gK
日本語OCR 無いの?

5:login:Penguin
06/08/24 04:56:28 A5+loJM+
オープンソースのOCRは、まだアルファベットの精度も厳しい状態らしいもんなぁ。
こういう分野こそIPAにしてほしいよ。

6:login:Penguin
06/08/25 10:40:46 DWIi4Hyn
オープンソースじゃなくてもいいから
PDFファイルに日本語OCRをして透明テキスト追加ができれば 
多少値段が張っても買う

7:login:Penguin
06/08/25 10:50:22 C36iItf5
ソースネクストにお願いして発売してもらおう。

8:login:Penguin
06/08/25 11:10:29 U0qISCE5
パクリ元が無いからソースネクストじゃ無理だろw

9:login:Penguin
06/08/26 01:27:15 miR2y+yn
ocrの認識エンジンってやっぱり複雑なの?
フリーソフトの域じゃ無理かねぇ。

10:login:Penguin
06/08/26 08:27:19 ZmML8ibz
>7
URLリンク(www.google.co.jp)

複雑さつーか、ノウハウそのものがやたら知られてる訳じゃないような。
関連特許も多そうだし。
URLリンク(www.hino.meisei-u.ac.jp)


11:login:Penguin
06/08/26 20:33:30 dwfRadz0
OCRATが良さそうですな。

12:login:Penguin
06/08/27 01:07:34 XnlG/nuS
日本語OCRを誰かさっさと作りやがれ!!

13:login:Penguin
06/08/27 22:04:54 WSpPhjmG
よーし、パパがんばっちゃおうかな!!


・・・無理っす。

14:login:Penguin
06/08/28 04:41:34 /rIGCUJQ
今までの方式を再現するより、CPUとメモリを贅沢に使うことを前提に
愚直なアルゴリズムを実装したほうがうまくいくような気がする。

15:login:Penguin
06/08/28 13:57:48 Cii6mITO
>>14
kwsk

16:login:Penguin
06/08/28 14:07:22 wgvNCbYv
>>15
それが人にものを頼む態度か。

17:login:Penguin
06/08/28 18:30:02 pZ8sjrgd
>>14
くわしく

18:login:Penguin
06/08/30 22:45:40 X4WHCARr
ocrホシスorz

19:login:Penguin
06/09/06 21:49:26 jkmQpdl3
HPが開発した“お蔵入り”OCRエンジンをGoogleがオープンソースで公開
URLリンク(opentechpress.jp)

20:login:Penguin
06/09/08 18:16:07 5bJPLsfP
移植よろ

21:login:Penguin
06/09/11 10:22:46 xHe91vNj
OCR無いんじゃ、メインマシンとして使えんがな。

22:login:Penguin
06/09/16 16:58:12 eUS5Q2ff
漏れはOCR使いたいから、Winとデュアルブートにしてる。

23:login:Penguin
06/09/18 18:43:40 7ToA0imS
奈良先端大の図書室にはスキャナーがあるようですね
今月のUNIXマガにでてましたけど
OCRはWinっぽいです

PDF化してDBに突っ込むのかな?
ぱっと見なんで読んでないですw

Epsonは作ってくれないのかねぇ~(ソフトは別会社か)

24:login:Penguin
06/09/27 17:58:45 Zq3CHTMG
さっさと移植しろよ、ゴルァ

25:login:Penguin
06/10/01 11:00:12 kLQrO3Nn
スレッド保守カキコ。

所有スキャナ
GT-9700F

26:login:Penguin
06/10/01 11:51:26 30sZhVt8
>>19
CentOS4.4に入れてみた。見事にハングする。
BTSにFC3で死ぬって書いてあるから同じなんだろうな。



27:login:Penguin
06/10/09 11:30:01 EQ4tTA39
昔gocrとかあったなぁ・・・

・文章領域推定
・背景分離
・文字認識

がOCRの基本3技術だと思うけど、それぞれどんな感じなの?
いま問題になっているのはどこ?


28:login:Penguin
06/10/10 00:55:22 /MdRGZUp
日本語の文字認識って、特に難しいんだと思う。
一とーとか、二とニとか、しとレとか、Winでもできの悪いOCRだとボロボロになる。

29:login:Penguin
06/10/10 08:43:46 6vSOB/G9
wineでエミュできるまともな日本語OCRってあったら教えてたもれ。

30:login:Penguin
06/10/11 00:06:24 GUwJsB4T
Windows使えよ

31:login:Penguin
06/10/11 22:45:22 eHaLTgt8
>>30
てめーが使ってろ

32:login:Penguin
06/10/11 23:24:23 XMU6af3T
OMRONがOmCRでも移植してくれればなぁ。

33:login:Penguin
06/10/13 23:14:26 IxIqTAt3
オ、オムロンって血圧計の・・・・?

34:login:Penguin
06/10/13 23:58:40 yGdobEUM
それ以外にオムロンってある?

35:login:Penguin
06/10/14 00:05:57 kwHyu9D6
>>33
自動改札だってオムロンだろう。

学生で企業の産業分野BUは見えないにしてもプロジェクトX位見てるだろう?

36:login:Penguin
06/10/17 08:39:43 cjTANUii
自動改札みたいな組み込み出さなくても、
オムロンソフトウェアは翻訳魂とかLinux用の
パッケージソフトをいくつか出してたんだが。

うちでは今でも現役だぞ。> 翻訳魂


37:login:Penguin
06/10/18 01:27:36 KSkySP//
電動工具のリョービがなんでフォント売ってんだよっていう疑問もある。

38:login:Penguin
06/10/18 01:46:10 4XMd0OBj
釣具も売ってるよ!

39:login:Penguin
06/10/18 02:42:49 yMNr6nz8
俺にとってオムロンはモデムだった

40:login:Penguin
06/10/18 10:56:53 B+acluru
>>38
釣具部門はもう売られただろ、確か。

41:login:Penguin
06/10/18 15:23:26 KSkySP//
釣具はやっぱりシマノ

42:login:Penguin
06/10/19 02:09:15 Ew7MVMXK
オムロンは音声合成もやっとるよ~

43:login:Penguin
06/10/19 16:12:04 iGPaBe3g
こんな自信のあるやつみたことない、、、、
  ↓↓↓↓↓↓↓↓↓↓↓↓↓↓
URLリンク(heisasimasita.blog.shinobi.jp)

44:login:Penguin
06/10/19 17:05:06 yx3VVHaw
閉鎖ってなってるよ

45:login:Penguin
06/10/25 15:22:56 song7LzM
そろそろ有志による開発が始まろうとしている

46:login:Penguin
06/11/01 00:56:06 TnbB/mJb
mac対応ソフトはあるのに

47:login:Penguin
06/11/08 20:00:46 kIH4bHzY
ocrってなんの略?

48:login:Penguin
06/11/08 20:03:26 wl557VXU
>>47
URLリンク(linux2ch.is.land.to)

49:login:Penguin
06/11/08 20:10:08 3+jIV1tj
OぷてぃCaRu

50:login:Penguin
06/11/09 23:54:13 MOxl8Jmh
OnlineChineseRelationship

51:login:Penguin
06/11/17 00:30:52 Kke65Bue
i am chicken.

52:login:Penguin
06/11/29 21:58:11 HNwoVyRZ
O・C・R!
O・C・R!

53:login:Penguin
06/12/12 21:57:49 YIMQLrAk
読んでココ!

54:login:Penguin
06/12/13 23:38:11 BhCrulAE
だが断る

55:login:Penguin
06/12/21 19:28:28 nxUBfYGz
なあに、かえって免疫力がつく。

56:login:Penguin
07/07/31 11:55:25 65rFl0Pu
誰か開発しろって言ってるだろ、ボケがぁ!!

57:login:Penguin
07/07/31 14:00:48 +viK+L6G
欧米語用だけど、ocradはほぼ100%の認識で便利に使えた
最適なdpiを探るのにちょっと時間がかかったけど

日本語用のOCRを激しく希望


58:login:Penguin
07/08/20 17:30:54 sNtfpeym
Wineで使えるか試してみよう。そうしよう。

59:login:Penguin
07/08/22 03:23:21 aaNrdmsM
ウチのスキャナはxsaneが対応してないす・・・

60:login:Penguin
07/08/22 07:43:03 GUTMrRDo
>>59
それはMSの陰謀だからxsaneが悪いわけじゃないし、普及すれば良くなるよ。

61:!(ФyФ+){ 私は孔酔 }
07/08/22 10:30:29 pnn4/ZUJ
>>56『追加』/debian-base.で個人使用、OS.の開発を考えて居るピョぞ¿...コチラオンシンフツウデス…

62:!(ФyФ+){ 私は孔酔 }
07/08/22 10:33:04 pnn4/ZUJ
        ,..♪
 ヾi、ヽ.i
 (,.ф ¢ф)  зξι  ピョピョっと
 ミ,.'.ノ
/ ̄″ ̄  ・・・>>61『追加』/嗚呼¿...コノスレニカンケイナカッタカ+コチラオンシンフツウデス

63:login:Penguin
07/09/06 11:20:11 Fb0o2EnQ
期待してきたスレなのに過疎ってるなぁ。

tesseract使ってみた。(HP起源ののGoogle系)
俺の場合はocradより精度よかった。
ただ、数字しか用事ないんだけど3を5と勘違いする確率が高い。
トレーニングすることで精度上がるみたいだけど、
だれかやったことある人いたら教えて。
TrainingTesseract - tesseract-ocr - Google Code
URLリンク(code.google.com)

64:login:Penguin
07/10/08 12:00:45 HruXyoxa
にぽんごがつかえないとイミないヨ

65:login:Penguin
07/10/08 12:59:47 tb1zM/Lh
日本語ocr
orz


66:login:Penguin
08/01/12 21:00:06 USJU18tI


orz




67:login:Penguin
08/01/20 00:17:49 EQfjQT28
VMWareでゲイツOS動かして(ry

68:login:Penguin
08/03/05 17:32:20 m5WO5cfN
ド素人が
SCSI接続のスキャナーを
にんしきさせるのは
むずかしいですか?


69:login:Penguin
08/03/09 19:24:23 WzCSxsqB
DVD番KNOPPIXで起動してgimp起動してみる。
運よければ認識する。

70:login:Penguin
08/03/10 10:37:37 NCtKpYso
>>68
昔はUSB接続のスキャナよりもSCSI接続の方が遙かに簡単だったけど。

71:login:Penguin
08/03/10 17:23:48 I068eTmS
saneでサポートされている機種ならなんにもしなくて認識すると思う。
サポートされてない機種は難しい。
USBでもSCSIで同じだと思う。

72:login:Penguin
08/07/05 10:00:21 p3OIquvj
まだあったのか、このスレ・・・

73:login:Penguin
08/07/06 18:27:56 4bK5eKwt
fedora core 8 に入っているデバイスドライバで対応しているスキャナの一覧知りたい

74:login:Penguin
08/07/06 18:40:14 yDT04Lsw
エプソンの古いスキャナはエプソンコーワがドライバを出してたので
相性が良さそうに思う。
それ以外はお金払ってVueScanを使うとよいと思う。
こいつのおかげで拾ってきたフィルムスキャナが使えて大喜び。

75:login:Penguin
08/07/08 22:48:57 h8Fjavx+
>>73
URLリンク(www.sane-project.org)
おおよそこれ
FC8には入ってなくて上の一覧にあったら自前でコンパイル
FC8ならまだアップデート来るだろうけど

76:login:Penguin
08/07/27 17:31:45 rGVms7pG
       http:// ; ?????????
     http:// ;  ????????????
URLリンク(?;???????????)<)  ?      ??
URLリンク(?;?)<) ???      ?          ???
http:// ??? ??????     ???    ??? ???
URLリンク(?;????????)<)    ?     ???    ?  ??

77:login:Penguin
08/08/07 22:26:27 G7yV4hjq
とりあえずこれだけは言える。
俺の人生にはいいことはなかったし、これからもない。

78:login:Penguin
08/11/28 20:30:26 U80ZIjo0
Linuxは普及しないと思いました。

79:login:Penguin
09/05/18 13:30:25 32LxwiHT
URLリンク(sourceforge.jp)

NHocrのソースコードを初公開 (ver 0.16(beta))
投稿者: hgot
日付: 2009-05-15 18:56
日本語文字認識プログラムNHocrのソースコードを初公開しました (ver 0.16(beta))。
Solaris SPARC/x86, Linux (x86_64)上で動作確認済みです。OCRopusからの呼び出し
が可能です。文字行認識部がライブラリ化されており、自作プログラムからの利用も
容易です。

80:login:Penguin
09/05/18 19:38:05 nm2XA63v
OCRって使わないほうがいいのかなと最近思う。
認識ミスはかならず起こるから、結局人間の目で検査することになるよね。
ところが似たような形ゆえに誤認識してるわけだから間違い探しが大変。

81:login:Penguin
09/05/19 15:20:55 hQEejHMo
スキャン→OCR→青空文庫テキスト化のノウハウをまとめた文章があってそれによれば
誤認識しやすい文字はエディタで文字色を変えて検査するとかの方法があるらしい

誤認識しやすい文字は
URLリンク(www.siesta.co.jp)

82:login:Penguin
09/05/19 22:47:05 VdrLajQJ
>>79
これいいですね。
試しに使ってみましたが、Windowsで認識率No.1を誇る本格読取の約200倍の
認識精度でした。
取り扱いも容易だし、このためだけにLinuxを導入する場合も出てくるのでは
ないでしょうか?
キラーアプリと言って差し支えないと思います。

83:login:Penguin
09/05/28 21:09:32 1fSWwA3J
>>82
つまり、本当は、使い物にならないレベルってこと?

84:login:Penguin
09/06/25 09:41:47 hXpPfq+7
市販品には勝てんな。

85:login:Penguin
09/07/05 07:38:52 p3XE0Qtt
>>81
市販のに追いつくのは無理だと思う。

86:login:Penguin
09/07/05 09:47:22 J147l0Qp
自分で作るしかないな。

87:login:Penguin
09/07/08 08:29:23 MYN3KcvK
>>85
学習が進むと市販製品より3桁精度が上がるぞ。


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch