16/12/26 01:47:37.00 v6AIeIuc0.net
スマホでOCR
カメラを内臓しているスマホの方が『買い物した直後にレシートをスキャンしてテキスト化したい』
という需要を満たせるせいか、Windows用ソフトが先細っている間に『Google Cloud Vision API』
という流行りのAIとかディープラーニングの技術を投入したAPIをOCRエンジンにしたスマホアプリが
公開されて成果をあげている模様。
結局自炊にはtesseract-ocrか?
で、この『Google Cloud Vision API』という奴、すこぶる評判が良いを通り越して
『もし的中率100%の占い師とか予想屋が実在したら?』レベルの優秀さだとすると、
自炊でのテキスト化に使用
→正解率が高すぎて手直しの必要がほとんどない
→著作権侵害の温床になりかねない
という名目で、一万円程度のPC用ソフトに搭載されることはないような気がします。
本当はひらがなとカタカナの『へべぺ』『エ工』『口ロ』『ト卜』『タ夕』といった光学的な識別だけ
では限度があるケースを前後の文脈から類推して判別してほしいケースにこそAIとかディープラーニング
の出番と言う気がしますが、ソフトを自作できるレベル以外のエンドユーザーには高嶺の花になるかも
しれません。
という訳で、なんとかしてtesseract-ocrの認識率を上げられないものでしょうか。