【文字認識】OCRソフト【 自炊 】at SOFTWARE
【文字認識】OCRソフト【 自炊 】 - 暇つぶし2ch883:名無しさん@お腹いっぱい。
23/10/03 06:17:08.75 8+ujl4QD0.net
512 x 512に区切って処理してて、256でウインドウをスライドさせているので256の倍数だと
最後のブロックに余りが出ないですね。

884:名無しさん@お腹いっぱい。
23/10/04 20:44:44.74 vRUF6acm0.net
>>861
ベクターあたりでの公開希望

885:名無しさん@お腹いっぱい。
23/10/09 23:35:14.38 WG0A8Uhb0.net
iOS17から縦書き日本語が読み取れるようになった
APIなりSDKあれば縦書き日本語OCRでは最強かもしれん知らんけど
ペラ紙書類の縦書きはもうiPhoneで完結だわ

886:名無しさん@お腹いっぱい。
23/10/19 07:36:34.92 zGVZ5rc10.net
>>0860
私もEPUBから青空文庫形式への変換を試みています
がEPUBの仕様の自由度が高くて難航しています。
出来れば公開してほしいです
お願いいたします。

887:名無しさん@お腹いっぱい。
23/10/19 09:00:07.52 9iReVXET0.net
公開するとメンテナンスしなきゃならないし、バグ対象はともかくおま環にまで対応しなきゃならないしエラー処理も細かく作らなきゃならないからヤダ。

888:名無しさん@お腹いっぱい。
23/10/19 09:27:27.40 bNKbLe6D0.net
epub, mobi →青空文庫の変換は対応タグに違いがいろいろあって、青空文庫では調整できないのも多いし、一部は標準化されてなくてビュアーごとの独自拡張だったりする。
結局、書籍の特徴や自分の好みや使ってるツールに合わせて決め打ちで変換することになる。汎用のツールを作るのは無理。

889:名無しさん@お腹いっぱい。
23/10/30 01:26:39.09 zJhf5BLT0.net
>>867
URLリンク(kyukyunyorituryo.github.io)

890:名無しさん@お腹いっぱい。
23/10/31 01:41:42.92 dvkv99P10.net
pdfに画像透明テキスト埋め込みするのって最適のライブラリって何かあるですか?
縦書きに対応は必須で、ふりがなに対応できるとうれしい。
それとも、コピペするとき不便だから、ふりがなは除去して埋め込むのが普通ですかね

891:名無しさん@お腹いっぱい。
23/11/05 14:23:45.25 0L6HLOnn0.net
PC画面の文字を認識して即翻訳できるソフトってありますか?できれば\0~1000以内で、
無料のCapture2Text試しましたが使い物にならなくて

892:名無しさん@お腹いっぱい。
23/11/05 14:24:06.46 0L6HLOnn0.net
PC画面の文字を認識して即翻訳できるソフトってありますか?できれば\0~1000以内で、
無料のCapture2Text試しましたが使い物にならなくて

893:名無しさん@お腹いっぱい。
23/11/05 14:24:11.27 0L6HLOnn0.net
PC画面の文字を認識して即翻訳できるソフトってありますか?できれば\0~1000以内で、
無料のCapture2Text試しましたが使い物にならなくて

894:名無しさん@お腹いっぱい。
23/11/05 15:35:03.26 UJ3RQ2Wr0.net
使ってないから違うかもだがCapCapはどう?

895:名無しさん@お腹いっぱい。
23/11/05 15:46:34.82 dDirpvM+0.net
スマホのGoogle翻訳アプリで画面撮影。

896:名無しさん@お腹いっぱい。
23/11/07 11:11:28.34 g1O/GcqC0.net
bunkoOCRの作者様へ
要望が有ります
1.
ルビに関係ない所に挿入された特殊文字(U+FFF9からU+FFFB)は、無視してほしい
2.
行頭の全角スペースと”「”の認識精度を上げてほしい
3.
青空文庫形式での出力時は以下の文字を置換してほしい
ルビ以外外での「《」を「[#始め二重山括弧]」に
ルビ以外外での「》」を「[#終わり二重山括弧]」に
縦書き未対応の記号の「≪」を「[#始め二重山括弧]」に
縦書き未対応の記号の「≫」を「[#終わり二重山括弧]」に
★変換したい文字は、ファイルで指定できればなお良い
4.
空行も出力してほしい
自炊小説の場合は空行も重要です

897:名無しさん@お腹いっぱい。
23/11/07 13:45:16.04 EgBq2MV30.net
>>874
PCOTならデスクトップは無理だがアプリ内OCR&翻訳はいける

898:名無しさん@お腹いっぱい。
23/11/08 19:09:27.13 EULq7AvV0.net
>>0873
ソフトウェアとして配布はされていませんが
以下のリンク先の記事は参考になりませんか?
URLリンク(qiita.com)

899:名無しさん@お腹いっぱい。
23/11/09 02:26:10.64 cayyqdYs0.net
>>0876
ルビが変なところに認識されるのは、孤立したものを除くルーチンがバグっているので直します
今、認識エンジンを再学習させているので、行頭の認識ももう少し改善する予定です
文字置換は、なにか変換テーブルを作ればいいのかしら
空行については、実は仕組み上めっちゃむずいのでちょっと考えます。
文字のブロックの座標は取れるのですが、その間隔が何行に相当するかをちゃんと
算出するのがかなりむずい。
今は、ブロックごとに空行を1行挟んで出力しています。
章番号とかも明後日に飛んでいくので、本当は間にちゃんと挟みたいのですが。

900:名無しさん@お腹いっぱい。
23/11/09 05:17:19.73 HO7qvDxE0.net
>>880
876です
回答ありがとうございます。
改善に期待しています
さて、文字の置換については
>>文字置換は、なにか変換テーブルを作ればいいのかしら
この方向でお願いします
実装して頂けるのであれば、ルビの表記の変換前に挿入して下さい
青空文庫形式の時のみの仕様ですので、他の形式には影響が
無いようにお願いします。

901:名無しさん@お腹いっぱい。
23/11/10 21:38:20.35 qu/YelkG0.net
Googleレンズみたいにリアルタイムにレシートを読み取ってくれるのがないか検索。
URLリンク(www.isp21.co.jp)
リアルタイムテキスト解析
独自のかざしOCR技術
spexperts が かざしOCR を利用
spexperts は LINEレシートを提供
でもLINEレシートは写真撮影してから解析で時間かかる。かなり正確だけど。

902:名無しさん@お腹いっぱい。
23/11/11 00:14:35.40 bRi6xLZA0.net
memo
>>882
特許6435017

903:過去ログ ★
[過去ログ]
■ このスレッドは過去ログ倉庫に格納されています


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch