07/03/06 20:26:11 0
自炊した小説の画像データをW-Zero3で読もうとすると、縮小されて読みづらかったので、
元の文字の大きさを保ったまま、別の画像サイズに配置し直す
アルゴリズム考えたんだけど、ニーズあるっすか?
画像データのビットの並びを検索して、文字としての画像要素を見つけて、
前後関係を保ったまま再配置するアルゴリズムです。
URLリンク(kjm.kir.jp)
OCRではないので、文字認識するわけじゃないけど、その手前で止めた感じ。
なお、原理的に縦書き小説のみ対応で、コミックは対象外です。
↓822x1200の画像データ食わせて、640x480に再配置した結果です。
URLリンク(kjm.kir.jp)
一応、連番画像データ食わせると、自動処理して連番出力するようにしたんだけど、
まだ誤変換も多くて。
とくにルビの抜き出しが難しいっす。