23/12/25 01:03:42.23 5F0dxNqp0.net
>>28
> ソをンと間違える確率7割~8割
検索文字列[ンソ]で全ファイルをgrepしてみたが、877件ヒットしてノーミスだった。
『ジャクソン』とか格好の登場人物もいたが、『ジャクンソ』はノーヒット。
> 1文字スペース部分が、空白改行2行に
これはどうだろ? 行頭スペース欠落が1件見つかったが以後まだ精査していないので明後日まで待ってくれ。
> 「噛」や「頬」のように細かいと文字化け
大ぴんぽん。確かにこの2つの文字は化けていた。
> ゴミの・なども文字化け
Scan Tailorを通して原稿をキレイにしたから(ゴミ取り機能)か、なかったような。
繰り返すが、OCRは元原稿の画像をどこまでキレイにできるかで結果が変わるから。
ただ全角のアルファベットは半角にされるねえ、やっぱり。
まあsed的なツールで一括置換だけど。