05/04/24 15:18:28 rBY4EOUi
今でも、マンガなんかで著作権無視しまくりでスキャナ取り込みしたのが出回ってるけど、
文字認識がまともになったら、文章中心のものは全テキストで取り込んでおきたい。
書式が固定的だから、XML化でもして、項番ごとにジャンプするWebサイトなんて簡単に作
れるしね。(ちょと、味気ないけど)
青空文庫は、全文打ち込みだったっけ?
ただ、著作権的にうまく回せるシステムがないのが癌だね。
あと、1970年ころの文庫本なんて、酸性紙でけっこうぼろぼろだったりするから、GBの
初期のころのもそろそろ危なそう。取り込んでしまった方が安全なんだけど。