07/06/22 00:46:30
えっとそれはですねー、マッチングといいまして、AというOCRと
BというOCRを同時に動作させて同一の書面を読ませるわけです。
AとBにはNTTデータが開発した非同期誤差ドレーミング理論で
計算した微妙な誤差を読み取りに発生させます。
で、ですね。AとBの結果を突合させます。機械的にですが。時間は
A4の用紙1000枚あたり0.731ミリ秒です。
そうしますとですね。このマッチングという処理を通じて大量の文書
を高速処理が可能なわけです。
開発には大体65億円の予算を組んでいただいています。