年金**五千万件の名寄せ方法at PROG
年金**五千万件の名寄せ方法 - 暇つぶし2ch844:あるじゃーのん
07/06/17 13:02:20
>>841,843
同じ漢字でも読みが違うのが人名ですよ?
数通りの読みに目をつぶっても、日本全国の全員の名前をデータベース化しないと
全件の自動処理はできませんよ。

姓は訓読みが多くて名は音訓混じりが多いから、
実際の氏名に近づけるなら訓読みに置き換えるかな。
濁点はたいていの場合抜けることになる。
入力ミスじゃなくて単純変換の賜物だったかもしれない。

データベースを作ったときの氏名がこんなんだと、
検索するときにこれに合わせて検索することで学習、
新規の入力時にもそれに合わせて入力することで間違った読みが量産されると。

諸悪の根源って奴ですね。



次ページ
続きを表示
1を表示
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch