09/10/17 05:31:43 eT4p2aZx0
本当に同じなのかなぁ。
ハッシュというキーがあるので、DBで処理するならこれがPrimaryKeyになるでしょう。
リストが重複する、ということは、DBでハッシュをキーにしていないってことじゃない?
どうしても同一ハッシュの可能性があるので、ファイルサイズとハッシュを使ってPrimaryKeyにしているんじゃない?
でも同一ファイルサイズ+ハッシュだとコリジョンする可能性を否定できない。
他に要素を利用しているとするなら結果は微妙に違ってくるはず。
いずれにしても、同一ハッシュファイルの処理をどうしているのかによって変わってくると思うよ。
「同じ」と断言できてる理由が良く分からない。