ファイルの重複検出ツールを作ろうぜat TECHファイルの重複検出ツールを作ろうぜ - 暇つぶし2ch■コピペモード□スレを通常表示□オプションモード□このスレッドのURL■項目テキスト125:デフォルトの名無しさん 09/01/14 14:35:59 どうせ、画像ファイルだろ。MD5を作るんじゃなくて、サムネイル画像作ってそいつで比較したら?w 126:デフォルトの名無しさん 09/01/14 14:39:27 画像なら、画像の特徴を比較する必要有り。部分md5では無理 127:デフォルトの名無しさん 09/01/14 17:40:08 サムネイルもインデックスみたいなもんだな 128:デフォルトの名無しさん 09/01/14 22:02:32 最近のコンピュータは高速だからファイルの先頭から1ビットずつ比較しようぜ 129:デフォルトの名無しさん 09/01/14 22:04:27 指紋認証のやり方で特徴点抽出 130:122 09/01/15 14:04:06 122 ですが、ファイルは主にプログラムのソースコードです。 現在使っている MD5 以外の検索方法は ベースファイル名が一致しファイルサイズが近いものを DB から抽出し、 ファイルの最初の 128KB のバイナリ差分が小さいものに絞り込み、最後に ファイル全体のバイナリ差分が小さいもの選んでいます。 この方法でそこそこの時間で検索できますが、大幅な絞り込みのために ファイル名を使っているのでファイル名が全然違うファイルは検索対象に ならないので困っています。 次ページ最新レス表示レスジャンプ類似スレ一覧スレッドの検索話題のニュースおまかせリストオプションしおりを挟むスレッドに書込スレッドの一覧暇つぶし2ch