お勧めの重複・類似・近似画像処理ソフト3at SOFTWARE
お勧めの重複・類似・近似画像処理ソフト3 - 暇つぶし2ch21:名無しさん@お腹いっぱい。
09/11/06 22:43:37 fJDKuci80
苦手とか言ってると、いつまでたっても得意にならないんだよ!

22:名無しさん@お腹いっぱい。
09/11/07 01:40:18 wXVk5SGKP
>>21
得意だったらGUI作ってクレオ

23:名無しさん@お腹いっぱい。
09/11/07 02:00:37 tksohliK0
とりあえずDLL公開しちゃいなYo

24:名無しさん@お腹いっぱい。
09/11/07 02:14:03 wXVk5SGKP
類似やデータベースに対応するかとかはどうする?
DVDのデータを蓄積して検索できるようにする。
あと似た画像、似た文書の検索など。
フォルダ(たち)を渡したら、テキストを出力するのでいい?

25:名無しさん@お腹いっぱい。
09/11/07 03:26:52 jNlSj40W0
え?画像を比較するんだから、比較する2つの画像の
フルパス文字列へのポインタが引数なんじゃないの?

26:名無しさん@お腹いっぱい。
09/11/07 03:41:36 wXVk5SGKP
そしたらGUIの負担が増える
フォルダ丸ごと渡したら、類似画像をまとめて返すのがいい

27:名無しさん@お腹いっぱい。
09/11/07 04:02:08 tksohliK0
GUIに任せる部分が多いのはダメだろw
2つの画像のパス受けて比較するだけのDLLって・・・
というかどういう比較をさせるかの細かい指示も
パラメータで渡すとか考えるとDLL作るのも面倒そうだな

28:名無しさん@お腹いっぱい。
09/11/07 04:31:56 JrJTQ7Ce0
比較の部分が一番重要なんだから、後はGUIでいいだろ。
VBだったら一日もあれば出来るし。

29:名無しさん@お腹いっぱい。
09/11/07 09:07:31 wXVk5SGKP
各人がそれぞれのDLLの入出力作ったら対応が大変。GUIの人がやりやすい方法がいい。

30:名無しさん@お腹いっぱい。
09/11/07 09:19:51 wXVk5SGKP
でも進まないから、仮仕様でDLLをうpするか。ちょっとまっててくれ

31:名無しさん@お腹いっぱい。
09/11/07 18:40:27 gHlC3aiq0
>>29
> 各人がそれぞれのDLLの入出力作ったら対応が大変。GUIの人がやりやすい方法がいい。
え?
DLLを書くのは 1NJHQ7nOP だけなのでは。

32:名無しさん@お腹いっぱい。
09/11/07 23:13:55 bhegt6a00
UnDup使って完全一致の重複ファイル消してさらに他の近似画像検索ソフトで
重複ファイル探して消して、そこからファイル振り分けソフト使って整理しようと思ったが

UnDupで45万ファイル190GBって出たのを見てそっとタスク終了を押した
整理とかいう次元じゃない、もう色々と手遅れのようだ


33:名無しさん@お腹いっぱい。
09/11/08 09:56:04 XmodM7/u0
どうせ見ないんだから丸ごと消しちまえよ

34:名無しさん@お腹いっぱい。
09/11/08 12:40:06 0nNXR1sf0
pico久しぶりに立ち上げたら、途中で落ちるようになってしまった...

で他にいいのを探してるんだけど、1.複数フォルダの比較可、
2.フォルダをD&Dで登録できる、
3.エクスプローラの右栗「送る」からフォルダを登録できる、
の条件だとしたらどれが良い?(2,3はどちらかでもおk)

35:名無しさん@お腹いっぱい。
09/11/08 17:12:41 BB6F8V3L0
ディレクトリ(フォルダ)を一つ指定して、その下全部のサブディレクトリ含めて
全ての画像ファイルを比較するソフトって、どれが良いでしょう?
別のディレクトリを2つ指定して比較するんじゃなくて・・・

36:名無しさん@お腹いっぱい。
09/11/10 06:51:06 3scT+RPGP
>>31
重複とか画像類似とかCRCとか文書類似とかデータベス対応とか
いろいろDLLの可能性がある。
ひとりで全部作れない。

37:名無しさん@お腹いっぱい。
09/11/10 12:05:43 +aj2rkXo0
立案者がトリでもつけてやらんと話がわけわかめ

38:名無しさん@お腹いっぱい。
09/11/10 16:39:11 g6RDf6IJ0
嘘ッパチだし

39:名無しさん@お腹いっぱい。
09/11/13 05:47:38 Xsr0Qkmn0
>>34
調べろよその位 このスレにあるやつ
>>15とか含めて

40:名無しさん@お腹いっぱい。
09/11/14 05:52:47 yneUaFx/P
類似画像自動分類は速度的に時間かかりすぎる。
まずはデータベース生成して、
あるひとつの画像を与えたら類似画像みつけてくるほうがいい。

41:名無しさん@お腹いっぱい。
09/11/16 20:18:39 c5JH3xls0
どういうのが理想なの?

42:名無しさん@お腹いっぱい。
09/11/17 17:39:34 QZWN5Kav0
>>40
確か、ThumbsPlusで出来たような
データベースのファイルサイズに制限があるけど

43:名無しさん@お腹いっぱい。
09/11/17 20:07:37 X1FKVoG60
結局何もなかった

44:名無しさん@お腹いっぱい。
09/11/19 15:13:27 0SdJdiY50
取りこぼしてスレ終了

45:名無しさん@お腹いっぱい。
09/11/19 19:59:18 fu18Plj/0
ディレクトリ関係無しにフォルダ内の画像全部比較してくれるソフトってありますか?

46:名無しさん@お腹いっぱい。
09/11/19 21:25:10 ZTp5scj+O
出来ないソフトあるのかい

47:名無しさん@お腹いっぱい。
09/11/28 03:24:19 HyncZv650
何もなかった何も

48:名無しさん@お腹いっぱい。
09/12/01 01:59:32 INqLRo++0
Undupってgifだけは関連付け関係なしに違うので開くな

49:名無しさん@お腹いっぱい。
09/12/01 13:57:52 5FKbbdMn0
エロ画像はpicasa→AbleCV→SimPixやってるわ

50:名無しさん@お腹いっぱい。
09/12/01 14:32:03 LLw3seFv0
GRIDまだかな

51:名無しさん@お腹いっぱい。
09/12/01 15:16:48 II0q2s2O0
a

52:名無しさん@お腹いっぱい。
09/12/01 17:55:49 BhkkqiuI0
>>48
1.5gで再現しない。
どんな手順でやればいいんだ?


53:名無しさん@お腹いっぱい。
09/12/05 00:19:42 jIC0QcxG0
[95]sage: 12/04(金)23:34 ID:*h
画像チェック専用じゃないけどXnView使ってる。
URLリンク(www.xnview.com)

左のフォルダで右クリックして「類似したファイルを検索」ね
ファイル数に制限は無いし、ファイル形式も問わないからjpgとpngが混ざってても良いし、
単純に回転させたファイルでも類似と見てくれる。

個人的には上のsimpixやImage Compareよりも良いと思う。

54:名無しさん@お腹いっぱい。
09/12/05 01:31:08 vPVuTUZ10
便利そうだな
精度や速度、重さはどんなもんなんだろ

55:名無しさん@お腹いっぱい。
09/12/05 01:41:22 z6Rve7P40
固まってしまったよ。

56:名無しさん@お腹いっぱい。
09/12/05 16:31:24 44t/kwUd0
>>53
そもそも、そのサイトが全然開かない。

57:名無しさん@お腹いっぱい。
09/12/05 18:42:33 brYdcrZ20
XnViewはexifに不整合あると無言で落ちるから使いにくい
リスト表示しただけで落ちてたらどのファイルか特定できねえだろ
デバッグダイアログくらい出せよ^^;

58:名無しさん@お腹いっぱい。
09/12/06 00:56:56 hiQ9NVOI0
XnViewは1個1個確認してやるにはいいかもしれないけど、
一括で削除とか出来ないし、表示順も類似性の高さ順じゃなく名前順だから、
類似性が高いのだけ確認とか出来ないから、全部確認しないとならないし
とてもいいとは思えない

59:名無しさん@お腹いっぱい。
09/12/06 07:29:03 pNExg6U/0
ThumbsPlus使えよ、有料だけど
さらに言うと英語だけど


60:名無しさん@お腹いっぱい。
09/12/07 04:51:52 SrgcTdAz0
250万ファイルの重複をUNDUPでやったら1日-2日ほどかかる。
これを10倍速以上の3時間以内で出来るやつ作ったら人気出るか。
いま作ってるところ。

61:名無しさん@お腹いっぱい。
09/12/07 04:53:17 SrgcTdAz0
23万個ほど重複出て、削除するにも2-3時間はかかるな。

62:名無しさん@お腹いっぱい。
09/12/07 06:50:33 IO/vxiQRO
GRIDの人のやつ(名称わからん)DB使ってmassモードにすると結構速いよ

63:名無しさん@お腹いっぱい。
09/12/07 08:54:17 xFpvHahh0
>>15試してみろ

64:名無しさん@お腹いっぱい。
09/12/07 09:03:39 3qlOZ3Mh0
釣りにマジレスしなくてもw

65:名無しさん@お腹いっぱい。
09/12/07 16:21:50 SrgcTdAz0
>>62

これ速度も精度もいいな。知ってる類似検索の中で一番の性能。

URLリンク(www.geocities.co.jp)

66:名無しさん@お腹いっぱい。
09/12/07 17:36:13 r9EBkSrH0
しかし検索後の処理がもうひとつ
数が多いから類似検索ソフトを使うのに、
数が多いのにあまり向いてないんじゃ本末転倒

67:名無しさん@お腹いっぱい。
09/12/08 06:30:19 OT6MZzNz0
Duplicate Cleaner良いかと思ったけど
日本語ファイル名が文字化けして駄目だわ
削除対象オプションが豊富っぽいのに残念

68:名無しさん@お腹いっぱい。
09/12/13 13:09:05 mQCXrPh30
類似検索の鉄板ソフトみたいなのってない訳?

69:名無しさん@お腹いっぱい。
09/12/13 13:15:33 x6uw1GDr0
あるよ

70:名無しさん@お腹いっぱい。
09/12/13 13:20:22 nQBw5JCx0
↑のやつなんでundupでやってるのに類似の話になってるの?

71:名無しさん@お腹いっぱい。
09/12/16 17:41:26 Bwgk+P2z0
スレで○○作るは99%当てにならない法則

72:名無しさん@お腹いっぱい。
09/12/18 16:31:15 iepA2UUW0
どういうGUIならいいのか漠然としすぎてて結局よく分からんから
キャッシュ生成と比較処理書いた所で投げっぱなしになってる

73:名無しさん@お腹いっぱい。
09/12/18 19:23:38 xlaIGlji0
私の場合は・・・
あるディレクトリ(フォルダ)以下、サブも含めて全部の中で、同一の画像を調べる。
あるディレクトリ(フォルダ)と、別のディレクトリ(フォルダ)を、サブも含めて同一の画像を調べる。
あるディレクトリ(フォルダ)と、別のディレクトリ(フォルダ)を、サブは含めず同一の画像を調べる。
この三種類が出来ればいいな。
一致した画像一覧のフルパスファイル名をクリックすると画像が表示されて、即消せるように。

74:名無しさん@お腹いっぱい。
09/12/18 21:43:37 Q2gUBo7C0
スレで○○作るは100%嘘

75:名無しさん@お腹いっぱい。
09/12/23 22:22:47 LrzztUh90
えろ画像とネタ画像を巡回ソフトで集めてる

気に入ったのは適当なディレクトリに移動 いらない画像はlogディレクトリに移動
nauなんたらで重複削除
見たことない画像だけ残る

みたいな感じで整理してるんだけどもっといい方法ないかね
logディレクトリがパンパンでディスクアクセスだけでしねる

76:名無しさん@お腹いっぱい。
09/12/23 23:10:47 QsKeJBnm0
いらないなら残さない

77:名無しさん@お腹いっぱい。
09/12/23 23:25:46 M3j5HUdP0
似たような方法だが、ファイル名をmd5に変換した後、
重複ファイル名で削除という事をやってた時があるな。
本当にいらない画像は、0KBの名前だけの存在になってた。

ファイル名をmd5で管理するのは定番の手法だから
nautilusも重複ファイル名比較が出来ればいいのに。

78:名無しさん@お腹いっぱい。
09/12/24 00:04:08 VAmgPQin0
ファイル名をmd5

これ笑うところかな

79:名無しさん@お腹いっぱい。
09/12/24 00:12:34 eDB3OCzu0
何が笑えるのかわからない
ファイル名のmd5だとでも思ったのだろうか


80:名無しさん@お腹いっぱい。
09/12/24 00:31:01 VAmgPQin0
ファイル名をmd5

これ笑うところかな

81:名無しさん@お腹いっぱい。
09/12/24 02:09:23 zdoDsX+M0
Vectorにそれっぽいのがあったので試してみる
javaいれるのめんどい

82:名無しさん@お腹いっぱい。
09/12/24 08:36:02 2Vc9Egxw0
ファイル名をMD5に変換するリネーマは結構あるから割とメジャーな方法だろう

笑うところとか
お前が笑われるべき存在

83:名無しさん@お腹いっぱい。
09/12/24 10:57:15 5nGuHEUS0
あれじゃね?
「今更md5とか馬鹿だろw」って意味じゃね?
md5も極稀に衝突するからなぁ

84:名無しさん@お腹いっぱい。
09/12/24 15:01:42 VAmgPQin0
ファイル名をmd5

これ笑うところかな

85:名無しさん@お腹いっぱい。
09/12/24 17:44:45 9rxg1GHZ0
ファイル名をMD5に変換する、って意味が分からん・・・

86:名無しさん@お腹いっぱい。
09/12/24 18:08:19 eDB3OCzu0
ファイル名を、ファイルのmd5ハッシュ値の文字列に、変更する。
って意味だろ
中身が同じなら同じ名前になるんだし。


87:名無しさん@お腹いっぱい。
09/12/25 10:44:33 ZvIb6/Ol0
ID:VAmgPQin0
なんでこんなに必死なの?

88:名無しさん@お腹いっぱい。
09/12/25 11:08:44 saEvAIDd0
イブなのに他にやることが無いからです

89:名無しさん@お腹いっぱい。
09/12/25 15:15:28 s/i6TirD0
コリジョン起こして関係ないものまで削除してそうだなw

90:名無しさん@お腹いっぱい。
09/12/25 15:49:07 5aHQlmPM0
そんな簡単にコリジョン起こしてたらWinnyとかここまで流行らなかっただろうに

91:名無しさん@お腹いっぱい。
09/12/25 15:57:14 2jvka5Wy0
nyなら初期からコリジョン起こしてたよ
アニメスレで報告されてたし

92:名無しさん@お腹いっぱい。
09/12/25 16:00:19 saEvAIDd0
つかnyはコリジョン起こしてもキャッシュ削除するわけじゃないから別に問題ない
コリジョン起こしてるキー配布してるノードが消えれば普通にDLされる

MD5に関しては俺はクローラに使ってるだけでHDDの方には使ってねぇなあ

93:名無しさん@お腹いっぱい。
09/12/25 16:10:56 8oosHTor0
nyのコリジョンはキャッシュ変換時に全体ハッシュ不整合エラーを引き起こしキャッシュが削除がされる。
しかし拡散しているので時間が経過するほど正常なファイルを落とせる確立が減る。

94:名無しさん@お腹いっぱい。
09/12/25 18:11:01 NZkPPBI30
winny使ったことないから知らんけどv4,v5,v6っちゅう独自ハッシュじゃないの?
md5はそんなに簡単に衝突しないはずだけど

95:名無しさん@お腹いっぱい。
09/12/25 18:12:32 w2kKy98H0
v4は独自。ただしハッシュねつ造が可能なので、
v5でmd5採用。v6はbbsに使われただけ。

96:名無しさん@お腹いっぱい。
09/12/25 19:16:52 A/I4IYEI0
個人的にはSHA-256とかSHA-512(とかの通称SHA-2)でやった方がMD5よりは安全だと思うが
如何せん処理速度の問題がなぁ

97:名無しさん@お腹いっぱい。
09/12/25 19:51:22 NZkPPBI30
ちゅうことは>>91の衝突はmd5関係ないってことかな

98:名無しさん@お腹いっぱい。
09/12/27 13:04:01 4myBqHgJ0
画像なんて落としても
もう二度と見やしないことに気付いて全削除余裕でした^q^

99:名無しさん@お腹いっぱい。
09/12/27 13:05:29 KaKERJnC0
確かに90%超は2度と見ていない気がする

100:名無しさん@お腹いっぱい。
09/12/27 17:54:23 x37pbjBK0
残り10%はEROですね
わかります

101:名無しさん@お腹いっぱい。
09/12/29 17:47:47 P/Flg+fa0
ああああああああああああああああああああああああああああああああああああああああ
Detail表示だと視認性に難有りだしLargeIcon表示だと領域食い過ぎのうえ情報足りない

102:名無しさん@お腹いっぱい。
10/01/08 13:37:37 Hu40rhqm0
ホッシュ

103:名無しさん@お腹いっぱい。
10/01/11 22:42:05 +AAOsOPI0
nautilusで拡張子フィルタをEnableにするとヒットしないんですが

104:名無しさん@お腹いっぱい。
10/01/11 22:48:18 bkbpxfkj0
…ってgnomeのファイルブラウザじゃないすか?
gnomeに聞いてくださいよ

105:名無しさん@お腹いっぱい。
10/01/18 02:23:04 0hdgbZGB0
検索対象と検索結果(サムネ)が別ペインで表示されていて、
検索結果は類似度・画像サイズ・ファイルサイズ等でソートできるような奴をこれから探すつもり。

106:名無しさん@お腹いっぱい。
10/01/22 04:01:38 bMTwRkOy0
undupは操作性さえ良ければなぁ

107:名無しさん@お腹いっぱい。
10/01/22 05:03:35 brJXBzpl0
えっ

108:名無しさん@お腹いっぱい。
10/01/22 15:51:44 n0t6NsB+0
フォルダ比較ウィンドウを開いている間は
本体の操作を一切受け付けないのはキツい
いちいちフォルダ比較の窓を閉じなきゃいかん

109:名無しさん@お腹いっぱい。
10/01/23 05:04:27 j/Pvwbth0
ずっとundup使ってたけど、
SDFにちょっと浮気してみようかな
undupは全然更新ないし

110:名無しさん@お腹いっぱい。
10/01/23 05:26:26 j/Pvwbth0
フォルダ比較できないのかSDF

111:名無しさん@お腹いっぱい。
10/01/23 16:35:20 CA4elzgj0
いや、出来るだろ

112:名無しさん@お腹いっぱい。
10/01/23 18:56:37 UhkddN0X0
誤解を招く言い方だったすまん

>>110で言ったフォルダ比較ってのは
undupのように比較対象のフォルダ内のファイル数なんかを表示する機能のこと

113:名無しさん@お腹いっぱい。
10/01/23 21:42:12 CA4elzgj0
それは必要なのか?

114:名無しさん@お腹いっぱい。
10/01/23 23:29:40 9fcwZH8e0
必要に決まってるじゃん

115:名無しさん@お腹いっぱい。
10/01/26 12:18:47 Bp+b92ug0
ぼうやはママのおっぱいでも吸ってろや

116:名無しさん@お腹いっぱい。
10/01/26 15:19:39 2dj7cNlz0
(^_^)

117:名無しさん@お腹いっぱい。
10/01/26 23:08:24 9faBZSvs0
現在のところundup最強
しかし更新がないのが欠点

118:名無しさん@お腹いっぱい。
10/01/27 01:54:38 dhTGyYlB0
今日も元気に取りこぼしっ

119:名無しさん@お腹いっぱい。
10/01/29 06:20:39 rKRBN0dh0
FileManyっての見た目が好みなんだが
いかがかしら

120:名無しさん@お腹いっぱい。
10/01/29 18:06:29 C/uY2wGL0
そんな事聞かれても、ダウンロードの直リンクURLが貼って無いから、試す気にもならん。

121:名無しさん@お腹いっぱい。
10/01/29 19:22:18 NFsfiRZA0
直リンク張るのか…
URLリンク(www.codepanic.net) インストーラー版
URLリンク(www.codepanic.net) ZIP圧縮版

URLリンク(www.codepanic.net)

122:名無しさん@お腹いっぱい。
10/01/30 15:04:34 atCyf2290
>>112
俺もそれが無いからUndup使ってる。
でも俺の環境だとフォルダ内ファイル数比較のウインドウが開くとき、ウインドウサイズの指定がおかしいらしく、最下段のフォルダが隠れた状態で表示される。
コレを直すのが面倒で仕方ない。

123:名無しさん@お腹いっぱい。
10/01/31 02:44:37 jisZvNDl0
マルチスレッド対応でお勧めの擬似判別ソフトある?
i7とか8スレだからフルに発揮させたいんだが、そんなのないと思うんで最低2スレ以上でお願いしまつ
ファイル数やフォルダの階層数も指定できると嬉しい


124:名無しさん@お腹いっぱい。
10/01/31 02:59:25 NiRSS/X30
GRIDはマルチ対応じゃなかったか

125:名無しさん@お腹いっぱい。
10/01/31 03:13:20 jgkOWh6x0
>擬似判別
判別したように見えるだけか

126:名無しさん@お腹いっぱい。
10/01/31 04:00:20 jisZvNDl0
>>124
そんな擬似画像処理ソフトってあったっけ?

>>125
判別じゃないな、すまん
識別ってところ?

127:名無しさん@お腹いっぱい。
10/01/31 04:39:04 NiRSS/X30
擬似って何だ類似じゃねえのか?

そしてこのスレくらいレス抽出しろよw

128:名無しさん@お腹いっぱい。
10/01/31 05:12:21 hBhxIolf0
擬似だから画像っぽいものを探すんじゃね

129:名無しさん@お腹いっぱい。
10/01/31 17:52:21 ilz0BUuo0
同じ画像と判断したファイルの一覧で、それぞれをクリックしたら
その画像を表示してくれるやつが少ないよな。
一応確認してから消したいのに。

130:名無しさん@お腹いっぱい。
10/02/01 08:40:51 hmZwCAjc0
見た目は嫌いじゃないけど機能が少なすぎで話にならん

131:名無しさん@お腹いっぱい。
10/02/01 16:53:14 zdHPHYdf0
>>130
> 見た目は嫌いじゃないけど機能が少なすぎで話にならん
どれが?

132:名無しさん@お腹いっぱい。
10/02/01 16:54:48 C5czh14H0
作者に要望してパーフェクトなものにしてもらおうぜ

133:名無しさん@お腹いっぱい。
10/02/04 13:27:04 jYJnRf2m0
zipの中身まで比較する方法ってないの?

134:名無しさん@お腹いっぱい。
10/02/04 13:31:50 O4I1NcHVP
>>133
aikowin

135:名無しさん@お腹いっぱい。
10/02/04 13:46:39 jYJnRf2m0
>>134
サンクス

136:名無しさん@お腹いっぱい。
10/02/07 18:56:01 juAfdkX/0
UnDupを紹介されて使ってみたのですが、
6時間ほど検索した時点で検索終了という小さなダイアログが真っ白になり暴走してしまいます。

何か暴走させないポイントなどありましたら教えてください。
データサイズは6Tぐらいありますが、できたら分割した検索はやりたくないです。

137:名無しさん@お腹いっぱい。
10/02/07 21:25:46 A65LSBQl0
メモリが少ないんじゃね

138:名無しさん@お腹いっぱい。
10/02/07 21:39:16 juAfdkX/0
>>137
8G積んでます。

139:名無しさん@お腹いっぱい。
10/02/07 22:05:59 O8dc9Agp0
>>138
32bitアプリには意味ないな

140:名無しさん@お腹いっぱい。
10/02/07 22:17:56 juAfdkX/0
>>139
いえ、RAMDISKに3G割り当てるとCドライブへのアクセスが劇的に減りますよ。
詳しくはGavotteでぐぐってください。

141:名無しさん@お腹いっぱい。
10/02/07 22:39:15 H0qU6SUf0
www

142:名無しさん@お腹いっぱい。
10/02/07 23:02:33 7ico/kxA0
別のを使おう

143:名無しさん@お腹いっぱい。
10/02/07 23:43:23 BEYi3+NR0
>>136
どうせ一回やればいいだけなんだから
分割でやりなさい


144:名無しさん@お腹いっぱい。
10/02/07 23:54:30 7ico/kxA0
>>140
32bitアプリだと1プロセスで4GB以上確保できないからって意味でしょう
プロセスの制限なのでRAMディスクに64GB割り当てても意味がない
実際UnDupはメモリ食いすぎで落ちているのだろうし

145:名無しさん@お腹いっぱい。
10/02/08 00:41:16 GMFdoIUF0
ハッシュ作成ソフトとRDBソフトでやればいけるだろうけどね
ハッシュ作成ソフトでハッシュ値とファイルサイズを作成してインサート(ファイルフルパス、ハッシュ値、ファイルサイズ)
あとはSQLでハッシュとファイルサイズでグルーピングしてカウントが2件を超えるレコードをテンポラリテーブルに出力
で、出力されテンプラリテーブルのハッシュ値とファイルサイズを元のテーブルから出力すれば完了

146:名無しさん@お腹いっぱい。
10/02/08 00:52:09 N8yNOW/p0
ハッシュテーブルと弱参照使ってる検索ソフトなら解決できる気がする
あるのか知らんが

147:名無しさん@お腹いっぱい。
10/02/08 09:18:53 gjkunL+F0
>>144
ためしにタスクマネージャーを起動してもそこまでメモリは消費していません。
100Mも使っていないので違うと思うのですが。

148:名無しさん@お腹いっぱい。
10/02/08 09:35:55 N8yNOW/p0
じゃあキャッシュ登録してるテーブルが上限値越えたんでね

149:名無しさん@お腹いっぱい。
10/02/08 09:38:04 gjkunL+F0
>>148
ファイル数1000万やそこらで上限超えるものですか?

150:名無しさん@お腹いっぱい。
10/02/08 09:45:02 N8yNOW/p0
その辺は作者じゃないと分からんよ
もしくは例外の処理がうまくいっていないとか
単にフリーズしただけだと考えられる原因は無限にあると言ってもいい

151:名無しさん@お腹いっぱい。
10/02/08 14:32:28 wg0AeQ5c0
ファイルアクセスに追随してバックグラウンドスキャンしていたアンチウイルスソフトがフリーズしたりしてるとカオスだよね

152:名無しさん@お腹いっぱい。
10/02/08 15:54:03 PRR/mDKY0
Easy Duplicate Finderでぐぐった時に見つけたDup SameFiles Searcherを試してみた
インストーラーexe版はアーカイブ版があれば出来るだけ使わないようにしてるのでzip版使用

D:1.63GB 9614ファイル (少ないのはご勘弁)

UnDup Ver.1.5g 完全一致1pass検索時間 1分06秒 簡易検索CRC32検索時間 1分08秒

重複45ファイル(21タイプ)

Dup_Same_Files_Searcher163.zip 検索時間 5 秒 めちゃ早!
※ スキャン時のチェックは念のためすべてはずした

重複255ファイル(UnDupとまったく同じファイル)

※ 使ってみた感想
  UnDupに比べて明らかに早く軽かった
  日本語のこの位長いファイル名
  一騎当千 Dragon Destiny 赤壁温泉大決戦 第1話 成都の爆乳 [一騎当千 Dragon Destiny] 0001-17.jpg もエラーなく検索
  検索後のファイル名 パス サイズ 日付はUnDupに比べて確認や視認性がよかった 
  検索後のファイル名ダブルクリックで関連付けアプリで画像等確認はUnDupと同じ
  日本語化パッチがあるがでデフォの日本ランゲージでも何故か文字化け等はない?
※ 結果
  30分位しか試してないので検索漏れ等がまだわからないのでとりあえず
UnDup FileMany Image Compare PiCo sias SimiPix 重複画像カッターと兼用しようと思う 以上!


153:名無しさん@お腹いっぱい。
10/02/08 15:58:26 N8yNOW/p0
5秒はすげえな

154:名無しさん@お腹いっぱい。
10/02/08 15:58:37 PRR/mDKY0
誤 重複255ファイル(UnDupとまったく同じファイル)

正 重複45ファイル(UnDupとまったく同じファイル)

間違えました・・・

試したい人はどうぞ
URLリンク(malich.ru)


155:名無しさん@お腹いっぱい。
10/02/08 16:14:11 r7IQE9IA0
>>152
ファイルの種類聞いてもいいか?
UnDupにはJPEGヘッダを無視する設定があるからそれにチェックついてれば
異なるサイズでもチェックの為に読み込みしてる可能性もあるよ

156:名無しさん@お腹いっぱい。
10/02/08 16:41:03 PRR/mDKY0
>>155
その通り JPEGヘッダを無視にチェック入ってた・・・・・・ orz

※JPEGヘッダを無視のチェックをはずした検索結果

UnDup Ver.1.5g 完全一致1pass検索時間 02秒 簡易検索CRC32検索時間 01秒


たまたま見つけて検索使ったらUnDupより早かったので普段レスすらしないのに稚拙なレポしたらこのありさま・・・スマン

157:名無しさん@お腹いっぱい。
10/02/08 16:55:25 N8yNOW/p0
これは酷い

158:名無しさん@お腹いっぱい。
10/02/08 17:02:14 r7IQE9IA0
>>156
どんまい
ただそのUnDupの結果ってログが残ってる状態なんじゃないかな?

159:名無しさん@お腹いっぱい。
10/02/08 17:55:57 PRR/mDKY0
>>158
うん残ってる

※ログ削除後(Del.log UnDup.CFGも削除)の検索結果 

UnDup Ver.1.5g 完全一致1pass検索時間 07秒 簡易検索CRC32検索時間 01秒

ログがあるから早いと思ったが9614ファイル程度だとそんな変わらんのかも、念のためUnDupを全削除してDLし直して見たけど
                                                    
                                                    


                      UnDup以上の速さと思い稚拙なレポと設定でなんか疲れた 旅に出ます 探さないで下さいOo。. (´-`)

160:名無しさん@お腹いっぱい。
10/02/08 17:58:29 PRR/mDKY0
誤 UnDup Ver.1.5g 完全一致1pass検索時間 07秒 簡易検索CRC32検索時間 01秒
正 UnDup Ver.1.5g 完全一致1pass検索時間 02秒 簡易検索CRC32検索時間 01秒

またなんか間違えてる・・  サヨナラ                                                   


161:名無しさん@お腹いっぱい。
10/02/08 18:10:15 r7IQE9IA0
>>159
>>160
検証はすごくありがたい

が、ちょっと落ち着けw

162:名無しさん@お腹いっぱい。
10/02/08 19:30:46 VmYYUE2L0
キニスンナ

163:名無しさん@お腹いっぱい。
10/02/08 20:09:31 g/RJ/lZF0
otu

164:名無しさん@お腹いっぱい。
10/02/09 03:32:31 lbPuRG130
>>149
マニュアルに「10万ファイルにつきおよそ6MBのメモリが必要となります」ってあった。
これが事実とすると1000万ファイルで100Mも使ってない時点で不可解。
イレギュラーなデータがあってうまく読み込めてないとかじゃね。

あと、既知の問題点に「●Unicodeのファイル名には対応していません」とある。
この辺も怪しいかも。

とりあえず、問題が発生したらマニュアルぐらい目を通してもいいんじゃないか…。

165:名無しさん@お腹いっぱい。
10/02/09 15:34:01 rp35J/R60
このジャンルの作者の人たちは、
速度や精度よりUIが重要だと何故わからんのだろう
精度がどんなに高くても、100%でない以上、
意図しない結果が出てるのをすぐに確認できなければ安心できないし、
検索の速度がどんなに速くても、削除等の処理に時間がかかるんじゃ何の意味もないのに
逆に言えば、それらがしっかりしてれば、
多少の速度や精度は問題にならないのに

166:名無しさん@お腹いっぱい。
10/02/09 15:44:35 n8aPQgu60
じゃあその理想の UI を細かく定義してみて

167:名無しさん@お腹いっぱい。
10/02/09 17:40:32 VZ3ozyxB0
>>166
> じゃあその理想の UI を細かく定義してみて
少なくとも、一緒だと判断した複数画像のサムネイルは表示して欲しい。

168:名無しさん@お腹いっぱい。
10/02/09 18:37:54 9nBzIIdZ0
類似でサムネでないやつなんかあるか?
Nauなんたら使ってるけど出るわ

169:名無しさん@お腹いっぱい。
10/02/09 20:58:40 cq1pYp/Y0
神眼を持つ俺参上

170:名無しさん@お腹いっぱい。
10/02/09 22:54:27 92EvGTBw0
細かく定義しろって言われてすくなくともほにゃらって舐めてるの?

171:名無しさん@お腹いっぱい。
10/02/09 23:00:51 92EvGTBw0
UIの定義なんだから、ペイントでもGIMPでも使って画面プロットしてみろ。
ペインのレイアウトとか、どこにどのペインを置くとか、メニューの階層や設定画面はどうたらと。

バカクライアントが言い出す「ビビっとくるWebサイトを作って下さい」とレベルが同じだ。

172:名無しさん@お腹いっぱい。
10/02/09 23:09:50 /UIdyqcN0
自分じゃ何も出来ないからこのスレでピーピィー騒いでるんだろどうせww 可哀そうだからほっとけw

173:名無しさん@お腹いっぱい。
10/02/10 03:10:43 QedOoEl90
類似ならフルパスのログ吐いてくれたらあとはビュアー使って目で確認するからUIとか
ぶっちゃけどうでもいい

174:名無しさん@お腹いっぱい。
10/02/10 06:57:56 PYhfFIGI0
言ってることは凄くよく分かるがなぜID:92EvGTBw0がキレているのか
何か嫌な案件でもございました?

175:名無しさん@お腹いっぱい。
10/02/10 13:36:49 Y8DQPa7G0
UIは大事だよな
細かいフォルダにたくさん分かれてるのは面倒だし
重複が100や200ならまだ作業も楽だが
数千を越えると確認作業にかかる手間を一つでも減らしたくなる

176:名無しさん@お腹いっぱい。
10/02/10 14:21:13 QIWxMXH30
大変ですねw

177:名無しさん@お腹いっぱい。
10/02/10 15:06:58 PYhfFIGI0
マメに整理し無いからそういうカオスに陥るんだと思うの

178:名無しさん@お腹いっぱい。
10/02/10 18:51:36 XoA9f84E0
>>168
> 類似でサムネでないやつなんかあるか?
幾つか試したけど、ファイルのフルパスのみ、ばっかりだった。

179:名無しさん@お腹いっぱい。
10/02/10 20:28:08 LEqL/ECh0
類似と重複を勘違いしてそうだなw

180:名無しさん@お腹いっぱい。
10/02/10 22:44:49 PYhfFIGI0
試しにソフト名挙げてくれよ
爆笑できそうだ

181:名無しさん@お腹いっぱい。
10/02/12 14:18:11 D5c3wSTg0
まったく表示できないことはないけど、
リストを表示、選択で画像表示って形式のは少なくないように思う。
SimiPixあたりがそうじゃなかったっけ。
ひとつの画像に対して、類似画像がひとつ。確認はできるけど、本当に最低限。
重複が10個くらいなのが前程じゃないかって作り。

GRIDあたりは少しマシになって、ひとつの画像に対して、複数の画像が表示される。
だけどこれも結局、重複が検出された回数だけ、確認処理をしてやらないといけない。
100、200と検出されるとやってられない。
GRIDがどうだったかは忘れたけど、類似検索の中には、逆引き・・・
1=2を類似として結果表示した後に、それを無視すると2=1を類似として出す奴がたまにあったように思う。
そうなってくると更に無駄に時間がかかる。

全体の結果を、一覧として表示できるソフトは、多くないね。

整理しないのが悪いって意見は、正しいが、
正しすぎてこの種のソフトの存在を否定する意見だ。

182:名無しさん@お腹いっぱい。
10/02/12 15:09:32 hRwf0XGE0
だからGUI案書けるもんなら書いてみろ低脳

183:名無しさん@お腹いっぱい。
10/02/12 15:16:31 hRwf0XGE0
口しか出せない癖にガタガタうっせーんだよ
嫌なら使うな
手作業で処理してろ

184:名無しさん@お腹いっぱい。
10/02/12 16:54:54 TQbrzKKt0
おちつけ

185:名無しさん@お腹いっぱい。
10/02/12 17:15:00 Glbgo3+90
>>181
二行目の二重否定で読む気が失せた

186:名無しさん@お腹いっぱい。
10/02/12 21:47:19 QiXrCb0a0
有料だけどThumbsPlus使え

187:名無しさん@お腹いっぱい。
10/02/13 14:32:29 FZrBAKQg0
ID:hRwf0XGE0

www

188:名無しさん@お腹いっぱい。
10/02/13 22:14:50 ylxVRRsX0
結果を1画面に表示するってのは検討したんだが、どうしても上手く行かなかったんだよねぇ。
実際に書いてみると分かるが、比較結果は十中八九親子関係の集合で管理することになる。
ツリー状のデータ構造はシーケンシャルには表示しにくい。

ABCDEFのよく似た画像を比較することを考える。
必要な組み合わせは

A-BCDEF
B-CDEF
C-DEF
D-EF
E-F

になる。
ハイフンの左が親(基準画像)で左が子(類似している画像)になる。
GRIDなんかがいい例で、親の中から1つを選択して子を別領域に表示するような形になっている。

これを線形に表示しようとするとABCDEF BCDEF CDEF DEF EFを1画面に1度に表示することになる。
被ってないのはAだけで残りはどこかで被ってる。Fなんか最悪で1画面に5個表示される。
これって見やすいか?色分けしたり区切るくらいはできるけど。

かといってここから情報を削るのは不味い。
状況によって検出されなかったりするのはUIの不備以上に悪だ。

他に上手い表示方法ある?検討に値するものがあったら教えて欲しいわ。

189:名無しさん@お腹いっぱい。
10/02/13 22:16:17 ylxVRRsX0
あ、期待はしてません。
おそらく>>181くらいの頭だと理解できないでしょうから…。

190:名無しさん@お腹いっぱい。
10/02/14 02:53:51 qfkW7IyG0
undup風にして操作性良くすりゃ全部OK

191:名無しさん@お腹いっぱい。
10/02/14 08:48:33 P3Obz6sp0
Undupは走査対象の中で同一のファイルがあった場合ズラズラ列挙していきますが、
ファイルAがファイルB~Zのどれと同じなのかっていう情報を提供していません。
とにかく重複であることは保証されているので必要ないからです。
そのため検索結果は1次元で管理することが容易になります。

しかし類似だと前述の状況からそういうわけに行きません。
「何と何が似ているか」を無視したら使い物にならないからです。

おそらく操作性しか言えない九官鳥さんには理解できないとは思いますが…。

192:名無しさん@お腹いっぱい。
10/02/14 11:06:09 V6Fro0L60
>ファイルAがファイルB~Zのどれと同じなのかっていう情報を提供していません。
これに関してはしてるだろ
色分けもされるし

類似なら%表示で親子関係にするのが一番見やすいだろ


193:名無しさん@お腹いっぱい。
10/02/14 11:09:17 P3Obz6sp0
>>192
それは失礼しました。

親子関係の話になると>>188に戻ります。
以降ループですね。
お疲れ様です。

194:名無しさん@お腹いっぱい。
10/02/14 11:21:49 P3Obz6sp0
重複だとABCDEFの例でいった場合
A=BCDEFが成立した時点で後続のB~Fを基準とした比較をしなくて済む様になるのも構造的なメリットですね。

A=B、A=CならばB=Cも自明に成立しますが、
A≒BCDEFだとA≒B、A≒CではB≒Cは成立しない可能性があります。
平均明度を評価基準にし、類似の条件を誤差5%とした時
A=50、B=52、C=48とすると、A≒BCは成立していますがB≒Cは成立していません。

195:名無しさん@お腹いっぱい。
10/02/14 14:00:34 XeRlBtEZ0
だからなにって話を延々としてるな

196:名無しさん@お腹いっぱい。
10/02/14 14:51:52 P3Obz6sp0
実装しにくいんだってことですよ。無能。

197:名無しさん@お腹いっぱい。
10/02/14 15:30:52 3IsUud6r0
しにくいから諦めたのか無能

198:名無しさん@お腹いっぱい。
10/02/14 15:35:53 P3Obz6sp0
あなた方が少ない頭で考えることなんて検討を重ねた上で廃棄してるんすよ。
アドバイス求めてんだから解決してくださいよ。ピシッと(´・ω・`)

199:名無しさん@お腹いっぱい。
10/02/14 17:42:31 sNQKznCa0
似てると判断した画像サムネイルは全部表示する必要があるだろ。
どれを消すかの判断に必要なんだから。

200:名無しさん@お腹いっぱい。
10/02/14 18:19:29 XeRlBtEZ0
っつーか
誰コイツ?

201:名無しさん@お腹いっぱい。
10/02/14 19:43:08 P3Obz6sp0
>>199
全部表示するのはいいのですけど、1画面に表示するようにすると
ABCDEF BCDEF CDEF DEF EFみたいな感じで同じ画像を同じ領域に何度も表示することになるのですよ。
これは本当に見やすいですかねっていう話なんですが。

どうしても検索結果を1画面に表示するってのをご所望なようなので。

202:名無しさん@お腹いっぱい。
10/02/14 21:40:12 D8OKQ3NL0
AからFまで全部表示させて
後はてめえで判断しろやって丸投げしちまえよ

203:名無しさん@お腹いっぱい。
10/02/15 10:29:04 n967OMHW0
能無しに吠えられてイラッと来るのは分かるが
テメエも能無しだろ吠えてんなよ能無し

204:名無しさん@お腹いっぱい。
10/02/15 10:49:56 CT29UZN+0
simipixのワンクリックで即ファイルを移動できる手軽さが気に入ったのですが
どうやらjpgファイルしか判定してくれないようです
これでpngを読めるようにできませんか?

205:名無しさん@お腹いっぱい。
10/02/15 18:13:18 tT79T0vh0
>>201
> ABCDEF BCDEF CDEF DEF EFみたいな感じで同じ画像を同じ領域に何度も表示することになるのですよ。
サッパリ意味が分からん。
ABCDEF の6種類が似てると判断したのなら、その6画像だけ表示すればいいだろ。

>>202
> AからFまで全部表示させて
> 後はてめえで判断しろやって丸投げしちまえよ
それでいいのに何故駄目なんだ?

206:名無しさん@お腹いっぱい。
10/02/15 18:17:13 tT79T0vh0
>>205
補足すると、例えばA~Z迄26個の画像があったとして、
Aから順番に比較する訳だが、Aに似てる、と判断された画像は、
もう他と比較する必要はない、って事。
だから、画像が何万あろうとも、似てると判断した画像は
どんどんその後の比較対象から外せる。
Aに似てるのがDGHZなら、ADGHZだけサムネイル表示すればいいだけ。
「ABCDEF BCDEF CDEF DEF EFみたいな感じで同じ画像を同じ領域に何度も表示することになる」
って、どうやったらそんな異常なアルゴリズムになるんだよ一体。

207:名無しさん@お腹いっぱい。
10/02/15 18:20:28 n967OMHW0
BがZに似てる可能性とかどうすんのその場合

208:名無しさん@お腹いっぱい。
10/02/15 18:23:06 n967OMHW0
補足

AがBに似ていると判断され
BがZに似ていると判断され
AがZと似ていると判断され”ない”場合がある

ここでAがBに似ていることで後の比較対象から外される場合
BがZに似ているっていう情報は消えてしまうわけだけどこれは問題ないんか

209:名無しさん@お腹いっぱい。
10/02/15 18:26:41 n967OMHW0
さらに補足

>ABCDEF の6種類が似てると判断したのなら

6種類が似ているという表現は正しくない
AはBCDEFと似ている、だ

この場合BとCが似ているとは限らない
だからBとCDEFが似ているは別枠の比較になる

210:名無しさん@お腹いっぱい。
10/02/15 18:28:09 n967OMHW0
つーか理解できてもいない癖に楯突かないでくれ
ウザイ

211:名無しさん@お腹いっぱい。
10/02/15 18:38:24 ClN/Qemb0
>>208
現実で考えると、
Aに似てるBに似てるなら、Aにも似てないわけないんじゃね、と思うけど、
実際には似つかない画像も混ざるんだろうし、
Aに似てる画像だけどんどん肥大しちゃうな

212:名無しさん@お腹いっぱい。
10/02/15 18:44:36 LztssEPP0
>>211
AからZの順で比較するならAが一番類似してる数が最初は多く見えるが
結局は逆のB→Aなんかは飛ばされるわけだからどの画像も自分以外と全て比較するのは一緒だよ

213:名無しさん@お腹いっぱい。
10/02/15 18:52:05 LztssEPP0
>>211
あー、その検索方法だとAとの類似と判断された画像が一番多くなって表示が困るってことか
失礼した

214:名無しさん@お腹いっぱい。
10/02/15 18:56:29 ClN/Qemb0
まぁ俺は>>202でいいと思う
>>188ではFが何枚も表示される事を危惧して、
色分けすることなんかを考えたりしているようだけど、
使用する側からすると、Fが何枚表示されてようが、どうでもいい事だと思うわ
基本的に横軸でしか考えないしね
Fという画像が、他にどんな画像と似てると見られているかなんて事は、知ったことじゃない
似てる画像が1枚でもあれば、消すなりするんだから

215:名無しさん@お腹いっぱい。
10/02/16 15:32:21 PkPi6aZh0
画像を見ていちいち確認しないなら
全類似ファイルの関連性が必要かもしれないが
閲覧して確認するんなら細かいことは要らない
見れば分かるから大雑把にコイツらなんか似てんぜ?って情報くれればいい
ややこしくなれば別フォルダに移して後で好きに検証すりゃいいしな

216:名無しさん@お腹いっぱい。
10/02/16 18:48:46 kNb6Cg9j0
>>211
> 実際には似つかない画像も混ざるんだろうし、
それは、似てると判断するアルゴリズムが間違ってるだけでは。

>>214
> 似てる画像が1枚でもあれば、消すなりするんだから
まさにそれだよね。
似てると判断されて表示されて、実際に見て確かに似てるなら、
一枚残して残りは全部消すだけの話。

>>215
> 画像を見ていちいち確認しないなら
> 全類似ファイルの関連性が必要かもしれないが
その場合、似てない別画像なのに、似てると判断されてる恐れがあるから、

> 閲覧して確認するんなら細かいことは要らない
こうなるんだよね。

> 見れば分かるから大雑把にコイツらなんか似てんぜ?って情報くれればいい
だから結論はこれなんだよな。

217:名無しさん@お腹いっぱい。
10/02/16 21:40:07 sl1TPji10
自動で画質悪いほうを捨ててくれる類似検索ソフト誰か作ってくれないかな

218:名無しさん@お腹いっぱい。
10/02/16 22:50:28 Da+WQFb00
>>217
セミオートなのはあるな
画像サイズ、ファイルサイズ、日付みたいな条件で出来る


219:名無しさん@お腹いっぱい。
10/02/16 22:56:52 tFtKThFD0
たとえばちょっと表情が違うだけで後は全く同じ構図の絵があったときに
ほぼ同じだから片方あればいいと思うか
この表情の変化が良いんだよと両方必要と思うか
結局見て判断するしかないんだよな。
あとは一度必要/不要と判断した類似画像を次に整理する機会に覚えていてくれればいいのだが…

220:名無しさん@お腹いっぱい。
10/02/16 23:31:54 PkPi6aZh0
それは消さずに不要フォルダでもつくってまとめておいて
それと類似するファイルをまとめて消すのが楽なんじゃね

221:名無しさん@お腹いっぱい。
10/02/17 04:28:21 fRScKqzj0
不要ファイルをハッシュ判定で削除するソフトならあるけど類似も消してくれるのは今のところないなあ
不要フォルダにある画像と99.9%一致したものを自動削除!ってできればいいけど不要ファイルが多くなってくると計算量がすごそうだw

222:名無しさん@お腹いっぱい。
10/02/17 15:57:41 7GznGPpw0
>>218
そのソフト教えてくれ

223:名無しさん@お腹いっぱい。
10/02/17 18:58:43 kEnEAhkt0
>>222
DupDetector だと思うが…

224:名無しさん@お腹いっぱい。
10/02/17 20:45:55 kNeYmusa0
こういう作業をやりたい人の数だけ、専用のソフトが必要だな。

225:名無しさん@お腹いっぱい。
10/02/17 22:46:58 0MdSyIrz0
画像は同じでjpgの圧縮率の違いによる劣化、微妙なサイズの違いとか見分けるのは流石に人力になっちゃうよなぁ

226:名無しさん@お腹いっぱい。
10/02/18 00:02:27 CreL4P0e0
>>225
A(100x100,100KB)の画像をリサイズして圧縮率も変えて保存したとして
B(125x125,75KB)
C(75x75,125KB)
の3つのファイルを比較した時に>>218みたいな単純な比較じゃ分からないからね

まあ画像の「顔」部分を抽出するアルゴリズムもあるくらいだから、どこかにあったりして…

227:名無しさん@お腹いっぱい。
10/02/18 02:07:28 rwGRKdsk0
重複してたっていいじゃない
人間だもの

               みつを

228:名無しさん@お腹いっぱい。
10/02/18 21:58:06 pjuhFdX70

>>221

GRID の場合…
検索対象のルートフォルダを「検索パス1」、不要ファイルの入ったフォルダを「検索パス2」、
検索2の方の「検索開始>>」ボタンで検索

結果が表示されたら上段の、グループのサムネで右クリックメニューから
RV_Special > Delete > all without 1st images で一応削除できる
(「検索パス2」のファイルは常に一番左に来るから「検索パス1」のファイルだけ消える)


229:名無しさん@お腹いっぱい。
10/02/20 10:25:08 +1uWBbIX0
今更だがテンプレNautilusのリンク先が間違ってるぞ。
URLリンク(www.geocities.co.jp)

230:名無しさん@お腹いっぱい。
10/02/20 10:39:12 +1uWBbIX0
>>122
あーそれ、俺の環境でも再現するわ。
多分だけど、フォルダ比較ウインドウの下に横スクロールバー出てるだろ。
カラムの長さを調整して、スクロールバーが表示されない状態にしてみな。
それでピッタリのサイズになるはずだ。

Undupはフォルダ比較ウインドウにスクロールバーを表示する事を想定してないんだろうな

231:名無しさん@お腹いっぱい。
10/02/20 19:48:27 HvPJgSgR0
>>229
どっちでも同じじゃね?
URLリンク(www.geocities.jp)
URLリンク(www.geocities.jp)
URLリンク(www.geocities.co.jp)
URLリンク(www.geocities.co.jp)


232:名無しさん@お腹いっぱい。
10/02/22 16:43:21 ihafj1uc0
うんこだっぷんの取りこぼしの理由知りたい?

233:名無しさん@お腹いっぱい。
10/02/24 08:57:40 CBKxfRbc0
SmartEyeの新しいの発見!

234:名無しさん@お腹いっぱい。
10/02/24 09:58:33 AIrA+V2g0
警察官もビビる内部監察官が実在〝恋愛捜査官〟に彼女と別れさせられた!!
警察官の配偶者とその親族は公安に身★辺調★査される (公然の秘密)。
漫画実話ナックルズ2010年4月号
URLリンク(megalodon.jp)
URLリンク(megalodon.jp)
URLリンク(megalodon.jp)
URLリンク(megalodon.jp)

集団強姦未遂で「停職30日」じゃ甘すぎるぞ!!自衛隊わいせつ事件簿 
《平成20年度》自衛隊員のわいせつ事件 全掲載
この漫画は公文書開示請求によって入手した報道発表文ならびに各資料をもとに脚色をまじえて
構成しております。漫画実話ナックルズ2010年4月号
URLリンク(megalodon.jp)
URLリンク(megalodon.jp)
URLリンク(megalodon.jp)
URLリンク(megalodon.jp)
URLリンク(megalodon.jp)
URLリンク(megalodon.jp)
URLリンク(megalodon.jp)
URLリンク(megalodon.jp)
URLリンク(megalodon.jp)

●東京地検の情報リークは国家公務員法違反●
URLリンク(megalodon.jp)
URLリンク(megalodon.jp)

235:名無しさん@お腹いっぱい。
10/03/03 10:57:04 maQ5ngwY0
GRIDは64Bitに対応してないの?

236:名無しさん@お腹いっぱい。
10/03/05 20:54:45 tJoB+eOe0
ImageCompare使いやすいわ
他におすすめとかある?

237:名無しさん@お腹いっぱい。
10/03/05 22:55:53 b3FZhTe00
GRIDは個人的におすすめ
数が多いと面倒かもしれないけどね

俺の環境の場合ImageCompareが浮動小数点エラーで落ちて使い物にならないんだけど
XPのSP2とかSP1だとまともに動くのかね?

238:名無しさん@お腹いっぱい。
10/03/06 20:11:06 PEzrvDzHP
フォルダ内の重複を総当りでチェックするのではなく、
こちらが指定したファイルに対して特定のフォルダから重複(類似)を探すソフトはないでしょうか?


239:名無しさん@お腹いっぱい。
10/03/06 20:16:31 3ikoS7cd0
GRID

240:名無しさん@お腹いっぱい。
10/03/06 20:24:50 PEzrvDzHP
ありがとう
見てみます

241:名無しさん@お腹いっぱい。
10/03/07 13:03:29 fGdbyaLN0
うんこだっぷんの取りこぼしの理由知りたい?

242:名無しさん@お腹いっぱい。
10/03/07 14:00:51 fYgEbYWx0
3次エロ画を整理したいんだけど結局どれとどれがおすすめなのよ

243:名無しさん@お腹いっぱい。
10/03/07 14:57:57 fGdbyaLN0
真眼と神眼と信眼

244:名無しさん@お腹いっぱい。
10/03/13 15:03:34 8WMnhNm40
FileHammerは?
URLリンク(mebiusbox.crap.jp)

245:名無しさん@お腹いっぱい。
10/03/19 07:51:49 7vPcMn650
一番手軽で使い勝手いいのってどれ?UnDupでいい?
UnDupは重複ファイルしかムリなの?一部合致ってのは?

246:名無しさん@お腹いっぱい。
10/03/19 15:26:30 c7X7KO/x0
一部合致ってどういう意味があるんだ?
画像だとして上はノーブラが合致で、
下がぱんつはいてないとと縞ぱんで不一致ってやつか?

247:名無しさん@お腹いっぱい。
10/03/19 15:27:38 PFPJE7H80
なんじゃそりゃw

248:名無しさん@お腹いっぱい。
10/03/19 19:20:20 mT3jTuwF0
GRIDのキャッシュフォルダから
存在しないフォルダのキャッシュを消したいのだがどうすりゃいいんだ?
それらしいボタンを押してるのに全然数が減らない。

249:245
10/03/19 20:00:40 7vPcMn650
>>246
俺もよくわからん
でも完全合致と部分合致とやらがある

250:名無しさん@お腹いっぱい。
10/03/19 21:08:54 HWp+eapI0
>249
使い方に書かれてない?
部分一致検索(ファイルの特定範囲のみを比較します。)
ってオプションじゃないかと思うんだけど
簡略化して高速検索するための物だと思ってるけど、
テキストみたいなファイルだと指定範囲によって類似近似シリーズ物を探すこととかも出来そうだな


251:名無しさん@お腹いっぱい。
10/03/20 05:03:08 jmY7iE8P0
そういう意味なのか
部分一致検索だともしかしたら完全には同じでないのがヒットすることもあるかも、ってこと?簡略化ってことは

252:名無しさん@お腹いっぱい。
10/03/20 06:49:53 AvukQUCM0
破損してるファイルだけどサイズも一緒で破損箇所までバイナリも一緒
っていうの探すんじゃね?

253:名無しさん@お腹いっぱい。
10/03/20 08:04:08 lghXesTk0
部分一致ってJaneのキャッシュみたいにヘッダがあるファイルのヘッダだけを比較とかに使うんじゃない?
まあ、可変長だからJaneのキャッシュは無理だが…

254:名無しさん@お腹いっぱい。
10/03/20 11:21:08 o65vciaR0
>>251
例えば1TBのファイルの中身を頭から尻尾まで調べ上げるのと、100kBのファイルを調べるのではかかる時間が違うでしょ?
DNA鑑定をする時にすべての配列を調べたりしないのと同じ
プレーンテキストなんかは無理だろうけど普通のファイルはある程度の範囲がバイナリ一致すれば同一とみなせる物がほとんど

範囲の指定は自分でできるからヘッダだけ比較することも頑張れば可能かもね
逆にJPGだとヘッダを無視するオプションもあるみたいだけど(純粋に画像の中身のみ比較したい人向けに)

255:名無しさん@お腹いっぱい。
10/03/20 23:11:34 VvY3CR4s0
こんな認識してる

1.完全一致検索 ( 1pass )
  同じサイズのファイルをリストアップ
  リストアップされた同じサイズのファイルどうしを先頭から最後まで比較する(以下全比較)
  同じサイズのファイルが10個あったら9*8*7*6*5*4*3*2回全比較する
  (全比較中に違いを見つけたら中断)
2.完全一致検索 ( 2pass )
  同じサイズのファイルをリストアップ
  リストアップされたファイルのCRCを計算する
  最後に同じサイズで同じCRCのファイルがあったら全比較する
3.簡易検索 (CRC32)
  同じサイズのファイルをリストアップ
  リストアップされたファイルのCRCを計算する
4.サイズを無視(部分一致)
  1~3は同じサイズのものがあったファイルしか開かないのに対し、これは指定したサイズ範囲の上限
  以上の大きさのファイルを全て開き部分一致チェックする
※1~3は「部分一致検索をする」にチェックを入れても無視される

2と3は拾い集めた画像フォルダ等、同じファイルが多数存在する可能性がある場合に有効
  拾い集めた画像フォルダなら3で十分
  サイズとCRCの両方が万が一一致してしまうのがいやな完璧主義なら2を使う

1はファイル構成が同じはずもしくはほぼ同じ(バックアップとか)のフォルダ同士を比較する時等に有効
  同ファイルが基本的に1対1ならCRCの計算と全比較の両方やるのはムダ
  それ以前にフォルダ比較ツールでも使った方がいい
  拾い集めた画像フォルダでもまめに一致検索をしている人は同じファイルが多数存在している
  可能性が低いのでこっちを使った方がいいかも

256:255
10/03/20 23:13:57 VvY3CR4s0
4は1~3のどれかで同ファイルを処分した後、一部破損で不一致になったファイルやダウンロード
ミスで途中で切れてしまっているファイルを探したい時に有効
  指定したサイズ範囲以上の全ファイルを開くので大量にある画像フォルダより、でかいゴミとなる
  動画等の大きなサイズのファイル向き
  より完璧にしたいなら比較範囲をずらして2回やる
  その際、指定した範囲が動画等のヘッダ部にかぶってしまうと違うファイルでも一致してしまう
  可能性があるので、多少先頭からずらした位置を指定する
  拾い集めた画像の場合一度目で見てキャッシュになっているものを保存するので途中で切れている
  可能性はまず無いし、ヘッダのみが違っているファイルはたいがいファイルサイズも違うので無意味
  (ヘッダを無視を使った方がいい)

257:255
10/03/20 23:23:25 VvY3CR4s0
訂正
×9*8*7*6*5*4*3*2回
○9+8+7+6+5+4+3+2回

258:名無しさん@お腹いっぱい。
10/03/21 00:31:20 VCxUSgn70
>>255
とりあえず、その1から4はそれぞれ比較方法の一つであって(UnDupには7通りの比較方法がある)
オプションである「部分一致検索をする」と同列に話すのはどうかなあとは思う
あと、「サイズを無視」には「部分一致検索をする」オプションが必ずセットでついてくるだけの話で、
基本的には(おそらく)全てのファイルを対象にCRC32での簡易検索をするものかと
他の比較方法の時はしたい人だけ「部分一致検索をする」にチェックを入れればいいよと

正直「部分一致検索をする」の使い道があまり思いつかなかったんだけど、確かに破損ファイルは探せるかもねえ
一度比較して重複をなくした後、部分一致検索してもし一致するファイルが有れば破損・不完全ファイルの可能性はあるね
少量の動画ファイルくらいならエクスプローラ上でファイル名やサイズでソートして人の目で確かめた方が速い事が多いだろうけど

259:名無しさん@お腹いっぱい。
10/03/21 04:15:23 M0W9f3rM0
難しい
CRCもよくわからんから読んでも理解できんわ

260:255
10/03/21 04:24:24 KXz/0NQ40
>>258
>あと、「サイズを無視」には「部分一致検索をする」オプションが必ずセットでついてくるだけの話で、
>基本的には(おそらく)全てのファイルを対象にCRC32での簡易検索をするものかと
>他の比較方法の時はしたい人だけ「部分一致検索をする」にチェックを入れればいいよと

全て違うサイズで1対だけわざと部分一致したファイル(サイズは違う)を入れたフォルダに対して
「サイズを無視」検索をやると当然1組の重複として表示されるけど、1~3は「部分一致検索をする」に
チェックを入れてもヒットしないし、File Monitorで見ても1ファイルも開いてないよ
だから、 「>基本的には(おそらく)全てのファイルを対象にCRC32での簡易検索をするものかと」 は×
(「サイズを無視」は全ファイル開いてる)

1~4以外の名前とかサイズとか日付とかのオプションを選択した時は「部分一致検索をする」がグレーに
なって使えなくなるから「部分一致検索をする」は「サイズを無視」以外では無効ってことだね

も1度訂正
○9+8+7+6+5+4+3+2+1回

261:255
10/03/21 06:30:52 KXz/0NQ40
すまん、間違ってた
1~3で「部分一致検索をする」にすると、同じサイズのファイルがあったらそれらの部分比較をするみたい
ファイルをコピーして片方の一部を意図的に変更して比較実行すると1~3ともヒットする
1は指定範囲のみの完全一致
2は指定範囲のみのCRCと完全一致
3は指定範囲のみのCRCの一致
ということかな?
ファイルサイズが同じものだけしか比較しないから一部破損とかフォーマットが決められたサイズ固定の
データの部分比較とかに使えるかな?
でも上限値がキロバイトでしか指定できないからデータ等には使いにくそう


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch