08/01/11 07:52:27 Mrkensmh0
ファイルを識別するのにハッシュという手法がある
デジタルのデータはどんなデータでもみんな数字の塊なので
その数字をある数で割った「余り」を記憶しておく
どんな大きいファイルでもどこかひとつでも数字が書き換えれると
余りはガラっと変化するので不正とかうっかりミスの発見に役立つ
「いま送ってもらったデータこっちで割り算してみたら余りが違うんで悪いけどもう一回送って」
といった感じに見えないとこで膨大なデータを逐一チェックしている
Youtubeも同様の手法でファイルの余りを計算してどこかにメモしている
アップロードされたときに過去に同じ「余り」がなかったかを探して
一致するものがあれば二つを比べてみて全く同じ内容であれば拒否できる
そうしないと同じファイルを延々と挙げられてどんどん圧迫されちゃうから
著作権等の問題が起きてファイルが排除された場合
メモしておいた余りは消さずに残しておくようにすれば
「違法で消されたのに懲りずにまたあげようとするバカ」は簡単にはじくことができる
つまり君のこと
これはYoutubeで公表されてるわけではないが
コンピュータの世界ではわりと基礎的な考え方なので
たぶんそうなってるだろうと容易に想像できるシステム
それでもあげたい場合は
ファイルの中身をちょっとだけ書き換えてやれば
過去のとは一致しなくなって受け付けてもらえる
FLVファイルを再エンコなしで書き換えるのは容易ではないけれど
mp3なら「音質は劣化させずにタグだけ書き換えるソフト」等が一杯あるので
ダウン>分解>mp3のタグ書き換え>結合>アップ
をすれば見た目も音も全く同じものを何個でもアップできる
なおYoutubeでは内容や音で中身を識別するシステムも鋭意開発中で
こんな簡単な方法はこれから使えなくなっていく予定
「右上にNHKっていうロゴが入ってる動画は全部NHKに連絡」とか
「カウントダウンTVのあのジングルが聴こえたら無条件で削除」なんてのも
やろうと思えばできる