16/05/07 15:29:24.41 27qAR0TH.net
普通の人が選手の家族の誕生日を知るすべがあるとは思えないけど
都市伝説だとしてもなるほどと思ったでござる
Pa: 子供の誕生日に優勝する確率
Pb: 優勝する確率
Pc: 子供の誕生日となる確率
一つの方法として、全選手についてこれらの量を計算して
Paの分布とPb*Pcの分布を比べることが考えられます
もっと極端な例の方がわかりやすいかもしれません
Pa: 人が陸地で生活している確率 だいたい十割
Pb: 人が地球上で生活している確率 だいたい十割
Pc: 地球上で陸地である確率 だいたい三割
この場合、Paの分布とPb*Pcの分布ははっきり異なります
人の生活と陸地とは関係があると推測します
こうした初歩的な考え方はゴキブリと一緒でどこにでも現れます
例えば下の例では、word2vecのネガティブサンプリングを紙の上で実行すると
「単語」と「文脈」を重み「log(Pa) - log(Pb*Pc)」で結んだ二部グラフに帰着します
Neural Word Embedding as Implicit Matrix Factorization
[Omer Levy](URLリンク(wp.me)