17/12/15 19:35:30.87 09zq8eEj.net
『価値のある選択をすることが可能』
165:132人目の素数さん
17/12/16 07:55:58.33 mT+9xt82.net
ゴルゴ13は100発100中
ゴルゴ14は10発10中
ゴルゴ15は1発1中
とする。
各々10000発撃ったとき各ゴルゴの命中数の期待値はいくらか?
ベイズでは事前確率分布を一様分布として計算できる。
166:132人目の素数さん
17/12/16 08:14:30.05 mT+9xt82.net
>>13
事前分布を一様分布にするから男子確率2/3になるだけ。日本人の男女比でBeta(53,49)程度にすればいいんじゃね??
167:132人目の素数さん
17/12/16 10:53:09.08 OapDnMcQ.net
必ずしも事前確率は主観的とか無条件確率というわけでもないよ。
問.
客が煙草を忘れて行ったとする。
忘れて行った人物が女性である確率を以下のデータから計算せよ。
喫煙率
男性 28.2%
女性 9.0%
男女計 18.2%
URLリンク(www.jti.co.jp)
全体と男女別の喫煙率から男女比が計算できる。
つまり女性である事前確率がわかる。
喫煙者であるというデータが与えられたときの
女性である事後確率をベイズの公式で計算できる。
168:132人目の素数さん
17/12/16 16:23:00.07 VtHjUxVo.net
>>159
やなこった
やっぱり怖い
見たくない
169:132人目の素数さん
17/12/16 18:07:28.15 osK/QMPe.net
>>164
客の男女比率のデータはないのか。
客の男女比率
男性 0%
女性 100%
だったら全体の喫煙率は無意味に
170:132人目の素数さん
17/12/16 22:13:18.96 l96X4miv.net
>>166
18.2*(f+m)= 9.0*f +28.2*m
から男女比は計算できる。
171:132人目の素数さん
17/12/16 22:15:31.90 l96X4miv.net
日本人の男女比を事前確率にしているという意味では
弱情報事前分布と言える。
172:132人目の素数さん
17/12/16 22:20:03.79 l96X4miv.net
# ある仮想の難治疾患患者25人に従来薬を投与して3人治癒した。
# 新薬が登場して3人に投与したところ治癒した人はいなかった。
# この新薬を継続して使う価値があるかどうか検討せよ。
別バージョン
# 巨乳女子大で25人に声をかけたら3人が誘いにのった。
# 桃尻女子大で3人に声をかけたら誰も誘いにのらなかった。
# どちらが口説きやすいか検討せよ。
JAGSでMCMCして治癒率の確率密度関数を描くとこうなる。
URLリンク(i.imgur.com)
治癒率差の期待値は
> mean(dif)
[1] -0.05136971
54%が負
> c(mean(dif<0),mean(dif>0))
[1] 0.5395 0.4605
5%幅の違いは同等扱いにすると
> c(mean(dif<ROPE[1]),mean(ROPE[1]<dif & dif<ROPE[2]), mean(dif>ROPE[2]))
[1] 0.4834 0.1236 0.3930
と計算できる。
95%HDIは
> HDInterval::hdi(dif)
lower upper
-0.4247349 0.2535357
と0を挟む。
RのパッケージBESTを改造して、治癒率の差の確率密度分布をかくと
URLリンク(i.imgur.com)
ゆえに新薬は無効とはいえないだけでなく、従来薬を凌駕する可能性が54%ある。
173:132人目の素数さん
17/12/17 01:13:50.49 Cjx7+SdG.net
非ベイズ確率論では、もっぱ�
174:轣A事前確率だけを研究する。 それに対して、ベイズ確率論では事後確率を問題にする
175:132人目の素数さん
17/12/17 08:29:26.52 X2tL9rcK.net
>>164
18.2*(f+m)= 9.0*f +28.2*mで男女比は92:100と計算できる。女性の割合は100/192。
これでベイズの公式で計算すると喫煙者が女性である確率は0.25755
この100/192を最頻値として集中度10のβ分布に女男比が従うとする(かなり緩やか分布ではあるがここは主観的)
> alpha
[1] 5.208333
> beta
[1] 4.791667
になる。
URLリンク(i.imgur.com)
集中度はURLリンク(en.wikipedia.org)を参照。
このモデルでstanでMCMCすると
mean se_mean sd 2.5% 25% 50% 75% 97.5% n_eff Rhat
female 0.5209 0.0006 0.1510 0.2275 0.4133 0.5225 0.6298 0.8059 66688 1.0001
female_smoker 0.2576 0.0003 0.0747 0.1125 0.2044 0.2584 0.3115 0.3985 66688 1.0001
忘れて行った人物が女性である確率は平均25.8% (95%信頼区間は11.3%-39.9%)と計算できる。
URLリンク(i.imgur.com)
176:132人目の素数さん
17/12/17 09:12:27.87 mF5SDvIe.net
日本全体の男女比じゃあだめじゃん
個々の店を利用する人の男女比なんて
どっちっかに大きく傾くことも多いだろうに
177:132人目の素数さん
17/12/17 09:35:59.92 X2tL9rcK.net
くじが100本あるとする。当たりがでるまでくじを買うことする。
運がいいのか3本めで当たりだった。何本あたりがあったと推測されるか?
期待値、最頻度値、95%信頼区間を算出せよ。
別バージョン:1学年100人の揺股女子高に声をかけたら3人目が開脚したとする。
開脚希望の女子高生は何人いると推測されるか?
分布はこんなかんじになる。
URLリンク(i.imgur.com)
んで、答は
mode mean
33.33333 39.99820
lower upper
4.3811 77.2252
信頼区間が幅広いのはデータ数から仕方がないことではある。
178:132人目の素数さん
17/12/17 09:37:07.57 X2tL9rcK.net
>>172
弱情報分布ってそんなもんだよ。
女性の平均身長は1m以上2m未満の一様分布を事前分布とできる。
179:132人目の素数さん
17/12/17 09:37:43.70 X2tL9rcK.net
>>172
ダメとかいう話じゃないんだね。
事前分布をどうするかという議論。
180:132人目の素数さん
17/12/17 10:14:14.33 jycrYxmo.net
>>173
この緩股女子高生20人にメールを送って誘ったところ2人が開脚したとする。
このデータを使って前問の確率分布を事前分布として緩股女子高の開脚率の期待値、最頻値、95%信頼区間を算出せよ。
こういうのがベイズ推論ね。
181:132人目の素数さん
17/12/17 11:12:20.75 eg22I2Ho.net
>>164 >>171
事象A : 女性である
事象B : 喫煙者である
ここで、ベイズの定理で
P(A|B) = {P(B|A) / P(B)} * P(A) という数式
に、
P(B) = 0.182
P(B|A) = 0.090 を代入すると、
P(A|B) = 90 / 182 * P(A)
= 0.4945 * P(A) ─★
ここで★に、P(A) = 100/192 = 0.5208 を代入
P(A|B) = 0.2576 となる。
尤もな値が得られる、ウームまてよ
もし、P(A)が1に近い値なら、それを
★に代入すると、
P(A|B)は、0.4945になり、1にはならない。
そう、この手の確率計算、何か変なのです。
182:132人目の素数さん
17/12/17 11:54:58.90 X2tL9rcK.net
P(A)を固定で考えずに変数と考えるのがベイズ統計。
P(A)が一様分布に従うとしても大して値は変わらない。
mean se_mean sd 2.5% 25% 50% 75% 97.5% n_eff Rhat
female 0.4979 0.0011 0.2885 0.0247 0.2477 0.4977 0.7473 0.9756 70793 1
female_smoker 0.2462 0.0005 0.1427 0.0122 0.1225 0.2461 0.3695 0.4824 70793 1
平均0.246 信頼区間は
183:[2.5%-97.5%]と広くなる。
184:132人目の素数さん
17/12/17 11:59:13.05 X2tL9rcK.net
>>176
posterior ∝ likelihood * prior を使ってグラフ化すると
URLリンク(i.imgur.com)
緩股女子高の開脚率の
最頻値
> optimise(posterior,c(0,1),maximum=TRUE)$maximum # mode
[1] 0.1304338
期待値
> integrate(function(x) x*posterior(x),0,1)$value # mean
[1] 0.16
メディアン値
> cdf <- function(x) integrate(posterior, 0,x)$value
> uniroot(function(x)cdf(x)-0.5,c(0.01,0.99))$root # median
[1] 0.1508781
95%信頼区間
> pdf2hdi(posterior)
lower upper
0.034818 0.301498
185:132人目の素数さん
17/12/17 12:20:18.88 X2tL9rcK.net
>173の事前分布の情報がないと
>176だけの情報だと
期待値
> integrate(function(x) x*pdf(x),0,1)$value
[1] 0.1363636
最頻値
> optimize(pdf,c(0,1),maximum = TRUE)$maximum
[1] 0.1000202
信頼区間
> pdf2hdi(pdf)
lower upper
0.017594 0.276573
となる。
relocation of credibilityがベイズ推計の根幹
186:132人目の素数さん
17/12/17 12:43:48.22 X2tL9rcK.net
>>172
店によって客の年齢層が違うから年齢層別の喫煙率がないとだめとか、
同年齢でも職業や学歴によって喫煙率が違うからだめ
とかいくらでもいえる。
与えられたデータで計算しろというのが問題の趣旨。
187:132人目の素数さん
17/12/17 12:45:20.15 X2tL9rcK.net
>>181
それを組み込むモデルが階層ベイズ
188:132人目の素数さん
17/12/18 06:05:12.22 TKDTxK+v.net
>>178
種明かしすると
一様分布での期待値は男女比=1:1としたときと同じ。
信頼区間は2.5%-97.5%と幅95%ならどこでもいい。
189:132人目の素数さん
17/12/19 21:21:09.51 TqEjsDs9.net
学び始めたんだけどってあるけど
いい加減過ぎ
190:132人目の素数さん
17/12/23 21:08:29.50 Gv2AOAvC.net
>>149
そんなの前提じゃないww
それを前提にしてるのは頻度説だけだww
ばかかw
191:132人目の素数さん
17/12/23 21:11:04.92 JamHfM57.net
その通り
192:132人目の素数さん
17/12/23 21:38:22.49 Gv2AOAvC.net
確立において共通的仮定は
μ(φ)=0
∀X∈2^A、μ(X)≧0
∀X,Y∈2^A、X∩Y=φ⇒μ(X∪ Y)=μ(X)+μ(Y)
の測度論的定義と
P(Ω)=1
0≦P≦1
上の3つめと同じ
の確立の公理主義的定義しかないわ
193:132人目の素数さん
17/12/23 21:45:21.81 R5cvga9/.net
とはいえ、その公理的確率論の主眼が極限法則の研究である以上、頻度主義を単なる一解釈、one of them と見なすこともまた不適切
194:132人目の素数さん
17/12/23 22:14:29.53 JamHfM57.net
ベイズ統計学では、事象の確率という考え方を採用し、
必ずしも頻度には基づかない確率を「確率」として見なす
またベイズの定理を用い、
事前確率及び尤度を仮定した下で事後確率を与える、
という相対的なメカニズムを主張している
したがって事後確率の計算結果の信憑性や有用性は、
事前分布と尤度の設定にかかっており、慎重を期すことが必要である
これはベイズ統計学が、不確実性を含む問題を人によって異なる
確率を用いて定式化することを許容する主観確率 (subjective probability)
という立場をとっていることによる
この立場はまだ解析対象となっていない新たな問題への
アプローチを可能にするという利点がある一方で、
確率の決め方について客観性に欠けるという批判もある(客観確率)
195:132人目の素数さん
17/12/23 22:58:03.28 Gv2AOAvC.net
>>188
であるならば頻度論的考えが前提というなら
それが公理に
196:組み込まれなければ前提ではないんだが そんな公理どこにあるの? 示してみ >>149は前提といってるんだから 公理レベルで明文化されてないとおかしい
197:132人目の素数さん
17/12/23 23:43:11.04 R5cvga9/.net
そう攻撃的になるなよ
俺は補足説明しただけであって、君の主張を否定したいわけではないんだから
198:132人目の素数さん
17/12/23 23:57:05.90 R5cvga9/.net
よく読んでみると、前提を公理と同義だと勝手に決めつけたのは>>185だね
公理化する前の段階、何を公理化して何を研究対象とするかという目的
>>149はこれを前提と言っているわけだから、君の怒りは最初から的外れだ
199:132人目の素数さん
17/12/24 00:47:21.62 0cx6DHwL.net
ある大学の入学者男女の比率は1であるという帰無仮説を検定する課題が花子と太郎に課された。
花子は50人を調査できたら終了として入学者を50人をみつけて18人が女子であるという結果を得た。
帰無仮説のもとで
50人中18人が女子である確率は 0.01603475
これ以下になるのは50人中0~18人と32~50人が裏口の場合なので
両側検定して
> sum(dbinom(c(0:18,32:50),50,0.5))
[1] 0.06490865
> binom.test(18,50,0.5)$p.value
[1] 0.06490865
で帰無仮説は棄却できないと結論した。
一方、本 番と十八番が好きな太郎は一人ずつ調べて18人めの女子がみつかったところで調査を終えることにした。
18人めがみつかったのは花子と同じく50人めであった。
帰無仮説のもとで
18人がみつかるのが50人めである確率は0.005772512
これ以下になるのは23人以下50人以上番めで女子18人めがみつかった場合なので
両側検定して
pnb=dnbinom(0:999,18,0.5)
> 1 - sum(pnb[-which(pnb<=dnbinom(50-18,18,0.5))]) # < 0.05
[1] 0.02750309
で帰無仮説は棄却される。
どちらの検定が正しいか、どちらも正しくないか?
検定する意図によってp値が変わるのは頻度主義統計の欠陥といえるか?
200:132人目の素数さん
17/12/24 00:47:53.93 0cx6DHwL.net
サンプルでの裏口入学率を横軸にして95%信頼区間を示す。
花子の検定での信頼区間は0.36~0.72で18/50を含む、p=0.06491
URLリンク(i.imgur.com)
太郎の検定での信頼区間は0.375~0.72で18/50を含まない、p= 0.0275
URLリンク(i.imgur.com)
主観である、検定の中止の基準の差でp値や信頼区間が変化するのは変だという批判である。
201:132人目の素数さん
17/12/24 00:52:00.99 0cx6DHwL.net
コインが続けて何回裏が出たらイカサマとみなす?
0.5^5 = 0.03125 < 0.05
なので5回?
202:132人目の素数さん
17/12/24 01:00:24.15 CT/NKMd7.net
ベイズ統計でいう確率は信憑性の指標。
天気予報の降水確率もこれに近い気がするな。
203:132人目の素数さん
17/12/24 01:35:25.50 CT/NKMd7.net
シミュレーションしてみると、
コインを100回投げると続けて5回以上、裏がでる確率は80%以上なので5回裏が続けてでてもイカサマでもないような気がする。
7回以上続けて裏でも3割を越える。
連続10回だと0.05未満になった。
204:132人目の素数さん
17/12/24 02:39:47.06 lv/b26ht.net
>162は事前確率分布を抜きの頻度主義統計では対応できないと思う。
205:132人目の素数さん
17/12/24 02:40:57.58 lv/b26ht.net
>>196
生存率とかもそうだな。
206:132人目の素数さん
17/12/24 12:23:14.68 CT/NKMd7.net
>>195
イカサマコインの定義を 裏がでる確率が1/3以下または2/3以上のときとすると。
(2/3)^5 = 0.1316872 > 0.05なので イカサマコインであるとは言えない。
としか、頻度主義統計では結論できないのではなかろうか?
207:132人目の素数さん
17/12/24 18:14:26.11 w9KqWG5P.net
>>195
ベイズの確率なら、
イカサマコインの確率が算出できるのぢゃ
事前確率
表がでる確率が1/2のコイン 0.5
表がでる確率が2/3のコイン 0.5
と適当かつ勝手にワシの主観でおく。
(1/2)^5 = 1/32 = 0.03125 で
(2/3)^5 = 32/243 = 0.1317 ぢゃから
事後確率
0.1317 / (0.1317+0.03125) = 0.8082
つまり、5連続表がでたら、
イカサマコインの確率は、
0.5→0.8082に改訂ぢゃ
208:132人目の素数さん
17/12/25 06:23:08.44 XjVyvstm.net
>>201
事前確率を一様分布にすると事後分布からの平均確率は6/7=0.8571429
URLリンク(i.imgur.com)
209:132人目の素数さん
17/12/25 06:37:38.74 XjVyvstm.net
>>202
事後分布で1/3以下,2/3以上である確率は
> pbeta(1/3,1+5,1) + pbeta(2/3,1+5,1,lower=FALSE)
[1] 0.9135802
でイカサマコインといえる。
210:132人目の素数さん
17/12/25 07:28:57.92 XjVyvstm.net
0.5lをモード値として1/3~2/3の間に95%が存在する5%のイカサマは許容するをβ分布Beta( 16.55299, 16.55299)を事前分布とすると
5回続けて表がでたときの事後分布は
URLリンク(i.imgur.com)
イカサマ確率は0.1031となる。
211:132人目の素数さん
17/12/25 07:32:36.66 XjVyvstm.net
>>204
0.5lをモード値
↓
0.5をモード値
212:132人目の素数さん
17/12/25 08:14:46.83 XjVyvstm.net
>>201
# 事前確率
# 表がでる確率が1/3のコイン 1/3
# 表がでる確率が1/2のコイン 1/3
# 表がでる確率が2/3のコイン 1/3
# と適当かつ勝手に変更
require(rjags)
N=5
z=5
y=c(rep(1,z),rep(0,N-z))
ph=c(1/3,1/2,2/3)
pc=c(1/3,1/3,1/3)
dataList5=list(N=N,y=y,ph=ph,pc=pc)
# JAGS model
modelString5 ="
model {
for(i in 1:N){
y[i] ~ dbern(ph[coin])
}
coin ~ dcat(pc[])
}
"
writeLines(modelString5,'TEMPmodel.txt')
jagsModel5=jags.model('TEMPmodel.txt',data=dataList5)
codaSamples5=coda.samples(jagsModel5,var=c('coin'),n.iter=100000,na.rm=TRUE)
summary(codaSamples5)
js5=as.matrix(codaSamples5)
mean(js5!=2)
5回続けて表がでたとき、
イカサマコインであった確率は
> mean(js5!=2)
[1] 0.81361
213:132人目の素数さん
17/12/25 11:38:23.64 +0PPmMfC.net
頻度主義統計の謎。
立方体からなるサイコロの目のでる確率はすべて等しく1/6である、を帰無仮説とする。
そのサイコロをふって1の目がでた。2回目は2の目がでた。
その確率は1/6*1/6で1/36=0.02778 < 0.05だから帰無仮説は棄却される。
どの目の組合せでも同じく帰無仮説は棄却される。
頻度主義統計のもとではすべてのサイコロはいびつである。
214:132人目の素数さん
17/12/25 12:39:07.20 +e1uiFf8.net
>>207
検定についてもう一度勉強した方がいい
215:132人目の素数さん
17/12/25 12:49:30.52 +0PPmMfC.net
>>208
p値で考えると>207は正しい。
216:132人目の素数さん
17/12/25 12:51:59.61 48ocxvwa.net
全然デタラメ
217:132人目の素数さん
17/12/25 13:06:33.35 +0PPmMfC.net
>>210
デタラメというのがデタラメじゃねえの?
数値で反論できてないし。
218:132人目の素数さん
17/12/25 13:16:30.22 +0PPmMfC.net
帰無仮説を点推定とすると>195の理論が成立する。
現実は>204だと思っている。
数値をだしての反論希望。
219:132人目の素数さん
17/12/25 13:25:55.54 48ocxvwa.net
>>212
だからその数値が無意味ですってw
220:132人目の素数さん
17/12/25 13:26:28.67 +0PPmMfC.net
頻度主義統計の謎
1000本に1本当りがでる宝くじに当たった人がいる
p=0.001<0.05だから偶然とは言えないから不正があった筈。
221:132人目の素数さん
17/12/25 13:27:32.80 +0PPmMfC.net
>>213
反論になってないんだよ。
数値だして反論できないんだろ?
222:132人目の素数さん
17/12/25 13:30:06.79 48ocxvwa.net
>>215
君あおりもヘタね
223:132人目の素数さん
17/12/25 13:33:42.68 +0PPmMfC.net
>>216
馬鹿なので反論できないwwwww
224:132人目の素数さん
17/12/25 13:35:33.47 +0PPmMfC.net
帰無仮説を分布に設定すればいいのに
頻度主義者にはそれができない、という批判なんだよ。
225:132人目の素数さん
17/12/25 13:37:16.46 +0PPmMfC.net
ゴルゴ13は100発100中
ゴルゴ14は10発10中
ゴルゴ15は1発1中
とする。
各々10000発撃ったとき各ゴルゴの命中数の期待値はいくらか?
ベイズでは事前確率分布を一様分布として計算できるが、
頻度主義統計では全く無力と気づいてベイズ統計を学び出したよ。
226:132人目の素数さん
17/12/25 13:54:39.97 +0PPmMfC.net
>>216
数値だして反論しないとバカと認定されちゃうよ。
>204書いたのは俺。
227:132人目の素数さん
17/12/25 16:14:18.07 hNYjHsl9.net
>>216
君、ごまかすのも下手ねw
228:132人目の素数さん
17/12/25 17:17:16.68 Yuo09ydY.net
■モンティホール問題(空箱とダイヤ)
このゲームができるのは1回だけです
ダイヤモンド1個を外からは中が見えない空箱100個の
中のどれかひとつに入れます
その中から1個の箱を選びます
98個の空箱を取り除きます
最後に残った2個の箱の中から1個の箱を選びます
ダイヤモンドが当たる確率は何%でしょうか?
229:132人目の素数さん
17/12/25 17:51:07.79 CUAFfOhi.net
>>220
数値以前の問題だけどな
230:132人目の素数さん
17/12/25 18:34:08.36 hNYjHsl9.net
>>223
敗北宣言??
231:132人目の素数さん
17/12/25 19:24:36.60 ZnFzwkFb.net
>>224
自分が間違ってるとは考えないの?
232:132人目の素数さん
17/12/25 19:30:16.93 P3YrdrZj.net
>>223,225
相手して欲しいだけの困ったちゃんだから触らないことよ
233:132人目の素数さん
17/12/25 20:08:44.89 hNYjHsl9.net
>>225
数学板なのに反論になってないんだね。
234:132人目の素数さん
17/12/25 20:18:40.97 ZnFzwkFb.net
>>227
あなたが間違った知識を持っていてもどうでもいいことだけど
私は優しいから貴方の知識が間違っていると言うことを教えておく
無知を知ることが出来て良かったね
235:132人目の素数さん
17/12/25 20:23:16.15 Yuo09ydY.net
>>222
前提として
・100個中1個ダイヤ入りの箱がある(自分で入れる訳ではない=第三者が入れる)
・自分が最初に選ぶ箱は便宜上「A」と名付ける
・98個の空箱を取り除く作業は答えを知っている第三者が「A」以外の99個から選んで行い、
最後に残された箱は便宜上「B」と名付ける
とすれば
「A」の中にダイヤがある確率は1/100、「B」の中にダイヤがある確率は99/100
2択とはいえ、五分五分の2択ではないことに気づけるかどうか
236:132人目の素数さん
17/12/25 20:50:34.25 54zGNhdP.net
>>229
ゲームが1回だけの時、
最初にプレイヤーがあたりを引く確率は1/100
はずれを引く確率も1/100になります
ゲームから98個の箱が除外された後に
残った2個の箱の内、選択変更後のあたりの確率が99%だと
証明する方法はゲームが1回に限定されている以上
存在しないのです
237:132人目の素数さん
17/12/25 20:57:46.62 54zGNhdP.net
「A」の中にダイヤがある確率は1/100、「B」の中にダイヤがある確率も1/100です
五分五分の2択ですのでダイヤを当てる確率は50%です
238:132人目の素数さん
17/12/25 23:42:43.79 hNYjHsl9.net
>>228
へへ、結局、反論できないだけだね。
カッコ悪い~。
239:132人目の素数さん
17/12/25 23:51:56.81 ZnFzwkFb.net
>>232
間違いを指摘してやる義理はないからね
240:132人目の素数さん
17/12/25 23:55:09.97 LkqxjkNl.net
無力だと言われて反発してるだけ
まともな反論など期待できようはずがない
241:132人目の素数さん
17/12/26 00:39:07.10 5+kOkN0j.net
>>233
ホントそれ
かまってちゃんにかまってやることはない
242:132人目の素数さん
17/12/26 00:40:19.96 xrB10Qkz.net
>>229
■ゲームを1回に限定すると
1.最初プレーヤーがあたりを引く確率は1/2である
2.箱を変更しない場合はそのまま1/2の確率である
(変更しないのであれば空箱が取り除かれようが残ろうが確率は変わらない)
3.98個の空箱を取り除いた後に箱を変更する場合、
最初に選択した箱がハズレであれば変更後の箱はあたりが確定である
つまり、最初に選択した箱がはずれである確率=箱を変更した場合に
あたりを引く確率である
4.最初の選択であたりを引く確率は1/2、はずれを引く確率も1/2である
5.
243:ゆえに、どちらの箱を選択してもあたりを引く確率は1/2である
244:132人目の素数さん
17/12/26 01:00:16.29 xrB10Qkz.net
ゲームは1回に限定されているので
事前確率と事後確率は一致します
245:132人目の素数さん
17/12/26 05:24:17.34 dE8Q4xnQ.net
>>233
間違ってないから指摘できないだけだろ。
カッコ悪い~。
コインが5回続けて表がでたら0.5^5 <0.05なのでイカサマコイン
とするなら
1/6^<0.05ならいびつなサイコロ。
点推定を帰無仮設にせず>204のように分布を事前確率にする方がいい。
246:132人目の素数さん
17/12/26 06:39:56.34 NxNUMS6b.net
あまりにも当たり前すぎることを見落としている。
単に試行回数が少ないだけ。
二項分布を正規分布で近似するための条件は経験則として
・npとnqの小さい方が10(場合によっては5)より大きい。
・0.1≦p≦0.9 で、かつ 5<npq
・25<npq
等が知られている。コイン(p=1/2)なら20~100回、サイコロ(p=1/6)なら30~180回
といずれでも数十回試行することが必要。
逆に言うと、これらから大きく離れた回数で、何らかの結論を出すような理論は危険。信憑性が足りない。
参考 URLリンク(www.naro.affrc.go.jp)
247:132人目の素数さん
17/12/26 07:13:31.29 eJd16J/8.net
>何らかの結論を出すような理論は危険
t分布すら知らんのか!
248:132人目の素数さん
17/12/26 08:16:20.70 5+kOkN0j.net
>>239
二項分布も知らないレス古事記は放置が一番よ
249:132人目の素数さん
17/12/26 09:13:34.13 NxNUMS6b.net
>>240
整理しよう。
あるサイコロ、あるいは、コインがあり、その1の目が出る確率、あるいは、表が出る確率が
1/6、1/2としてよいかを検定しようとしている。
その検定に必要な試行回数は239で示したような回数が必要であり、>>207で行ったような
たった2回の試行では足りない、というのが239の内容だ。
そこに、t分布がどのように現れるのか?
t分布は、体重、身長、点数、...等という、正規分布の確率変数に出来るデータを直接
いくつか得て、それを元に、想定していた分布と差があるかどうかを検証する。
その「いくつか」の個数がデータの数だとか、自由度の直結するものだ。
しかし、239で与えた試行回数というものは、全く異なる。
正規分布の確率変数に直結する一つのデータを得るために必要な試行回数だ。
239の回数だけ、試行を行い、はじめて、t分布で言うところの、「1つのデータ」を得ることが出来る。
あなたは、次元の異なる内容を比較して反論したつもりでいるだけ。
250:132人目の素数さん
17/12/26 12:12:04.68 K9ImdNUu.net
>>239
試行数が少なくても計算できるのがベイズ統計。
サイコロのある目のでる確率が1/8以下か1/4以上であるときを歪(いびつ)なサイコロと定義する。
事前分布としてどの目のでる確率も1/6で、ディリクレ分布(集中度母数=1)に従うとして
1の目が2回続いたときの1の目のでる事後確率分布をJAGSで計算してグラフ化すると次のようになる。
95%信頼区間に歪でない場合の確率1/8~1/4が含まれるので歪とは判断されない。
URLリンク(i.imgur.com)
1の目が5回続いたときの事後確率分布は
URLリンク(i.imgur.com)
これは95%信頼区間の下限が1/4を超えているから歪であると判断される。
251:132人目の素数さん
17/12/26 12:16:52.98 K9ImdNUu.net
>>239
正規分布で近似する必要はどこにもない。
252:132人目の素数さん
17/12/26 12:21:29.57 K9ImdNUu.net
>>239
あんたには>219の問題は解けないだろ?
信頼区間は広くなるが、結論は出せる。
253:132人目の素数さん
17/12/26 13:02:42.03 bh2BICch.net
>>245
信仰心を持てば解けるのです!!
254:132人目の素数さん
17/12/26 13:10:49.28 K9ImdNUu.net
>>239
URLリンク(www.youtube.com)
255:KU の12:41から ベイズ推計で1打数1安打と2打数0安打の打率が推定されている。 他の選手のデーターから事前分布を設定しての算出。 データが少ないと信頼区間が広くなるだけで算出はできる。
256:132人目の素数さん
17/12/26 14:45:43.43 K9ImdNUu.net
>>246
事前分布を信仰すれば解ける
257:132人目の素数さん
17/12/26 15:55:16.98 K9ImdNUu.net
>そのサイコロをふって1の目がでた。2回目は2の目がでた。
これを題材にしてベイズ推計する。
事前分布としてどの目のでる確率も1/6で、ディリクレ分布(集中度母数=1)に従うとして
事後確率のおのおのの目の分布を図示すると。
URLリンク(i.imgur.com)
という風になる。
95%HDI(Highest Intensity Interval)がどの目でも
1/8~1/4を含むから、
どの目に関しても歪とは結論されない。
別の試行で計算してみる。
18回サイコロを投げて1の目が10回、2の目が8回でたときの
事後分布は
URLリンク(i.imgur.com)
2の目以外は非歪コイン域(Range of Practical Equivalence: ROPE)と
95%HDIが重ならないので、2以外の目は歪と結論できる。
標本数が少ないとHDIが広くなるだけ。
正規分布近似など全く必要なし。
258:132人目の素数さん
17/12/26 16:14:54.26 K9ImdNUu.net
以上の議論で、
少数例でも結論はだせる。
とうぜん信用区間は広くなる、信憑性が低くなっていることは区間幅で数値化されているのだから問題なし。
どこにもp値との比較はでてこない。強いて言うなら95%HDIの5%が危険率に匹敵するくらい。
259:132人目の素数さん
17/12/26 20:08:52.62 NxNUMS6b.net
ほぼ一直線の分布曲線が、ベイズ更新により、なだらかなピークを持つ曲線に変化したのを見て、
「ほら、この辺に平均値があるはず」等と、喜んでいるだけ。
頻度主義はいわば、鋭いピークを持つ分布曲線になるまで、じっと結論を待つことにアナロジーできる。
>>少数例でも結論はだせる。
>>とうぜん信用区間は広くなる、信憑性が低くなっていることは区間幅で数値化されているのだから問題なし。
「サンプル数が少ないと、信憑性が低くなる」
ということを
「サンプル数が少ないと、信憑性が低くなるが、それを数値化しているから問題ない」
と強弁しているだけだね。
つまり、「少数例でも結論はだせる」ではなく、「だせたつもりでいる」だけ。
一定の信用度を持つまで結論を先送りするか、信用度を犠牲にして結論をだすかの違い。
260:132人目の素数さん
17/12/26 21:38:58.06 dE8Q4xnQ.net
>>251
事前分布をもとに結論が出せてるじゃん。
コインの例なら一様分布を選ぶか一か八かのbeta(0.5,0.5)にするから弱情報分布のbeta(2,2)を選ぶかが、主観的と呼ばれるだけ。
ベイズの確率はcredibility信憑性なのだから、何の問題もない。
正規分布近似の必要は全くないので近似できる標本数が必要という議論は誤りだね。
261:132人目の素数さん
17/12/26 21:42:17.50 dE8Q4xnQ.net
>>251
事前分布をもとに結論が出せてるじゃん。
コインの例なら一様分布を選ぶか、一か八かのbeta(0.5,0.5)にするか、弱情報分布のbeta(2,2)を選ぶかが、主観的と呼ばれるだけ。
ベイズの確率はcredibility信憑性なのだから、何の問題もない。
正規分布近似の必要は全くないので近似できる標本数が必要という議論は誤りだね。
262:132人目の素数さん
17/12/26 21:51:31.77 dE8Q4xnQ.net
>>251
じゃあ、>219の各ゴルゴの期待値とその信頼区間を
頻度主義統計で答えてみ!
100発100中ならサンプル数として十分だろ。
ゴルゴ13とゴルゴ14の命中率はどちら上か検定してみ!
サンプル数不足なら1000発1000中のゴルゴ12とのゴルゴ13との比較でもいいぞ。
頻度主義統計でp値出してみ。
263:132人目の素数さん
17/12/26 21:57:12.23 dE8Q4xnQ.net
>>251
直線の一様分布にも平均値あるんだが、頭が腐ってない?
264:132人目の素数さん
17/12/26 22:55:59.71 xrB10Qkz.net
ゴルゴ13
ゴルゴ14
ゴルゴ15は
全員同じ能力で各々10000発撃ったときの命中率は10000発10000中のみ
265:132人目の素数さん
17/12/27 00:14:11.16 mWIG5IHC.net
命中率がp未満とする。
n発撃って、全発命中する確率はp^n未満となるが、これがたまたま発生したと考えると、
p^n<0.05 や p^n < 0.01 という式が立てられる。
これが、ゴルゴにより達成されたと考え、この結果の否定が採用される。
例えば、n=1000 で 危険率0.05を採用すると、 p<0.997009 からp≧0.997009
例えば、n=1000 で 危険率0.01を採用すると、 p<0.995405 からp≧0.995405
例えば、n=100 で 危険率0.05を採用すると、 p<0.970487 からp≧0.970487
例えば、n=100 で 危険率0.01を採用すると、 p<0.954993 からp≧0.954993
例えば、n=10 で 危険率0.05を採用すると、 p<0.741134 からp≧0.741134
例えば、n=10 で 危険率0.01を採用すると、 p<0.630957 からp≧0.630957
例えば、n=1 で 危険率0.05を採用すると、 p<0.05 からp≧0.05
例えば、n=1
266: で 危険率0.01を採用すると、 p<0.01 からp≧0.01 あくまで、命中率の下限を評価しただけなので、実際の命中率は、1とそれぞれの間のどこかにある。 危険率5%で、 1000発1000中 → 10000中 9970発~10000発 平均 9985 100 発100 中 → 10000中 9705発~10000発 平均 9852 10 発10 中 → 10000中 7411発~10000発 平均 8705 1 発1 中 → 10000中 500発~10000発 平均 5250
267:132人目の素数さん
17/12/27 06:31:31.84 D9mPzlGu.net
>>257
対称でない確率分布から期待値だすのに片側検定での境界値と
上限値を足して2で割るかよ?
期待値は原点周りの一次モーメントだぞ。
ベイズでの期待値を教えてあげよう。
命中率の事前分布を一様分布にするとn発n中のゴルゴの命中期待値は(n+1)/(n+2)になる。
268:132人目の素数さん
17/12/27 07:15:29.14 D9mPzlGu.net
>>258
そして 事後確率の95%信頼区間は 0.05の(n+1)乗根から1になる。
269:132人目の素数さん
17/12/27 07:18:48.33 ipSdYKfI.net
>>258
>命中率の事前分布を一様分布にすると
正規分布なら?
270:132人目の素数さん
17/12/27 07:43:22.18 D9mPzlGu.net
>>257
もとのデータが変わらないのに危険率を変えるとオマエのいう平均値が変わるのは変だと思わんのかよ?
まさに主観的wwww
オマエの「平均値」計算式でn=100のときの「平均値」がどう変動するかグラフにしてやったぞ。
URLリンク(i.imgur.com)
271:132人目の素数さん
17/12/27 07:46:39.94 D9mPzlGu.net
>>260
正規分布は-∞から+∞までとるから、正規分布の仮定は最初から間違いだよ。
定義域が0~1のβ分布を使うほうがよい。
一様分布もβ分布の特殊型なのはベイズ統計の常識。
272:132人目の素数さん
17/12/27 07:51:42.33 D9mPzlGu.net
>>260
正規分布を事前分布にするとして
平均と分散はどう主観的に設定すんのよ?
スナイパーなのだから、命中率の平気値は5割以上だろとか、いやプロなんだらゴルゴ13は9割以上でゴルゴ15はまぐれだから5割未満じゃないの?
おのおのの分散はどう設定する?
こういう議論をしなくていいのが、一様分布ではある。
まあ、生まれる男の生まれる確率が一様分布というのは事前分布としては俺も不適切だと思う。
273:132人目の素数さん
17/12/27 08:05:14.37 mQ1e/AFE.net
>>256
fisher.testやカイ二乗検定だとそういう結論になるだろね。
274:132人目の素数さん
17/12/27 08:23:03.86 mQ1e/AFE.net
有意水準(危険率)を変えれば推定区間幅が変わるのは頻度主義でもベイズでも同様。
だが、危険率を変えたら推定平均値(期待値)も変わるという
>527の議論は頻度主義でも落第。
275:132人目の素数さん
17/12/27 15:03:00.79 D9mPzlGu.net
>>265
>257のアンカーミス。
データの変化はないのに。
平均値(期待値)の算出が検者の主観(危険率)で決まるはずはないね。
276:132人目の素数さん
17/12/27 16:16:26.53 D9mPzlGu.net
>>257
対称でない確率分布から期待値だすのに片側検定での境界値と
上限値を足して2で割るかよ?
反論を待っているぞ。
277:132人目の素数さん
17/12/27 16:19:59.78 D9mPzlGu.net
>>260
>正規分布なら?
の要望に応じてstanでやってみた。
n=100のケース
一様分布の平均と同じく事前正規分布の平均は0.5とする。
標準偏差はGelman *1)に準じてHalf-Cauchyでやってみる。
*1)URLリンク(projecteuclid.org)
(逆ガンマ分布は母数の影響を受けすぎなので弱情報分布に向かないという趣旨の論文)
平均0.5 標準偏差は半コーシー分布
mean se_mean sd 2.5% 25% 50% 75% 97.5% n_eff Rhat
p 0.9899 0.0002 0.0100 0.9628 0.9860 0.9929 0.9972 0.9997 2394 1.0005
sigma 3.3759 0.3620 12.2452 0.2954 0.7799 1.5483 3.3236 14.7428 1144 1.0016
平均0.5 標準偏差は[0,10]の一様分布(確率変数の標準偏差として明らかに過剰)
mean se_mean sd 2.5% 25% 50% 75% 97.5% n_eff Rhat
p 0.9901 0.0001 0.0096 0.9642 0.9861 0.9930 0.9971 0.9997 6746 1.0005
sigma 3.0639 0.0467 2.6177 0.3145 0.9298 2.1411 4.6519 9.2510 3146 1.0009
WinBUGSで推奨の逆ガンマ分布を標準偏差の事前分布にしてみると
mean se_mean sd 2.5% 25% 50% 75% 97.5% n_eff Rhat
p 0.9901 0.0002 0.0098 0.9640 0.9864 0.9931 0.9971 0.9998 1780 1.0008
sigma 3.7042 0.8736 28.9458 0.2199 0.4260 0.7150 1.5033 17.5846 1098 1.0013
最初から一様分布にしたときと大差なし。
mean se_mean sd 2.5% 25% 50% 75% 97.5% n_eff Rhat
p 0.9902 0.0001 0.0097 0.9648 0.9863 0.9933 0.9972 0.9997 7377 1.0002
278:132人目の素数さん
17/12/27 17:18:30.60 D9mPzlGu.net
ベイズ統計でゴルゴ13(百発百中)とゴルゴ14(十発十中)の命中率の差の分布も計算できる。
URLリンク(i.imgur.com)
平均、最頻値、中央値は以下の通り
mean median mode
0.07288324 0.05019718 0.01531325
95%信用区間の中心が平均値になるのではないのは明らか。
279:132人目の素数さん
17/12/27 20:44:43.55 ywHK8j63.net
大数の法則は裏を返せば
「サンプルサイズが小さい方が、より極端な値をとる確率が高い」
ということでもある
この性質によって差が出ただけのものに対しても、
人はそれが偶然によるものではなく、何か意味があると錯覚してしまいやすい
280:132人目の素数さん
17/12/27 21:19:43.00 ECwIz9Lh.net
信仰心をふりかざすキティ害のスレ
数学板なのに
281:132人目の素数さん
17/12/27 21:59:36.93 mWIG5IHC.net
議論をする相手には、いくつか条件が必要です。そうでなければ、まともな議論になりません。
詳しく述べることは控えますが、私はあなたとは議論しません。
これを最後に去りますが、一点補足します。
>>257の方法において、危険度を少しゆるめの値、0.1353(=1/e^2)を採用すると、
ベイズの結論に漸近的に一致する結果を得ます。(n→∞で一致します。)
あなたが棄て、いちゃもんをつけている方法から、あなたが信仰するのと同じ結論が出てきます。
ではさよなら。
282:132人目の素数さん
17/12/27 22:06:27.29 ywHK8j63.net
「偶数が表に書かれたカードの裏は赤色である」という
仮説を検証するにはどのカードをひっくり返すべきか?
URLリンク(ds055uzetaobb.cloudfront.net)
赤色のカードをひっくり返したくなるのが『確証バイアス』
283:132人目の素数さん
17/12/28 02:23:56.05 YCLsYRJb.net
捨て台詞を残して敗走宣言、カッコ悪いね。
危険率つきでの平均値の次は勝手にnを増やすかよ。
>257の平均値の計算式はこれだろ
> a=0.05
> n=c(1,10,100,1000)
> 5000*(a^(1/n)+1)
[1] 5250.000 8705.672 9852.435 9985.044
284:
285:132人目の素数さん
17/12/28 02:45:01.21 YCLsYRJb.net
撃つ前の命中率の事前分布を一様分布として
事後確率はベータ分布B(n+1,1)の期待値だから
期待値は(n+1)/(n+2)
10000発打ったときは
> n=c(1,10,100,1000)
> 10000*(n+1)/(n+2)
[1] 6666.667 9166.667 9901.961 9990.020
n→∞にする意味はない。
n発n中のときの期待値を計算しろという問題なのだから。
286:132人目の素数さん
17/12/28 03:06:11.65 YCLsYRJb.net
ベイズでG13(百発百中)とG14(十発十中)の命中率の差の分布も計算できる。
URLリンク(i.imgur.com)
命中率の差の平均が7.3%
95%信用区間は-2.4%~24%と0を跨ぐので命中率に有意差はないと表現できる。
G14の方が命中率が高い可能性も9.4%あることも計算できる。
少数例から決断を迫られるときの指標にはなる。
287:132人目の素数さん
17/12/28 03:16:06.97 YCLsYRJb.net
>>271
数学では信仰は公理と呼ばれる。
論理学でこれを公理とする宗派もある。
(A1) φ→(ψ→φ)
(A2) (φ→(ψ→χ))→((φ→ψ)→(φ→χ))
(A3) (¬φ→¬ψ)→(ψ→φ)
288:132人目の素数さん
17/12/28 05:02:28.77 oPGh8GH6.net
>>277
>数学では信仰は公理と呼ばれる。
ベイズ統計では公理というよりはむしろやはり信仰と呼ぶ方がしっくり来るな
289:132人目の素数さん
17/12/28 05:14:18.71 YCLsYRJb.net
>>278
ベイズでの確率は信憑性を表す数値、自身の確信度や他人への説得力の指標。
事前分布は信仰。
無情報分布や弱情報分布の方が信者が集めやすい。
290:132人目の素数さん
17/12/28 09:15:30.25 HCqabl1Q.net
ベイズの統計は、モピロン数学ぢゃ。
事前分布は公理ぢゃない。かつ
事前分布は信仰なんかぢゃない。つまり、
事前分布は大概、主観なのぢゃ。
まぁっ、精密には、動物的直感なのぢゃ。
ベイズぢゃない統計こそ、迷信なのぢゃ。
291:132人目の素数さん
17/12/28 13:44:38.04 4F0poT1V.net
落ちこぼれは馬鹿を認めたくなく信仰と言いたがる
292:132人目の素数さん
17/12/28 14:43:21.82 peGp7Azr.net
>247
少数例でベイズで遊んでみた。
打者A:1打数1安打、打者B:2打数0安打とするとき打者Aの方が打率が高いといえるか?
打者の打率は一様分布に従うとする(平均5割なので現実離れである)。
打率の差を描くと
URLリンク(i.imgur.com)
95%HDIが0を跨ぐので有意差があるとは判断できない。
URLリンク(www.youtube.com)
1打数1安打と2打数0安打の記録は投手が打者になったときの記録のようなので
Beta(0.1,0.5)を事前分布に設定して(打率.167相当)、打率の差の事後分布を描くと
URLリンク(i.imgur.com)
95%HDI下限が0を越えているのでAの方が打率が高いと結論できる。
事前分布という信仰によって判断が変わる。
293:132人目の素数さん
17/12/28 19:26:45.19 YCLsYRJb.net
打率の期待値(平均)を1/6,標準偏差を0.05となるβ分布、Beta(9.09 45.46)でやってみる。
URLリンク(i.imgur.com)
となって有意差なし。こういう遊びができるのもベイズの魅力だね。
294:132人目の素数さん
17/12/28 19:29:15.37 YCLsYRJb.net
ベイズの事前分布は信仰、頻度主義のp<0.05も信仰。
ベイズの方が提供してくれる情報が多い、というのが俺の感想。
異論は認める。
295:132人目の素数さん
17/12/28 19:34:36.49 AiHQE3QT.net
事前分布を決めてしまえば
まだ一発も撃ったことのない0発0中のゴルゴ16の命中期待値
のような、データ数が少ないどころか0個の場合でも算出・結論できる
296:132人目の素数さん
17/12/28 20:29:50.46 HCqabl1Q.net
「まだ弾を撃ってない」は、
「2発撃って1発、命中」みたいなものか。
297:132人目の素数さん
17/12/28 20:49:30.00 pp9Bni0X.net
■大数の法則が成立しないケース
大数の法則は期待値の存在を前提としている
そのため、期待値の存在しない場合に大数の法則を適用する
ことは適切ではない
つまり、「サイコロを1回投げて1の目の出る確率」は、
観測不可能なのである
298:132人目の素数さん
17/12/29 06:05:40.91 PE87aOTr.net
一様分布は
principleof insufficient reason(理由不十分の原則)
に準拠。
299:132人目の素数さん
17/12/29 15:07:00.03 PE87aOTr.net
もとの問題(>207)をベイズの手法で検討する。
サイコロを振って1の目が何回続いたら99%の確率でイカサマといえるかを考えてみる。
どの目のでる確率も1/9~1/3であるなら許容範囲としてイカサマとは見做さない、とする。
各々の目のででる確率は集中度母数=1のディリクレ分布に従うとして
グラフ化(stanでサンプリング)すると
URLリンク(i.imgur.com)
9回続くと1の目がでる確率の99%Highest Density Intervalが許容範囲と重ならないので9回と計算できた。
300:132人目の素数さん
17/12/29 16:46:40.76 JQohD8FP.net
>>289
1の目が最初から9回でた場合と
全部の目が1000回でた後1の目が9回でた場合と
同じ結果?
301:132人目の素数さん
17/12/29 18:03:29.80 PE87aOTr.net
>>290
最初から1の目が続いたときのシミュレーション。
302:132人目の素数さん
17/12/29 18:16:14.78 sgSVkvH3.net
>>291
本当に9回も連続しないといけない?
303:132人目の素数さん
17/12/29 18:35:31.87 GB8Nvxqn.net
>>291
他の目の出かたも考慮が必要だよな
304:132人目の素数さん
17/12/29 19:04:11.62 PE87aOTr.net
>>292
95%の信頼性でよければ7回になる。
305:132人目の素数さん
17/12/29 19:08:14.72 A7TCdTIf.net
サイコロで1が2.57回連続の
確率は、0.01ぢゃ
∵ 1/6^2.57 = 0.01
つまり
1が3回連続で、有意にイカサマぢゃ
信頼度は0.99ぢゃ、
若干トンデモ論ぢゃから参考程度ぢゃ
306:132人目の素数さん
17/12/29 19:34:05.22 sgSVkvH3.net
1が確率1で他の目が確率0の場合と
1が確率3/8で他の目が確率5/8の場合と
同じ?
307:132人目の素数さん
17/12/29 19:38:38.68 PE87aOTr.net
>>293
1~6の目がそれぞれ60,50,40,30,20,10回でたときの
各々の目がでる確率の分布は
次のようになる。 95%信頼区間が6の目が許容範囲と重ならないのでイカサマサイコロという判断になる。
URLリンク(i.imgur.com)
308:132人目の素数さん
17/12/29 19:39:03.29 sgSVkvH3.net
296は
イカサマの程度のこと
309:132人目の素数さん
17/12/29 19:46:59.72 PE87aOTr.net
>>298
事前分布をパラメータがc(1,1,1,1,1,1)のディリクレ分布にしての計算。
310:132人目の素数さん
17/12/29 19:49:03.98 PE87aOTr.net
>>295
ではサイコロの1,3,5の順に出たら(1/6)^3=0.00463なのでイカサマ???
311:132人目の素数さん
17/12/29 19:52:26.44 PE87aOTr.net
>>295
ではサイコロの目が1,3,5の順に出たら(1/6)^3=0.00463なのでイカサマ???
312:132人目の素数さん
17/12/29 19:57:58.04 PE87aOTr.net
200本に1本当たる宝くじが当たったら1/200 < 0.01だからイカサマ?
313:132人目の素数さん
17/12/29 20:35:28.47 A7TCdTIf.net
>>301
サイコロの目が1,3,5の順 もしくは、
サイコロの目が5,3,1の順 もしくは、
サイコロの目が3,1,5の順 で出た
と考えた方が良いのぢゃ
イカサマぢゃないなら、このような
事象の確率は、3/(6^3) = 0.014 ぢゃ
で、0.05を下回っている!。
スナワチ、有意にイカサマぢゃ
おそらく奇数しか出ないのぢゃ。
だから、イカサマぢゃ
314:132人目の素数さん
17/12/29 20:48:42.28 sRcK2CzS.net
>>300
二項分布のことを知らないな
315:132人目の素数さん
17/12/29 21:03:05.53 PE87aOTr.net
サイコロの目が3、4と続いた
(1/6)^2 = 0.02777778 < 0.05
なのでイカサマサイコロ。
別のサイコロで5,6と順にでた。
(1/6)^2 = 0.02777778 < 0.05
すべてのサイコロはイカサマサイコロ????
316:132人目の素数さん
17/12/29 21:07:15.89 PE87aOTr.net
サイコロを2個ふったら6と6がでた。
(1/6)^2 < 0.05だからイカサマサイコロ?
21本以上で1本あたるクジはすべてイカサマ?
n>20 で 1/n < 0.05
317:132人目の素数さん
17/12/29 21:08:39.59 JQohD8FP.net
>>305
おかしいと思うだろ?
その考え方が間違ってるって事だよ
318:132人目の素数さん
17/12/29 21:11:22.22 5lZLT2Zj.net
>>306
> ID:PE87aOTr
反語だったかスマン
319:132人目の素数さん
17/12/30 03:07:48.83 ptFpCzXE.net
>>307
p値で判断するのが間違い ということでいいよな?
320:132人目の素数さん
17/12/30 08:30:51.16 jFg12bBm.net
ワシが迷えるピミたちに、正解
を解説とする。次の通りぢゃ
《 超 結 論 》
モピロン、p値での判断は間違い
∴ベイズの統計で判断しよう。
《 超 怪 説 》
200本に1本当たる宝くじで、
厳正な抽選なら、
p値でのイカサマ判断率は、1/200
厳正な抽選かどうかは、
普通に考えてZeroで、1/200ぢゃない
∵
宝くじ、胴元が儲かるシステム
厳正なら胴元は、儲からない。
ぢゃから、宝くじは、イカサマぢゃ
321:132人目の素数さん
17/12/30 09:04:16.51 Eg/yPu8D.net
>>309
お前の考えるp値に意味がないってことよ
322:132人目の素数さん
17/12/30 11:19:18.21 tRjmjmCf.net
>>309
なんども>>207は間違っていると指摘されているのに聞こえないようだな
なぜ聞こえないか?
それはお前がバカの壁に囲まれているからだ
お前には、お前を取り囲んでいるバカの壁が見えないんだろうけどな
323:132人目の素数さん
17/12/30 11:49:16.41 d3n194HI.net
科学ではなく信仰心のみに依存する気違いスレ
324:132人目の素数さん
17/12/30 12:58:08.99 LvZUJbb9.net
統計学は科学ではない
科学の正しさを保証することが目的であり、そこにはどうしたって、ただ信じるしかない仮定が要る
325:132人目の素数さん
17/12/30 13:17:40.75 jRp29nNM.net
>>312
反論できない馬鹿の自己紹介乙。
326:132人目の素数さん
17/12/30 13:24:58.46 jRp29nNM.net
1の目のでる確率が1/6であるを帰無仮説にする。
> binom.test(2,2,1/6)
Exact binomial test
data: 2 and 2
number of successes = 2, number of trials = 2, p-value = 0.02778
alternative hypothesis: true probability of success is not equal to 0.1666667
95 percent confidence interval:
0.1581139 1.0000000
sample estimates:
probability of success
1
p-value = 0.02778 ゆえに帰無仮説は棄却される。
どこか、間違っている?
327:132人目の素数さん
17/12/30 13:40:01.96 tRjmjmCf.net
>>316
お前に正しい答えを教えてやっても理解できないだろ?
無駄なことはしない
328:132人目の素数さん
17/12/30 13:47:14.55 LvZUJbb9.net
何度も指摘する割にはその理由の解説は一度もしない
無駄なことをしない主義の人間のやることではない
329:132人目の素数さん
17/12/30 13:49:04.08 jRp29nNM.net
>>317
反論もできず無駄なレスしてるの、かっこ悪いね。
330:132人目の素数さん
17/12/30 13:52:20.67 tRjmjmCf.net
どこが間違っているか指摘してやろう
よく聞けよ
お前の頭の中が間違っている
331:132人目の素数さん
17/12/30 13:57:04.06 tRjmjmCf.net
>>318
相手が理解できないことを教えてやるのは無駄だけど
自分の無知をさらけ出している奴を見るのは面白いだろ
332:132人目の素数さん
17/12/30 13:57:18.09 LvZUJbb9.net
そういうとこがかっこ悪いというのに、まだ続けるのかw
333:132人目の素数さん
17/12/30 13:59:41.02 LvZUJbb9.net
>>321
君の発言から知性や知識を感じとったことは一度もないぞ
334:132人目の素数さん
17/12/30 14:10:46.56 tRjmjmCf.net
自分の無知を認められないプライドだけが高いバカにつける薬はないな
335:132人目の素数さん
17/12/30 15:40:35.27 jRp29nNM.net
サイコロの1の目のでる事前確率を分布(例、平均1/6標準偏差0.1の分布)に設定するのではなく
1/6に設定したするときは
ベイズでは1/6である確率を考える。
そんなものはどこにも情報がないので1/6である確率分布を一様分布として
1の目が続いたときに1/6である事後確率分布を考える。
2回続いたとき
URLリンク(i.imgur.com)
1/6である確率は95%の確率で0~0.6であるので
1の目が2回続いても1の目のでる確率は1/6であるともないとも言えない。
1の目が5回続くと0~0.0147なので95%以上の確率で1/6でないと結論できる。
URLリンク(i.imgur.com)
336:132人目の素数さん
17/12/30 15:49:05.74 jRp29nNM.net
>>325
こういう解説をすると
ベイズにおける確率って頻度じゃなくて
確信度(credibility)だと思えるね。
ベイズはrelocation of credibilityと説明されて納得できたな。
337:132人目の素数さん
17/12/30 16:20:58.
338:91 ID:+KsoN3lF.net
339:132人目の素数さん
17/12/30 16:59:54.53 GvGYAtyy.net
宝くじの期待利益は47%
340:132人目の素数さん
17/12/30 17:04:42.97 cBRghH77.net
>>316
問題をすり替えてる
敗北宣言だな
341:132人目の素数さん
17/12/30 17:12:41.34 +KsoN3lF.net
>>329
(1/6)^2<0.05で同じじゃん。
342:132人目の素数さん
17/12/30 17:13:47.87 +KsoN3lF.net
>320のようなのが敗北宣言。
343:132人目の素数さん
17/12/30 17:22:31.02 GvGYAtyy.net
宝くじは収益金の47%がごく少数の当選者に再配分される仕組みです
参加コストが53%と膨大なので、競馬・競輪・オートレース・競艇と
いった他の国営ギャンブルの約25%と比較すると、
とても割の合わない再配分(還元)率です
1万円の投資(支払)に対し、
期待値(平均当選金額)は4,700円という仕組みです
1万円買うごとに、平均値で5,300円損する仕組みなのです
344:132人目の素数さん
17/12/30 17:37:28.70 +KsoN3lF.net
21人に1人当たるというクジがあるとする。
このクジの当選確率は1/21であるを帰無仮説とする。
最初の1本で当たった。
> binom.test(1,1,1/21)
Exact binomial test
data: 1 and 1
number of successes = 1, number of trials = 1, p-value = 0.04762
alternative hypothesis: true probability of success is not equal to 0.04761905
95 percent confidence interval:
0.025 1.000
sample estimates:
probability of success
1
故に帰無仮説は棄却。
345:132人目の素数さん
17/12/30 17:39:20.56 +KsoN3lF.net
>>329
すり替えというならどこがすり替えよ?
オマエのいうすり替え前の問題に反論すればいいだけの話。
346:132人目の素数さん
17/12/30 17:53:54.62 gQvbuISO.net
>>326
俺もベイズ統計は統計といっているけど確率を扱っていないかも知れないと思ってた所
347:132人目の素数さん
17/12/30 18:17:33.80 ptFpCzXE.net
>>335
馬鹿だから>321のような投稿をする確率を考えるのが頻度主義
>321のような投稿をする奴が馬鹿である確率を考えるのがベイズ
348:132人目の素数さん
17/12/30 18:37:05.13 ptFpCzXE.net
>>333
二人めが当たる確率は(20/21)*(1/20)=1/21
三人め(20/21)*(19/20)*(1/19)=1/21
以下同様
p<0.05が起こったので帰無仮説は棄却され、イカサマクジであると結論される。
349:132人目の素数さん
17/12/30 19:02:58.55 ptFpCzXE.net
>>325
危険率(誤判定)の確率5%で
頻度主義統計では1の目が2回続いたらイカサマ
ベイズ統計では1の目が5回続いたらイカサマ
と判断が別れる。
どちらが現実に近いかは個人の感覚次第だろうね。
350:132人目の素数さん
17/12/30 19:31:24.07 zuHICsNh.net
米酢
351:132人目の素数さん
17/12/30 19:38:19.28 Zit4bgkm.net
結局確率の前提(公理)はコルモゴルフしかないでおわり
352:132人目の素数さん
17/12/30 19:39:57.93 IeIGPYO6.net
>>340
ベイズ的には確率は確信度の指標で終わり。
353:132人目の素数さん
17/12/30 19:41:50.97 Zit4bgkm.net
>>341
ベイズは確率論の一分野にすぎないでおわり
354:132人目の素数さん
17/12/30 19:43:08.61 IeIGPYO6.net
公理は信仰
>277参照。
論理学の証明でこの恒真式(もしくは公理)が出てくるといつも詐欺にあったような気になる。
P→(Q→P)
馬鹿ならば(シリツならば馬鹿である)
馬鹿ならば(裏口ならば馬鹿である)
¬P→(P→Q)
馬鹿でないなら(馬鹿であればシリツである)
馬鹿でないならば(馬鹿であれば裏口である)
Qとして天才とか変態とかを選んでも恒真式、というのは日常言語感覚からは乖離しているな。
ド底辺特殊シリツ医大を最高学府と呼ぶような気持ち悪さを覚える。
355:132人目の素数さん
17/12/30 19:44:02.28 IeIGPYO6.net
>>342
この世で確実なものは死と税金である、で終わり。
356:132人目の素数さん
17/12/30 19:48:10.85 Zit4bgkm.net
>>343
→は論理式から論理式を導くための記号であって
⇒(ならば)という記号は命題から新しい命題を作るものであるという区別すらついないのか
おわり
357:132人目の素数さん
17/12/30 19:49:16.82 Zit4bgkm.net
>>344
公理系が違う
おわり
358:132人目の素数さん
17/12/30 19:52:06.34 IeIGPYO6.net
>>345-346
宗派が違う、で終り。
359:132人目の素数さん
17/12/30 19:53:01.90 gQvbuISO.net
>>343
PとQを前提としてP∧Qを結論し
P∧Qを前提としてPを結論する
結局
PとQを前提としてPが結論できるわけです
至極当たり前ですよね
これを
Pを大前提とするなら「Qを前提としてPを結論できる」としたものが
P→(Q→P)
になります
360:132人目の素数さん
17/12/30 19:54:54.68 Zit4bgkm.net
>>347
宗派の違いとはつまり集合の定義によるものであって
結局は集合論に帰着する
宗派でくぎりたいなら宗派の定義を数学的にめいかくにすべき
おわり
361:132人目の素数さん
17/12/30 19:57:49.23 IeIGPYO6.net
>>349
オマエのいう数学的が定義されていないと無意味。
362:132人目の素数さん
17/12/30 20:00:10.16 Zit4bgkm.net
>>350
数学的に扱えるようにしろでおわり
集合の定義は命題によりあきらかにできるので
真偽が定められる命題でていぎすればいいだけ
おわり
363:132人目の素数さん
17/12/30 20:00:22.96 IeIGPYO6.net
>>348
Qとして天才とか変態とかを選んでも恒真式、というのは日常言語感覚からは乖離している、の意味は理解できないみたいだね。
364:132人目の素数さん
17/12/30 20:03:03.67 Zit4bgkm.net
>>352
さけのんでるのでよんでないが
数学的論理と日常言語感覚は乖離してるおわり
365:132人目の素数さん
17/12/30 20:04:57.54 gQvbuISO.net
>>352
なんの問題も感じませんよ?
366:132人目の素数さん
17/12/30 20:07:36.24 IeIGPYO6.net
誰も>207に反論できない、でいい?
367:132人目の素数さん
17/12/30 20:18:52.21 Zit4bgkm.net
>>355
そうだね
頻度主義は確率論の一かいしゃく(一分野)にすぎないからね
あと有意水準の選択は主観だからなぜそれを選んだのか説明できるのかというもんだがでてくる
一般に標本は2じゃたりないけど
これが頻度主義の限界だね
だから主観確率やら理論確率とのちがいがあるんだよな
368:132人目の素数さん
17/12/30 20:31:57.30 Zit4bgkm.net
>>207
母比率の検定か
やっぱこれまちがっとるなww
酒飲んでるので自分で計算してくれw
369:132人目の素数さん
17/12/30 20:40:01.56 gQvbuISO.net
>>355
反論だらけだけど君はレス乞食だね
370:132人目の素数さん
17/12/30 21:36:01.15 Zit4bgkm.net
207は頻度論がすべてじゃないという視点はいいが例がわるかったね
検定はもともと欠陥ある手法だからな
371:132人目の素数さん
17/12/30 22:19:56.96 Zit4bgkm.net
>>192
確率論の前提ならそれは公理しかないわけが?
確率論のぜんていでないならば何の前提か示すべきだろ
372:132人目の素数さん
17/12/30 22:20:37.79 GvGYAtyy.net
>>207
サイコロの1と2の目を上にして
サイコロに回転を加えて振ることによって
α=0.05よりもかなり大きな値がとれる
373:132人目の素数さん
17/12/30 22:22:18.40 Zit4bgkm.net
いうとくが確率論の公理を研究対照するにするならそれなりの世界的評価のあるものでないといけないな
だせる?
374:132人目の素数さん
17/12/30 22:27:03.78 tRjmjmCf.net
>>334
答えを教えたら
>>333みたいな馬鹿レスが見られなくなるだろ
だから教えない
375:132人目の素数さん
17/12/31 08:01:37.98 PGk0vCX2.net
>>363
答られない、宣言だな。
反論もできず無駄なレスしてるの、かっこ悪いね。
376:132人目の素数さん
17/12/31 09:06:38.49 xHu9zKh4.net
>>364
お前がどう思おうとどうでもよい
>>207がバカ過ぎるレスであることは変わらない
これだけ間違いだと指摘されているにも関わらず
まだそれに気づけないのも笑える
377:132人目の素数さん
17/12/31 09:56:00.87 PGk0vCX2.net
>>365
>310のような賛同者もいるんだが、
オマエの評価は>323なんだな。
反論提示できずに逃げ回っているからね。
378:132人目の素数さん
17/12/31 10:25:40.83 xHu9zKh4.net
>>366
自分では間違いに気づけないのから答えを教えてもらいたいのか?
379:132人目の素数さん
17/12/31 10:52:56.45 14tdpK/Y.net
5試合連続で勝敗予想的中なら頻度主義では予知能力あるとされる。p=0.03125 < 0.05
URLリンク(to-kei.net)
ベイズでやってみる
380:なら 的中率が1/2である確率は一応分布に従う(事前分布)として 5試合連続的中した後の的中率事後分布がどうなるかを考える。
381:132人目の素数さん
17/12/31 10:54:35.98 14tdpK/Y.net
>>367
お前に賛同する者はこのスレにはいないみたいだぞwww
オマエの評価はこれな。
>何度も指摘する割にはその理由の解説は一度もしない
>無駄なことをしない主義の人間のやることではない
382:132人目の素数さん
17/12/31 11:49:41.63 xHu9zKh4.net
>>369
賛同者が多いほど正しいって言いたいの?
やっぱりバカだな
383:132人目の素数さん
17/12/31 12:02:50.53 14tdpK/Y.net
>>370
>君の発言から知性や知識を感じとったことは一度もないぞ
>何度も指摘する割にはその理由の解説は一度もしない
>無駄なことをしない主義の人間のやることではない
と評価されている現実を受容できないみたいだな。
かっこ悪いね~
384:132人目の素数さん
17/12/31 12:07:59.53 14tdpK/Y.net
>>368
的中率が5割である可能性の確率の事後分布を描くとこんな感じだな。
URLリンク(i.imgur.com)
ベイズでは5回連続程度ではイカサマ占い師の疑惑を払拭してくれないな。
385:132人目の素数さん
17/12/31 17:20:00.26 14tdpK/Y.net
ベイズの方が帰無仮説を棄却しにくいな。
10回サイコロを振って5回、一の目がでたら頻度主義では
> binom.test(5,10,1/6)
Exact binomial test
data: 5 and 10
number of successes = 5, number of trials = 10,
p-value = 0.01546
でp=1/6が棄却される。
ベイズだとp=1/6の確率分布を一様分布とすると
10回サイコロを振って7回でて
95%HDI(highest density interval)の上限が0.05を下回る。
URLリンク(i.imgur.com)
386:132人目の素数さん
17/12/31 17:55:51.10 xz3/0gsZ.net
コインがイカサマのワシの検定ぢゃ
事前確率は、当方への神の御告げにより、
表確率0.1のコインである確率 1/5
表確率0.3のコインである確率 1/5
表確率0.5のコインである確率 1/5
表確率0.7のコインである確率 1/5
表確率0.9のコインである確率 1/5
‎とする。
コインを5回なげたら5回とも表なら
事後確率
0.1^5+0.3^5+0.5^5+0.7^5+0.9^5 = 0.79225
(‎0.5^5) / 0.79225 = 0.039
‎∴
‎表確率0.5のコインである確率 0.039
‎∴
‎イカサマ確率は、1 - 0.039 = 0.961 ぢゃ
ちなみに、p値 = 0.5^5 なのぢゃろう。
どうも1 - p値は、イカサマ確率とは違う。
そんな方法で検定するのは時代遅れぢゃ
モピロン、当方への神の御告げ 割と完璧
だから、イカサマ確率を算出できる。
387:132人目の素数さん
17/12/31 18:26:42.91 mR92//4D.net
シュレディンガーの猫が!
______
/ /|
┃ ̄ ̄ ̄ ̄ ̄┃ ┃< にゃー
┃ ┃ ┃
┃ ┃/
 ̄ ̄ ̄ ̄ ̄ ̄
_人人人人人人人人_
> 生 存 確 認 <
 ̄^Y^Y^Y^Y^Y^Y^Y^Y ̄
388:132人目の素数さん
17/12/31 19:19:37.04 14tdpK/Y.net
1番目~5番目のコインである確率をJAGSでシミュレーションすると
1 2 3 4 5
0.000015 0.003207 0.039246 0.212041 0.745491
という結果になった。
389:132人目の素数さん
17/12/31 19:24:01.77 14tdpK/Y.net
>>376
理論値は
[1] 0.00001262228 0.00306721363 0.03944461975 0.21214263175 0.74533291259
まあ、よく一致しているな。
390:132人目の素数さん
17/12/31 20:15:10.88 14tdpK/Y.net
イカサマコインの定義をp=0.5以外とすると
表確率0.01のコインである確率 1/100
表確率0.02のコインである確率 1/100
....
表確率0.99のコインである確率 1/100
表確率1.000のコインである確率 1/100
1-0.5^5/(0.01^5+0.02^5+...+0.99^5+1.00^5) = 0.9981801
0.001単位で区切ると 0.9998131になってしまうね。
391:132人目の素数さん
17/12/31 20:21:32.08 vRYXSQrZ.net
ベイズ統計学で
トランプのシャッフルについての見識は得られる?
十分シャッフルされた状態にするのに
どういう切り方で何度やればいいかとか
392:132人目の素数さん
17/12/31 22:29:56.85 D0SDvzGU.net
あけおめ!
おまえらの似非統計今年もたのしむわwwwwwwwwwwww
393:132人目の素数さん
17/12/31 23:55:46.53 +bjpI6TD.net
>>373
>>ベイズだとp=1/6の確率分布を一様分布とすると
>>10回サイコロを振って7回でて
10回サイコロを振って7回1の目が出たのなら、0.6~0.7の当たりにピークを持つような
分布になることが予想されるけど、示されている図は、0に近いところにピークが来るよ
うなグラフになってます。この図は、1以外の目のグラフじゃないですか?
「1の目が出すぎで歪んでいる」≠「(1以外の例えば)6の目が出なさすぎで歪んでいる」
だと思います。
394:132人目の素数さん
18/01/01 00:08:06.35 3B1sF6u0.net
∧_∧
( ´Д` ) 新年あけまして
/ ヽ
し、__X__,ノJ
/´⌒⌒ヽ
l⌒ ⌒l おめでとうございます
⊂ ( ) ⊃
V ̄V
395:132人目の素数さん
18/01/01 00:08:36.83 sla5GeSe.net
>>381
目の出る確率ではなくてp=1/6が正しい確率の分布。
サイコロを投げる前はp=1/6である可能性は0.01でも0.99でも同じ一様分布だったが
10回中7回、一の目がでたことから
p=1/6が正しい確率の分布が0に近い方にピークを持つようになった。
396:132人目の素数さん
18/01/01 00:38:54.91 mbIYUD21.net
なるほど、そうだったんですか。
>>297に描かれている図の方は、「各目の出る確率の分布」だったので、
てっきり、そのような分布だと思っていました。
>>373は、「1の目の出る確率が1/6で正しいかどうか」の確率のようなものとのことですが、
逆に、「1の目の出る確率」のようなものも、同時に求めることも出来るんですか?
397:132人目の素数さん
18/01/01 01:16:39.05 ZAhqpjh2.net
サイコロを投げる前(事前確率分布)と10回投げて0~7回1の目がでた時のp=1/6が正しい確率の分布をグラフにすると
URLリンク(i.imgur.com)
確率の平均の最大値は10×1/6回あたりにあるのがみてとれる。
398:132人目の素数さん
18/01/01 01:49:47.01 mbIYUD21.net
別種のグラフだと言うことがよく分かりました。
わざわざありがとうございました。
399:132人目の素数さん
18/01/01 08:18:33.42 ZAhqpjh2.net
>>384
>逆に、「1の目の出る確率」のようなものも、同時に求めることも出来るんですか?
同時には求まらない。
1の目の出る確率を一様分布とするすれば10回中7回1の目がでた後の事後分布はbeta(1+7,1+10-7)なので平均8/12,最頻値7/10になる。
サイコロの目なので最頻値1/6、分散0.1^2と主観的に事前確率分布を決めてしまえば
これに相当するβ分布のパラメータは3.26,12.3となるので(この計算はやや面倒)
平均値0.4015354 中央値0.3989152 最頻値0.3858124 で 95%信用区間は 0.2189457~ 0.5873959
この様子をRのパッケージBESTのplotPost関数を改造してグラフにすると
URLリンク(i.imgur.com)
400:132人目の素数さん
18/01/01 10:56:56.09 ZAhqpjh2.net
>>387(補足)
>サイコロの目なので最頻値1/6、分散0.1^2と主観的に事前確率分布を決めてしまえば
と書いたが
サイコロの目は6面あるから事前分布の最頻値を1/6にするのはまあいいとして分散の値の根拠がないじゃないか、との批判は当然。
そこで標準偏差が0~100の間で一様分布するとして
JAGSでMCMCしたのが以下のグラフ。
URLリンク(i.imgur.com)
分散0.1^2のときより歪なのが明らかになったといえる。
401:132人目の素数さん
18/01/01 12:30:52.15 ZAhqpjh2.net
>>388(補足の補足)
>サイコロの目は6面あるから事前分布の最頻値を1/6にする
これだって主観的過ぎるという異論も当然ある。
1の目のでる確率の平均(正規分布を仮定するので最頻値と一致)も平均1/6で標準偏差が一様分布に従うとしてMCMCでサンプリングしてみた。
(標準偏差は0~100の範囲の一様分布に設定)
URLリンク(i.imgur.com)
一の目がでる値の平均値は2/3程度で平均の平均を1/6と固定したときとあまり変わらない。
402:132人目の素数さん
18/01/01 12:38:18.73 ZAhqpjh2.net
Gelmanの主張に従って標準偏差の事前分布をhalf-cauchy分布にしてみた。
尺度母数=5での結果をグラフにすると
URLリンク(i.imgur.com)
コーシー分布なだけあって1000を超える値がサンプリングされている。
それでも、1の目の出る確率の平均は2/3程度で他の結果と同じ。
403:132人目の素数さん
18/01/01 12:42
404::40.06 ID:yJ9akvJN.net
405:132人目の素数さん
18/01/01 14:56:56.97 ZAhqpjh2.net
beta(1+7,1+10-7)のβ分布になるので期待値は8/12、最頻値が10/7
パラメータを
a=8
b=4
と おいて
最頻値 (a-1)/(a+b-2)
平均値 a/(a+b)
分散 a*b/((a+b)^2*(a+b+1))
というだけの話。
事前分布の期待値や分散に様々な仮定をおいてもこの結論はほぼ同じ。
分散の事前分布に半コーシー分布(尺度母数5)を使うと事後分布がβ分布でよく当てはまるのだが、
URLリンク(i.imgur.com)
逆ガンマ関数(母数=0.001)を使うとずれが大きい。
URLリンク(i.imgur.com)
406:132人目の素数さん
18/01/01 21:11:56.66 ZAhqpjh2.net
正月休みの暇つぶしクイズ
薬剤yを1人ずつ投与して効果判定したら、3人めで効果が確認できた。
薬剤gを9人同時に投与したら3人に効果があった。
どちらの有効性が高いか?
別バージョン(こっちがオリジナルw)
ゆるゆる女子大生に1人ずつメールで誘ったら3人めが開脚。、
がばがば女子大生9人に一斉にメールを送ったら3人が開脚。
どっちが開脚が容易か?
頻度主義からするとどちらも1/3だから優劣なしになるのだが、
ベイズ統計における確率はcredibility(確信の度合い、信憑性や説得力の度合いと言ってもいい)なので
議論の余地がある。
407:132人目の素数さん
18/01/01 21:40:26.36 3B1sF6u0.net
■モンティホール問題(チャーハンと餃子)
このゲームができるのは1回だけです
チャーハン99皿と餃子1皿を個別に
外からは中が見えない100個の箱に入れます
その中から1個の箱を選びます
チャーハンが入った98個の箱を取り除きます
最後に残った2個の箱の中から1個の箱を選びます
あなたが餃子を当てる確率は何%でしょう?
408:132人目の素数さん
18/01/02 02:08:33.95 VleVG2NU.net
>>393
頻度論ってそんなんだっけ?
頻度論は無限に思考を行ったときの頻度が確率といっちするっていう
確率とはなにかの解釈であって
3回やったうち1回あることがおきたなら
三分の一の確率だというもんじゃなかったような
明確な定義なんてないんだろうけど
頻度と頻度論的確率解釈をごっちゃにしてるような
一応ぐぐったけど明確な定義らしきものはみつからからなかったので
英語版ウィキみたらやっぱりそうかいてる
409:132人目の素数さん
18/01/02 02:27:16.20 VleVG2NU.net
あと検定とが信頼区間求めるとかしないといみないんじゃない?
あと何回目で成功するは幾何分布やから
3分の1の確率で成功するとするなら
三回目に成功する確率は
(1/3)*(2/3)^2= 0.1481481
じゃないのかなあ
410:132人目の素数さん
18/01/02 04:46:33.00 qdmBZ37O.net
検者の意図で変わるp値。
(修正再掲)
ある大学の入学者男女の比率は1であるという帰無仮説を検定する課題が花子と太郎に課された。
花子は50人を調査できたら終了として入学者を50人をみつけて18人が女子であるという結果を得た。
帰無仮説のもとで
50人中18人が女子である確率は 0.01603475
これ以下になるのは50人中0~18人と32~50人が女子の場合なので
両側検定して
> sum(dbinom(c(0:18,32:50),50,0.5))
[1] 0.06490865
> binom.test(18,50,0.5)$p.value
[1] 0.06490865
で帰無仮説は棄却できないと結論した。
一方、本 番と十八番が好きな太郎は一人ずつ調べて18人めの女子がみつかったところで調査を終えることにした。
18人めがみつかったのは花子と同じく50人めであった。
帰無仮説のもとで
18人がみつかるのが50人めである確率は0.005772512
これ以下になるのは23人以下50人以上番めで女子18人めがみつかった場合なので
両側検定して
pnb=dnbinom(0:999,18,0.5)
> 1 - sum(pnb[-which(pnb<=dnbinom(50-18,18,0.5))]) # < 0.05
[1] 0.02750309
で帰無仮説は棄却される。
どちらの検定が正しいか、どちらも正しくないか?
検定する意図によってp値が変わるのは頻度主義統計の欠陥といえるか?
411:132人目の素数さん
18/01/02 04:51:42.20 qdmBZ37O.net
>>396
レスありがとう。
幾何分布と二項分布の比較になる。
グラフにするとこんな感じ。
URLリンク(i.imgur.com)
最頻値や期待値を比べてどう解釈するかの議論ではないかと思う。
412:132人目の素数さん
18/01/02 05:33:08.57 +hyeNOE4.net
確率質量関数と確率密度関数をグラフにしてみた。
URLリンク(i.imgur.com)
413:132人目の素数さん
18/01/02 07:43:25.38 +hyeNOE4.net
サイコロを2回投げて1の目が2回続いた。
この確率は(1/6)^2=0.02777778
この確率以下の事象の起こる確率の総和がp値であるから
1,1の目のでる確率1/36
1,2の目のでる確率1/36
1,3の目のでる確率1/36
...
6,5の目のでる確率1/36
6,6の目のでる確率1/36
全部たすと1になる。
ゆえに、頻度主義統計のもとではイカサマサイコロは存在しない。
414:132人目の素数さん
18/01/02 10:53:13.85 okX91MtS.net
検定はまったくのごまかしだが
区間推定もたいがいなまやかしだな
415:132人目の素数さん
18/01/02 11:10:15.05 VleVG2NU.net
>>398
なにの主張なのかよくわからんけど
分布の形がにてるたら別にどの確率分布をつかってもいいってこと?
頻度論てき確率の問題かどうかの話にはなってないし
頻度論とかの問題じゃなく
実験の結果によって実験をかえる
つまり、成功したらそこでやめる
実験計画にもんだいがあるんだけど
事前に何回やって得られたデータから分析をおこなうってのと
事前に何回やるかきめずに成功したらそこで実験をやめるってのは
根本的に違うし後者は安易にやるべきじゃない。
416:132人目の素数さん
18/01/02 11:15:09.96 wUdm8Yrk.net
>>402
>事前に何回やるかきめずに成功したらそこで実験をやめるってのは
>根本的に違うし後者は安易にやるべきじゃない。
それはまさに正論。
p<0.05になったらサンプリングをやめるというイカサマに騙される椰子大杉。
417:132人目の素数さん
18/01/02 11:16:32.46 wUdm8Yrk.net
>>402
細くて長い のと 太くて短いのが どちらが有用かという価値判断だな。
チン〇の話ではないぞwww
418:132人目の素数さん
18/01/02 11:51:00.03 wUdm8Yrk.net
>>393
開脚率の期待値を計算してみた。
ゆるゆる女子大生の開脚率期待値:r人目で初�
419:゚て開脚 r=3 Ex.yuru <- function(r){ integrate(function(x)x*(1-x)^(r-1)*x,0,1)$value/integrate(function(x)(1-x)^(r-1)*x,0,1)$value } Ex.yuru(r) 2/(r+2) がばがば女子大生の開脚率期待値:N人中z人開脚 N=9 z=3 Ex.gaba <- function(N,z){ integrate(function(x) x*choose(N,z)*x^z*(1-x)^(N-z),0,1)$value/integrate(function(x)choose(N,z)*x^z*(1-x)^(N-z),0,1)$value } Ex.gaba(9,3) (z+1)/(N+2)
420:132人目の素数さん
18/01/02 12:17:16.24 VleVG2NU.net
>>404
ごめん
なにがいいたいのかわからん
421:132人目の素数さん
18/01/02 12:49:46.01 4hqDCKt8.net
本人が分かってないし
422:132人目の素数さん
18/01/02 13:01:02.65 wUdm8Yrk.net
両女子大生の開脚率の事前確率を一様分布として事後分布をグラフにしてみた。
URLリンク(i.imgur.com)
423:132人目の素数さん
18/01/02 13:03:46.13 VleVG2NU.net
>>405
ちがうよそれ
その式ならr(最初の成功がでるまでの試行回数。ふつうはこっちをxとく)について積分しないといけない
x(確率。ふつうはpとおく)がパラメータ
幾何分布の期待値は1/pだからpを推定しないともとまらない
二項分布の期待値はnp
393の例の設定でやるなら幾何分布の期待値は3で二項分布も3
np=1/pが成り立つときに二項分布と幾何分布の期待値はひとしくなる
二項分布やら幾何分布の確率分布図のx軸や確率分布関数f(x)のxは確率じゃないよ
424:132人目の素数さん
18/01/02 13:07:31.56 wUdm8Yrk.net
>>406
最頻値での確率を重視するなら、がばがば女子大生
平均値(期待値)を重視するなら、ゆるゆる女子大生
ということ。
425:132人目の素数さん
18/01/02 13:13:55.97 VleVG2NU.net
Rつかいたいだけで何やってるか全然わかってなさそうな人だな
426:132人目の素数さん
18/01/02 13:26:19.92 wUdm8Yrk.net
>>409
確率の期待値を計算したいのであって、回数の期待値を計算したいわけではないから問題なし。
β分布の横軸は0~1までの確率だよ。
事前確率分布一様分布が9回試行して3回成功することでβ(1+3,1+6)のβ分布にベイズ更新されるというお話。
427:132人目の素数さん
18/01/02 14:01:36.23 wUdm8Yrk.net
>>409
階層ベイズモデルのスクリプト書いたことない?
>393のだと
ゆるゆる開脚率p1
がばがば開脚率p2
とその差diff
の分布を求めるMCMCを実行。
横軸は当然、確率。
縦軸は確率密度。
JAGSで書けばこんな感じ。
model{
for(i in 1:r){
y[i] ~ dbern(p1)
}
z ~ dbin(p2,N)
diff = p1 -p2
p1 ~ dbeta(1,1)
p2 ~ dbeta(1,1)
}
428:132人目の素数さん
18/01/02 14:32:32.36 ZrKCLBbv.net
>>393
薬剤y = 効果があったのが1人いた。そこで
実験止めたら、3人に実験してた。
薬剤y' = 3人同時で、1人効果あり
薬剤g' = 効果があったのが3人になったとき
実験止めたら、9人に実験してた。
薬剤g = 9人同時で、3人効果あり
としたとき、安易には
P(y) = P(y') = P(g) = P(y') = 1/3 なのぢゃが
多分、
P(y) = P(y') = 2/5 > P(g') = P(g) = 4/11
ぢゃろう。何となく
なお、
薬剤g'' = 効果があったのが1人いた。
その時点で7人に実験してた。
‎で、実験は続行したら、
‎ラッキーなことに、
‎8人目、9人目 効果があり
‎そこで実験を止める。
としたとき、
心理的に、P(g'') > P(g) = 4/11 ぢゃが。
429:132人目の素数さん
18/01/02 14:32:58.81 VleVG2NU.net
>>412
なるほどね
>>400
統計的検定においても
きむ仮説を何にするか有意水準をなににするかは一意にきめられることではない
主観確率でつまりさいころが明らかに不正であるという印象があるなら
きむ仮説や有意水準はかえることができる
たとえば1でそうにない1が出る確率について検定することになる
それは主観確率じゃないかというはなしになるが
結局はそういうことになる
確率とは
主観確率と古典確率と頻度確率を折衷したものなんだから
主観確率だって頻度確率やら古典確率を考慮に入れて決定されるのだから。
430:132人目の素数さん
18/01/02 14:37:49.78 VleVG2NU.net
>>412
つまり頻度論的確率の問題じゃないってことでいいよね?
431:132人目の素数さん
18/01/02 15:50:49.08 wG0bXeaR.net
東洋大の往路優勝はヴェイパーフライ4%の効果である。
だれか、これをベイズ統計で検証してください。
どのようにアプローチするのか勉強したいです。
432:132人目の素数さん
18/01/02 23:57:07.77 RTOZbcrb.net
>>394
モンティホール問題を1回だけ行う時の当たる確率は
最後に二者択一を1回行うだけですので
必ず50%です
箱が100万個あっても変わりません
これは否定できません
433:132人目の素数さん
18/01/03 00:45:15.58 fOPEnBcc.net
>>418
7億円当たる確率も
当たりくじあ当たらないかの2者択一だから50%だな
434:132人目の素数さん
18/01/03 00:53:44.65 s/LhPEGm.net
>>418
そう思うだろ?リアルでやってみ?
200回実行したけど、理論通りだったわ。
435:132人目の素数さん
18/01/03 00:54:11.32 s/LhPEGm.net
てか誰かこれおなしゃす>>417
436:132人目の素数さん
18/01/03 08:05:48.04 YJfyxrv+.net
サイコロを2回投げて1の目が2回続いた。
この確率は(1/6)^2=0.02777778
この確率以下の事象の起こる確率の総和がp値であるから
1,1の目のでる確率1/36
1,2の目のでる確率1/36
1,3の目のでる確率1/36
...
6,5の目のでる確率1/36
6,6の目のでる確率1/36
全部たすと1になる。
ゆえに、頻度主義統計のもとではイカサマサイコロは存在しない。
×頻度主義統計のもとではイカサマサイコロは存在しない。
○サイコロの目のでる確率はどの目でも1/6であるという帰無仮説は棄却されない。
437:132人目の素数さん
18/01/03 08:20:21.27 YJfyxrv+.net
>>368
5試合連続で勝敗予想的中なら頻度主義では予知能力あるとされる。p=0.03125 < 0.05
URLリンク(to-kei.net)
これは片側検定だから有意水準0. 05なら
0. 025と比較すべき。0.03125 > 0. 025
5試合連続で勝敗予想外れの確率も0.03125だから
両側検定なら0.03125 + 0.03125 = 0.0625 > 0. 05
なので
5試合連続で勝敗予想的中では予知能力があるとは言えない。
438:132人目の素数さん
18/01/03 08:38:06.74 WX3O++x6.net
>>415
無限に存在する素数を確率論的に扱いたいんだがどうすればいいか?。
恐怖の全数調査の真分布が使えない。
439:132人目の素数さん
18/01/03 08:40:41.51 YJfyxrv+.net
>>394
モンティホールの問題ってこういうの問題じゃなかった?
最初にn個から選んだ箱Aと
A を除いたn-1個からn-2個の外れを除いて残った箱B
Aがあたりの確率 1/n
Bがあたりの確率 (n-1)/n
440:132人目の素数さん
18/01/03 09:06:30.85 YJfyxrv+.net
>>399
平均値、最頻値、中央値を計算させてみた。
> # mean
>
> integrate(function(x)x*pdf_y(x),0,1)$value ; 2/(r+2)
[1] 0.4
[1] 0.4
>
> integrate(function(x)x*pdf_g(x),0,1)$value ; (z+1)/(N+2)
[1] 0.3636364
[1] 0.3636364
>
> # mode
>
> optimise(yuru,c(0,1),maximum = TRUE)$maximum ; 1/r
[1] 0.3333205
[1] 0.3333333
>
> optimise(gaba,c(0,1),maximum = TRUE)$maximum ; z/N
[1] 0.3333226
[1] 0.3333333
>
> # median
>
> uniroot(function(x){integrate(function(t)pdf_y(t),0,x)$value-0.5},c(0,1))$root
[1] 0.3857168
>
> uniroot(function(x){integrate(function(t)pdf_g(t),0,x)$value-0.5},c(0,1))$root
[1] 0.3550879
>
441:132人目の素数さん
18/01/03 12:30:45.00 UYxHQku1.net
詳しい計算 有難い。
そっか。なるほど、
効き目は、まずは、平均の大きい
薬剤yuruyuru というか薬剤yを選択、
開脚というか効果がだめなら、
薬剤gabagaba というか薬剤gを選択
これで、成功率がいい感じだろう。
442:132人目の素数さん
18/01/03 12:39:02.43 TJ1i0Y5b.net
Three prisoners problem.
443:132人目の素数さん
18/01/03 18:18:14.06 UYxHQku1.net
《囚人Aの恩赦の超確率特論》
直感的怪答
AかCのいずれか1/2に上昇します。
ベイズ改訂で1/3から1/2になります。
模範解答
もともと3人だし、1/3のままである。
ワシの主観的快答
Aの恩赦確率は1ぢゃ。
快説しよう
看守は、
「Bは死刑」と言ったが、
「Aは死刑」とは言ってないし、
「Cは恩赦」とも言ってない。
ぢゃから、おそらく絶対100%、
B=死刑 、A=恩赦、 C=死刑ぢゃ。
証明オワリぢゃ
444:132人目の素数さん
18/01/03 19:33:44.56 s/LhPEGm.net
>>429
死刑と恩赦が隣�
445:闕№チているシュレティンガーな状態が正解
446:132人目の素数さん
18/01/03 19:50:42.87 ve03RCFR.net
■3囚人問題(英: Three Prisoners problem)
ある監獄にA、B、Cという3人の囚人がいます
3人のうちランダムに選ばれた1人に恩赦が出ます
誰が恩赦になるかは看守は答えない
囚人Aに看守が「Bは死刑になる」と教えてくれます
この時、看守は嘘は言いません
囚人Aに恩赦が与えられる確率は何%でしょうか?
447:132人目の素数さん
18/01/03 20:34:00.63 ve03RCFR.net
>>429
「Cは恩赦」と言わない≠Cが死刑
448:132人目の素数さん
18/01/03 20:46:43.09 YJfyxrv+.net
死刑囚A,B,CでAが看守に尋ねてBは死刑執行されると告げられたと設定。
恩赦(onsha)を受けるをo,死刑執行されると告(tsuge)げられるをtで表す。
Aが恩赦を受ける確率P(A=o)=1/3
Bが恩赦を受ける確率P(B=o)=1/3
Cが恩赦を受ける確率P(C=o)=1/3
求めたいのは、Bが死刑執行されると告げられた後のAが恩赦を受ける確率P(A=o|B=t)である。
ベイズの公式により
P(A=o|B=t) = P(B=t|A=o)*P(A=o) / P(B=t)
P(B=t) = P(B=t|A=o)*P(A=o) + P(B=t|B=o)*P(B=o) + P(B=t|C=o)*P(C=o)
P(B=t|B=o)=0 Bが恩赦を受けるときBが死刑執行されると告げられる確率=0
P(B=t|C=o)=1 CBが恩赦を受けるときBが死刑執行されると告げられる確率=1
問題は P(B=t|A=o)
恩赦を受けるのがAであるときに看守がCではなくBが死刑執行されると告げる確率は示されていない。
この確率をpとすると
P(A=o|B=t)は p/(p+1)となる。
もちろんp=0.5であれば、P(A=o|B=t)=1/3と看守に告げられる前と同じである。
ここでpが一様分布からさまざなβ分布に従うとするとどうなるか、グラフにしてみた。
URLリンク(i.imgur.com)
左の緑が看守がBとCが死刑執行予定であるときにBを選んで答える確率分布。
右の青が看守がBと告げたときのAが恩赦を受ける確率の分布。
449:132人目の素数さん
18/01/03 21:01:24.21 YJfyxrv+.net
無情報分布として一様分布を考えると
Aが恩赦を受ける確率の期待値(平均値)は
> 1-log(2)
[1] 0.3068528
となる。
p/(p+1)を [0,1]で定積分すれば求まる。
前述のJAGSでシミュレーションしたグラフに表示したもほぼ一致。
450:132人目の素数さん
18/01/03 21:17:04.59 YJfyxrv+.net
(タイプミス修正)
死刑囚A,B,CでAが看守に尋ねてBは死刑執行されると告げられたと設定。
恩赦(onsha)を受けるをo,死刑執行されると告(tsuge)げられるをtで表す。
Aが恩赦を受ける確率P(A=o)=1/3
Bが恩赦を受ける確率P(B=o)=1/3
Cが恩赦を受ける確率P(C=o)=1/3
求めたいのは、Bが死刑執行されると告げられた後のAが恩赦を受ける確率P(A=o|B=t)である。
ベイズの公式により
P(A=o|B=t) = P(B=t|A=o)*P(A=o) / P(B=t)
P(B=t) = P(B=t|A=o)*P(A=o) + P(B=t|B=o)*P(B=o) + P(B=t|C=o)*P(C=o)
P(B=t|B=o)=0 Bが恩赦を受けるときBが死刑執行されると告げられる確率=0
P(B=t|C=o)=1 Cが恩赦を受けるときBが死刑執行されると告げられる確率=1
問題は P(B=t|A=o)
恩赦を受けるのがAであるときに看守がCではなくBが死刑執行されると告げる確率は示されていない。
この確率をpとすると
P(A=o|B=t)は p/(p+1)となる。
もちろんp=0.5であれば、P(A=o|B=t)=1/3と看守に告げられる前と同じである。
ここでpが一様分布からさまざなβ分布に従うとするとどうなるか、グラフにしてみた。
URLリンク(i.imgur.com)
左の緑が看守がBとCが死刑執行予定であるときにBを選んで答える確率分布。
右の青が看守がBと告げたときのAが恩赦を受ける確率の分布。
451:132人目の素数さん
18/01/03 21:18:40.64 ve03RCFR.net
看守は何人いるんだ?
452:132人目の素数さん
18/01/03 21:19:44.92 YJfyxrv+.net
無情報分布として一様分布を考えると
Aが恩赦を受ける確率の期待値(平均値)は
> 1-log(2)
[1] 0.3068528
となる。
Cが恩赦を受ける確率の期待値(平均値)は
> log(2)
[1] 0.6931472
当然、Bが恩赦を受ける確率は0
453:132人目の素数さん
18/01/03 21:23:08.80 YJfyxrv+.net
>>436
看守は一人。
まあ、確率分布を何人もいたときの複数の看守意見の分布と考えてもいいけどね。
454:132人目の素数さん
18/01/03 21:58:15.94 YJfyxrv+.net
>>431
俺が高校生の頃に聞いた問題だと
本人には死刑になると教えない
という設定だった。
何も知らないとAは死刑になる確率が2/3。
B、Cのうち少なくともどちらかは死刑になるので本人じゃないAに死刑になる人を一人教えてくれと看守に頼んでBと教わった。
それでAは自分かCのどちらかが死刑になるが確率は1/2に減ったと喜んだ。
これは正しいか?
という問題だったな。
455:132人目の素数さん
18/01/04 00:26:43.93 dMZFg8dN.net
■2つの封筒問題(two envelopes problem)
2種類の小切手があり、1つの小切手には
他方の4倍の金額が書き込まれています
中身が分からないように、それぞれ封筒に入れます
あなたは、どちらか1つの封筒を選ぶことができます
封筒を開けると10万円の小切手が入っていました
もし不満なら、残りの封筒と交換できます
あなたは交換しますか?しませんか?
456:132人目の素数さん
18/01/04 01:19:46.48 7TmRrDht.net
>>440
1万と100万が入っているのはそれぞれ1/2
よって、期待値は50万となるため、入れ替えが良い
457:132人目の素数さん
18/01/04 08:48:41.71 UEiSPdrw.net
>>440
>>441の有難い話が本当なら、
10万円が交換�
458:キるだけで 期待値が、5倍にupぢゃ。 きっとさらに、交換すれば5倍の5倍 ぢゃから、10倍にupするハズぢゃ スナワチ、100万円ぢゃ! ワシなら2回交換するぞ。
459:132人目の素数さん
18/01/04 09:06:51.37 WqG62CGY.net
>>441
100万/10万なのか10万/1万なのか、前者の確率をpとして
pの確率分布を考えるのがベイズ流だろね。
460:132人目の素数さん
18/01/04 12:00:36.09 rTIHbEtO.net
100万円が含まれている確率をpとして
pの確率分布を事前分布として
B_kokan <- function(p,A=10^5,n=10)p*A*n+(1-p)*A/n
がどう変わるかみればいい。
グラフにしてみた。
URLリンク(i.imgur.com)
461:132人目の素数さん
18/01/04 12:22:41.37 7VxnZUcj.net
>>443
ベイズ統計だと
1/10
10/100
100/1000
1000/10000
はみなちがいますね
462:132人目の素数さん
18/01/04 14:55:23.69 rTIHbEtO.net
>>435
恩赦を受けるのがAであるとき(=BとCに死刑執行されるとき)に看守が、死刑執行されるのはBであると告げる確率 P(B=t|A=o) を横軸
死刑執行されるのはBであると告げられたときに恩赦を受けるのがAである確率 P(A=o|B=t) を 縦軸に グラフにしてみる。
URLリンク(i.imgur.com)
463:132人目の素数さん
18/01/04 16:17:35.72 rTIHbEtO.net
看守が嘘つきであった場合
看守が嘘を答える確率はqで一定である。
但しBとCが死刑執行予定であるときどちらを答えても嘘にならないのでBと答える確率をpとする。
この看守がBが死刑執行される予定であると答えたとき、Aが恩赦を受ける確率はいくらか?
464:132人目の素数さん
18/01/04 16:25:43.20 rTIHbEtO.net
恩赦を受けれる可能性は殺人件数に逆比例するという情報が得られた。
ABCの殺人件数をa,b,c とする。
看守がBが死刑執行されると告げたときのAの恩赦の確率はどうなるか?
465:132人目の素数さん
18/01/04 16:33:28.02 rTIHbEtO.net
>>448
これでいいと思う。
p*(a/(a+b+c))/ ( p*(a/(a+b+c)) + q*(b/(a+b+c)) + (1-q)*(c/(a+b+c)) )
466:132人目の素数さん
18/01/04 16:35:12.70 rTIHbEtO.net
>>449
これだと恩赦確率が殺人件数比例になってしまうな。
考え直そう。
467:132人目の素数さん
18/01/04 16:37:28.69 rTIHbEtO.net
>>450
間違えてない気もしてきた。
ご意見募集。
468:132人目の素数さん
18/01/04 16:43:18.29 rTIHbEtO.net
>>451
P(A=o|B=t) = p*((1/a)/(1/a+1/b+1/c))/ ( p*((1/a)/(1/a+1/b+1/c)) + q*((1/b)/(1/a+1/b+1/c)) + (1-q)*((1/c)/(1/a+1/b+1/c)) )
だろな、たぶん。
469:132人目の素数さん
18/01/04 16:49:38.93 rTIHbEtO.net
Onsha <- function(a,b,c,p,q) {
p*((1/a)/(1/a+1/b+1/c))/ ( p*((1/a)/(1/a+1/b+1/c)) + q*((1/b)/(1/a+1/b+1/c)) + (1-q)*((1/c)/(1/a+1/b+1/c)) )
}
> Onsha(10,10,10,0.5,0)
[1] 0.3333333
> Onsha(10,10,10,0.5,0.3)
[1] 0.3333333
> Onsha(10,20,30,0.5,0.3)
[1] 0.5660377
恩赦確率が同じときは、看守の嘘つき確率の影響は受けないね。
470:132人目の素数さん
18/01/04 17:07:57.72 i/K9ABI7.net
さいころ振ったら6が出ました
つぎに6が出る確率はどうなる?
1 低くなる
連続で6が出る可能性はひくい
2 変わらない
6が出る確率は前に何が出たか影響を受けない
3 高くなる
さいころがいかさまの可能性があるから
471:132人目の素数さん
18/01/04 19:22:37.86 a4WHGiLz.net
>>448
囚人A,B,Cの殺人件数を3,6,9人とする。
罪状の重さに逆比例して恩赦が受けられるという。
恩赦の受けられる確率分布はディリクレ分布に従うとして
最小母数が1となるようにして母数alphaは3,1.5,1とする。
BとCが死刑執行されるときに看守がBが死刑と答える確率は一様分布に従う
看守が嘘をつく確率も一様分布に従うとする。
JAGSのスクリプトだとこんな感じ
alpha=c(1/3,1/6,1/9)*9
modelString='
model{
abc ~ ddirch(alpha)
poa=abc[1] # probability of onsha of A
pob=abc[2] # probability of onsha of B
poc=abc[3] # probability of onsha of C
p ~ dbeta(1,1)
q ~ dbeta(1,1)
onsha= p*poa/ ( p*poa + q*pob + (1-q)*poc )
}
この条件のもとで
Aが恩赦を受ける確率分布は
URLリンク(i.imgur.com)
となる。
まあ、殺人件数が一番少ないAが恩赦を受ける確率が
1/3から上昇したのは納得できる結果である。
こういうのがベイズ推計の面白さであるね。
472:132人目の素数さん
18/01/04 20:57:07.68 OPGTqw0h.net
なにがなんでも、P(A=o|B=t)の
誰よりも完璧な模範解答を探るべく
>>435 の pの分布 について
一様分布ではなく
f(p) = (2/3)p + 2/3 という確率分布で
p/(p+1) の期待値は1/3になるか?
自分勝手にチャレンジしかし挫折。
一応、チャレンジ内容を説明すると
A=恩赦、B=C=死刑の時の
看守が「B死刑」と告げる確率を
P(B=t|A=o) とか、簡単にpとおく
看守が「B死刑」と告げた時の
A=恩赦、B=C=死刑の確率を
P(A=o|B=t) とおく。
すると、確かに
P(A=o|B=t) = p/(p+1) となると思う。
さて、
pの確率分布 f(p) = (2/3)p + 2/3
pの範囲[0,1] で積分値は1となるが
p/(p+1) の平均(期待値)を求めたい
でも数学得意なワシぢゃが
計算が分からん。
ここでGiveUp。