20/03/29 14:48:03.55 0jXKnAa1.net
学術の巨大掲示板群 - アルファ・ラボ
URLリンク(x0000.net)
数学 物理学 化学 生物学 天文学 地理地学
IT 電子 工学 言語学 国語 方言 など
180:132人目の素数さん
20/03/29 15:31:10 WogCQeQk.net
>>170
初期値に依存するから意味のないスクリプトであると判明したので撤回します。
181:132人目の素数さん
20/03/29 15:31:33 WogCQeQk.net
>>169
単なる数字の遊びだろうね。
182:132人目の素数さん
20/03/29 15:37:58 WogCQeQk.net
>>169
前提となっているのが、
日本人1億2680万人いるとして
日本人の感染者数が1人である確率も1億人である確率も同じと、一様分布を仮定しているのが現実離れしている。
よって現実的には意味がない。
183:132人目の素数さん
20/03/31 03:21:38.60 5/cy/U/F.net
URLリンク(youtu.be)
専門家会議がモデルを出したから議論してくれ
184:132人目の素数さん
20/03/31 06:08:43.61 2llZ2I8j.net
>>175
Reed Frost モデルかな?
何を使ったかには言及がなかった。
185:132人目の素数さん
20/03/31 06:12:02.74 2llZ2I8j.net
Reed -Frostはパラメータが1個ですむから推定しやすいんだろう。
186:132人目の素数さん
20/03/31 08:54:47.69 2llZ2I8j.net
>>76
54119人という値になった。
計算プログラムは以下の通り。
# width of 99% confidence interval when 1000 subjects are examined
p2w <- function(
prevalence,
subjects=1000,
sensitivity=0.6,
specificity=0.9,
conf.level=0.99){
# prevalence -> width of 99% confidence interval
n=subjects
p=prevalence*sensitivity+(1-prevalence)*(1-specificity) # positive rate=prev*TP+(1-prev)*FP
q=1-p
2*qnorm(1-(1-conf.level))*sqrt(p*q/n) # width of 99%CI
}
p2w=Vectorize(p2w)
prevalence=seq
187:(0,1,by=0.01) plot(prevalence,p2w(prevalence),bty='l',type='l',lwd=2,ylab='99%CI width', main='subjects:1000\nsensitivity:0.6\nspecificity:0.9') optimize(p2w,c(0,1),maximum=TRUE) # sj2w <- function(subjects){ # subjects -> maximum 99%CI width & its prevalence optimize(function(prev) p2w(prev,subjects),c(0,1),maximum = TRUE) } # at how many subjects 99%ci width equals 0.01 uniroot(function(x,u0=0.01) sj2w(x)$objective-u0,c(1000,100000))
188:132人目の素数さん
20/03/31 09:55:37.96 cpD4Fk2x.net
上って、灘校東大理IIIの超秀才のはずなのに、なんで
あんなに頭の悪い発言ばかりしてんの?
変な宗教にでも取り憑かれて理性が狂わされてるのかな?
189:132人目の素数さん
20/03/31 10:07:35.24 2llZ2I8j.net
日本人1億2680万人からX人を無作為に抽出してPCR検査して、感染者数(≠検査陽性者数)を信頼区間99%誤差±1%で検定したい。
PCR検査は感度0.6,特異度0.9とする。
何人を抽出すれば十分といえるか?
54000人程度になったけど、あってる?
190:132人目の素数さん
20/03/31 14:43:06 2llZ2I8j.net
>>179
超秀才は理Iに行くんじゃないの?
191:132人目の素数さん
20/03/31 14:50:29 ncBHjUEo.net
>>180
感染率の程度、感度・特異度の値の精度の言及無しに出された結論に、ほとんど説得力は無い。
192:132人目の素数さん
20/03/31 15:19:09 2llZ2I8j.net
>>182
感度 beta(13.6991,9.4661)でmode 0.6 sd=0.1
特異 beta(36.172,4.908) でmode 0.9 sd=0.05
でベイズの階層モデルを組んでみるかな。
193:132人目の素数さん
20/03/31 15:45:31.45 2llZ2I8j.net
>>183
そのβ分布を弱情報事前分布に設定して、乱数発生させて計算すると
54000人で99%信頼区間の幅の分布は
> summary(s2w(54000))
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.008144 0.009912 0.009981 0.009927 0.010005 0.010011
となるから、まあ、概ねあっていると思うな。
194:132人目の素数さん
20/03/31 17:50:11.35 ncBHjUEo.net
最も重要なファクターは事前感染率。
事前感染率はいくらに設定したの?
偽陽性が調査対象の10パーセント程含まれる。
医者が怪しいと判断した場合にのみ検査をする場合は、真陽性が調査対象の数十パーセントが期待できる。
このような場合は、真陽性は偽陽性より多数であることが期待でき、検査対象の正確な感染率は把握できるが、
「日本人1億2680万人からX人を無作為に抽出」のような方法だと、感染率0.01%(←現在確認できている感染者の
7倍程度が実際の感染者数に相当)辺りが妥当だと思われるが、この場合、五万人調査して、真陽性5人、偽陽性5000人
のような数字が出てくる。感染率0.02%だったとすると、真陽性10人、偽陽性5000人だ。
中央値のみで判断すると、例えば、5005人の陽性が出ると、0.01%で、5010人の陽性者が出ると0.02% のような
データが出てくる。誤差との見極めは困難。
このような数字から、信頼できる感染率が出せるのか?
195:132人目の素数さん
20/04/01 07:44:43.76 xwYPMdxl.net
>>185
一様分布
196:132人目の素数さん
20/04/01 07:48:29.51 xwYPMdxl.net
確率の分布を考えずにスポットで考える思考のやつとは議論にならんな。
ベイズ階層モデルやったことないの?
197:132人目の素数さん
20/04/01 09:12:32 bZbNlxPT.net
0%~100% までの一様分布のようだな。
つまり、事前確率全く不明だから、1/2教の経典に従い、0.5=50%でやったということ。
医者が検査を行った方がよいと判断した集団でも、なかなか有病率50%はいかない。
そのような結果は、無作為抽出で必要なの調査人数はどれくらいか等という議論では使えない。
全住民を対象にした無作為抽出なら、十
198:万人に一人 以上いる(いた)のは確実だった一方、 百人に一人 という程たくさんはいないだろう と見積もれる。0.001%~1% 辺りで行うべき。 ちょっと考えれば判ることを指摘しているに過ぎない。 調査対象の有病率0.01以下の集団に対し、特異度90%の性能の機器で調査しても、ほとんどがエラー。 せめて 有病率 は、 1-特異度 と同じオーダーか、1-特異度 より大きくないと、扱えない。 特異度99.99%の機器を用意するか、でなければ、有病率を10パーセント程度以上に煮詰めてからやれというお話。
199:132人目の素数さん
20/04/01 09:19:12 deMoC1lt.net
>>188
東京都の行政検査では陽性率が50%を越える日があるぞ。
200:132人目の素数さん
20/04/01 09:26:31 deMoC1lt.net
有病率の事前分布を一様分布として
日々の陽性数は二項分布に従うとして
オリンピック延期決定後の検査を受けた集団での有病率をMCMC出だすと
(感度特異度は既述のβ分布を仮定)
> subjects=c(74,95,87,143,244,330)
> positives=c(17,41,47,40,63,68)
> PCRs3(subjects,positives,iter=10000,warmup=1000)
mean lower upper
0.37288732 0.09822213 0.63719043
201:132人目の素数さん
20/04/01 09:31:13 deMoC1lt.net
>>188
別に有病率を(0,0.1)の一様分布にしても計算できるけど
都の行政検査も陽性率が50%を越える日もあったから一様分布でいいと思うね。行政検査に回った集団の話だけど。
感度・特異度も弱情報事前分布が設定できる。
202:132人目の素数さん
20/04/01 09:33:18 deMoC1lt.net
一変数のポイント確率しか計算できない奴との議論は不毛だね。
203:132人目の素数さん
20/04/01 09:43:53 HHJL1yTu.net
結局なんの疫学データにも基づかない、疫学データで追試することもできない、なんの理論的根拠もない統計仮説下のお話なんて統計学、疫学できないな意味なんかないんだよな。
計算機で遊んでる以上の意味なんかない。
204:132人目の素数さん
20/04/01 09:46:36 bZbNlxPT.net
>>189
だからきちんと「なかなかいかない」と書きました。
>>191
目的が「日本人1億2680万人からX人を無作為に抽出してPCR検査して、感染者数(≠検査陽性者数)
を信頼区間99%誤差±1%で検定したい。 」なのだから、あなたの主張は前提を無視ししている。
205:132人目の素数さん
20/04/01 12:55:21.15 xwYPMdxl.net
>>193
計算機で遊ぶこともできずに電卓で計算して必死で書いていて虚しくない?
CTの診断能を検討した論文。
URLリンク(doi.org)
誰でも鑑別できるのか疑問に思った
このペーパのTable 3に3人の読影医の結果が載っている。
TP FP TN FN sen spc PPV NPV accuracy
1 158 13 192 61 0.72 0.94 0.92 0.76 0.83
2 157 24 181 62 0.72 0.88 0.87 0.74 0.80
3 206 156 49 13 0.94 0.24 0.57 0.79 0.60
陽性尤度比、陰性尤度比、Diagnostic Odd Ratio(陽性尤度比/陰性尤度比)を計算して加えると
TP FP TN FN sen spc PPV NPV acc PLR NLR DOR
1 158 13 192 61 0.72 0.94 0.92 0.76 0.83 11.4 0.30 38
2 157 24 181 62 0.72 0.88 0.87 0.74 0.80 6.1 0.32 19
3 206 156 49 13 0.94 0.24 0.57 0.79 0.60 1.2 0.25 5
PPV,accuracy,DORから読影医3が劣っているようにみえる。
PPVで三者を検定してみる。多重比較になるので一番厳しいBonferri法で補正
Pairwise comparisons using Pairwise comparison of proportions
data: TP out of TP + FP
1 2
2 0.4 -
3 1e-15 2e-11
明らかに3が劣っている。
206:132人目の素数さん
20/04/01 12:55:59.40 xwYPMdxl.net
読影医1,2を加算して計算すると
感度72% [67-76]
特異度91% [88-94]
という結果が得られた。
しかし、現実には何でもコロナと診断する傾向のある読影医3も紛れこむからこういう読影医も加算して計算しないと現実的でないね。
問題
3人を統合したときの感度・特異度とその95%信頼区間を述べよ。
207:132人目の素数さん
20/04/01 12:59:59.63 YULTPcko.net
昔パソコンは習うより慣れろ、理屈なんかわからなくても使ってたらわかるってのがあったけど、まさに正反対の方向にダメダメだな。
学問に対するなんの畏敬の念もない。
208:132人目の素数さん
20/04/01 13:08:31.65 xwYPMdxl.net
>>197
>学問に対するなんの畏敬の念
ひょっとしてアホなの?
209:132人目の素数さん
20/04/01 13:14:52.37 xwYPMdxl.net
Housefield数の計算原理がわからなくても
この画像が新型コロナ肺炎かどうか、診断できる方が有用なんだよな。
URLリンク(pubs.rsna.org)
中心極限定理の証明できなくても、学問への畏敬とかなくても、二項分布を正規分布で近似して計算できる。
210:132人目の素数さん
20/04/01 18:34:14.58 zMY/D89k.net
>>168 他皆様
有名人の感染者が増えてきましたが
市中感染率に影響はないという県警でよろしいのでしょうか?
211:132人目の素数さん
20/04/02 06:13:09 +vJJzaTC.net
>>200
サンプルサイズは期待値の信頼区間幅に影響するけど期待値そのものに影響しないってことでは?
212:132人目の素数さん
20/04/02 09:26:20.10 mzm7EAoV.net
市中感染率が増加の時はもちろんそうだが、一定、あるいは、減少傾向であっても、
経過日数が多くなれば、感染者数は多くなる。
例えば、十日に一人有名人の感染が報告されるというのが継続されていたなら、感染率は一定と
考えられるが、それが、一週間に一人 → 五日に一人 → 三日に一人 → ほぼ毎日 →...
のように、報告されるペースに変化があると、感染率も変化していると考えられる。
213:132人目の素数さん
20/04/02 09:30:08.05 mzm7EAoV.net
補足だが、あまりにも、有名人感染の報告頻度が多くなると、ニュースとしての価値が低くなり、
以前であったら報告されていたであろうケースが報告されなくなるということもあるので、
その辺も考慮して考える必要はある。
214:132人目の素数さん
20/04/03 11:52:46 cch/ocoF.net
横浜市立大学データサイエンス学部佐藤彰洋教授のCOVID-19(新型肺炎)の感染拡大抑止に関する研究・検討資料内容を共有するページ
URLリンク(www.fttsus.jp)
矢原 徹一:九州大学理学研究院教授の試算
URLリンク(jbpress.ismedia.jp)
215:132人目の素数さん
20/04/04 11:37:34 ZFu90Xbq.net
SEIR MODEL
dS(t)/dt = mu*(N-S) - b*S(t)*I(t)/N - nu*S(t)
dE(t)/dt = b*S(t)I(t)/N - (mu+sig)*E(t)
dI(t)/dt = sig*E(t) - (mu+g)*I(t)
dR(t)/dt = g*I(t) - mu*R + nu*S(t)
mu:自然死亡率 b:感染率(S->I)
nu:ワクチン有効率(S->R) sig:発症率(E->I),g:回復率(I->R)
の微分方程式の数値解を使ってシミュレーション
対策しない(外出を控えず、マスクもしない)方が患者や死者は増えるけど早く収束するな。
contact_rate と trannsmission_probabilityを変化させてグラフにしてみた。
URLリンク(i.imgur.com)
216:132人目の素数さん
20/04/04 15:28:24 zerwqPau.net
一次�
217:Y業ごと消滅していいならそうかもな
218:132人目の素数さん
20/04/05 09:54:53.42 fV/kgtmE.net
オリンピック延期決定以後の東京都の行政PCR検査での陽性率をグラフにすると
URLリンク(i.imgur.com)
(陽性数より検査件数の公表は2~3日遅れる)
PCR検査は感度60%、特異度90%くらいなので検査を受けた集団の有病率はもっと多いはず。
感度(最頻値0.6 標準偏差0.1)、特異度(最頻値0.9 標準偏差0.05)のベータ分布に設定、有病率は(0,1)の一様分布でMCMCしたみた。
URLリンク(i.imgur.com)
有病率40%くらいありそうだな。
219:132人目の素数さん
20/04/05 23:57:53 fV/kgtmE.net
新型コロナ肺炎に再感染があるとして流行具合をシミュレーションしてみた。
赤が感染者
上:再感染率0%
中:再感染率1%
下:再感染1%に治癒確率を5倍にする治療薬がある場合
URLリンク(i.imgur.com)
220:132人目の素数さん
20/04/06 00:03:24 xOX4/rO7.net
>>208
準拠したモデルはこれ
SEIRS MODEL
dS(t)/dt = mu*(N-S) - b*S(t)*I(t)/N - nu*S(t) + rho*R(t)
dE(t)/dt = b*S(t)I(t)/N - (mu+sig)*E(t)
dI(t)/dt = sig*E(t) - (mu+g)*I(t)
dR(t)/dt = g*I(t) - mu*R(t) + nu*S(t) - rho*R(t)
mu:自然死亡率 b:感染率(S->I)
nu:ワクチン有効率(S->R) sig:発症率(E->I),g:回復率(I->R)
rho:再感染率(R->S)
Rのスクリプトはここに置いた
スレリンク(hosp板:417番)-420
221:132人目の素数さん
20/04/06 01:00:30.67 taqqH9Ce.net
>>207
疑い例だけに絞って検査してるんだから、有病率が高いのは当たり前。
検査を拡大すれば感染者数は増えるが、有病率はぐっと下がるだろう。
222:132人目の素数さん
20/04/06 05:54:28.61 xOX4/rO7.net
>>210
検査を受けた集団の有病率の事前分布を(0,0.2)に設定して実行すると
URLリンク(i.imgur.com)
MCMCで感度や特異度の事後分布が出せるのが面白い。
223:132人目の素数さん
20/04/06 08:06:29.84 xOX4/rO7.net
>>209
基本的に鎖国しているモデルだから、
入国者や出国者による人口増減とその保菌率・感染率を組み込んだモデルにしないと実態にそぐわないな。
昨今、輸入されているコロナの発症率・回復率などが異なるとすると益々、複雑なモデルになっちゃう。
224:132人目の素数さん
20/04/06 16:39:50 taqqH9Ce.net
死者数が少ないのは注目すべきことだけど、それもいつまで続くか、、、
発症から集中治療室に入るまで2週間弱。死ぬまでがさらに一週間。
ってことは、この2週間での感染者激増が死者数に反映するまで、
あと一週間かかるってこと。
重症者の激増もそろそろ始まることだと思われる。
検査数とか感染者数、重症者数etc.を可視化したデータってここくらいか?
URLリンク(toyokeizai.net)
225:132人目の素数さん
20/04/06 17:50:09 taqqH9Ce.net
韓国は46万件の検査で感染者が1万人。
感染かどうかをどう確定したのか知らないけど、有病率が2%だと
すれば、特異度がよほど高くないと、陽性者のかなりの割合が
偽陽性ってことになりそう。
226:132人目の素数さん
20/04/06 22:07:12.60 Sgr4CLg/.net
>>207
東京都は陽性者数は公表しても検査人数を迅速に公表しないのでRのパッケージAmeliaを使って多重代入法による欠測データ処理してみる。
#
subjects=c(74,95,87,143,244,330,41,145,164,469,NA,NA,NA)
positives=c(17,41,47,40,63,68,13,78,66,97,89,117,143)
(dataset=data.frame(subjects,positives))
# 検査実施人数を欠測データとしてAmeliaで推定
library(Amelia)
na.idx=which(is.na(subjects))
M=1000
set.seed(1234) ; a.out=amelia(dataset,m=M)
imp=a.out$imputations
NAsubject=NULL
for(i in 1:M){
NAsubject=rbind(NAsubject,imp[[i]][na.idx,1])
}
missing.data=round(apply(NAsubject,2,mean))
subjects[na.idx]=missing.data
227: PCRs3(subjects,positives,iter=10000,warmup=1000,verbose=TRUE) 行政検査例の有病率と95%信頼区間 mean lower upper 0.3745734 0.1048757 0.6575508 https://i.imgur.com/DxVNXad.png
228:132人目の素数さん
20/04/07 07:24:45.67 TwUCHcsI.net
4月5日の陽性者数が検査人数より多いのは単純ミス?
URLリンク(stopcovid19.metro.tokyo.lg.jp)
Ameliaでの欠測推測を確認しようと思ったのにもとのデータがあてにならない。
229:132人目の素数さん
20/04/07 07:48:06 TwUCHcsI.net
晋型コロナ肺炎に感度0.9,特異度0.9の迅速検査が開発されたと仮定する。
日本人1億2595万人からX人を無作為抽出して有病率を推定したい。
有病率の99%信頼区間幅を1%以内で検定したい。
何人を抽出すれば十分といえるか?
230:132人目の素数さん
20/04/07 08:24:28 TwUCHcsI.net
>>76
感度0.6 特異度0.9として1000人検査したときはの有病率の99%信頼区間幅は何%以内におさまるか?
231:132人目の素数さん
20/04/07 10:09:26.39 /UNISUK0.net
>>216
検査結果の集計日と、対応する検査数の集計日が揃ってないからかもね。
データがあてにならないのはその通りかも。
232:132人目の素数さん
20/04/07 20:47:10.10 /iaYsYaQ.net
URLリンク(imgur.com)
スプレッドシートのgrowthで予測してみると、9月には人類滅亡しそうです。
元データは
URLリンク(www.worldometers.info)
233:132人目の素数さん
20/04/07 21:10:10.27 TwUCHcsI.net
ソース不明な数字だけど
"名前:名無しさん@1周年[sage] 投稿日:2020/04/07(火) 20:29:49.57 ID:GcsEpAfR0 (PC)
他国の総感染者数が今の日本と同程度の時の死者数
イタリア, 感染3089人 死者107人
スペイン, 感染2965人 死者 84人
アメリカ, 感染3499人 死者 64人
イラン , 感染3513人 死者107人
フランス, 感染3661人 死者 79人
日本 , 感染3123人 死者 77人
"
country=c('イタリア','スペイン','アメリカ','イラン','フランス','日本')
infected=c(3089,2965,3499,3513,3661,3123)
dead=c(107,84,64,107,79,77)
df=data.frame(country,dead,infected)
df
re.lm=lm(dead~infected,data=df)
summary(re.lm)
chisq.test(dead,infected)
names(infected)=country
names(dead)=country
pairwise.prop.test(dead,infected)
> chisq.test(dead,infected)
Pearson's Chi-squared test
data: dead and infected
X-squared = 24, df = 20, p-value = 0.2424
Warning message:
In chisq.test(dead, infected) : Chi-squared approximation may be incorrect
> pairwise.prop.test(dead,infected)
Pairwise comparisons using Pairwise comparison of proportions
data: dead out of infected
イタリア スペイン アメリカ イラン フランス
スペイン 1.00000 - - - -
アメリカ 0.00066 0.11005 - - -
イラン 1.00000 1.00000 0.01762 - -
フランス 0.01843 0.79242 1.00000 0.24130 -
日本 0.24724 1.00000 0.79242 1.00000 1.00000
P value adjustment method: holm
234:132人目の素数さん
20/04/08 00:23:04 KlmY0AUa.net
アメリカの致死率高くない?
現時点での死者数と感染者数からだと3%くらいなんだが、これは
見かけ上の数値で、実際には発症から死亡まで2週間以上かかかる
から、10日くらい前の感染者数を分母にしないと見誤る。
で、このタイムラグを考慮にいれると少なくとも10%くらいの致死率
になりそ。日本の2,3倍になる計算だ。
235:132人目の素数さん
20/04/08 00:27:12 KlmY0AUa.net
>>221
その数字もタイムラグを考慮に入れないと致死率を見誤るよ。
感染者の増大率が大きいところでは、死者数を過小評価する。
たとえば2週間後の死者数で比較すべき。
236:132人目の素数さん
20/04/08 19:19:57.90 gX6rmgSD.net
>>223
感染から死亡までの期間は一定でないからどうだろね。
237:132人目の素数さん
20/04/08 19:24:23.22 gX6rmgSD.net
SEIRモデルに再感染(免疫を失ってR からSへの変遷)があるとしてグラフ化してみた。
1万人に1人の感染者と9人の保菌者がいるとして、
再感染率0%のとき
URLリンク(i.imgur.com)
再感染率0.1%(1000人に1人の割合で免疫を失う)場合
URLリンク(i.imgur.com)
再感染率0.1%で外出自粛等で接触が8割減になった場合
URLリンク(i.imgur.com)
238:132人目の素数さん
20/04/09 01:14:30 m5ECJkjO.net
>>224
まあ、発症してすぐ感染が発覚するわけでもないから、
症状がある程度続いてから陽性判定されるとすれば、
10日前後のディレイかな。しかも、どのくらいの分散
かわかんないけど、正規分布で畳み込んだ感じで。
239:132人目の素数さん
20/04/09 02:02:32 m5ECJkjO.net
英国もフランスも致死率高いな。
のきなみ10%越え。
240:132人目の素数さん
20/04/09 02:09:10 NyLklR2N.net
英国とフランスは医療崩壊してるの?
241:132人目の素数さん
20/04/09 09:37:43.05 m5ECJkjO.net
しらんがな
242:132人目の素数さん
20/04/09 11:57:57 cpUiyQfM.net
これこそ、国を守るってことだな。
キューバ政府は2020年3月24日(火)以降、外国人観光客の入国を認めないと発表しました。
キューバに入国できるのは居住者のみで、これには出張で短期または長期滞在する外国人も含まれます。
加えて、キューバに入国する人は全員14日間隔離されます。
商業活動は維持されますが、商船や航空機の乗務員の移動は制限されます。キューバの領空は封鎖されません。
今回の制限措置は30日間有効で、状況に応じて延長される可能性もあります。
243:132人目の素数さん
20/04/09 12:26:32 cpUiyQfM.net
>>216
オリンピック延期決定以降のデータで検討
陽性人数が検査人数を上回るデータは検査人数を欠測データ(NA)として計算する。
dates subjects positives
1 2020-03-24 74 17
2 2020-03-25 95 41
3 2020-03-26 87 47
4 2020-03-27 143 40
5 2020-03-28 244 63
6 2020-03-29 330 68
7 2020-03-30 41 13
8 2020-03-31 145 78
9 2020-04-01 164 66
10 2020-04-02 469 97
11 2020-04-03 551 89
12 2020-04-04 NA 117
13 2020-04-05 NA 143
14 2020-04-06 356 83
15 2020-04-07 271 79
16 2020-04-08 NA 144
その設定で
# LittleのMCAR検定 データが MCAR または MAR であるという帰無仮説のもとで検定
library(BaylorEdPsych)
LittleMCAR(dataset)$p.value
LittleMCAR(dataset)$p.value
this could take a while[1] 0.004907289
有意差がでて出鼻をくじかれた
244:132人目の素数さん
20/04/09 14:54:07 pa+n/S2z.net
URLリンク(twitter.com)
(deleted an unsolicited ad)
245:132人目の素数さん
20/04/10 00:25:10 EjAtBG4Z.net
日本もすでに欧州同様指数関数ラインにのってる模様、
URLリンク(i.imgur.com)
欧州並になるのは文字通り時間の問題かと
日本のコロナ感染発覚者数
3月24日 1193
3月25日 1307
3月26日 1387
3月27日 1499
3月28日 1693
3月29日 1866
3月30日 1953
3月31日 2178
4月 1日 2384
4月 2日 2617
4月 3日 2935
4月 4日 3139
4月 5日 3654
4月 6日 3906
4月 7日 4257
4月 8日 4667
オリンピック延期決定
246:した3月24日をDay1として線形回帰すると https://i.imgur.com/Q45Xo8V.png y=c(1193,1307,1387,1499,1693,1866,1953,2178,2384,2617,2935,3139,3654,3906,4257,4667) z=as.Date("2020-03-24")+ 0:(length(y)-1) plot(z,y,bty='l',pch=19) x=1:length(y) plot(x,y,bty='l') (re.lm=lm(log(y)~x)) b0=re.lm$coef[1] b1=re.lm$coef[2] names(b0)='' f <- function(x) exp(b0)*exp(b1*x) # 1059.063*exp(0.09231543*x) curve(f(x),add=T) n=1:50 plot(n,f(n),bty='l') f1 <- function(y) print(log(y*exp(-b0))/b1 + as.Date("2020-03-24"),quote=F) f1(c(5000,1e4,5e4,1e5,5e5,1e6,1e7,1e8,1.2595e8)) 感染者が5千、1万、5万、10万、50万、百万、1千万、1億、1億2595万人に達する日は > f1(c(5000,1e4,5e4,1e5,5e5,1e6,1e7,1e8,1.2595e8)) [1] 2020-04-09 2020-04-17 2020-05-04 2020-05-12 2020-05-29 [6] 2020-06-06 2020-07-01 2020-07-26 2020-07-28
247:132人目の素数さん
20/04/10 06:57:42.69 EjAtBG4Z.net
>>233
1日ずれていた。
> f1(c(5000,1e4,5e4,1e5,5e5,1e6,1e7,1e8,1.2595e8,77e8))
[1] 2020-04-10 2020-04-17 2020-05-04 2020-05-12 2020-05-29
[6] 2020-06-06 2020-07-01 2020-07-26 2020-07-28 2020-09-10
世界の人口77億人にたっするのは9月10日となった。
248:132人目の素数さん
20/04/10 07:03:11.67 EjAtBG4Z.net
>>216
行政検査人数と医療機関の行った検査も含めて、陽性者数を公表しているだけみたいだな。
これじゃぁ、陽性率も有病率も何の解析もできない。
249:132人目の素数さん
20/04/10 07:18:35.21 EjAtBG4Z.net
URLリンク(toyokeizai.net)
のデータ使って
全国と東京の線形回帰の係数を比べると
全国
Call:
lm(formula = log(y) ~ x)
Coefficients:
(Intercept) x
6.84962 0.09253
東京
Coefficients:
(Intercept) x
5.1707 0.1332
東京の方が感染者増加速度が速いね。
東京都の人口13,951,636(令和2年1月1日現在) に達する日は
> f1(13951636)
2020-06-15
となった。
250:132人目の素数さん
20/04/10 07:23:05.91 EjAtBG4Z.net
今日の東京の感染者予想人数は
> d2i("2020-4-10")
daily total
241.1515 1934.2759
251:132人目の素数さん
20/04/10 11:19:37 oS02oOtl.net
URLリンク(pbs.twimg.com)
このグラフを見ろ
252:132人目の素数さん
20/04/10 11:22:37 wWOTJ0FB.net
>>238
だから何なの?
253:132人目の素数さん
20/04/10 11:47:04.58 EjAtBG4Z.net
感染者数の増加は直線より指数関数の方がフィットするな。
URLリンク(i.imgur.com)
254:132人目の素数さん
20/04/10 12:02:00 K2O0fmDQ.net
>>238
エクセルのグラフって、マークと曲線がちょっとずれるよね。
ってか、凡例までそうなってて、すっごく気持ち悪い。
なんでだろ?
255:132人目の素数さん
20/04/10 12:04:52 K2O0fmDQ.net
有名人の感染がボチボチ出てくるってことは、市中感染率も
それなりに高いんだろうな。0.1%は超えてそう。
256:132人目の素数さん
20/04/10 14:27:39 XjWf1V4z.net
>>242
120万人罹患してるってこと?
発症者が5000人いってないのに?
発症率0.4%しかない雑魚ウィルスならサイトカインストームなんて起こさないでしょ?
これウィルスが強すぎて免疫系が異常に発動して起こるもんらしいから。
257:132人目の素数さん
20/04/10 14:29:22 XjWf1V4z.net
あ、0.1%か。
12万人で発症率4%。
どのみちないだろな。
258:132人目の素数さん
20/04/10 14:58:22 K2O0fmDQ.net
>>244
0.1%ってのはあくまで都内や大阪を想定した推測ね。
259:132人目の素数さん
20/04/10 15:52:37.05 Qxo2/Tvi.net
>>216
これひどいよなぁ
陽性率隠しの一環にしか見えない
そもそも陽性者数と検査数って普通に検査してりゃ一対一で対応するだろ
各検査機関がそれらを普通に出せば足し合わせるだけでいい
260:132人目の素数さん
20/04/11 01:01:52 g/e7gi/j.net
そういうミスは統計資料にはつきもの。それでもデータさえ
多ければ大勢に影響なし。
261:132人目の素数さん
20/04/11 06:07:34 Dikmq831.net
>>8
優秀ですね
262:132人目の素数さん
20/04/11 13:47:45 mKhDXvLi.net
東京都のこのデータを使って
URLリンク(stopcovid19.metro.tokyo.lg.jp)
オリンピック延期決定前後で陽性者の増え方に違いがあるかをグラフにしてみた。
URLリンク(i.imgur.com)
黒塗り丸が延期決定前で黒線がその回帰曲線1日毎に1.078594 倍に増加
赤丸が延期決定後で赤線がその回帰曲線 1日毎に1.136801 倍に増加
青は全体での回帰曲線 1日毎に1.088687 倍に増加
263:132人目の素数さん
20/04/11 15:33:13 mKhDXvLi.net
>>247
集計ミスじゃなくて、集計デザインそのものに問題があるよ。
陽性数は東京都全部の集計なのに、検査数は行政検査だけで指定医療機関での検査を除外している集計している。
これじゃ陽性率から有病率を推測するのも不可能。
264:132人目の素数さん
20/04/11 17:18:33.74 HlGO5aHy.net
風邪ひいたみたい。感染予防には抜かりはないのに、
265:132人目の素数さん
20/04/11 21:40:53.17 vjB1aI8B.net
ランダムに検査して、感染者数を推定してほしいんだけな
266:132人目の素数さん
20/04/12 09:01:25.70 uhjyERyF.net
オーストリアがやったらしいよ。
それによりますと、全体のおよそ0.3%が陽性と判定され、分析の結果、この時期に少なくとも1万200人、最大で6万7400人が感染していた可能性があることがわかったということです。
オーストリアの人口はおよそ890万人で、政府は最も可能性が高い数字として、この時期におよそ2万8500人が感染していたと推定しています。
267:132人目の素数さん
20/04/12 09:56:34.10 uhjyERyF.net
>>253
コピペしそこなったけど、検査は1533人に施したそうだ。
感度100%、特異度100%の完璧な検査だったと仮定して、サンプルサイズ1500と
サンプル比率0.3%で、信頼度95%で推定すると母集団での比率は0.12%~0.7%
くらいだと推定できるから、オーストリア政府発表と一致するね。そういう
単純な計算なのかねぇ?
268:132人目の素数さん
20/04/12 10:02:10.44 uhjyERyF.net
もひとつコピペし忘れた、判明している感染者数は12,200人ね。
特異度が100%って考えにくいから、まあ、結構な捕捉率じゃねーの?
>当時医療機関などで確認されていた感染者はおよそ1万2200人だったことから、
>政府は、実際に感染していた人は公表の2倍以上に上るとみられるとしています。
269:132人目の素数さん
20/04/12 12:34:54.53 QLYmTD4y.net
>>254
1533*0.3/100=4.6だけど陽性は5人?
270:132人目の素数さん
20/04/12 12:40:40.53 +MLUgV1E.net
>>254
95%信頼区間も計算方法がいくつかあるよね。
> binom::binom.confint(5,1533)
method x n mean lower upper
1 agresti-coull 5 1533 0.003261579 0.0011557601 0.007850672
2 asymptotic 5 1533 0.003261579 0.0004073974 0.006115760
3 bayes 5 1533 0.003585398 0.0009655853 0.006611832
4 cloglog 5 1533 0.003261579 0.0012670654 0.007342721
5 exact 5 1533 0.003261579 0.0010598477 0.007594894
6 logit 5 1533 0.003261579 0.0013582045 0.007811457
7 probit 5 1533 0.003261579 0.0013079622 0.007530462
8 profile 5 1533 0.003261579 0.0011715789 0.006997012
9 lrt 5 1533 0.003261579 0.0011411357 0.006992346
10 prop.test
271: 5 1533 0.003261579 0.0012013872 0.008065116 11 wilson 5 1533 0.003261579 0.0013939315 0.007612501
272:132人目の素数さん
20/04/12 13:03:50.97 +MLUgV1E.net
有病率:一様分布
感度:最頻値0.6標準偏差0.1のベータ分布
特異度:最頻値0.9標準偏差0.05のベータ分布
として検査陽性数は有病率*感度+(1-有病率)*(1-特異度)の確率に従う二項分布
というモデルでMCMCすると
URLリンク(i.imgur.com)
有病率
mean lower upper
0.002678327 0.000029215 0.005582318
感染者数
> c(0.002678327, 0.000029215, 0.005582318)*8900000
[1] 23837.11 260.01 49682.63
という結果になった。
検査陽性数が少ないから信頼区間幅が広くなるなぁ。
エントリーに5以下があると正規分布での近似が悪くなると習ったような記憶がある。
273:132人目の素数さん
20/04/12 17:10:06 uhjyERyF.net
>>256
それは書いてないけど、そうなるよね。陽性は4人か5人だろうね。
274:132人目の素数さん
20/04/12 17:23:55 uhjyERyF.net
>>258
意外と特異度が高いんだよねぇ。99%をゆうにこえるとは...。
ってことは、検査数を増やしても偽陽性に惑わされる心配はあまりないってことか。
この調査から言えることは、検査の特異度がかなり高いってことと、有病率の上限
が1%には届かないと見積もれることかな?
275:132人目の素数さん
20/04/12 20:15:06 NHP4603i.net
最終的に陽性と判断されたのは、1500件中、4,5件だと思われるが、
これは、PCR検査機器の性能チェックじゃ無く、有病率の調査なんだから、
陽性とでた場合には、PCR機器をもう一度回したかもしれないし、
その人を呼んで、再度検体を採取してチェックしたのではないか?
具体的には、一次検査では、1500件中150件ほど陽性が出る。
この150人に対し、再調査を指示して、20件ほど陽性が出る。
この20人に対し、三次検査、四次検査を行って、最終的に4件程が陽性だと判断したと。
検査機器自体の特異度が高いのではなく、運用による効果だと考える方が無難では?
276:132人目の素数さん
20/04/12 20:37:37 t0enBOyQ.net
ドメイン知識ゼロ感
277:132人目の素数さん
20/04/12 21:48:49.76 +MLUgV1E.net
>>260
特異度の事前分布を最頻値0.9標準偏差0.05にした影響かと思って
特異度の事前分布を最頻値0.5 標準偏差0.2にしてMCMCしても同様の結果だった。(感度は最頻値0.6標準偏差0.1で同じ設定)
PCRs2(1533,5,SEN=0.6,SPC=0.5,SD1=0.1,SD2=0.2)$fit
Inference for Stan model: model3.
4 chains, each with iter=2000; warmup=1000; thin=1;
post-warmup draws per chain=1000, total post-warmup draws=4000.
mean se_mean sd 2.5% 50% 97.5% n_eff Rhat
prev 0.00273 0.00005 0.00249 0.00010 0.00200 0.00912 2406 1.0011
sen 0.57489 0.00205 0.10047 0.37477 0.57377 0.76629 2403 1.0009
spc 0.99592 0.00004 0.00182 0.99181 0.99613 0.99882 2203 1.0007
p 0.00559 0.00003 0.00185 0.00258 0.00539 0.00975 3191 1.0000
lp__ -72.11408 0.03392 1.22437 -75.33316 -71.80596 -70.68418 1303 1.0048
prev:prevalence 有病率
sen : sensitivity 感度
spc : specificity 特異度
278:132人目の素数さん
20/04/12 23:37:41 NHP4603i.net
以前、>>188 で
>>せめて 有病率 は、 1-特異度 と同じオーダーか、1-特異度 より大きくないと、扱えない。
と指摘したことがあります。>>260や、>>263の結果は、将にこれを実証したといえそうですね。
主語を、特異度に変えると、
「特異度は 1-有病率 と同じオーダーか、1-有病率 より大きくないと、扱えない。」となります。
279:132人目の素数さん
20/04/12 23:39:41 NHP4603i.net
上の 260へのリンクは、>>258の間違いです。
280:132人目の素数さん
20/04/12 23:59:37 NHP4603i.net
>>264 さらに訂正
誤:「特異度は 1-有病率 と同じオーダーか、1-有病率 より大きくないと、扱えない。」
正:「1-特異度は 有病率 と同じオーダーか、有病率 より小さくないと、扱えない。」
281:132人目の素数さん
20/04/13 05:55:48.12 qYuv8ZQx.net
1-特異度=偽陽性率
282:132人目の素数さん
20/04/13 05:58:17.03 qYuv8ZQx.net
HIV検査などは有病率<偽陽性率だが、だからといって扱えないわけではない。
283:132人目の素数さん
20/04/13 06:14:55.51 qYuv8ZQx.net
陽性(陰性)的中率や精度は有病率に左右されるけど、陽性(陰性)尤度比や診断的オッズ比は有病率には左右されない。
ただ、これだけの話。
284:132人目の素数さん
20/04/13 06:56:13.98 qYuv8ZQx.net
臨床の世界では、陽性尤度比が10以上、陰性尤度比が0.1以下なら有用な検査とされる。
5以上、0.5以下なら、参考にはなるという程度だな。
Evidence-Based Physical Diagnosis, 4e だと3以上、0.3以下としている。
285:132人目の素数さん
20/04/13 09:47:52 5wetDrgQ.net
>>268
>>188などの書き込みは、>>180の問いに対する流れで書かれたものであって、
そこで書かれた「扱えない」は、「有病率の調査として誤差が大きすぎて使えない」という意味。
「検査自体が無意味」等というような意味で使っていたかのような誤解を与えかねない268の書き込みは、
話のすり替えであり、不適当であることを指摘しておく。
286:132人目の素数さん
20/04/13 10:35:51.38 LCm4R7zM.net
>>269
思うに、臨床の場では陽性が疑わしい患者をみるから、
「市中での」有病率はあまり関係ないってことなんじゃ
ないかな?
陽性かどうか五分五分という状況で検査すると思えば、
事前確率が50%という仮定(有病率50%に対応)になって、
陽性判定が真の陽性である確率と偽の陽性である確率との
比は感度/(1-特異度)になる。これが陽性尤度比だよね?
287:132人目の素数さん
20/04/13 15:30:20 SYLNYopk.net
感度0.6 特異度0.9の検査で1533人検査して3例陽性であった、有病率を計算せよ
という問題をやってみるといいね。
解答不能になる。
288:132人目の素数さん
20/04/13 15:39:19 SYLNYopk.net
1533例中5例陽性のとき、弱情報事前分布を以下のように
有病率:一様分布
感度:最頻値0.6標準偏差0.1のベータ分布
特異度:最頻値0.5標準偏差0.2のベータ分布
として検査陽性数は有病率*感度+(1-有病率)*(1-特異度)の確率に従う二項分布
としてJAGSでMCMCしてみた。的中率・精度・尤度比・診断的オッズ比の分布も出してみた。
URLリンク(i.imgur.com)
URLリンク(i.imgur.com)
289:132人目の素数さん
20/04/13 17:12:33.46 SYLNYopk.net
>>273
>253の数字だと陽性数は5人なので1533人検査して5人陽性とする。
有病者の人数をxとすると 0.6x+(1-0.9)(1533-x)=5を解くとありえない数値になるね。
感度0.6特異度0.9という前提が間違っていると考えると、どんな値が尤もらしい値なのかを探求したくなる。
MCMCはその手段を与えてくれる。
290:132人目の素数さん
20/04/13 19:03:16 LCm4R7zM.net
>>275
よくわかんないのは、たとえサンプル集団の有病者が0でも、特異度が
99.5%なら陽性判定は7人出るはずなので、陽性5人だとXは解無しに
なるんじゃね?それでも特異度が99.5%である確率はゼロではないって
なんか不思議。
291:132人目の素数さん
20/04/13 19:05:13 LCm4R7zM.net
>>276
あ、わかった、そのサンプルではたまたま特異度が99.7%より高い
試行にあたったと考えりゃいいわけね。
スマソ。
292:132人目の素数さん
20/04/14 02:28:37.10 s2XHPXPF.net
>>277
なんでもかんでも確率変数にして
実測値から確率分布がどう変化するかをみるのがベイズだと思っている。
件の話では感度も特異度も定数とは考えないで話を進めちゃう。
犬三匹本のKruscke 曰く
The role of data is to re-allocate credibitity across possibilities.
We reallocte credibitility to paramete values t
293:hat are consistent with the data. p値ですら確率分布を考えうる。 p<0.05だから有意差あり、とドヤ顔で言っている奴にp値の95%信頼区間はどれくらいですかと聞くと唖然するね。 (アホ扱いされないように自分で計算してからすべき質問) なんでも確率変数と考えるとこんなのもあり。 平均100 標準偏差15で定義される知能指数で 標準大学の新入生の知能指数の平均が100 裏口医大の新入生の知能指数の平均が85であったとする。 どちらも新入生は100人として各大学から1/10を無作為抽出して知能指数をt検定したときのp値の期待値、中央値を求めよ。 また、p値が0.05以上になって裏口医大の新入生の知能指数は統計的に有意差はないと主張できる確率はいくらか? 知能指数が正規分布するとして乱数発生させてシミュレーションしたら Min. 1st Qu. Median Mean 3rd Qu. Max. 0.0000002 0.0092459 0.0388977 0.1082749 0.1295300 0.9942922 とう結果が得られた。
294:132人目の素数さん
20/04/14 06:19:07.84 s2XHPXPF.net
typo 修正
We reallocate credibitility to parameter values that are consistent with the data.
295:132人目の素数さん
20/04/14 09:48:43 RnKKsh7J.net
>>278
なるほどね。
>なんでもかんでも確率変数にして
でも、それぞれの確率変数がどういう意味を持つのか
いちいち考えないと気がすまないのが物理屋。
296:132人目の素数さん
20/04/14 09:58:00 RnKKsh7J.net
たとえば、定数であることだけは既知であるが、その値が
分からないという場合、確率変数にしちゃって問題ないのか
って気はする。
検査の感度や特異度は確かに定数とは限らんからいいけど
(一回一回の検査ごとに違っててもいい)。
297:132人目の素数さん
20/04/14 11:28:35.78 zYa8gAY0.net
p値が確率変数なのはベイズじゃなくても当たり前というか、そう考えないと理論が組み立てられんだろw
298:132人目の素数さん
20/04/14 13:11:38 s2XHPXPF.net
>>282
でもp値の分布とかは、頻度主義統計では考えていないのじゃないかな?
299:132人目の素数さん
20/04/14 13:14:47 s2XHPXPF.net
まあ、円周率の1億桁目がわからんから、0~9の一様分布とするのはどうかとは思うが、
こういう問題
あるタクシー会社のタクシーには1から通し番号がふられている。
タクシー会社の規模から保有タクシー台数は100台以下とわかっている(弱情報事前分布)。
この会社のタクシーを5台みかけた。最大の番号が60であった。
この会社の保有するタクシー台数の期待値と95%信用区間(信頼区間)を求めよ。
をベイズで解くときは、
60台~100台である確率を一様分布として処理している。
300:132人目の素数さん
20/04/14 16:41:03 RnKKsh7J.net
>弱情報事前分布
これが情弱事前分布に見えてしょうがないw
301:132人目の素数さん
20/04/15 04:24:36 wTXTja96.net
>>283
もちろんその通り
302:132人目の素数さん
20/04/15 07:19:52.90 RDFXoUEv.net
>>283
教科書には載ってないだけで、ちゃんと研究はされてるぞ。
303:132人目の素数さん
20/04/15 10:03:34.39 W3U2j8/d.net
URLリンク(youtu.be)
この人が言っていることって正しいの?
条件付き確率なんて持ち出さなくても
疑わしい人を選んで検査したほうが
無作為に検査するよりも陽性の頻度が高まるのは
当たり前の話だと思うんだけど。
304:132人目の素数さん
20/04/15 10:10:56 RDFXoUEv.net
>疑わしい人を選んで検査したほうが
>無作為に検査するよりも陽性の頻度が高まるのは
>当たり前
その考え方がまさに条件付き確率だよ。
305:132人目の素数さん
20/04/15 10:37:28.37 xqPpULBp.net
>>289
だーから、大層に数学的権威を持ち出さなくても
小学生にだって直感で分かることなのに。
で、それをもって�
306:ヌう検査数を疑わしいサンプルだけに絞ったほうが その検査が持つ本来の精度が上がるという理屈は論理的に正しいの?
307:132人目の素数さん
20/04/15 11:01:07 9c33QMeg.net
>>290
何をもって精度が上がるというのかによるけど、陽性と判定された
人が確かに陽性である可能性は高くなる。絞らないと、陽性だと言
われた人の中に相当数陰性の人が交じる可能性が高い。
ただし、陰性と言われた人が確かに陰性である可能性は低くなる。
308:132人目の素数さん
20/04/15 12:10:24.29 hQN0z2GO.net
【コロナ訃報】英数学者ジョン・ホートン・コンウェイ氏、コロナで死亡 82歳 ライフゲーム考案、超現実数の発明などで知られる
309:132人目の素数さん
20/04/15 12:14:29.71 tBvL+zz3.net
> だーから、大層に数学的権威を持ち出さなくても
> 小学生にだって直感で分かることなのに。
ワロタ
310:132人目の素数さん
20/04/15 12:20:37.56 9c33QMeg.net
検査した場合、次の4パターンが考えられる。
(1)陽性判定(ほんとに感染者)
→隔離され、しばらく様子見(症状に応じて治療)→治れば解放
(2)陽性判定(実は感染してない)
→隔離され、しばらく様子見→そこで他の感染者から感染
(3)陰性判定(ほんとに感染してない)
→自主隔離で自宅で2週間程度様子見
(4)陰性判定(実は、感染)
→自主隔離で自宅で様子見→状態が悪くなって再検査or自然治癒
疑い例に絞らず、市中感染率がいまのように低い状況で検査をすると、
(2)の割合が増えてかえって感染者を増やす可能性が高い。
疑い例に絞ると(4)の割合が相対的に増えるが、疑い例に絞らずに検査
した場合より実数として増えるわけではないので、問題ない。
311:132人目の素数さん
20/04/15 12:38:37.69 xqPpULBp.net
>>291
> 何をもって精度が上がるというのかによるけど、
当然、PCR検査の対象者を陽性らしい人だけに絞れば
PCR検査が本来持つ精度そのものが上がるのかってことだよ。
直感的に考えたら上がらない。
条件確率を用いるとなぜ「PCR検査それ事態の性能が上がる」と
結論できるのか、それを説明できる人がいる?
312:132人目の素数さん
20/04/15 12:43:43.28 xqPpULBp.net
>>293
実際そうでしょう。小学生にその質問をしてみるといいよ。
風邪っぽい症状がある人だけを集めたグループAと
そうじゃない人を当てずっぽうに集めたグループBがあって、
どっちの検査をしたほうが陽性の人がたくさん見つかるのかって。
ほとんどの小学生が計算なんかしなくてもグループAだと答えるでしょう。
313:132人目の素数さん
20/04/15 15:42:48 9c33QMeg.net
>>295
精度の定義はなんなのかってこと。精度とか性能をきちんと
定義して考えないと、小学生の思考からは抜け出せないよ。
ってか、>>291に書いてあることは理解できたの?
314:132人目の素数さん
20/04/15 15:45:17 9c33QMeg.net
>>296
やっぱり>>291に書いてあることが理解できてないみたいね。
ある人が陽性だと判定されたときに、その検査結果がどのくらい
信用できるかってことだよ。
315:132人目の素数さん
20/04/15 17:32:31 Bshpjqmp.net
検査の目的は、感染者をできるだけ発見すること。
そうすることで感染経路を追跡して虱潰しにできる。
それができると感染者が増えるのを抑制でき、肺炎で重篤化する患者も減らせる。
望ましくないのは、発見できていない感染者がどんどん増えること。
検査を手当たり次第にすれば偽陽性も含めて追跡できる。
感染しているのに追跡できない人が市中に増える確率は下がるはず。
偽陽性かどうかは他の症状や検査を繰り返すことでその不確実性を低減できるはず。
偽陰性の場合も他の症状との兼ね合いで不確実性を低減できるはず。
一度の検査を絶対視せず、それを重要な手がかりの一つと考えれば手がかりが増えることに貢献する。
このことから検査をしないほうが利得が高いとする根拠がどう見出されるのか疑問。
316:132人目の素数さん
20/04/15 17:32:31 Bshpjqmp.net
検査の目的は、感染者をできるだけ発見すること。
そうすることで感染経路を追跡して虱潰しにできる。
それができると感染者が増えるのを抑制でき、肺炎で重篤化する患者も減らせる。
望ましくないのは、発見できていない感染者がどんどん増えること。
検査を手当たり次第にすれば偽陽性も含めて追跡できる。
感染しているのに追跡できない人が市中に増える確率は下がるはず。
偽陽性かどうかは他の症状や検査を繰り返すことでその不確実性を低減できるはず。
偽陰性の場合も他の症状との兼ね合いで不確実性を低減できるはず。
一度の検査を絶対視せず、それを重要な手がかりの一つと考えれば手がかりが増えることに貢献する。
このことから検査をしないほうが利得が高いとする根拠がどう見出されるのか疑問。
317:132人目の素数さん
20/04/15 18:59:26.56 9c33QMeg.net
>>300
検査をしない、じゃなくて、疑いがある場合だけに検査を絞るべきってこと。
その理由は >>294に書いてある。理解できなきゃ、自分の無能を嘆きなさい。
市中感染率が1%にも満たない世界で、無節操な検査を有効化するには、陽性
だろうが陰性だろうが軽症者は自宅隔離するという方法をとらないと駄目。
それでも、感染者が一定の割合で陰性判定されちゃうから、感染経路の
虱潰しなんてことは到底不可能。
318:132人目の素数さん
20/04/15 19:02:16.82 9c33QMeg.net
>>300
>偽陰性の場合も他の症状との兼ね合い
無症状者も1割以上いるんじゃないか?
319:132人目の素数さん
20/04/15 20:29:49 QUOc+3YV.net
>>294
その(2)が起こっても隔離されているので市中感染は増えない。
(2)はそもそも検査それ自体の結果ではなく、検査の結果どのように扱うかの問題。
検査を制限すべき派はそこを巧妙に混同させて論理のすり替えを行っている。
>>302
症状のある人だけとか、症状のハードルを上げている場合、
無症状者も含めて検査場に連絡してこなくなるので当局が把握できない。
把握できない感染者がじわじわ増えていくことがいちばんやっかい。
その数をできるだけ抑えてその状態を長く保つには検査の制限は障害になる。
320:132人目の素数さん
20/04/15 22:03:18.41 9c33QMeg.net
>>303
>(2)が起こっても隔離されているので市中感染は増えない。
あんたは感染してもいないのに感染の危険にさらされてもいいのかね?
運が悪かったと諦めろと?
>把握できない感染者がじわじわ増えていく
検査をむやみに増やしても、偽陰性でリリースされる感染者はかなりの
割合で存在するんだから、把握できない感染者は増える。
(4)のケースは疑いありの非検査者の場合なら自宅隔離させられるが、
誰でも検査の場合にはそういう歯止めもなくなる。
ってか、こういうことを議論するなら定量的にやれよ。数学や統計を
使わずに定性的な議論をしても無駄。
321:132人目の素数さん
20/04/15 22:08:37.14 0UT8Eg4R.net
検査をもっとおこなった方がいいという人は、ほとんど、検査の正確性についての視点が欠落している。
有病率0.1%、感度70%、特異度90%という前提で、検査をおこなって、100人陽性と判断されたとする。
病室、あるいは、隔離管理されたホテル客室を100用意しなければならないが、本当に、感染している人は
何人いることが予想されるか?
答えは0.6958人だ。 一人いるかいないか。ほぼ確実に99室は無駄に使われる。
一方、クラスター発生時の濃厚接触者、あるいは、CTスキャンや、病状を見て、医者が疑わしいと判断
した場合の限定検査なら、事前の有病率はかなり高いことが期待される。
前者は対象者をどれくらいに広げるかによるが、10%程度、後者は50%位あるかもしれない。
有病率以外を同じ条件で、100人陽性が出た場合、有病率10%だと43.75人、有病率30%だと75人が
本当に感染している。有病率10%でも、用意した100室の内半分以上は無駄。
30%だと、1/4が無駄になるが、これくらいなら許容範囲かもしれない。
感度70%程度だから、10人真の感染者が検査をしに来ても、3人は、いわば「お墨付き」で市中に放たれてしまう。
一方、特異度90%だから、検査を受けに来た非感染者の1/10(←検査を受けた人の1/10にほぼ等しい)は、いわば、
「無実の罪」で、隔離生活を強いられてしまう。
これらを理解すれば、「希望者全員に検査を受けさせるべき」等という発言が如何に愚かか判るはず。
322:132人目の素数さん
20/04/15 23:14:13.84 .net
>>305
低学歴の空想
323:132人目の素数さん
20/04/15 23:39:03 0UT8Eg4R.net
有病率r、感度p、特異度qのとき、 陽性的中率 は pr / (pr+(1-r)(1-q)) で与えられます。
p=0.7、q=0.9 なら、(陽性的中率) = 7r/(6r+1) です。
r=0.001 で、(陽性的中率) = 0.00695825
r=0.01 で、(陽性的中率) = 0.0660377
r=0.1 で、(陽性的中率) = 0.4375
r=0.3 で、(陽性的中率) = 0.75
r=0.5 で、(陽性的中率) = 0.875
です。空想ではありません。事実に基づいた定量的なお話です。
324:132人目の素数さん
20/04/15 23:51:00 .net
>>307
与えられねえよクソ低学歴
高校入学してから吠えろ知恵遅れ猿
325:132人目の素数さん
20/04/15 23:57:19 .net
>>307
r=1なら的中率が常に1だな
低知能に生まれてしまったことを呪いながら死にな役立たず生ゴミ
326:132人目の素数さん
20/04/15 23:58:42 0UT8Eg4R.net
与えられて欲しくないという、あなたの願望ですか?
URLリンク(ja.wikipedia.org)陽性適中率
をご覧下さい。
327:132人目の素数さん
20/04/16 00:02:44 OjGN+Ds9.net
IUTTでもおなじみフェセンコ氏がコロナのSIRモデル論じている
URLリンク(arxiv.org)
328:132人目の素数さん
20/04/16 00:04:18 Y1iriB2t.net
>>309
r=1 なら、全員が病気です。
検査によって、陰性と判断される人もいるでしょうが、
陽性と判断された人は、全て本当に陽性=病気です。
だから、的中しています。常に1で、問題ありません。
329:132人目の素数さん
20/04/16 00:09:06 .net
>>310
バカペディアをソースにしてる時点で無能低学歴確定
330:132人目の素数さん
20/04/16 00:09:53 .net
>>312
感度0なら陽性者0
バカ丸出しだろこの猿
331:132人目の素数さん
20/04/16 00:11:46 .net
>>310
出典なしの妄想がソースwwwwww
低知能低学歴って全てが空想なのなwwwww
332:132人目の素数さん
20/04/16 00:15:39 .net
>>310
このバカペディアを弄った低学歴猿って確実にベイズの定理を理解してない
333:132人目の素数さん
20/04/16 00:20:16 oinCpTGH.net
医学誌BMJに掲載された記事によれば、
中国で新規に確認された感染者のうち78%は明確な症状を示さなかったという。
これが本当なら、検査に症状制限を高く設定している場合、
少なくとも78%は感染していても完全に検査体制から排除されていることになる。
偽陰性が野に放たれることを相対的に重大視する検査制限主義者が
これを無視するのはいったいどういう理屈からなのか。
334:132人目の素数さん
20/04/16 00:30:18 oinCpTGH.net
>>304
> あんたは感染してもいないのに感染の危険にさらされてもいいのかね?
> 運が悪かったと諦めろと?
それは検査後の扱い、処遇の方法論の問題であって、
検査それ自体がもたらすリスクではない。
例えば、偽陰性の可能性があることを被験者に伝えれば、
検査期間が被験者に陰性のお墨付きを与えていることにもならない。
検査で陰性と出た人も症状があれば経過観察対象にできる。
検査をやれば、検査+診察+αで陽性者を漏らしてしまう確率は減る。
検査を制限する手法だと、
自覚症状の素人判断だけで疑わしい人を検証することすら放棄していることになる。
335:132人目の素数さん
20/04/16 00:31:59 .net
>>305
そもそも感度70%とか言ってる時点で論文読めない低学歴猿と確定するからな
URLリンク(iina-kobe.com)
完全なデマ
336:132人目の素数さん
20/04/16 00:38:23 .net
>>305
> 感度70%程度だから、10人真の感染者が検査をしに来ても、3人は、いわば「お墨付き」で市中に放たれてしまう。
>一方、特異度90%だから、検査を受けに来た非感染者の1/10(←検査を受けた人の1/10にほぼ等しい)は、いわば、
「無実の罪」で、隔離生活を強いられてしまう。
は?
お前の理屈なら感度70%なら10人の真の感染者が検査をしに来たら7人はちゃんと隔離されるんだが?
陰性的中率出してみろよ猿
そして首吊って死ね
337:132人目の素数さん
20/04/16 00:45:17 oinCpTGH.net
>>305さんの理屈は、
検査推進派が検査だけを拠り所にして結論を出す
という仮定を暗黙のうちにしていないか?
検査推進派がPCR検査だけを
338:絶対視するとどこで主張している? 検査推進派はあくまでも無症状の人までも検査の機会を与える考えにすぎない。 PCR検査だけでお墨付きを与えるなどとは誰も主張していない。 検査推進反対派はここを巧妙にすり替えている。
339:132人目の素数さん
20/04/16 00:48:00 .net
>>321
そもそもこいつの陽性的中率自体に何の意味も無いけどな
陰性的中率とやらも出してみればわかる
片方だけ条件付確率で論理をでっち上げもう片方は条件付確率を使わないというトリック
340:132人目の素数さん
20/04/16 00:48:16 .net
>>321
しかも感度そのものがデマだし
URLリンク(iina-kobe.com)
341:132人目の素数さん
20/04/16 01:09:50 .net
感度90%特異度99%だろ
URLリンク(i.imgur.com)
342:132人目の素数さん
20/04/16 01:10:28 .net
>>305
特異度90%のソースなし
捏造
343:132人目の素数さん
20/04/16 01:26:29 oinCpTGH.net
>>304
> ってか、こういうことを議論するなら定量的にやれよ。数学や統計を
> 使わずに定性的な議論をしても無駄。
統計を使った言説のトリックというか詐術の多くは定性的な議論のところにある。
その詐術を数や式の権威を使って覆い隠すパターンがほとんど。
統計的言説で騙されていけないのはそこ。
344:132人目の素数さん
20/04/16 01:34:30 oinCpTGH.net
a. 個人の自覚症状
b. 医師の診察
c. PCR検査
という3つのフィルターがあるとする。
検査制限派は、aかbの時点でPCR検査の機会を与えず門前払いする。
これが合理的であるためには、aやbがcよりも精度が高いという前提がなくてはならない。
検査推進派はa, b, cの機会をすべて与えようと努力する。
これら三つの検閲の組み合わせたほうがaとbで門前払いしてしまうより優れていると考えるから。
345:132人目の素数さん
20/04/16 04:50:54 .net
なお実際の精度は99.3%ある模様
URLリンク(finance.yahoo.com)
3DMed test demonstrated 99.3% sensitivity and 100% specificity in Chinese clinical trial
Nucleic Acid test performed on proprietary automated platform to increase throughput
CE Mark and China FDA approval have been received; 3DMed in discussions with US FDA and WHO
Technology was deployed in Wuhan, China with over 100,000 tests completed
Combination coronavirus and influenza A/B testing novel among PCR approaches
346:132人目の素数さん
20/04/16 06:27:45.10 .net
>>307
>>328のソースによると感度99.3%特異度100%なので
有病率1%と仮定すると陽性的中率は100%やね
はいおつかれ
URLリンク(i.imgur.com)
347:132人目の素数さん
20/04/16 06:48:30 10nqZrEx.net
>>307
感度と特異度が確定しているという前提が空想だよ。
>274参照
348:132人目の素数さん
20/04/16 06:57:21 10nqZrEx.net
(1)新型コロナ肺炎に感度100%の所見をひとつ述べよ。
(2)新型コロナ肺炎に特異度100%の所見をひとつ述べよ。
349:132人目の素数さん
20/04/16 07:00:05 10nqZrEx.net
>>326
同意。これ!
“Statistics are like bikinis. What they reveal is suggestive, but what they conceal is vital.”
350:132人目の素数さん
20/04/16 07:06:20 Ikob+nf7.net
面白そうなスレだな
1から読んでみるわ
351:132人目の素数さん
20/04/16 07:18:24 .net
>>330
で各国の実データ使うとどうなりますのん?
352:132人目の素数さん
2020/04/1
353:6(木) 07:19:05 .net
354:132人目の素数さん
20/04/16 10:22:32 6PriXNuy.net
なんか、まともに議論も数学もできない、とてつもないバカが二人混じってるな。
(= >>335,326)
idなしのやつの方は人間として終わってるバカだがw
困ったもんだ。
355:132人目の素数さん
20/04/16 10:36:23 6PriXNuy.net
>>326
君は降雨確率が30%という予報で、雨が降ったら騙されたって言う手合のようだねw
「世の中には3つの嘘がある。嘘、大嘘、そして統計である」という言葉があるが、
統計を理解してない人が統計を扱えばそうなっちゃう。
356:132人目の素数さん
20/04/16 10:38:53 6PriXNuy.net
>>318
つ>>301
357:132人目の素数さん
20/04/16 10:47:34 6PriXNuy.net
>>328
精度じゃなくて感度だよ。しかも試験管のテスト。
PCR検査で感度・特異度ともにどちらもほぼ100%になるのは常識。
検体採取の行程(ヒューマンエラーetc.)まで考慮にいれれば、
感度も特異度も下がる。特に感度のほうはスワブでちゃんと
検体が取れてるかどうかが怪しくて、かなり下がる。
358:132人目の素数さん
20/04/16 10:52:20 6PriXNuy.net
特異度を下げるのはこういうコンタミが起きたりするから。
レアだけど無視できない。
>愛知県PCR検査ミス 陰性の24人を陽性と判定‥1人が陽性患者と同室に
URLリンク(hicbc.com)
359:132人目の素数さん
20/04/16 11:17:58 .net
>>339
in Chinese clinical trial
360:132人目の素数さん
20/04/16 11:19:36 .net
>>339
検体はひとつでは無い
日本では6検体
無知が吠えんな
361:132人目の素数さん
20/04/16 11:22:34 .net
>>340
確率出してから吠えて
362:132人目の素数さん
20/04/16 23:31:42 10nqZrEx.net
そのうち、過剰診断と言い出す予感。
福島の甲状腺がんみたいに。
363:132人目の素数さん
20/04/16 23:33:03 10nqZrEx.net
>331に即答できる人いないの?
364:132人目の素数さん
20/04/17 02:11:00 7ANIVQwh.net
>>345
穿った質問に素直に時間かける阿呆が居ると思ってる奴
365:132人目の素数さん
20/04/17 04:40:45 FGyxpq6I.net
>>346
ロスマンの疫学を読んだことのある人なら答えられるし、
感度特異度の意味を理解していれば自分で答えが出せる。
366:132人目の素数さん
20/04/17 04:50:30 FGyxpq6I.net
サパイラ 身体診察のアートとサイエンスにも載っているが、こっちは100%の所見ではないな。
367:132人目の素数さん
20/04/17 06:45:53.79 i6G48nGU.net
>>347
君が書いたらいい
368:132人目の素数さん
20/04/17 07:04:43 FGyxpq6I.net
サパイラ 身体診察のアートとサイエンスには
あらゆる疾患に感度の高い検査(所見)として 10 finger test が挙げられている。
すなわち、指が10本あれば疾患ありと判断する。
この検査の感度は100%に近い。新型コロナでも高感度。
369:132人目の素数さん
20/04/17 07:21:40 FGyxpq6I.net
身体診察のアートとサイエンス の 翻訳者のひとりには岩田健太郎がいる。
俺は旧版を原著で読んだ。
引用すると、
A test with high sensitivity is not necessarily a useful test. The sign “10 fingers” would be
extremely sensitive for almost any disease because most patients with the disease will have ten
fingers. Very few patients with the disease will have a different number of fingers. Thus, the ratio of
true positives (number of patients with the disease who have ten fingers) to the sum of true positives
plus false negatives (where false negatives are people who have the disease and do not have ten
fingers)
370: will usually be greater than 0.99 (except in a sanitarium for Hansen disease). Yet, common sense tells us that the possession of ten fingers, however sensitive on paper, is not of great use to the diagnostician. Why not? The reason is that most of the people in the world have ten fingers but do not have the disease.
371:132人目の素数さん
20/04/17 07:34:40 FGyxpq6I.net
>>334
各国の検査数と陽性数のデータがあれば、
β分布のパラメータを以下のように設定してMCMCすれば出せる。
beta(13.6991,9.4661)でmode 0.6, sd = 0.1
beta(36.172,4.908)でmode 0.9 sd = 0.05
東京都で検査を受けたハイリスクグループでの陽性率を出そうしたんだが、
東京都は行政検査数しか公表しないので出す術がない。
372:イナ ◆/7jUdUKiSM
20/04/17 21:14:42 UUkt12DA.net
コロナが苦手なものはなんだ? 相手の弱点をみつけようよ。乾燥に弱いとか、熱に弱いとか、なんかないの? 前に使った薬がなんで効いてるか、その仕組みがわかったらなぁ。治ってる人や症状改善した人がいるってところになにかヒントがあるよ。
]∩∩∥ □ ∥;;;;;\
(-_-)) ∥;;;;;;∥
(っγυ 。∥╂─╂∥
]`(_)_)ц~ ∥╂─╂∥
、■υυ■__∥\\\∥
`\\\\\\\\\`)
`\\\\\\\\\/|
`\\\\\\\\`/ |
_\\\\\\\\/ L
 ̄|\\\\\\/| /
]| ∥ ̄ ̄ ̄ ̄∥ | / /
__| ∥ □ □ ∥ |/ /
___`∥________∥/_/
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄∥ /
__________________∥/
373:132人目の素数さん
20/04/17 21:32:06 FGyxpq6I.net
>>353
>コロナが苦手なもの
知性だな。
台湾の知性が制御している。
374:132人目の素数さん
20/04/17 22:05:39 TfUPqX9r.net
>>343
オープンなリソース管理はコロナの弱点だろうな
公務員が数ちょろまかしてるような国では強くなれる
375:イナ ◆/7jUdUKiSM
20/04/17 22:07:42 UUkt12DA.net
>>354罰金刑か。前>>353結局罰金刑しかないか。逮捕して処刑するしかないかなとは思ってたんだ俺も。
∥∩∩∥ □ ∥;;;;;\
((-_-) ∥;;;;;;∥
(っγυ 。∥╂─╂∥
■`(_)_)ц~ ∥╂─╂∥
\■υυ■_∩∩、\\∥
\\\\⊂(_ _ )`⌒つ)
\\\\\\\`υ、\/|
\\\\\`.,、、、\`/ |
__\\\\彡`-`ミっ/ L
 ̄|\_\\_U,~⌒ヾ /
]| ∥ ̄ ̄ ̄ ̄U~~U / /
__| ∥ □ □ ∥ |/ /
___`∥________∥/_/
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄∥ /
__________________∥/
376:マイヤービートリス
20/04/18 16:10:15.81 Joe2nOPR.net
ベイズを議論している人に教えてほしいのだが
URLリンク(webronza.asahi.com)
でこの人の計算や解釈は正しいの?
377:132人目の素数さん
20/04/18 17:17:45 PWtsyGc9.net
>>ニュースなどで「クラスターで陽性が10人」=「10人が感染」と素直に受け取ってしまう向きも多いだろう。
>>1万人を検査すると、70人+198人が陽性と判定される。本当の陽性は70人だから、結果が正しい確率は70÷268=26%
>>正解は、約26%だ。判定が「陽性」でも、本当の感染者は10人中3人以下ということだ。
明らかに誤っている部分がある。
市中感染率を1%と仮定し、その中から無作為に調査を行って、10人の陽性と判断される者を見つけた場合、
確かに、本当の感染者は2.6人程度。
しかし、クラスターが発見され、その周辺から、感染者を探す場合は、事前確率は1%ではない。
どの範囲まで、調査対象を広げるかにもよるが、50%とかが期待される。
仮に50%だとすると、87.5%、陽性と判断された結果は正しい。
378:132人目の素数さん
20/04/18 17:17:48 vWIoYYH+.net
pr2pv <- function( # prevalence to predicative value
pr ,# prevalence
sn=0.7, # sensitibity=TP/(TP+FN)
sp=0.9) # specificity=TN/(TN+FP)
{
N=1 # polutaion million, billion,or any proper unit
si=pr*N # sick population
he=(1-pr)*N # healthy population
TP=si*sn
FN=si*(1-sn)
TN=he*sp
FP=he*(1-sp)
PPV=TP/(TP+FP)
NPV=TN/(TN+FN)
PV=c(PPV=PPV,NPV=NPV)
return(PV)
}
> pr2pv(0.01,0.7,0.98)
PPV NPV
0.2611940 0.9969174
計算はあってる。面倒だから解説は読まない。
379:132人目の素数さん
20/04/18 17:37:48 vWIoYYH+.net
クラスターから何人検査して何人陽性であったのかによって結果が違ってくるね。
検査の感度を最頻値0.7標準偏差0.1
特異度を最頻値0.98 標準偏差0.01
有病率は(0,1)の一様分布
を弱情報事前分布(情弱事前分布w)として
クラスターから10人検査したら10人陽性であったとき stanでMCMCした結果
URLリンク(i.imgur.com)
URLリンク(i.imgur.com)
380:132人目の素数さん
20/04/18 17:41:14.84 vWIoYYH+.net
クラスターから100人検査して10人陽性だった場合
mean se_mean sd 2.5% 50% 97.5% n_eff Rhat
prev 0.13475 0.00044 0.05797 0.04287 0.12754 0.27095 17334 1.00010
sen 0.66409 0.00074 0.10423 0.44686 0.67054 0.84855 20036 1.00010
spc 0.97580 0.00007 0.01006 0.95256 0.97714 0.99146 20272 1.00012
p 0.10797 0.00019 0.03044 0.05633 0.10530 0.17455 24621 1.00001
PPV 0.76071 0.00072 0.09797 0.53774 0.77243 0.91536 18317 1.00011
NPV 0.95986 0.00013 0.01749 0.91811 0.96260 0.98585 17185 1.00010
precision 0.94212 0.00013 0.01766 0.90229 0.94405 0.97089 19310 1.00010
pLR 33.28155 0.14736 18.25227 12.71591 28.84717 80.12622 15341 1.00013
nLR 0.34429 0.00075 0.10692 0.15527 0.33782 0.56712 20099 1.00010
DOR 114.74459 0.78412 97.10981 25.95828 89.02272 356.05482 15338 0.99996
lp__ -75.90415 0.01168 1.27866 -79.22234 -75.58340 -74.42549 11979 1.00024
PPVは0.76
381:132人目の素数さん
20/04/18 17:55:40.37 vWIoYYH+.net
>358の指摘の通り、陽性的中率はその集団の有病率の影響されるから、クラスターの有病率を1%にするのは間違い。
情報がないから、クラスター内の有病率の確率分布を一様分布として計算するとか、母集団の有病率の10倍以内とか設定すればクラスター内の有病率の確率分布が出せる。
クラスタ100人検査で10人陽性、クラスター内の有病率は母集団の10倍以内と設定すると
陽性的中率は、0.684 95%CI(0.497-0.857)と計算された。
382:132人目の素数さん
20/04/18 18:10:34.06 vWIoYYH+.net
結局、誤った解説を読む羽目になったw
383:マイヤービートリス
20/04/18 18:18:36 Joe2nOPR.net
>>358
有難うございます。
>>しかし、クラスターが発見され、その周辺から、感染者を探す場合は、事前確率は1%ではない。
この見積もりがキーですね。
>>359,360,361,362
計算有難うございます。
384:132人目の素数さん
20/04/18 20:40:48.15 iquzLVJz.net
>>358
おいおい、なにも間違ったことは書いてないでしょ。
君の引用の仕方に問題があるんだよ。
>>ニュースなどで「クラスターで陽性が10人」=「10人が感染」と素直に受け取ってしまう向きも多いだろう。
で一旦段落は終わってるんだから、1万人を検査すると云々という、設定された
「問題」の答えとは直接リンクしてない。君のように勘違いする人はいるかも
しれないが、きちんと読めば間違ったことは書いてないことがわかるはず。
どこにもクラスターの有病率が1%だなどとは書いてない。
で、仮に有病率が50%でも、
>「クラスターで陽性が10人」=「10人が感染」
ではないわけで、引用元の著者の主張はまっとうなものだと思える。
>>364
だから、有病率が高いと見込まれる集団での検査であればいいわけで、
むやみに検査せずにある程度絞り込むべきだ(たとえば、クラスター
感染が疑われる集団を対象にせよ)とまで記事の中で述べられていれば
よかったんだろうけど、そこまで書かなかったのは片手落ちだったかもね。
385:132人目の素数さん
20/04/18 21:33:23 PWtsyGc9.net
もし、記事が、
「ニュースなどで「陽性判定が10人」=「10人が感染」と素直に受け取ってしまう向きも多いだろう。」
と書かれていたなら、あなたの指摘は正しいだろう。しかし、実際は
>> ニュースなどで「クラスターで陽性が10人」=「10人が感染」と素直に受け取ってしまう向きも多いだろう。
となっている。
クラスターとは、集団の存在、つまり、濃度の濃い部分があることを示唆したものであり、
母集団の感染率をそのまま用いるべきではない点を指摘した。
だから、非クラスターなら、正解だか、クラスターなら正解とは言えないという主旨で書いている。
換言すれば、問題の設定では、
「真の感染率=1%とする。(検査に至った経緯や、発熱・咳など他の所見は無視する)。」
と書いているのに対し、問題の解説では、「クラスター」を持ち出して解説しているのは、明らかに不適当。
386:132人目の素数さん
20/04/19 00:22:33.17 eKu2VjGM.net
>>366
クラスターですら、「陽性判定=感染」ってことではないんだから、その
一文で言いたいことに間違いはない。
でもって、著者は、クラスターの有病率が1%なんてことは一言も言って
ないし、そもそも、クラスターについての具体的な解説もしていない。単に
ニュースで扱われる文言の例としてそこで1回だけクラスターという言葉が
使われてるだけ。クラスターの検査を否定してる内容でもない。
有病率があがると的中率も大きくあがることについては、記事中のグラフで
示してあるから、情報が示されてないわけでもない。記事の主旨とは直接関係
ないので文章中では触れなかっただけでしょうね。
387:132人目の素数さん
20/04/19 01:26:51.78 R/sv/z3n.net
統計全然わからないんだけど、今行われてるPCR検査で陽性と判断されて、本当に罹患してる確率ってどの程度なの?
388:132人目の素数さん
20/04/19 01:56:19.99 gn6lsHTI.net
もし、筆者の伝えたいことが、「陽性判定は、即、感染者ということにはならない」 つまり、
「間違えることもある」という点にあるのであれば、あなたの言い分は通るかもしれないが、筆者の力点は、
>>正解は、約26%だ。判定が「陽性」でも、本当の感染者は10人中3人以下ということだ。
を見て判る通り、「陽性的中率が低い」というというところにある。
そのために、感度や特異度、真の感染率などに、具体的な数字を与えているし、問題設定の中では、わざわざ
>> (検査に至った経緯や、発熱・咳など他の所見は無視する)。
等と断り、終始定量的な説明が加えられている。
ならばこそ、なおさら、「クラスター」という言葉は使うべきでは無かった。
クラスター周辺での調査と、市中での無作為検査では、陽性的中率が変わってしまうのは、
全体を通して、筆者が言いたいことであっただろうに、にもかかわらず、問題の解説で
前提を崩してしまう「クラスター」という言葉を使ったのだから。
そもそも、ニュースでは、「PCRで陽性が○○人」等という使い方をしていただろうか?
単に「感染者○○人」だと思う。もちろん、この感染者の中には、偽陽性も含まれているだろうが、
検査陽性者数と感染者数の違いに注目を与えかねない「陽性者○○人」のような報道は記憶に無い。
そう考えると、「誤解の種」を自ら蒔いて、刈り取るかのような記事に見えてきた。
389:132人目の素数さん
20/04/19 02:31
390::27.50 ID:Czp86qrf.net
391:132人目の素数さん
20/04/19 07:50:33.21 Czp86qrf.net
クラスターで10人が陽性として検査した人数と陽性的中率PPVとの関係をグラフにしてみた。
灰色実線は95%信頼区間境界、灰色点線はPPV=0.26の線
URLリンク(i.imgur.com)
全人口の有病率をクラスター内の有病率にすり替えて、10人陽性でも感染しているのは3人以下という間違った結論を出している。
わかっていて書いているのか、馬鹿なのか、どちらかは不明。
392:132人目の素数さん
20/04/19 07:56:38.54 Czp86qrf.net
>>368
罹患の定義による。
他人のゲノムでコンタミネーションが起こったりしていなければ、
あるゲノムのシークアンスが検出されたら罹患というなら、罹患率は100%
ウイルスとして増殖能力を有しているかは不明、死骸の一部を検出しているだけかもしれない。
393:132人目の素数さん
20/04/19 08:01:23.85 Czp86qrf.net
>>369
東京都の発表では 感染者数とせず、陽性患者数と表現している。
正確を期すなら陽性者数とすべきだろうな。
URLリンク(stopcovid19.metro.tokyo.lg.jp)
394:132人目の素数さん
20/04/19 20:39:24 Czp86qrf.net
Natureのこの論文はエクセルとRのコードがついていて自分で再現できるので入力の手間が省ける。
URLリンク(www.nature.com)
感染させる確率分布をガンマ分布を平行移動させた分布として想定して、データから最尤法でパラメータ算出している。
395:132人目の素数さん
20/04/20 17:39:51 Db3kUO+J.net
>>374
そのプログラムをみていくと
感染させる確率分布を
#--- infectiousness, gamma distribution ---
# gpar[1:2]: hyper-parameters (gamma)
# x : infection time of infectee w.r.t onset time of infector
f.Xc = function(x, gpar) { dgamma(x, gpar[1], gpar[2]) }
ガンマ分布にしているけど
一人が一人を感染させるモデルだから
形状パラメータgpar[1]は1で固定、つまり、指数分布だと思うんだがどうだろ?待ち時間の分布と同じ考え。
w.r.t = with reference to らしい
396:132人目の素数さん
20/04/20 19:39:48 Db3kUO+J.net
>>375
補足
ひとりが別の一人に一回感染させるというモデルなので待ち時間の分布の指数分布でいいと思う。
ガンマ分布の形状パラメータ=1とおけば指数分布になる。
プログラムを書き直してグラフにすると
URLリンク(i.imgur.com)
発症前に感染させている確率は47%と原著とあまりかわらないが、そのピークは発症1.6日前という結果になった。
397:132人目の素数さん
20/04/20 21:40:46 LmPkmRXS.net
>>369
>>正解は、約26%だ。判定が「陽性」でも、本当の感染者は10人中3人以下ということだ。
ああ、確かにそこは問題だな。前段の「クラスターで陽性が10人」とリンクすると
思われても仕方がない。著者もうかつだとは思うが、有病率により的中率が変わると
いう話の内容は間違いではない。
398:132人目の素数さん
20/04/20 21:52:20 LmPkmRXS.net
>>371
元記事のグラフの有病率0.1のところをみれば的中率が80%越えになってるわけで、
単純に「クラスター」って言葉を軽んじてただけなんだろうね。
URLリンク(webronza.asahi.com)
399:132人目の素数さん
20/04/20 23:44:00 IwCIr2qd.net
>>375
たにんへの感染力の分布なんか数学的にわかるわけないやん?罹患して気道部にウィルスを放出できるくらいのウィルス量が繁殖するのは罹患していきなりなわけがない。
400:132人目の素数さん
20/04/21 00:05:49 bowf2rRh.net
適当にSEIRモデル�
401:g張してシミュレーションすれば分かるけどかなり自粛しても感染爆発は起こるよ
402:132人目の素数さん
20/04/21 02:51:28 7mnZKVUh.net
URLリンク(www.youtube.com)
東大数学科卒の高橋洋一氏が人との接触7割減」の根拠を数式から
語ってるがどう見る?
403:132人目の素数さん
20/04/21 06:50:58.83 J5/+FVIQ.net
ガンマ分布:「一定期間に1回起きると期待されるランダムな事象が複数回起きるまでの時間の分布」
複数回でなくて1回だと指数分布だと思う。
何度も感染した症例を扱っているのではないのだから、ガンマ分布のパラメータを求める意味が理解できない。
404:132人目の素数さん
20/04/21 06:56:00.72 J5/+FVIQ.net
>>380
SEIRモデルだと感染爆発させた方が早期に収束する。死者や感染者は増えるけど。
シミュレーションでは鎖国している前提で4割が感染すればオリンピックは可能だった。
SEIRモデルはEは感染力なし、Rは再感染しないというモデルだからなぁ。
モデルを修正してR->Sの再感染が0.1%あるだけで終焉しなかったな。
しかも、外部から感染力の強いキャリアー(保菌者)が入ってくることはモデルには組み込まれていない。
405:132人目の素数さん
20/04/21 06:59:16.79 J5/+FVIQ.net
>>379
結局、一定期間に1回起きると期待されるランダムな事象として、その一定期間を推測しているんだろ?
406:132人目の素数さん
20/04/21 07:47:46 J5/+FVIQ.net
>>381
SIRモデルって鎖国モデルだから結論は信用できん。
407:132人目の素数さん
20/04/21 11:00:38 LfxF6Y+G.net
統計できる人尊敬するわ
MCMCとか訳分からん
408:132人目の素数さん
20/04/21 11:28:48 J5/+FVIQ.net
>>386
統計ってある統計量がほんにゃら分布に従うというのを黙って受容しないと次に進めないよね。
郡内分散と郡間分散の比がF分布に従うとか言われても
どうしてかは理解していない。
stanのNUTSとかfrog leapとかわからんままにMCMCさせている。
409:イナ ◆/7jUdUKiSM
20/04/21 13:30:52 0ilKIHza.net
こういうときこそコンピューターとかに頼らずに一つ一つ数をかぞえて方程式を立て、微分するべきだと思う。
∥∩∩∥ □ ∥ \
(-_-)) ∥______∥
(っγυ 。∥╂─╂∥
■`(_)_)ц~ ∥╂─╂∥
\■υυ■_∩∩、\\∥
\\\\⊂(_ _ )`⌒つ)
\\\\\\\`υ、\/|
\\\\\`.,、、、\`/ |
__\\\\彡`-`ミっ/ L
 ̄|\_\\_U,~⌒ヾ /
]| ∥ ̄ ̄ ̄ ̄U~~U / /
__| ∥ □ □ ∥ |/ /
___`∥________∥/_/
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄∥ /
__________________∥/
410:132人目の素数さん
20/04/21 14:53:08 pHehMVs5.net
>>386
sirモデルでは罹患した患者が回復するまでの機会中常に一定の確率(感染率)で遭遇した感受受宿主に感染を広めると仮定して立式してる。
ザックリした傾向を見るならそれで十分だけど、実際のモデルではそんな事はありえない。
感染する確率は患者の体内で繁殖しているウィルス量の増加に従って増えるからその効果を勘案してΓ分布(というかt^c d^x なる形の関数)に応じて感染率が罹患した時点から変化するとするんでしょ?
もちろんコレでも大体の傾向見るにはコレで十分というモデルを臨床例から適当に選んでるだけでしょ?
実際には未来永劫感染力を持ち続けるなんて事があるはずないし、罹患初期のウィルス量の増え方はおそらく指数関数的に増えるものを採用すべきだろうし。
411:132人目の素数さん
20/04/21 14:54:06 pHehMVs5.net
mcmc
412:132人目の素数さん
20/04/22 08:56:14 0tlpvLKp.net
>>388
無理無理。
カブトガニVSシオマネキ論争はコンピュータの計算結果で決着がついたよ。
413:132人目の素数さん
20/04/22 13:23:53 0tlpvLKp.net
週末は休むとか週間変動の影響を除くために1週間の移動平均で線形回帰して片対数
414:グラフにすると https://i.imgur.com/7VwfswD.png 自粛の効果がでてきているな。 多分、検査自粛の効果だろうな。
415:イナ
20/04/22 19:51:00.75 iq1GZOqA.net
∥∩∩ ∥ □ ∥前>>388
((-_-)∥ ∥______
(っ⌒⌒゙ 。∥╂─╂
■`(_)_)ц~ ∥╂─╂
\■υυ■_∩∩、\\\
\\\\⊂(_ _ )`⌒つ、
\\\\\\\`υ、\\\\\\\\\\\\\\\\`>>391カブトガニでもシオマネキでもシュクメルリでも微分するのがいちばん強力だと思う。
416:132人目の素数さん
20/04/23 04:58:29 3vcirHk0.net
>>393
これを微分で解いたら、ネ申か狂人だろな。
AからHの8人はそれぞれ正直者か嘘つきであり、誰が正直者か嘘つきかはお互いに知っている。
A,B,C,D,Eは嘘つきなら必ず嘘をつくが、F,G,Hは嘘つきでも正しいことを言う場合がある。
次の証言から確実に正直者と断定できるのは誰か?
A「嘘つきの方が正直者より多い」
B「Hは嘘つきである」
C「Bは嘘つきである」
D「CもFも嘘つきである」
E「8人の中に、少なくとも1人嘘つきがいる」
F「8人の中に、少なくとも2人嘘つきがいる」
G「Eは嘘つきである」
H「AもFも正直者である」
417:132人目の素数さん
20/04/23 08:28:17 3vcirHk0.net
CTとPCRの一致係数(κ値)を信頼区間つきでMCMCしようかと思ってスクリプトを書いたはいいが
肝心なデータがない :(
事前分布を一様分布にするのには異論があるかもしれん。
library(rjags)
kappa.model='
model{
A ~ dbeta(1,1) # A:Pr[CT+], 1-A:Pr[CT-]
B ~ dbeta(1,1) # B:Pr[PCR+|CT+]
C ~ dbeta(1,1) # C:Pr[PCR-|CT-]
p[1]=A*B # CT+PCR-
p[2]=A*(1-B) # CT+PCR-
p[3]=(1-A)*(1-C) # CT-PCR+
p[4]=(1-A)*C # CT-PCR-
y[1:4] ~ dmulti(p[],n) # multinominal distribution
po=(p[1]+p[4])/n # observed agreement
pe=(p[1]+p[2])/n*(p[1]+p[3])/n + (p[3]+p[4])/n*(p[2]+p[4])/n # coincidence
kappa=(po-pe)/(1-pe)
PABAK=2*po-1 # Prevalence Adjusted Bias Adjusted Kappa
}
'
writeLines(kappa.model,'kappaj.txt')
418:132人目の素数さん
20/04/23 10:37:41 3vcirHk0.net
中国には特異度100%の検査キットがあるんだってね。
すべて陰性にでるようにセットされていると。
419:132人目の素数さん
20/04/23 13:51:17 3vcirHk0.net
新型コロナ患者を治療している病院に100人の職員がいる。
検体採取器具は5人分、試薬は1回分しかないとする。
無作為抽出した5人の職員から採取した検体を混合して検査したら陽性であった。
職員の陽性者数の期待値を求めよ。
また、50人以上の感染者いる確率はいくつか?
検査の陽性率はハイリスク群に検査している東京の数値2457/6654を使って計算せよ。
URLリンク(i.imgur.com)
420:132人目の素数さん
20/04/23 13:53:25 3vcirHk0.net
>>397
こんなグラフになった。
URLリンク(i.imgur.com)
421:132人目の素数さん
20/04/23 17:36:48 3vcirHk0.net
>>397
これであってるかな?
> # 期待値
> integrate(function(x) x*pdf(x),0,100)$value
[1] 37.13
> # 50人以上の確率
> integrate(pdf,50,100)$value
[1] 0.0041903
> c(HPDI.lower=lwr,HPDI.upper=upr) # HPDI
HPDI.lower HPDI.upper
27.778 46.558
422:132人目の素数さん
20/04/23 22:02:05.89 MtjaFZpr.net
レベル低
423:132人目の素数さん
20/04/24 02:55:58 juJsFFfP.net
慶応大の調査で、コロナ以外で来院した人をPCR検査したところ
4/67の確率で要請だった
東京都内1500万のうち何人くらいが感染しているか推定せよ
424:132人目の素数さん
20/04/24 03:18:37 XPGerQAq.net
岩田健太郎・�
425:_戸大学教授『東京はすでに20万~400万人感染の可能性』 https://leia.5ch.net/test/read.cgi/poverty/1587664106/
426:132人目の素数さん
20/04/24 05:36:50.27 9Fe9PNfV.net
>>401
ニュー速でやったが、ベイズでこんな感じ?(感染者率)
URLリンク(i.imgur.com)
427:132人目の素数さん
20/04/24 05:52:14 9Fe9PNfV.net
>>397
混ぜて検査する方法の最適化問題ってのもあるね。
URLリンク(mobile.twitter.com)
(deleted an unsolicited ad)
428:132人目の素数さん
20/04/24 08:13:06 0onl6lJy.net
>>401
これって東京の無作為サンプリングではなさそうだよね
病院に来たって事は熱が出てたのかもしれないし
想定できる母集団ってなんになるのだろうか
429:132人目の素数さん
20/04/24 12:07:56 v55OWzbu.net
新型コロナ患者を治療している病院に100人の職員がいる。
検体採取器具は10人分、試薬は1回分しかないとする。
無作為抽出した10人の職員から採取した検体を混合して検査したら陰性であった。
職員の陽性者数の期待値を求めよ。
また、50人以上の感染者いる確率はいくつか?
検査の陽性率はハイリスク群に検査している東京の数値2457/6654を使って計算せよ。
430:132人目の素数さん
20/04/24 12:11:36 v55OWzbu.net
>>401
95%CIで
> binom::binom.confint(4,67)
method x n mean lower upper
1 agresti-coull 4 67 0.05970149 0.019131154 0.1480232
2 asymptotic 4 67 0.05970149 0.002968439 0.1164345
3 bayes 4 67 0.06617647 0.015026904 0.1253507
4 cloglog 4 67 0.05970149 0.019283398 0.1337560
5 exact 4 67 0.05970149 0.016504404 0.1458632
6 logit 4 67 0.05970149 0.022588780 0.1485238
7 probit 4 67 0.05970149 0.020905075 0.1402573
8 profile 4 67 0.05970149 0.018970462 0.1332788
9 lrt 4 67 0.05970149 0.018929939 0.1332756
10 prop.test 4 67 0.05970149 0.019297952 0.1534709
11 wilson 4 67 0.05970149 0.023459351 0.1436950
431:132人目の素数さん
20/04/24 17:39:04 8oiI190P.net
>>401
まじか。
まあ、体調悪いから病院に行くわけで、バイアスかかってるとはいえ...。
432:132人目の素数さん
20/04/24 17:42:10 v55OWzbu.net
>>404
ラテン方陣の問題?
433:132人目の素数さん
20/04/24 20:48:11 v55OWzbu.net
>>403
事前分布にJefferey分布を使っているな。
URLリンク(i.imgur.com)
破線が事前分布、実戦が事後分布
curve(dbeta(x,0.5+4,0.5+67-4),bty='l',xlab='probability',ylab='density')
curve(dbeta(x,0.5,0.5),add=T,lty=2)
434:132人目の素数さん
20/04/24 20:55:16 v55OWzbu.net
>>410
青実線が事前分布を一様分布(Beta(1,1))としたとき。
URLリンク(i.imgur.com)
Jeffereyの方が95%CI幅が小さいな。
> binom::binom.bayes(4,67,prior.shape1 = 0.5,prior.shape2 = 0.5)
method x n shape1 shape2 mean lower upper sig
1 bayes 4 67 4.5 63.5 0.06617647 0.0150269 0.1253507 0.04999999
> binom::binom.bayes(4,67,prior.shape1 = 1, prior.shape2 = 1)
method x n shape1 shape2 mean lower upper sig
1 bayes 4 67 5 64 0.07246377 0.01876916 0.1338218 0.04999999
435:132人目の素数さん
20/04/24 21:13:10 v55OWzbu.net
>>401
URLリンク(georgebest1969.typepad.jp)
に準じて 東京都民の1395万人に当てはめると
> data.frame(method=ci[,1],round(ci[,4:6]*pop))
method mean lower upper
1 agresti-coull 832836 266880 2064924
2 asymptotic 832836 41410 1624262
3 bayes 923162 209625 1748642
4 cloglog 832836 269003 1865896
5 exact 832836 230236 2034792
6 logit 832836 315113 2071907
7 probit 832836 291626 1956590
8 profile 832836 264638 1859240
9 lrt 832836 264073 1859195
436: 10 prop.test 832836 269206 2140919 11 wilson 832836 327258 2004545 岩田の計算は 5 exact 832836 230236 2034792
437:132人目の素数さん
20/04/24 21:35:58 v55OWzbu.net
>>402
感度30-70%(最頻値0.5,標準偏差0.2のβ分布),特異度(最頻値0.9 標準偏差0.05のβ分布)に設定。
有病率の事前分布は0-1の一様分布にして
MCMCしてみると
URLリンク(i.imgur.com)
という結果になった。
有病率の信頼区間は広すぎw
mean lower upper
0.22346412787 0.00000002913 0.83202346988
438:132人目の素数さん
20/04/24 21:50:22 v55OWzbu.net
>>413
有病率の最頻値は
> density(prev)$x[which.max(density(prev)$y)]
[1] 0.019186
439:132人目の素数さん
20/04/24 22:01:25 v55OWzbu.net
>>413
事前分布をJeffereyにしたら、
> js=PCRj4(67,4,SEN=0.5,SD1=0.2,SPC=0.9,SD2=0.1,N.ITER=1e6)$js
mean lower upper
1.4972e-01 6.3120e-14 8.5733e-01
> summary(prev)
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.0000 0.0111 0.0472 0.1497 0.1442 1.0000
> density(prev)$x[which.max(density(prev)$y)] # mode
[1] 0.0032278