数学統計に詳しい人が語るコロナウイルス

数学統計に詳しい人が語るコロナウイルスat MATH

数学統計に詳しい人が語るコロナウイルス - 暇つぶし2ch314:１３２人目の素数さん
20/04/15 15:45:17 9c33QMeg.net
>>296
やっぱり>>291に書いてあることが理解できてないみたいね。
ある人が陽性だと判定されたときに、その検査結果がどのくらい
信用できるかってことだよ。

315:１３２人目の素数さん
20/04/15 17:32:31 Bshpjqmp.net
検査の目的は、感染者をできるだけ発見すること。
そうすることで感染経路を追跡して虱潰しにできる。
それができると感染者が増えるのを抑制でき、肺炎で重篤化する患者も減らせる。
望ましくないのは、発見できていない感染者がどんどん増えること。

検査を手当たり次第にすれば偽陽性も含めて追跡できる。
感染しているのに追跡できない人が市中に増える確率は下がるはず。
偽陽性かどうかは他の症状や検査を繰り返すことでその不確実性を低減できるはず。

偽陰性の場合も他の症状との兼ね合いで不確実性を低減できるはず。
一度の検査を絶対視せず、それを重要な手がかりの一つと考えれば手がかりが増えることに貢献する。

このことから検査をしないほうが利得が高いとする根拠がどう見出されるのか疑問。

316:１３２人目の素数さん
20/04/15 17:32:31 Bshpjqmp.net
検査の目的は、感染者をできるだけ発見すること。
そうすることで感染経路を追跡して虱潰しにできる。
それができると感染者が増えるのを抑制でき、肺炎で重篤化する患者も減らせる。
望ましくないのは、発見できていない感染者がどんどん増えること。

検査を手当たり次第にすれば偽陽性も含めて追跡できる。
感染しているのに追跡できない人が市中に増える確率は下がるはず。
偽陽性かどうかは他の症状や検査を繰り返すことでその不確実性を低減できるはず。

偽陰性の場合も他の症状との兼ね合いで不確実性を低減できるはず。
一度の検査を絶対視せず、それを重要な手がかりの一つと考えれば手がかりが増えることに貢献する。

このことから検査をしないほうが利得が高いとする根拠がどう見出されるのか疑問。

317:１３２人目の素数さん
20/04/15 18:59:26.56 9c33QMeg.net
>>300
検査をしない、じゃなくて、疑いがある場合だけに検査を絞るべきってこと。
その理由は >>294に書いてある。理解できなきゃ、自分の無能を嘆きなさい。
市中感染率が1％にも満たない世界で、無節操な検査を有効化するには、陽性
だろうが陰性だろうが軽症者は自宅隔離するという方法をとらないと駄目。
それでも、感染者が一定の割合で陰性判定されちゃうから、感染経路の
虱潰しなんてことは到底不可能。

318:１３２人目の素数さん
20/04/15 19:02:16.82 9c33QMeg.net
>>300
>偽陰性の場合も他の症状との兼ね合い
無症状者も１割以上いるんじゃないか？

319:１３２人目の素数さん
20/04/15 20:29:49 QUOc+3YV.net
>>294
その(2)が起こっても隔離されているので市中感染は増えない。
(2)はそもそも検査それ自体の結果ではなく、検査の結果どのように扱うかの問題。
検査を制限すべき派はそこを巧妙に混同させて論理のすり替えを行っている。

>>302
症状のある人だけとか、症状のハードルを上げている場合、
無症状者も含めて検査場に連絡してこなくなるので当局が把握できない。
把握できない感染者がじわじわ増えていくことがいちばんやっかい。
その数をできるだけ抑えてその状態を長く保つには検査の制限は障害になる。

320:１３２人目の素数さん
20/04/15 22:03:18.41 9c33QMeg.net
>>303
＞(2)が起こっても隔離されているので市中感染は増えない。
あんたは感染してもいないのに感染の危険にさらされてもいいのかね？
運が悪かったと諦めろと？

＞把握できない感染者がじわじわ増えていく
検査をむやみに増やしても、偽陰性でリリースされる感染者はかなりの
割合で存在するんだから、把握できない感染者は増える。
(4)のケースは疑いありの非検査者の場合なら自宅隔離させられるが、
誰でも検査の場合にはそういう歯止めもなくなる。
ってか、こういうことを議論するなら定量的にやれよ。数学や統計を
使わずに定性的な議論をしても無駄。

321:１３２人目の素数さん
20/04/15 22:08:37.14 0UT8Eg4R.net
検査をもっとおこなった方がいいという人は、ほとんど、検査の正確性についての視点が欠落している。
有病率0.1%、感度70%、特異度90%という前提で、検査をおこなって、100人陽性と判断されたとする。
病室、あるいは、隔離管理されたホテル客室を100用意しなければならないが、本当に、感染している人は
何人いることが予想されるか？
答えは0.6958人だ。　一人いるかいないか。ほぼ確実に99室は無駄に使われる。
一方、クラスター発生時の濃厚接触者、あるいは、CTスキャンや、病状を見て、医者が疑わしいと判断
した場合の限定検査なら、事前の有病率はかなり高いことが期待される。
前者は対象者をどれくらいに広げるかによるが、10%程度、後者は50%位あるかもしれない。
有病率以外を同じ条件で、100人陽性が出た場合、有病率10%だと43.75人、有病率30%だと75人が
本当に感染している。有病率10%でも、用意した100室の内半分以上は無駄。
30%だと、1/4が無駄になるが、これくらいなら許容範囲かもしれない。
感度70%程度だから、10人真の感染者が検査をしに来ても、3人は、いわば「お墨付き」で市中に放たれてしまう。
一方、特異度90%だから、検査を受けに来た非感染者の1/10(←検査を受けた人の1/10にほぼ等しい)は、いわば、
「無実の罪」で、隔離生活を強いられてしまう。
これらを理解すれば、「希望者全員に検査を受けさせるべき」等という発言が如何に愚かか判るはず。

322:１３２人目の素数さん
20/04/15 23:14:13.84 .net
>>305
低学歴の空想

323:１３２人目の素数さん
20/04/15 23:39:03 0UT8Eg4R.net
有病率r、感度p、特異度qのとき、　陽性的中率　は pr / (pr+(1-r)(1-q))　で与えられます。

p=0.7、q=0.9　なら、(陽性的中率) = 7r/(6r+1) です。

r=0.001　で、(陽性的中率) = 0.00695825
r=0.01 　で、(陽性的中率) = 0.0660377
r=0.1 　で、(陽性的中率) = 0.4375
r=0.3 　で、(陽性的中率) = 0.75
r=0.5 　で、(陽性的中率) = 0.875

です。空想ではありません。事実に基づいた定量的なお話です。

324:１３２人目の素数さん
20/04/15 23:51:00 .net
>>307
与えられねえよクソ低学歴
高校入学してから吠えろ知恵遅れ猿

325:１３２人目の素数さん
20/04/15 23:57:19 .net
>>307
r=1なら的中率が常に1だな
低知能に生まれてしまったことを呪いながら死にな役立たず生ゴミ

326:１３２人目の素数さん
20/04/15 23:58:42 0UT8Eg4R.net
与えられて欲しくないという、あなたの願望ですか？
URLﾘﾝｸ(ja.wikipedia.org)陽性適中率
をご覧下さい。

327:１３２人目の素数さん
20/04/16 00:02:44 OjGN+Ds9.net
IUTTでもおなじみフェセンコ氏がコロナのSIRモデル論じている

URLﾘﾝｸ(arxiv.org)

328:１３２人目の素数さん
20/04/16 00:04:18 Y1iriB2t.net
>>309
r=1　なら、全員が病気です。
検査によって、陰性と判断される人もいるでしょうが、
陽性と判断された人は、全て本当に陽性＝病気です。
だから、的中しています。常に１で、問題ありません。

329:１３２人目の素数さん
20/04/16 00:09:06 .net
>>310
バカペディアをソースにしてる時点で無能低学歴確定

330:１３２人目の素数さん
20/04/16 00:09:53 .net
>>312
感度0なら陽性者0
バカ丸出しだろこの猿

331:１３２人目の素数さん
20/04/16 00:11:46 .net
>>310
出典なしの妄想がソースwwwwww
低知能低学歴って全てが空想なのなwwwww

332:１３２人目の素数さん
20/04/16 00:15:39 .net
>>310
このバカペディアを弄った低学歴猿って確実にベイズの定理を理解してない

333:１３２人目の素数さん
20/04/16 00:20:16 oinCpTGH.net
医学誌BMJに掲載された記事によれば、
中国で新規に確認された感染者のうち78％は明確な症状を示さなかったという。

これが本当なら、検査に症状制限を高く設定している場合、
少なくとも78％は感染していても完全に検査体制から排除されていることになる。

偽陰性が野に放たれることを相対的に重大視する検査制限主義者が
これを無視するのはいったいどういう理屈からなのか。

334:１３２人目の素数さん
20/04/16 00:30:18 oinCpTGH.net
>>304
> あんたは感染してもいないのに感染の危険にさらされてもいいのかね？
> 運が悪かったと諦めろと？

それは検査後の扱い、処遇の方法論の問題であって、
検査それ自体がもたらすリスクではない。

例えば、偽陰性の可能性があることを被験者に伝えれば、
検査期間が被験者に陰性のお墨付きを与えていることにもならない。

検査で陰性と出た人も症状があれば経過観察対象にできる。
検査をやれば、検査＋診察＋αで陽性者を漏らしてしまう確率は減る。
検査を制限する手法だと、
自覚症状の素人判断だけで疑わしい人を検証することすら放棄していることになる。

335:１３２人目の素数さん
20/04/16 00:31:59 .net
>>305
そもそも感度70%とか言ってる時点で論文読めない低学歴猿と確定するからな

URLﾘﾝｸ(iina-kobe.com)

完全なデマ

336:１３２人目の素数さん
20/04/16 00:38:23 .net
>>305
> 感度70%程度だから、10人真の感染者が検査をしに来ても、3人は、いわば「お墨付き」で市中に放たれてしまう。
>一方、特異度90%だから、検査を受けに来た非感染者の1/10(←検査を受けた人の1/10にほぼ等しい)は、いわば、
「無実の罪」で、隔離生活を強いられてしまう。

は？
お前の理屈なら感度70%なら10人の真の感染者が検査をしに来たら7人はちゃんと隔離されるんだが？

陰性的中率出してみろよ猿
そして首吊って死ね

337:１３２人目の素数さん
20/04/16 00:45:17 oinCpTGH.net
>>305さんの理屈は、
検査推進派が検査だけを拠り所にして結論を出す
という仮定を暗黙のうちにしていないか？
検査推進派がPCR検査だけを

338:絶対視するとどこで主張している？検査推進派はあくまでも無症状の人までも検査の機会を与える考えにすぎない。 PCR検査だけでお墨付きを与えるなどとは誰も主張していない。検査推進反対派はここを巧妙にすり替えている。

339:１３２人目の素数さん
20/04/16 00:48:00 .net
>>321
そもそもこいつの陽性的中率自体に何の意味も無いけどな
陰性的中率とやらも出してみればわかる
片方だけ条件付確率で論理をでっち上げもう片方は条件付確率を使わないというトリック

340:１３２人目の素数さん
20/04/16 00:48:16 .net
>>321
しかも感度そのものがデマだし

URLﾘﾝｸ(iina-kobe.com)

341:１３２人目の素数さん
20/04/16 01:09:50 .net
感度90%特異度99%だろ
URLﾘﾝｸ(i.imgur.com)

342:１３２人目の素数さん
20/04/16 01:10:28 .net
>>305
特異度90%のソースなし
捏造

343:１３２人目の素数さん
20/04/16 01:26:29 oinCpTGH.net
>>304
> ってか、こういうことを議論するなら定量的にやれよ。数学や統計を
> 使わずに定性的な議論をしても無駄。

統計を使った言説のトリックというか詐術の多くは定性的な議論のところにある。
その詐術を数や式の権威を使って覆い隠すパターンがほとんど。
統計的言説で騙されていけないのはそこ。

344:１３２人目の素数さん
20/04/16 01:34:30 oinCpTGH.net
a. 個人の自覚症状
b. 医師の診察
c. PCR検査
という3つのフィルターがあるとする。
検査制限派は、aかbの時点でPCR検査の機会を与えず門前払いする。
これが合理的であるためには、aやbがcよりも精度が高いという前提がなくてはならない。
検査推進派はa, b, cの機会をすべて与えようと努力する。
これら三つの検閲の組み合わせたほうがaとbで門前払いしてしまうより優れていると考えるから。

345:１３２人目の素数さん
20/04/16 04:50:54 .net
なお実際の精度は99.3％ある模様

URLﾘﾝｸ(finance.yahoo.com)
3DMed test demonstrated 99.3% sensitivity and 100% specificity in Chinese clinical trial
Nucleic Acid test performed on proprietary automated platform to increase throughput
CE Mark and China FDA approval have been received; 3DMed in discussions with US FDA and WHO
Technology was deployed in Wuhan, China with over 100,000 tests completed
Combination coronavirus and influenza A/B testing novel among PCR approaches

346:１３２人目の素数さん
20/04/16 06:27:45.10 .net
>>307
>>328のソースによると感度99.3%特異度100%なので
有病率1%と仮定すると陽性的中率は100%やね
はいおつかれ
URLﾘﾝｸ(i.imgur.com)

347:１３２人目の素数さん
20/04/16 06:48:30 10nqZrEx.net
>>307
感度と特異度が確定しているという前提が空想だよ。
>274参照

348:１３２人目の素数さん
20/04/16 06:57:21 10nqZrEx.net
(1)新型コロナ肺炎に感度100%の所見をひとつ述べよ。
(2)新型コロナ肺炎に特異度100%の所見をひとつ述べよ。

349:１３２人目の素数さん
20/04/16 07:00:05 10nqZrEx.net
>>326
同意。これ！
“Statistics are like bikinis. What they reveal is suggestive, but what they conceal is vital.”

350:１３２人目の素数さん
20/04/16 07:06:20 Ikob+nf7.net
面白そうなスレだな
1から読んでみるわ

351:１３２人目の素数さん
20/04/16 07:18:24 .net
>>330
で各国の実データ使うとどうなりますのん？

352:１３２人目の素数さん
2020/04/1

353:6(木) 07:19:05 .net

354:１３２人目の素数さん
20/04/16 10:22:32 6PriXNuy.net
なんか、まともに議論も数学もできない、とてつもないバカが二人混じってるな。
（= >>335,326)
idなしのやつの方は人間として終わってるバカだがｗ

困ったもんだ。

355:１３２人目の素数さん
20/04/16 10:36:23 6PriXNuy.net
>>326
君は降雨確率が30%という予報で、雨が降ったら騙されたって言う手合のようだねｗ

「世の中には3つの嘘がある。嘘、大嘘、そして統計である」という言葉があるが、
統計を理解してない人が統計を扱えばそうなっちゃう。

356:１３２人目の素数さん
20/04/16 10:38:53 6PriXNuy.net
>>318
つ>>301

357:１３２人目の素数さん
20/04/16 10:47:34 6PriXNuy.net
>>328
精度じゃなくて感度だよ。しかも試験管のテスト。
PCR検査で感度・特異度ともにどちらもほぼ100%になるのは常識。

検体採取の行程（ヒューマンエラーetc.）まで考慮にいれれば、
感度も特異度も下がる。特に感度のほうはスワブでちゃんと
検体が取れてるかどうかが怪しくて、かなり下がる。

358:１３２人目の素数さん
20/04/16 10:52:20 6PriXNuy.net
特異度を下げるのはこういうコンタミが起きたりするから。
レアだけど無視できない。

>愛知県ＰＣＲ検査ミス　陰性の２４人を陽性と判定‥１人が陽性患者と同室に
URLﾘﾝｸ(hicbc.com)

359:１３２人目の素数さん
20/04/16 11:17:58 .net
>>339

in Chinese clinical trial

360:１３２人目の素数さん
20/04/16 11:19:36 .net
>>339
検体はひとつでは無い
日本では6検体
無知が吠えんな

361:１３２人目の素数さん
20/04/16 11:22:34 .net
>>340
確率出してから吠えて

362:１３２人目の素数さん
20/04/16 23:31:42 10nqZrEx.net
そのうち、過剰診断と言い出す予感。
福島の甲状腺がんみたいに。

363:１３２人目の素数さん
20/04/16 23:33:03 10nqZrEx.net
>331に即答できる人いないの？

364:１３２人目の素数さん
20/04/17 02:11:00 7ANIVQwh.net
>>345
穿った質問に素直に時間かける阿呆が居ると思ってる奴

365:１３２人目の素数さん
20/04/17 04:40:45 FGyxpq6I.net
>>346
ロスマンの疫学を読んだことのある人なら答えられるし、
感度特異度の意味を理解していれば自分で答えが出せる。

366:１３２人目の素数さん
20/04/17 04:50:30 FGyxpq6I.net
サパイラ身体診察のアートとサイエンスにも載っているが、こっちは100%の所見ではないな。

367:１３２人目の素数さん
20/04/17 06:45:53.79 i6G48nGU.net
>>347
君が書いたらいい

368:１３２人目の素数さん
20/04/17 07:04:43 FGyxpq6I.net
サパイラ身体診察のアートとサイエンスには
あらゆる疾患に感度の高い検査（所見）として　10　finger test が挙げられている。
すなわち、指が１０本あれば疾患ありと判断する。

この検査の感度は１００％に近い。新型コロナでも高感度。

369:１３２人目の素数さん
20/04/17 07:21:40 FGyxpq6I.net
身体診察のアートとサイエンス　の　翻訳者のひとりには岩田健太郎がいる。
俺は旧版を原著で読んだ。　

引用すると、

A test with high sensitivity is not necessarily a useful test. The sign “10 fingers” would be
extremely sensitive for almost any disease because most patients with the disease will have ten
fingers. Very few patients with the disease will have a different number of fingers. Thus, the ratio of
true positives (number of patients with the disease who have ten fingers) to the sum of true positives
plus false negatives (where false negatives are people who have the disease and do not have ten
fingers)

370: will usually be greater than 0.99 (except in a sanitarium for Hansen disease). Yet, common sense tells us that the possession of ten fingers, however sensitive on paper, is not of great use to the diagnostician. Why not? The reason is that most of the people in the world have ten fingers but do not have the disease.

371:１３２人目の素数さん
20/04/17 07:34:40 FGyxpq6I.net
>>334
各国の検査数と陽性数のデータがあれば、
β分布のパラメータを以下のように設定してMCMCすれば出せる。

beta(13.6991,9.4661)でmode 0.6, sd = 0.1
beta(36.172,4.908)でmode 0.9 sd = 0.05

東京都で検査を受けたハイリスクグループでの陽性率を出そうしたんだが、
東京都は行政検査数しか公表しないので出す術がない。

372:イナ ◆/7jUdUKiSM
20/04/17 21:14:42 UUkt12DA.net
コロナが苦手なものはなんだ？　相手の弱点をみつけようよ。乾燥に弱いとか、熱に弱いとか、なんかないの？　前に使った薬がなんで効いてるか、その仕組みがわかったらなぁ。治ってる人や症状改善した人がいるってところになにかヒントがあるよ。
]∩∩∥ □ ∥;;;;;＼
(-_-)）　　∥;;;;;;∥
(っγυ　｡∥╂─╂∥
]`(_)_)ц~ ∥╂─╂∥
､■υυ■__∥＼＼＼∥
`＼＼＼＼＼＼＼＼＼`)
`＼＼＼＼＼＼＼＼＼/|
`＼＼＼＼＼＼＼＼`/ |
_＼＼＼＼＼＼＼＼/　L
￣|＼＼＼＼＼＼／|　/
］| ∥￣￣￣￣∥ | / /
__| ∥ □　□ ∥ |/ /
___`∥________∥／_/
￣￣￣￣￣￣￣￣￣∥ /
__________________∥/

373:１３２人目の素数さん
20/04/17 21:32:06 FGyxpq6I.net
>>353
＞コロナが苦手なもの

知性だな。
台湾の知性が制御している。

374:１３２人目の素数さん
20/04/17 22:05:39 TfUPqX9r.net
>>343
オープンなリソース管理はコロナの弱点だろうな
公務員が数ちょろまかしてるような国では強くなれる

375:イナ ◆/7jUdUKiSM
20/04/17 22:07:42 UUkt12DA.net
>>354罰金刑か。前>>353結局罰金刑しかないか。逮捕して処刑するしかないかなとは思ってたんだ俺も。
∥∩∩∥ □ ∥;;;;;＼
（(-_-）　　∥;;;;;;∥
（っγυ　｡∥╂─╂∥
■`(_)_)ц~ ∥╂─╂∥
＼■υυ■_∩∩､＼＼∥
＼＼＼＼⊂(_ _ )`⌒つ)
＼＼＼＼＼＼＼`υ､＼/|
＼＼＼＼＼`.,､､､＼`/ |
__＼＼＼＼彡`-`ﾐっ/　L
￣|＼_＼＼_U,~⌒ヾ　/
］| ∥￣￣￣￣U~~U / /
__| ∥ □　□ ∥ |/ /
___`∥________∥／_/
￣￣￣￣￣￣￣￣￣∥ /
__________________∥/

376:マイヤービートリス
20/04/18 16:10:15.81 Joe2nOPR.net
ベイズを議論している人に教えてほしいのだが
URLﾘﾝｸ(webronza.asahi.com)
でこの人の計算や解釈は正しいの？

377:１３２人目の素数さん
20/04/18 17:17:45 PWtsyGc9.net
>>ニュースなどで「クラスターで陽性が10人」＝「10人が感染」と素直に受け取ってしまう向きも多いだろう。
>>１万人を検査すると、70人+198人が陽性と判定される。本当の陽性は70人だから、結果が正しい確率は70÷268＝26％
>>正解は、約26％だ。判定が「陽性」でも、本当の感染者は10人中3人以下ということだ。

明らかに誤っている部分がある。

市中感染率を1%と仮定し、その中から無作為に調査を行って、10人の陽性と判断される者を見つけた場合、
確かに、本当の感染者は2.6人程度。

しかし、クラスターが発見され、その周辺から、感染者を探す場合は、事前確率は1%ではない。
どの範囲まで、調査対象を広げるかにもよるが、50%とかが期待される。
仮に50%だとすると、87.5%、陽性と判断された結果は正しい。

378:１３２人目の素数さん
20/04/18 17:17:48 vWIoYYH+.net
pr2pv <- function( # prevalence to predicative value
pr ,# prevalence
sn=0.7, # sensitibity=TP/(TP+FN)
sp=0.9) # specificity=TN/(TN+FP)
{
N=1 # polutaion million, billion,or any proper unit
si=pr*N # sick population
he=(1-pr)*N # healthy population
TP=si*sn
FN=si*(1-sn)
TN=he*sp
FP=he*(1-sp)
PPV=TP/(TP+FP)
NPV=TN/(TN+FN)
PV=c(PPV=PPV,NPV=NPV)
return(PV)
}

> pr2pv(0.01,0.7,0.98)
PPV NPV
0.2611940 0.9969174
計算はあってる。面倒だから解説は読まない。

379:１３２人目の素数さん
20/04/18 17:37:48 vWIoYYH+.net
クラスターから何人検査して何人陽性であったのかによって結果が違ってくるね。

検査の感度を最頻値0.7標準偏差0.1
特異度を最頻値0.98 標準偏差0.01
有病率は(0,1)の一様分布
を弱情報事前分布(情弱事前分布w)として

クラスターから10人検査したら10人陽性であったとき　stanでMCMCした結果

URLﾘﾝｸ(i.imgur.com)
URLﾘﾝｸ(i.imgur.com)

380:１３２人目の素数さん
20/04/18 17:41:14.84 vWIoYYH+.net
クラスターから100人検査して10人陽性だった場合

mean se_mean sd 2.5% 50% 97.5% n_eff Rhat
prev 0.13475 0.00044 0.05797 0.04287 0.12754 0.27095 17334 1.00010
sen 0.66409 0.00074 0.10423 0.44686 0.67054 0.84855 20036 1.00010
spc 0.97580 0.00007 0.01006 0.95256 0.97714 0.99146 20272 1.00012
p 0.10797 0.00019 0.03044 0.05633 0.10530 0.17455 24621 1.00001
PPV 0.76071 0.00072 0.09797 0.53774 0.77243 0.91536 18317 1.00011
NPV 0.95986 0.00013 0.01749 0.91811 0.96260 0.98585 17185 1.00010
precision 0.94212 0.00013 0.01766 0.90229 0.94405 0.97089 19310 1.00010
pLR 33.28155 0.14736 18.25227 12.71591 28.84717 80.12622 15341 1.00013
nLR 0.34429 0.00075 0.10692 0.15527 0.33782 0.56712 20099 1.00010
DOR 114.74459 0.78412 97.10981 25.95828 89.02272 356.05482 15338 0.99996
lp__ -75.90415 0.01168 1.27866 -79.22234 -75.58340 -74.42549 11979 1.00024
PPVは0.76

381:１３２人目の素数さん
20/04/18 17:55:40.37 vWIoYYH+.net
>358の指摘の通り、陽性的中率はその集団の有病率の影響されるから、クラスターの有病率を１％にするのは間違い。
情報がないから、クラスター内の有病率の確率分布を一様分布として計算するとか、母集団の有病率の10倍以内とか設定すればクラスター内の有病率の確率分布が出せる。
クラスタ100人検査で10人陽性、クラスター内の有病率は母集団の10倍以内と設定すると
陽性的中率は、0.684　95％CI（0.497-0.857)と計算された。

382:１３２人目の素数さん
20/04/18 18:10:34.06 vWIoYYH+.net
結局、誤った解説を読む羽目になったｗ

383:マイヤービートリス
20/04/18 18:18:36 Joe2nOPR.net
>>358
有難うございます。
>>しかし、クラスターが発見され、その周辺から、感染者を探す場合は、事前確率は1%ではない。
この見積もりがキーですね。
>>359,360,361,362
計算有難うございます。

384:１３２人目の素数さん
20/04/18 20:40:48.15 iquzLVJz.net
>>358
おいおい、なにも間違ったことは書いてないでしょ。
君の引用の仕方に問題があるんだよ。
>>ニュースなどで「クラスターで陽性が10人」＝「10人が感染」と素直に受け取ってしまう向きも多いだろう。
で一旦段落は終わってるんだから、１万人を検査すると云々という、設定された
「問題」の答えとは直接リンクしてない。君のように勘違いする人はいるかも
しれないが、きちんと読めば間違ったことは書いてないことがわかるはず。
どこにもクラスターの有病率が１％だなどとは書いてない。
で、仮に有病率が50%でも、
>「クラスターで陽性が10人」＝「10人が感染」
ではないわけで、引用元の著者の主張はまっとうなものだと思える。
>>364
だから、有病率が高いと見込まれる集団での検査であればいいわけで、
むやみに検査せずにある程度絞り込むべきだ（たとえば、クラスター
感染が疑われる集団を対象にせよ）とまで記事の中で述べられていれば
よかったんだろうけど、そこまで書かなかったのは片手落ちだったかもね。

385:１３２人目の素数さん
20/04/18 21:33:23 PWtsyGc9.net
もし、記事が、

「ニュースなどで「陽性判定が10人」＝「10人が感染」と素直に受け取ってしまう向きも多いだろう。」

と書かれていたなら、あなたの指摘は正しいだろう。しかし、実際は

>> ニュースなどで「クラスターで陽性が10人」＝「10人が感染」と素直に受け取ってしまう向きも多いだろう。

となっている。
クラスターとは、集団の存在、つまり、濃度の濃い部分があることを示唆したものであり、
母集団の感染率をそのまま用いるべきではない点を指摘した。
だから、非クラスターなら、正解だか、クラスターなら正解とは言えないという主旨で書いている。

換言すれば、問題の設定では、
「真の感染率＝1％とする。（検査に至った経緯や、発熱・咳など他の所見は無視する）。」
と書いているのに対し、問題の解説では、「クラスター」を持ち出して解説しているのは、明らかに不適当。

386:１３２人目の素数さん
20/04/19 00:22:33.17 eKu2VjGM.net
>>366
クラスターですら、「陽性判定＝感染」ってことではないんだから、その
一文で言いたいことに間違いはない。
でもって、著者は、クラスターの有病率が１％なんてことは一言も言って
ないし、そもそも、クラスターについての具体的な解説もしていない。単に
ニュースで扱われる文言の例としてそこで１回だけクラスターという言葉が
使われてるだけ。クラスターの検査を否定してる内容でもない。
有病率があがると的中率も大きくあがることについては、記事中のグラフで
示してあるから、情報が示されてないわけでもない。記事の主旨とは直接関係
ないので文章中では触れなかっただけでしょうね。

387:１３２人目の素数さん
20/04/19 01:26:51.78 R/sv/z3n.net
統計全然わからないんだけど、今行われてるPCR検査で陽性と判断されて、本当に罹患してる確率ってどの程度なの？

388:１３２人目の素数さん
20/04/19 01:56:19.99 gn6lsHTI.net
もし、筆者の伝えたいことが、「陽性判定は、即、感染者ということにはならない」　つまり、
「間違えることもある」という点にあるのであれば、あなたの言い分は通るかもしれないが、筆者の力点は、
>>正解は、約26％だ。判定が「陽性」でも、本当の感染者は10人中3人以下ということだ。
を見て判る通り、「陽性的中率が低い」というというところにある。
そのために、感度や特異度、真の感染率などに、具体的な数字を与えているし、問題設定の中では、わざわざ
>> （検査に至った経緯や、発熱・咳など他の所見は無視する）。
等と断り、終始定量的な説明が加えられている。
ならばこそ、なおさら、「クラスター」という言葉は使うべきでは無かった。
クラスター周辺での調査と、市中での無作為検査では、陽性的中率が変わってしまうのは、
全体を通して、筆者が言いたいことであっただろうに、にもかかわらず、問題の解説で
前提を崩してしまう「クラスター」という言葉を使ったのだから。
そもそも、ニュースでは、「PCRで陽性が○○人」等という使い方をしていただろうか？
単に「感染者○○人」だと思う。もちろん、この感染者の中には、偽陽性も含まれているだろうが、
検査陽性者数と感染者数の違いに注目を与えかねない「陽性者○○人」のような報道は記憶に無い。
そう考えると、「誤解の種」を自ら蒔いて、刈り取るかのような記事に見えてきた。

389:１３２人目の素数さん
20/04/19 02:31

390::27.50 ID:Czp86qrf.net

391:１３２人目の素数さん
20/04/19 07:50:33.21 Czp86qrf.net
クラスターで１０人が陽性として検査した人数と陽性的中率PPVとの関係をグラフにしてみた。
灰色実線は95%信頼区間境界、灰色点線はPPV＝0.26の線
URLﾘﾝｸ(i.imgur.com)
全人口の有病率をクラスター内の有病率にすり替えて、１０人陽性でも感染しているのは３人以下という間違った結論を出している。
わかっていて書いているのか、馬鹿なのか、どちらかは不明。

392:１３２人目の素数さん
20/04/19 07:56:38.54 Czp86qrf.net
>>368
罹患の定義による。
他人のゲノムでコンタミネーションが起こったりしていなければ、
あるゲノムのシークアンスが検出されたら罹患というなら、罹患率は１００％
ウイルスとして増殖能力を有しているかは不明、死骸の一部を検出しているだけかもしれない。

393:１３２人目の素数さん
20/04/19 08:01:23.85 Czp86qrf.net
>>369
東京都の発表では　感染者数とせず、陽性患者数と表現している。
正確を期すなら陽性者数とすべきだろうな。
URLﾘﾝｸ(stopcovid19.metro.tokyo.lg.jp)

394:１３２人目の素数さん
20/04/19 20:39:24 Czp86qrf.net
Natureのこの論文はエクセルとRのコードがついていて自分で再現できるので入力の手間が省ける。
URLﾘﾝｸ(www.nature.com)
感染させる確率分布をガンマ分布を平行移動させた分布として想定して、データから最尤法でパラメータ算出している。

395:１３２人目の素数さん
20/04/20 17:39:51 Db3kUO+J.net
>>374
そのプログラムをみていくと
感染させる確率分布を
#--- infectiousness, gamma distribution ---
# gpar[1:2]: hyper-parameters (gamma)
# x : infection time of infectee w.r.t onset time of infector
f.Xc = function(x, gpar) { dgamma(x, gpar[1], gpar[2]) }
ガンマ分布にしているけど
一人が一人を感染させるモデルだから
形状パラメータgpar[1]は1で固定、つまり、指数分布だと思うんだがどうだろ？待ち時間の分布と同じ考え。

w.r.t = with reference to らしい

396:１３２人目の素数さん
20/04/20 19:39:48 Db3kUO+J.net
>>375
補足

ひとりが別の一人に一回感染させるというモデルなので待ち時間の分布の指数分布でいいと思う。
ガンマ分布の形状パラメータ＝１とおけば指数分布になる。
プログラムを書き直してグラフにすると
URLﾘﾝｸ(i.imgur.com)
発症前に感染させている確率は47％と原著とあまりかわらないが、そのピークは発症1.6日前という結果になった。

397:１３２人目の素数さん
20/04/20 21:40:46 LmPkmRXS.net
>>369

>>正解は、約26％だ。判定が「陽性」でも、本当の感染者は10人中3人以下ということだ。

ああ、確かにそこは問題だな。前段の「クラスターで陽性が１０人」とリンクすると
思われても仕方がない。著者もうかつだとは思うが、有病率により的中率が変わると
いう話の内容は間違いではない。

398:１３２人目の素数さん
20/04/20 21:52:20 LmPkmRXS.net
>>371
元記事のグラフの有病率0.1のところをみれば的中率が80％越えになってるわけで、
単純に「クラスター」って言葉を軽んじてただけなんだろうね。
URLﾘﾝｸ(webronza.asahi.com)

399:１３２人目の素数さん
20/04/20 23:44:00 IwCIr2qd.net
>>375
たにんへの感染力の分布なんか数学的にわかるわけないやん？罹患して気道部にウィルスを放出できるくらいのウィルス量が繁殖するのは罹患していきなりなわけがない。

400:１３２人目の素数さん
20/04/21 00:05:49 bowf2rRh.net
適当にSEIRモデル�

401:g張してシミュレーションすれば分かるけどかなり自粛しても感染爆発は起こるよ

402:１３２人目の素数さん
20/04/21 02:51:28 7mnZKVUh.net
URLﾘﾝｸ(www.youtube.com)

東大数学科卒の高橋洋一氏が人との接触7割減」の根拠を数式から
語ってるがどう見る？

403:１３２人目の素数さん
20/04/21 06:50:58.83 J5/+FVIQ.net
ガンマ分布：「一定期間に1回起きると期待されるランダムな事象が複数回起きるまでの時間の分布」
複数回でなくて1回だと指数分布だと思う。
何度も感染した症例を扱っているのではないのだから、ガンマ分布のパラメータを求める意味が理解できない。

404:１３２人目の素数さん
20/04/21 06:56:00.72 J5/+FVIQ.net
>>380
SEIRモデルだと感染爆発させた方が早期に収束する。死者や感染者は増えるけど。
シミュレーションでは鎖国している前提で4割が感染すればオリンピックは可能だった。
SEIRモデルはEは感染力なし、Rは再感染しないというモデルだからなぁ。
モデルを修正してR->Sの再感染が0.１%あるだけで終焉しなかったな。
しかも、外部から感染力の強いキャリアー（保菌者）が入ってくることはモデルには組み込まれていない。

405:１３２人目の素数さん
20/04/21 06:59:16.79 J5/+FVIQ.net
>>379
結局、一定期間に1回起きると期待されるランダムな事象として、その一定期間を推測しているんだろ？

406:１３２人目の素数さん
20/04/21 07:47:46 J5/+FVIQ.net
>>381
SIRモデルって鎖国モデルだから結論は信用できん。

407:１３２人目の素数さん
20/04/21 11:00:38 LfxF6Y+G.net
統計できる人尊敬するわ
MCMCとか訳分からん

408:１３２人目の素数さん
20/04/21 11:28:48 J5/+FVIQ.net
>>386
統計ってある統計量がほんにゃら分布に従うというのを黙って受容しないと次に進めないよね。
郡内分散と郡間分散の比がF分布に従うとか言われても
どうしてかは理解していない。
stanのNUTSとかfrog leapとかわからんままにMCMCさせている。

409:イナ ◆/7jUdUKiSM
20/04/21 13:30:52 0ilKIHza.net
こういうときこそコンピューターとかに頼らずに一つ一つ数をかぞえて方程式を立て、微分するべきだと思う。
∥∩∩∥ □ ∥　　＼
（-_-)）　　∥______∥
（っγυ　｡∥╂─╂∥
■`(_)_)ц~ ∥╂─╂∥
＼■υυ■_∩∩､＼＼∥
＼＼＼＼⊂(_ _ )`⌒つ)
＼＼＼＼＼＼＼`υ､＼/|
＼＼＼＼＼`.,､､､＼`/ |
__＼＼＼＼彡`-`ﾐっ/　L
￣|＼_＼＼_U,~⌒ヾ　/
］| ∥￣￣￣￣U~~U / /
__| ∥ □　□ ∥ |/ /
___`∥________∥／_/
￣￣￣￣￣￣￣￣￣∥ /
__________________∥/

410:１３２人目の素数さん
20/04/21 14:53:08 pHehMVs5.net
>>386
sirモデルでは罹患した患者が回復するまでの機会中常に一定の確率(感染率)で遭遇した感受受宿主に感染を広めると仮定して立式してる。
ザックリした傾向を見るならそれで十分だけど、実際のモデルではそんな事はありえない。
感染する確率は患者の体内で繁殖しているウィルス量の増加に従って増えるからその効果を勘案してΓ分布(というかt^c d^x なる形の関数)に応じて感染率が罹患した時点から変化するとするんでしょ？
もちろんコレでも大体の傾向見るにはコレで十分というモデルを臨床例から適当に選んでるだけでしょ？
実際には未来永劫感染力を持ち続けるなんて事があるはずないし、罹患初期のウィルス量の増え方はおそらく指数関数的に増えるものを採用すべきだろうし。

411:１３２人目の素数さん
20/04/21 14:54:06 pHehMVs5.net
mcmc

412:１３２人目の素数さん
20/04/22 08:56:14 0tlpvLKp.net
>>388
無理無理。
カブトガニVSシオマネキ論争はコンピュータの計算結果で決着がついたよ。

413:１３２人目の素数さん
20/04/22 13:23:53 0tlpvLKp.net
週末は休むとか週間変動の影響を除くために１週間の移動平均で線形回帰して片対数

414:グラフにすると https://i.imgur.com/7VwfswD.png 自粛の効果がでてきているな。　多分、検査自粛の効果だろうな。

415:イナ
20/04/22 19:51:00.75 iq1GZOqA.net
∥∩∩ ∥ □ ∥前 >>388
（(-_-)∥　　∥______
（っ⌒⌒ﾞ　｡∥╂─╂
■`(_)_)ц~　∥╂─╂
＼■υυ■_∩∩､＼＼＼
＼＼＼＼⊂(_ _ )`⌒つ､
＼＼＼＼＼＼＼`υ､＼＼＼＼＼＼＼＼＼＼＼＼＼＼＼＼`>>391カブトガニでもシオマネキでもシュクメルリでも微分するのがいちばん強力だと思う。

416:１３２人目の素数さん
20/04/23 04:58:29 3vcirHk0.net
>>393
これを微分で解いたら、ネ申か狂人だろな。

AからHの8人はそれぞれ正直者か嘘つきであり、誰が正直者か嘘つきかはお互いに知っている。
A,B,C,D,Eは嘘つきなら必ず嘘をつくが、F,G,Hは嘘つきでも正しいことを言う場合がある。
次の証言から確実に正直者と断定できるのは誰か？

A「嘘つきの方が正直者より多い」
B「Hは嘘つきである」
C「Bは嘘つきである」
D「CもFも嘘つきである」
E「8人の中に、少なくとも1人嘘つきがいる」
F「8人の中に、少なくとも2人嘘つきがいる」
G「Eは嘘つきである」
H「AもFも正直者である」

417:１３２人目の素数さん
20/04/23 08:28:17 3vcirHk0.net
CTとPCRの一致係数（κ値）を信頼区間つきでMCMCしようかと思ってスクリプトを書いたはいいが
肝心なデータがない　：（
事前分布を一様分布にするのには異論があるかもしれん。

library(rjags)
kappa.model='
model{
A ~ dbeta(1,1) # A:Pr[CT+], 1-A:Pr[CT-]
B ~ dbeta(1,1) # B:Pr[PCR+|CT+]
C ~ dbeta(1,1) # C:Pr[PCR-|CT-]
p[1]=A*B # CT+PCR-
p[2]=A*(1-B) # CT+PCR-
p[3]=(1-A)*(1-C) # CT-PCR+
p[4]=(1-A)*C # CT-PCR-
y[1:4] ~ dmulti(p[],n) # multinominal distribution
po=(p[1]+p[4])/n # observed agreement
pe=(p[1]+p[2])/n*(p[1]+p[3])/n + (p[3]+p[4])/n*(p[2]+p[4])/n # coincidence
kappa=(po-pe)/(1-pe)
PABAK=2*po-1 # Prevalence Adjusted Bias Adjusted Kappa
}
'
writeLines(kappa.model,'kappaj.txt')

418:１３２人目の素数さん
20/04/23 10:37:41 3vcirHk0.net
中国には特異度１００％の検査キットがあるんだってね。
すべて陰性にでるようにセットされていると。

419:１３２人目の素数さん
20/04/23 13:51:17 3vcirHk0.net
新型コロナ患者を治療している病院に100人の職員がいる。
検体採取器具は5人分、試薬は1回分しかないとする。
無作為抽出した5人の職員から採取した検体を混合して検査したら陽性であった。
職員の陽性者数の期待値を求めよ。
また、50人以上の感染者いる確率はいくつか？
検査の陽性率はハイリスク群に検査している東京の数値2457/6654を使って計算せよ。
URLﾘﾝｸ(i.imgur.com)

420:１３２人目の素数さん
20/04/23 13:53:25 3vcirHk0.net
>>397
こんなグラフになった。

URLﾘﾝｸ(i.imgur.com)

421:１３２人目の素数さん
20/04/23 17:36:48 3vcirHk0.net
>>397
これであってるかな？

> # 期待値
> integrate(function(x) x*pdf(x),0,100)$value
[1] 37.13
> # 50人以上の確率
> integrate(pdf,50,100)$value
[1] 0.0041903
> c(HPDI.lower=lwr,HPDI.upper=upr) # HPDI
HPDI.lower HPDI.upper
27.778 46.558

422:１３２人目の素数さん
20/04/23 22:02:05.89 MtjaFZpr.net
レベル低

423:１３２人目の素数さん
20/04/24 02:55:58 juJsFFfP.net
慶応大の調査で、コロナ以外で来院した人をPCR検査したところ
4/67の確率で要請だった
東京都内1500万のうち何人くらいが感染しているか推定せよ

424:１３２人目の素数さん
20/04/24 03:18:37 XPGerQAq.net
岩田健太郎・�

425:_戸大学教授『東京はすでに20万～400万人感染の可能性』 https://leia.5ch.net/test/read.cgi/poverty/1587664106/

426:１３２人目の素数さん
20/04/24 05:36:50.27 9Fe9PNfV.net
>>401
ニュー速でやったが、ベイズでこんな感じ？(感染者率)
URLﾘﾝｸ(i.imgur.com)

427:１３２人目の素数さん
20/04/24 05:52:14 9Fe9PNfV.net
>>397
混ぜて検査する方法の最適化問題ってのもあるね。

URLﾘﾝｸ(mobile.twitter.com)
(deleted an unsolicited ad)

428:１３２人目の素数さん
20/04/24 08:13:06 0onl6lJy.net
>>401
これって東京の無作為サンプリングではなさそうだよね
病院に来たって事は熱が出てたのかもしれないし
想定できる母集団ってなんになるのだろうか

429:１３２人目の素数さん
20/04/24 12:07:56 v55OWzbu.net
新型コロナ患者を治療している病院に100人の職員がいる。
検体採取器具は10人分、試薬は1回分しかないとする。
無作為抽出した10人の職員から採取した検体を混合して検査したら陰性であった。
職員の陽性者数の期待値を求めよ。
また、50人以上の感染者いる確率はいくつか？
検査の陽性率はハイリスク群に検査している東京の数値2457/6654を使って計算せよ。

430:１３２人目の素数さん
20/04/24 12:11:36 v55OWzbu.net
>>401
95%CIで
> binom::binom.confint(4,67)
method x n mean lower upper
1 agresti-coull 4 67 0.05970149 0.019131154 0.1480232
2 asymptotic 4 67 0.05970149 0.002968439 0.1164345
3 bayes 4 67 0.06617647 0.015026904 0.1253507
4 cloglog 4 67 0.05970149 0.019283398 0.1337560
5 exact 4 67 0.05970149 0.016504404 0.1458632
6 logit 4 67 0.05970149 0.022588780 0.1485238
7 probit 4 67 0.05970149 0.020905075 0.1402573
8 profile 4 67 0.05970149 0.018970462 0.1332788
9 lrt 4 67 0.05970149 0.018929939 0.1332756
10 prop.test 4 67 0.05970149 0.019297952 0.1534709
11 wilson 4 67 0.05970149 0.023459351 0.1436950

431:１３２人目の素数さん
20/04/24 17:39:04 8oiI190P.net
>>401
まじか。
まあ、体調悪いから病院に行くわけで、バイアスかかってるとはいえ...。

432:１３２人目の素数さん
20/04/24 17:42:10 v55OWzbu.net
>>404
ラテン方陣の問題？

433:１３２人目の素数さん
20/04/24 20:48:11 v55OWzbu.net
>>403
事前分布にJefferey分布を使っているな。

URLﾘﾝｸ(i.imgur.com)

破線が事前分布、実戦が事後分布

curve(dbeta(x,0.5+4,0.5+67-4),bty='l',xlab='probability',ylab='density')
curve(dbeta(x,0.5,0.5),add=T,lty=2)

434:１３２人目の素数さん
20/04/24 20:55:16 v55OWzbu.net
>>410
青実線が事前分布を一様分布(Beta(1,1))としたとき。

URLﾘﾝｸ(i.imgur.com)

Jeffereyの方が95%CI幅が小さいな。

> binom::binom.bayes(4,67,prior.shape1 = 0.5,prior.shape2 = 0.5)
method x n shape1 shape2 mean lower upper sig
1 bayes 4 67 4.5 63.5 0.06617647 0.0150269 0.1253507 0.04999999
> binom::binom.bayes(4,67,prior.shape1 = 1, prior.shape2 = 1)
method x n shape1 shape2 mean lower upper sig
1 bayes 4 67 5 64 0.07246377 0.01876916 0.1338218 0.04999999

435:１３２人目の素数さん
20/04/24 21:13:10 v55OWzbu.net
>>401

URLﾘﾝｸ(georgebest1969.typepad.jp)

に準じて　東京都民の1395万人に当てはめると

> data.frame(method=ci[,1],round(ci[,4:6]*pop))
method mean lower upper
1 agresti-coull 832836 266880 2064924
2 asymptotic 832836 41410 1624262
3 bayes 923162 209625 1748642
4 cloglog 832836 269003 1865896
5 exact 832836 230236 2034792
6 logit 832836 315113 2071907
7 probit 832836 291626 1956590
8 profile 832836 264638 1859240
9 lrt 832836 264073 1859195

436: 10 prop.test 832836 269206 2140919 11 wilson 832836 327258 2004545 岩田の計算は 5 exact 832836 230236 2034792

437:１３２人目の素数さん
20/04/24 21:35:58 v55OWzbu.net
>>402
感度30-70％(最頻値0.5,標準偏差0.2のβ分布),特異度(最頻値0.9 標準偏差0.05のβ分布)に設定。
有病率の事前分布は0-1の一様分布にして　

MCMCしてみると

URLﾘﾝｸ(i.imgur.com)

という結果になった。

有病率の信頼区間は広すぎｗ

mean lower upper
0.22346412787 0.00000002913 0.83202346988

438:１３２人目の素数さん
20/04/24 21:50:22 v55OWzbu.net
>>413
有病率の最頻値は
> density(prev)$x[which.max(density(prev)$y)]
[1] 0.019186

439:１３２人目の素数さん
20/04/24 22:01:25 v55OWzbu.net
>>413
事前分布をJeffereyにしたら、

> js=PCRj4(67,4,SEN=0.5,SD1=0.2,SPC=0.9,SD2=0.1,N.ITER=1e6)$js
mean lower upper
1.4972e-01 6.3120e-14 8.5733e-01

> summary(prev)
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.0000 0.0111 0.0472 0.1497 0.1442 1.0000

> density(prev)$x[which.max(density(prev)$y)] # mode
[1] 0.0032278

440:１３２人目の素数さん
20/04/24 22:03:05.10 v55OWzbu.net
>>415
この最頻値はオーストリアの0.3％という値に等しいな。

441:１３２人目の素数さん
20/04/24 23:51:07 v55OWzbu.net
>>415
Jeffreys が正しいスペリングみたい。　Jefferey'sかと思っていた。

442:１３２人目の素数さん
20/04/25 13:54:43 R/UD6QQG.net
某医療センターでは治療後、2回連続してPCR検査陰性であれば退院させているとする。
PCR検査は
感度0.3~0.7 : β分布(2.625,2.625)相当
特異度 0.95~1.0 : β分布(26.5014,2.3422)相当
有病率は一様分布として
2回連続してPCR検査陰性の患者の有病率の期待値を求めよ。

２回連続検査陰性の患者が感染者である確率と有病率との関係をグラフにしてみた。
灰色点線は95％信頼区間

URLﾘﾝｸ(i.imgur.com)

443:１３２人目の素数さん
20/04/25 17:53:16 MKtk31sc.net
>>409
動的計画法を使うらしい。

URLﾘﾝｸ(qiita.com)

444:１３２人目の素数さん
20/04/26 21:43:36 0lgRXnyr.net
スレチですが統計に詳しい方がいると思って伺いました。
工学系の大学院生で論文を読んでて、見慣れない記号や数式が出てきたので質問させてください。
この数式中のEは何を意味するのでしょうか？
Rの期待値的なものですか？

URLﾘﾝｸ(i.imgur.com)

445:１３２人目の素数さん
20/04/27 02:54:57 cS0ISst+.net
院生でわからないってマジか
専門外の機械学習いきなりやらされたのかな？

446:１３２人目の素数さん
20/04/27 06:45:22 S7AmHM83.net
有病率が0.3％（オーストリアの無作為抽出)や6%(慶応大学の入院患者無作為抽出）のときは

感度30～70%　特異度90～100%のPCR検査キットでは

陰性的中率は
オーストリアの例では　95％[87％～99％]
慶応の例では 94%[86～99％]になる。

すべて陰性にでる中国のイカサマキットなら
陰性的中率は
オーストリアの例では99.7％
慶応の例では94%になる。

有病率が10％くらいになればイカカマキットの方が陰性的中率の成績が劣る。

447:１３２人目の素数さん
20/04/27 07:30:42 S7AmHM83.net
某医療センターでは治療後、2回連続してPCR検査陰性であれば退院させているとする。
PCR検査は
感度0.3~0.7 : β分布(2.625,2.625)相当
特異度 0.95~1.0 : β分布(26.5014,2.3422)相当
として

ｎ回連続して陰性であれば退院とするとどれくらいの感染者が野に放たれるかを
有病率（＝検査前確率）を変化させてグラフにしてみた。

URLﾘﾝｸ(i.imgur.com)

448:１３２人目の素数さん
20/04/28 10:03:02.25 /p2virDs.net
URLﾘﾝｸ(www.researchgate.net)

449:_Study/link/5ea19006458515ec3aff8f36/download https://i.imgur.com/3GWmZz3.png に有病率の低い群で行った唾液と鼻咽頭スワッブ200例のcross-section tableがあったのでこれでKappa係数とPABAK（prevalence ad-justed bias adjusted kappa）とその信頼区間をstanのMCMCで出してみた。 swabと唾液でまあ、結果が合致している。 > print(fit.kappa,pars=c('kappa','PABAK')) Inference for Stan model: kappa. 4 chains, each with iter=2000; warmup=1000; thin=1; post-warmup draws per chain=1000, total post-warmup draws=4000. mean se_mean sd 2.5% 25% 50% 75% 97.5% n_eff Rhat kappa 0.81 0 0.07 0.65 0.77 0.81 0.86 0.92 3540 1 PABAK 0.93 0 0.02 0.88 0.92 0.93 0.95 0.97 3342 1 JAGSでMCMCしてもほぼ同じ結果。 https://i.imgur.com/XKT53Fy.png

450:１３２人目の素数さん
20/04/28 21:14:48.22 V+QD5qnX.net
>>394
答えなくね？

451:１３２人目の素数さん
20/04/29 16:59:02 YhsQxAnp.net
>>425
正解。正直者が誰もいないようにプログラムした。
イナ師が微分で解いてくれるのを期待していたんだが。

452:１３２人目の素数さん
20/04/29 17:43:56 YhsQxAnp.net
PCR検査は
感度0.3~0.7 : β分布(2.625,2.625)相当
特異度 0.95~1.0 : β分布(26.5014,2.3422)相当
として、
URLﾘﾝｸ(statmodeling.hatenablog.com)
の設定を踏襲して、利用できるデータを更新して

推定陽性率は
> summary(p.pos) ; HDInterval::hdi(p.pos)[1:2]
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.000031 0.000067 0.004681 0.005229 0.009325 0.016658
lower upper
0.00003082 0.01408833

推定有病率は
> summary(prevalence) ; HDInterval::hdi(prevalence)[1:2]
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.00000 0.00166 0.00529 0.01040 0.01129 0.16078
lower upper
0.0000005693 0.0305640211

453:１３２人目の素数さん
20/04/29 18:02:18.86 FBYarVUq.net
>>426
正直者の確定が誰もいないというより、条件を満たす正直者・嘘つきの組み合わせが存在しないよね？
URLﾘﾝｸ(i.imgur.com)

454:１３２人目の素数さん
20/04/29 18:35:59 uFfpYtab.net
rRT-PRC検査の感度・特異度ともに90%以上です。

455:１３２人目の素数さん
20/04/29 19:40:54.19 uFfpYtab.net
通常の医療でも臨床診断の5%は誤診だと推定されていたりする。
これを実際の数として見積もると膨大になる。

456:１３２人目の素数さん
20/04/29 20:37:12 YhsQxAnp.net
>>429
採取手技や採取時期で変動すると思う。
コンタミによる偽陽性もあるだろうし。

457:１３２人目の素数さん
20/04/29 20:38:43 YhsQxAnp.net
>>428
言っていることは同じ。
全部の条件を満たす組み合わせは存在しない。

458:１３２人目の素数さん
20/04/29 20:39:49 YhsQxAnp.net
>>427
このデータは再現性がないことがわかったので撤回します。

459:１３２人目の素数さん
20/04/30 10:01:57 42TM9o6B.net
ふぉー

＜新型コロナ＞抗体検査５．９％陽性　市中感染の可能性　都内の希望者２００人調査
URLﾘﾝｸ(www.tokyo-np.co.jp)

460:１３２人目の素数さん
20/04/30 12:13:53 qOF+URFa.net
>>434

"検査結果では、一般市民の百四十七人の４・８％にあたる七人が陽性、
医療従事者五十五人のうち９・１％の五人が陽性だった。
URLﾘﾝｸ(www.tokyo-np.co.jp)

"

> r1=5;r2=7;n1=55;n2=147
> prop.test(c(r1,r2),c(n1,n2))

2-sample test for equality of proportions with continuity
correction

data: c(r1, r2) out of c(n1, n2)
X-squared = 0.679, df = 1, p-value = 0.41
alternative hypothesis: two.sided
95 percent confidence interval:
-0.052613 0.139194
sample estimates:
prop 1 prop 2
0.090909 0.047619

Warning message:
In prop.test(c(r1, r2), c(n1, n2)) :
Chi-squared approximation may be incorrect
> poisson.test(c(r1,r2),c(n1,n2))

Comparison of Poisson rates

data: c(r1, r2) time base: c(n1, n2)
count1 = 5, expected count1 = 3.27, p-value = 0.33
alternative hypothesis: true rate ratio is not equal to 1
95 percent confidence interval:
0.47778 6.98763
sample estimates:
rate ratio
1.9091

461:１３２人目の素数さん
20/04/30 19:13:48 42TM9o6B.net
>>434
これの興味深いところは、陽性率の高さもさることながら、医療関係者の感染率が一般市民のそれよりも
（多分有意に）高いことだと思う。抗体検査の精度ってほとんどデータが無いに等しいけど、医療関係者の
感染者率が平均よりも多いのならば（実際そうなのだと思う）、このテストはそれを反映したものと言えて、
抗体検査の信頼性をある程度証明できるかもしれない。
そして、市中の陽性率の高さも。

この辺、ベイズで上手く検証できないかな。

462:１３２人目の素数さん
20/04/30 20:32:35.24 qOF+URFa.net
>>436
>医療関係者の感染率が一般市民のそれよりも（多分有意に）高い
χ二乗検定では、p-value = 0.41 で　標本数が少ないから有意差がでない。
エントリーが５以下のときには信頼するなと習ったな。
まあ、ポアソンでもp-value = 0.33
>435にRの出力を貼っておいた。

463:１３２人目の素数さん
20/04/30 20:35:20.83 rbz2947p.net
>>436
55人中5人と147人中7人じゃ、有意差ないだろ。
と書こうと思ったら、 >>437氏に先を越されたｗｗｗ

464:１３２人目の素数さん
20/04/30 20:41:39 rbz2947p.net
抗体検査キットの評価をしたら特異度はみな5/5だったらしいけど、サンプルが
５つだけって意味だとすると、せいぜい90％以上くらいのことしか言えないな。
特異度95%だとしたら、５％が陽性っていわれてもねぇｗ

465:１３２人目の素数さん
20/04/30 21:20:01 qOF+URFa.net
>>436
事前分布にかなり影響をうけるが、

感度特異度とも50-70％(最頻値60%標準偏差10％のβ分布),
有病率は一様分布、
検査陽性数は陽性確率が　有病率*感度＋（１-有病率)*(1-特異度)の二項分布に従う

というモデルでプログラムを組むと

model
{
for(i in 1:N) {
x[i] ~ dbin(p,n[i])
}
p = prev*sen + (1-prev)*(1-spc)
PPV=sen*prev/(sen*prev+(1-prev)*(1-spc))
NPV=(1-prev)*spc/((1-prev)*spc+prev*(1-sen))
precision=(prev*sen+(1-prev)*spc)/
((prev*sen+(1-prev)*spc + (1-prev)*(1-spc)+(prev*(1-sen))))
pLR=sen/(1-spc)
nLR=(1-sen)/spc
DOR=pLR/nLR
sen ~ dbeta(sn[1],sn[2])
spc ~ dbeta(sp[1],sp[2])
prev ~ dbeta(shape1,shape2)
}

結果は、
URLﾘﾝｸ(i.imgur.com)

有病率の期待値は2.3%、最頻値は0.31%　少数データなので信頼区間が広い。
有病率が平均値50%の一様分布というのは現実離れした分布だとは思う。

466:１３２人目の素数さん
20/04/30 21:22:46 qOF+URFa.net
>>439
すべてが陰性に出るイカサマキットなら特異度が100％
>18参照

467:１３２人目の素数さん
20/04/30 21:33:35 qOF+URFa.net
>55人中5人と147人中7人じゃ、有意差ないだろ。

その比率のまま、約4倍(3.87倍)になればχ二乗検定で有意差がでるね。
r1=5;r2=7;n1=55;n2=147
mat=matrix(c(r1,r2,n1,n2),2,b=T)
fn <- function(x) chisq.test(mat*x)$p.value
fn=Vectorize(fn)
uniro

468:ot(function(x) fn(x)-0.05,c(1,10))$root fn(4) > fn(4) [1] 0.045678

469:１３２人目の素数さん
20/04/30 21:47:02.48 qOF+URFa.net
>>440（追記)
>有病率が平均値50%の一様分布というのは現実離れした分布だとは思う。
オーストリアのデータ0.3%を参考に有病率の事前分布が0.2-0.4％
β(10.865, 3279.34)に相当として、MCMCしてみた。
感度と特異度の事前分布は前回と同じ。
URLﾘﾝｸ(i.imgur.com)
さほど、有病率が高いという結論は引き出せないな。

470:１３２人目の素数さん
20/04/30 22:23:36 gdjT5b3G.net
自己流な検定

A群55人中5人とB群147人中7人に有意差はあるか？

モンテカルロ法で検証

A群もB群も同じ陽性率で、0.0594と仮定する
∵ 陽性率は、 12/(55+147) = 12/202 = 0.0594

モンテカルロ法100万回したら
B群の陽性者が7名となったのは、125238回
その内 A群の陽性が5名以上は、28293回

∴ P(55人中5人以上｜147人中7人) = 28293/125238 = 0.226
∴ 有意差なし

EXCEL VBAソースコード概略

Dim I As Long
Dim J As Long
Dim K As Long

K = 1
For I = 1 To 1000000
A = 0
For J = 1 To 55
If Rnd(1) < 0.0594 Then '陽性
A = A + 1
End If
Next

B = 0
For J = 1 To 147
If Rnd(1) < 0.0594 Then '陽性
B = B + 1
End If
Next

If B = 7 Then 'B群の陽性者が7名の場合
Cells(K, "A") = A 'A群の陽性者の人数
K = K + 1
End If
B = 0

Next

471:１３２人目の素数さん
20/04/30 23:17:24 qOF+URFa.net
β分布と乱数発生で比較。

一般人と医療従事者の確率分布に従う乱数を１０００万個発生させて比率の分布をグラフにすると
９５％信頼区間が１を挟むから有意差なし。比率が１以上となる確率も87.5％で95%を越えないから有意差なし。
URLﾘﾝｸ(i.imgur.com)

a=0.5 ; b=0.5
r1=5 ; r2=7 ; n1=55 ; n2=147
layout(1)
layout(matrix(1:2,2))
curve(dbeta(x,a+r2,b+n2-r2),0,0.3,bty='l',ann=F,lwd=2)
curve(dbeta(x,a+r1,b+n1-r1),col=2,add=T,lwd=2)
legend('center',bty='n',legend=c('general','medical'),lwd=2,col=1:2)
k=1e7
general=rbeta(k,a+r2,b+n2-r2)
medical=rbeta(k,a+r1,b+n1-r1)
BEST::plotPost(medical/general,compVal = 1)

472:１３２人目の素数さん
20/05/01 00:36:14 LcUyF6Tc.net
>>441
すべてが陰性に出るなら陽性は０人だろｗ

473:１３２人目の素数さん
20/05/01 07:22:53 LJVZP1pw.net
>>446
偽陽性率０％だから特異度は１００％

474:１３２人目の素数さん
20/05/01 10:05:01 LcUyF6Tc.net
>>447
だから、陽性が何人か出てんだから感度0%のインチキじゃなかろうってこと。

475:１３２人目の素数さん
20/05/04 00:17:48 Q8iLGwO2.net
最近の報道

インドは、中国企業から購入した中共ウイルス（新型コロナウイルス）の迅速スクリーニング検査キットの精度がわずか5％だとして、約50万個の注文をキャンセルした。

....
神戸市中央区にある市立医療センター中央市民病院の医師などのグループは、ことし３月末から先月７日にかけて、新型コロナウイルス以外の理由で外来を受診した患者から無作為に1000人を選び、血液中に新型コロナウイルスに感染したあとにできる「抗体」があるか調べました。
グループによりますとその結果、3.3％にあたる33人から抗体が検出されたということです。

以上を知ったある会社が
必ず陽性がでる試薬33個と必ず陰性がでる試薬967個を混ぜた1000試薬をセットにしてインドに売り込んだ。

問題

1試薬は1回しか検査できないとして
これがイカサマキット�

476:ﾅあることを証明する手段はあるか？

477:１３２人目の素数さん
20/05/04 15:22:29 jDRWX2Ph.net
3月の宿題で(1)のみ正解の数弱@shukudai_sujaku

昨年度の大学への数学(大数)での勝率は、

学コンBコースが 1/1 = 100% ，

宿題が 3/10 = 30% でした！

宿題の勝率が低すぎると思うので、

これからは一層精進していきたいです！

URLﾘﾝｸ(twitter.com)
(deleted an unsolicited ad)

478:１３２人目の素数さん
20/05/04 22:45:28 94tg6i4k.net
高橋洋一(統計数理研究所→大蔵省)
スウェーデンの感染症対策を解説
URLﾘﾝｸ(youtu.be)

479:１３２人目の素数さん
20/05/05 06:07:12 ht6rG86e.net
URLﾘﾝｸ(toyokeizai.net)
のデータを使って
P=14895/153581 　#　2020/05/04
PCR検査の感度30-70％のモデルM1と感度70-90％のモデルM2のどちらが信憑性があるか、ベイズファクターで計算してみる。
M1は感度が最頻値60%標準偏差10%、M2は最頻値80%標準偏差10%のベータ分布に設定
特異度はいずれも最頻値95%標準偏差2.5%に設定し、有病率は一様分布を仮定
陽性数は、陽性率(P)＝真陽性率＋偽陽性率=有病率=有病率*感度 + (1-有病率)*(1-特異度)の二項分布に従うとする。
事後確率分布は
URLﾘﾝｸ(i.imgur.com)
陽性率P=14895/153581=0.09698465での事後確率分布の密度比(Savage-Dickey density ratio)でベイズファクターを出すと
> d1/d2 # Savage-Dickey densiti ratio = BF12
[1] 1.007722

まあ、ちょっぴり、感度30-70％のモデルの方がいいかも、という結果。
陽性数/検査数の時系列データでもあればもう少し差がでるかもしれん。
東京都のデータで計算させようかと思ったが、東京都は検査人数を隠蔽しているので使いものにならない。

480:１３２人目の素数さん
20/05/05 06:26:36.20 FpoKo6a+.net
訂正
陽性数は、陽性率(P)＝真陽性率＋偽陽性率=有病率=有病率*感度 + (1-有病率)*(1-特異度)の二項分布に従うとする
↓
陽性数は、陽性率(P)＝真陽性率＋偽陽性率=有病率*感度 + (1-有病率)*(1-特異度)の二項分布に従うとする

481:１３２人目の素数さん
20/05/05 11:13:29 b2IqdVzK.net
3月の宿題で(1)のみ正解の数弱@shukudai_sujaku

昨年度の大学への数学(大数)での勝率は、

学コンBコースが 1/1 = 100% ，

宿題が 3/10 = 30% でした！

宿題の勝率が低すぎると思うので、

これからは一層精進していきたいです！

URLﾘﾝｸ(twitter.com)
(deleted an unsolicited ad)

482:１３２人目の素数さん
20/05/05 23:00:17 wvtmzVA1.net
>>449
抗体のはいったサンプルを２，３０個試してみりゃわかんじゃないの？
いくらなんでも感度が３％じゃつかえねぇ。

483:１３２人目の素数さん
20/05/06 15:29:26 RG00+xls.net
イカサマキットの感度特異度の事前分布を一様分布に設定して
抗体のはいったサンプルを２０個で全部陰性であったので３０個試したら全部陰性であったとすると
感度・特異度の事後分布は

URLﾘﾝｸ(i.imgur.com)

484:１３２人目の素数さん
20/05/06 15:32:34 RG00+xls.net
ところが、有病率33/1000であったときに無作為に２０人および３０人を選んで全部陰性であっても
感度・特異度の事後分布は
URLﾘﾝｸ(i.imgur.com)

485:１３２人目の素数さん
20/05/06 15:52:13 RG00+xls.net
>>454
事後分布を一様分布に設定して、このコピペ小僧の正解率の期待値・最頻値・95％信頼区間を求めよ。
その結果、
URLﾘﾝｸ(i.imgur.com)

486:１３２人目の素数さん
20/05/06 15:58:11 RG00+xls.net
>>458
ベータ分布の理論値

> HDInterval::hdi(qbeta,shape1=5,shape2=8)[1:2]
lower upper
0.1406542 0.6377277
> 5/(5+8) # mean
[1] 0.3846154
> (5-1)/(5-1+8-1) # mode
[1] 0.3636364

487:１３２人目の素数さん
20/05/06 16:25:45 RG00+xls.net
>>454
このコピペ小僧の正解率に学コンと宿題で差があるかを検定せよ。
事前分布にJefferysを用いた結果、
URLﾘﾝｸ(i.imgur.com)

488:１３２人目の素数さん
20/05/06 17:08:09 tNZVV9ZH.net
>>456
感度が5%以下じゃつかいもんにならんわなぁ。インチキで確定。

489:１３２人目の素数さん
20/05/06 23:23:13 wABsYddm.net
URLﾘﾝｸ(www.buzzfeed.com)
大阪市立大学が一昨年の血液を使って検査したところ、偽陽性は1人もいなかったそうだ。

490:１３２人目の素数さん
20/05/07 00:59:54 0vbdeA0/.net
>>462
>2020年4月中の2日間に同大学の付属病院を、新型コロナウイルス感染症の診療以外で受診した
>患者を対象に、そこから無作為に312人を抽出・・・・312 人（年齢中央値 66.5 歳、
>男性：女性=154：158）のうち、3人が陽性であることがわかった。約1%の陽性率だ。
>統計的な誤差を考慮すると、95%の確率で0.33〜2.8%の間に入る・・・・・・・・・・・・
教えてエロい人
Ｑ１統計的推定を述べるなら「95%の確率で」でなく「信頼率95%で」と書くのが適切ではないか？
Ｑ２無作為抽出陽性率3/312=0.96%の母集団陽性率上側/下側信頼区間=0.96-0.33/2.80-0.96と
　　上側区間≠下側区間で左右非対称分布想定は何故？
Ｑ３サンプルサイズ312は過少では？過少に伴う推定誤差加算が必要では？

491:１３２人目の素数さん
20/05/07 02:09:04.11 VnQvkZ57.net
>>463
Wilsonの式を使ったんだろうね。
method x n mean lower upper
1 agresti-coull 3 312 0.0096 0.0019 0.029
2 asymptotic 3 312 0.0096 -0.0012 0.020
3 bayes 3 312 0.0112 0.0016 0.023
4 cloglog 3 312 0.0096 0.0027 0.026
5 exact 3 312 0.0096 0.0020 0.028
6 logit 3 312 0.0096 0.0031 0.029
7 probit 3 312 0.0096 0.0029 0.027
8 profile 3 312 0.0096 0.0024 0.025
9 lrt 3 312 0.0096 0.0024 0.025
10 prop.test 3 312 0.0096 0.0025 0.030
11 wilson 3 312 0.0096 0.0033 0.028
URLﾘﾝｸ(ja.wikipedia.org)

492:１３２人目の素数さん
20/05/07 02:30:17 VnQvkZ57.net
Wilsonの式での95％信頼区間幅を1％以内にしたいなら
サンプルサイズは38411が必要という計算になった。

Rでの算出プログラム
library(binom)
x=3
n=312
binom.wilson(x,n)
fn <- function(n){
x=0:n
l=binom.wilson(x,n)[,5]
u=binom.wilson(x,n)[,6]
max(u-l)
}
fn=Vectorize(fn)
n=seq(1000,50000,by=1000)
plot(n,fn(n))
abline(h=0.01,lty=3)
uniroot(function(x,u0=0.01) fn(x)-u0, c(10000,50000))

493:１３２人目の素数さん
20/05/07 17:10:06 CHL0/p02.net
>>462
５０人で０でしょ？
だったら、特異度として保証されるのはせいぜい９８％程度じゃん。
１％の陽性率に対して、それでは不十分。

494:１３２人目の素数さん
20/05/07 18:13:41.63 VnQvkZ57.net
>>466
95％信頼区間の下限境界は
事前分布をJeffreysで
> qbeta(0.95,0.5+50,0.5,lower=F)
[1] 0.9624989
事前分布を一様分布で
> qbeta(0.95,1+50,1,lower=F)
[1] 0.942952

495:１３２人目の素数さん
20/05/07 18:52:47.08 VnQvkZ57.net
特異度の95%の信頼区間の下限値を0.99にするのに必要なサンプルサイズは
事前分布を一様分布で
> uniroot(function(x) fn(x)-0.99, c(100,500))$root
[1] 297.0728
Jeffreysで
> uniroot(function(x) fn(x,0.5,0.5)-0.99, c(100,500))$root
[1] 190.8606
fn <- function(x,shape1=1,shape2=1){
qbeta(0.95,shape1 + x, shape2, lower=F)
}
n=50:500
plot(n,fn(n),type='l', ylab='95%CI.lower')
abline(h=0.99,lty=3)
uniroot(function(x) fn(x)-0.99, c(100,500))$root
uniroot(function(x) fn(x,0.5,0.5)-0.99, c(100,500))$root

496:１３２人目の素数さん
20/05/07 20:13:12 VnQvkZ57.net
URLﾘﾝｸ(www.buzzfeed.com)
のデータを使って、不明なものは一様分布（ベータ分布の形状母数(1,1)）に事前分布を設定してMCMCしてみる。

x=c(3,33)
n=c(312,1000)
m=50
N=length(n)
shape1=1
shape2=1

model{
for(i in 1:N){
x[i] ~ dbin(p,n[i]) # 二項分布
}
p <- prev*sen+(1-prev)*(1-spc) # 陽性=真陽性+偽陽性
sen ~ dbeta(shape1,shape2)
spc ~ dbeta(shape1+m,shape2)
prev ~ dbeta(shape1,shape1)
}

その結果
URLﾘﾝｸ(i.imgur.com)

497:１３２人目の素数さん
20/05/07 21:49:37 CHL0/p02.net
>>469
なにやってるかよくわからんので、見当外れの指摘かもしれんが、
大阪市大の3/312と神戸大の33/1000ってのは特異度も感度も異なる
であろう別種のキットによる検査結果なんで、一緒くたにしちゃ
まずいんでないの？

498:１３２人目の素数さん
20/05/07 22:36:59.75 VnQvkZ57.net
>>470
同一キットじゃないから、ご指摘の通り。
しかも神戸大の方では陰性検体での確認はされていないから、神戸大方の陽性率が高いのは偽陽性を含む可能性もあるね。
大阪市大だけのデータでやってみると。
URLﾘﾝｸ(i.imgur.com)

499:１３２人目の素数さん
20/05/07 22:46:09.05 VnQvkZ57.net
>>471
使える情報が少なすぎて信頼区間が広すぎ。
有病率:0-87%
キットの感度:0-70%
ってコイントス変わらんな。

500:１３２人目の素数さん
20/05/07 22:48:00.40 VnQvkZ57.net
結局のところ、断定的な結論は出せないねということを数字で確認しているだけｗ

501:１３２人目の素数さん
20/05/08 02:04:52 Ugc87SUM.net
>>464
>>465
有難うございます。
二項分布下の母比率の信頼区間推定問題なんですね。
A２：正規分布近似法でなくWilsonの信頼区間法で解くから
　　上側区間≠下側区間となり平均値まわり左右非対称信頼区間と
　　なるのですね。

502:１３２人目の素数さん
20/05/08 09:15:37 WmDpVhCu.net
3月の宿題で(1)のみ正解の数弱@shukudai_sujaku

昨年度の大学への数学(大数)での勝率は、

学コンBコースが 1/1 = 100% ，

宿題が 3/10 = 30% でした！

宿題の勝率が低すぎると思うので、

これからは一層精進していきたいです！

URLﾘﾝｸ(twitter.com)
(deleted an unsolicited ad)

503:１３２人目の素数さん
20/05/08 11:37:38 CfFk/Uw1.net
>>474
Rのlibrary binomを使って　binom::confint(3,312)で　>464の出力が得られる
信頼区間をグラフにすると
URLﾘﾝｸ(i.imgur.com)
点線は3/312
正規分布近似のasymptotic以外は非対称。

どれを使うべきか？　好きなのを使えばいい、と思う。
但し、値が負になったり１を越えたりするのは不採用の方が賢明だとは思う。

Wilson法は値が０や１に近くても信頼できるという人がいるけど、どうやって検証するのかはよくわからん。

504:１３２人目の素数さん
20/05/08 12:41:19 CfFk/Uw1.net
>>476
binom::confintはbinom.confint(3,312)の間違い

library("binom")
binom.confint(3,312)

505:１３２人目の素数さん
20/05/09 13:22:10 oDT7bFgO.net
レムデシビルで初のRCTが出たんだけど、
URLﾘﾝｸ(www.thelancet.com)(20)31022-9.pdf
レムデシビルRCTで有意差だせず、症例数不足で検出力不足とか。

確かに、効力がわずからなら検出力不足
> n1=158
> n2=78
> pwr.2p2n.test(h=c(0.8,0.5,0.2),n1=n1,n2=n2,sig.level = 0.05,power=NULL,
+ alternative = "two.sided")

difference of proportion power calculation for binomial distribution (arcsine transformation)

h = 0.8, 0.5, 0.2
n1 = 158
n2 = 78
sig.level = 0.05
power = 0.9999336, 0.9508568, 0.3037150
alternative = two.sided

NOTE: different sample sizes

"
Remdesivir group (n=158)Placebo group (n=78)Difference
Clinical improvement rates
Day 7 4 (3%) 2 (3%) 0.0% (-4.3 to 4.2)
Day 14 42 (27%) 18 (23%) 3.5% (-8.1 to 15.1)
Day 28 103 (65%) 45 (58%) 7.5% (-5.7 to 20.7)
"

どの週においても両群で症状改善率は不変
症状改善率はどちらも一様分布を事前分布に仮定して

症状改善率の差δ=:０というモデルとδ≠０というモデルでのベイズファクター（周辺尤度比＝エビデンス比）を求めると
> (BF01=d.post/d.prio)
[1] 1.01472
なので、どちらのモデルが得られたデータを説明するのに適しているかは判断できず

506:、という結果になった。検出力不足か、差がないのかには決着つかず。

507:１３２人目の素数さん
20/05/09 13:22:52 oDT7bFgO.net
library(pwr)
library(rjags)
library(polspline)
par(bty='l')

n1=158
n2=78
pwr.2p2n.test(h=c(0.8,0.5,0.2),n1=n1,n2=n2,sig.level = 0.05,power=NULL,
alternative = "two.sided")
pwr.2p2n.test(h=NULL,n1=n1,n2=n2,sig.level = 0.05,power=0.80,
alternative = "two.sided")

s1=c(4,42,103) # improvement with Remdesivir
s2=c(2,18,45) # improvement with placebo
# s1=103 ; s2=45 # Day 28
N=length(s1) # 3
shape1=1 # prior parameter in dbeta
shape2=1

data=list(n1=n1,n2=n2,s1=s2,N=N,shape1=shape1,shape2=shape2)

modelString='
model{
# data
for(i in 1:N){
s1[i] ~ dbin(p1,n1)
s2[i] ~ dbin(p2,n2)
}
# parameter
delta <- p1 - p2
# priors
p1 ~ dbeta(shape1, shape2)
p2 ~ dbeta(shape1, shape2)
# sampling from priors
pri.p1 ~ dbeta(shape1, shape2)
pri.p2 ~ dbeta(shape1, shape2)
pri.delta <- pri.p1 - pri.p2
}
'
writeLines(modelString,'tmp.txt')
n.iter=1e5 ; thin=1
jagsModel=jags.model('tmp.txt',data,inits = NULL,n.chains=4,n.adapt=n.iter/5)
update(jagsModel)
codaSamples=coda.samples(jagsModel,c('delta','pri.delta'),n.iter,thin)
# plot(codaSamples)
coda2summary(codaSamples)
js=as.data.frame(as.matrix(codaSamples))
BEST::plotPost(js$delta,compVal=0,xlab=bquote(delta))
fit.post=logspline(js$delta)
fit.prio=logspline(js$pri.delta)
curve(dlogspline(x, fit.post), -2,2, lty=2, xlab=bquote(delta),ylab='Density')
curve(dlogspline(x, fit.prio), add=T)
(d.post=dlogspline(0,fit.post))
(d.prio=dlogspline(0,fit.prio))
legend('topright', bty='n', legend=c('δ≠0','δ=0'), lty=1:2)
abline(v=0,col=8)
points(c(0,0),c(d.post,d.prio),pch=c(1,19))
(BF01=d.post/d.prio)

508:１３２人目の素数さん
20/05/09 13:25:29 oDT7bFgO.net
確率分布を図示すると

URLﾘﾝｸ(i.imgur.com)

509:１３２人目の素数さん
20/05/09 14:25:05 74hNX8Dr.net
100例もやって差がでないのなら、はっきり言って効き目なしとかわらん。
むしろ副作用がこわい。

アビガンはどうなんだろうね。なぜか国内のまとまったデータがまだ出てこない。

510:１３２人目の素数さん
20/05/09 14:26:34 74hNX8Dr.net
まあ、軽症者が８割とかだと、早期投与の効き目を判定するには相当の
人数に使わないとわかんないだろうけど。

511:１３２人目の素数さん
20/05/09 15:22:40 oDT7bFgO.net
死亡率に関してはベイズファクターで推論できた。

Remdesivir group (n=158) Placebo group (n=78) Difference
Day 28 mortality 22 (14%) 10 (13%) 1.1(-8.1% to 10.3%)"

事前確率分布をどうするかだが、なんの情報もないので
実薬群も対照群も一様分布(もしくはJeffreys分布)とする。

死亡率の差δの事前分布と事後分布の確率分布曲線を描いてδ=0での確率密度比(Savage-Dickey density ratio)が
ベイズファクター（周辺尤度の比)になる。　

これをJAGSを用いたプログラムで計算すると、一様分布のとき8.34 Jeffrey分布のとき6.40となる。、
10を超えないいのでまあ、中程度の確信で検出力不足によるのではなく、もともと差がないのであろうと推論できる。

サンプルサイズを増やしてもレムデシビルは軽症・早期投与でも致死率を改善しないであろうと予想。

512:１３２人目の素数さん
20/05/09 17:15:11 oDT7bFgO.net
>どの週においても両群で症状改善率は不変
この前提はおかしいので週ごとに症状改善率が変わるようにモデルを変更

model{
# data
for(i in 1:N){
s1[i] ~ dbin(p1[i],n1)
s2[i] ~ dbin(p2[i],n2)
}

# parameter
alpha <- delta*sigma
for(i in 1:N){
p1[i] <- phi(x1[i]) # probit:pnorm(x)
p2[i] <- phi(x2[i])
# p1[i] <- ilogit(x1[i]) # logit:exp(x)/(1+exp(x))
# p2[i] <- ilogit(x2[i])
}
# model
for(i in 1:N){
x1[i] ~ dnorm(mu + alpha/2, pow(sigma,-2)) # alpha:difference of mean
x2[i] ~ dnorm(mu - alpha/2, pow(sigma,-2))
}

# priors
delta ~ dnorm(0,1)
mu ~ dnorm(0,1)
sigma ~ dt(0,1,1)T(0,)
}

ベイズファクターは
> (BF01=d.post/d.prio)
[1] 0.997627

513:4 症状改善率に差がないというモデルも差があるというモデルも周辺尤度（エビデンス）はほぼ同じという結果。

514:１３２人目の素数さん
20/05/09 20:41:59 74hNX8Dr.net
あ、 >>482はレムデシじゃなくてアビガンについての話だかんね。
レムデシは重症者向けらしいけど、たぶん駄目だろ。

515:１３２人目の素数さん
20/05/09 21:35:34 Fh34v+Vz.net
【政府が隠す３．１１】　地震波形が、核実験と同じ
ｽﾚﾘﾝｸ(earth板)
sssp://o.5ch.net/1nmad.png

516:１３２人目の素数さん
20/05/11 00:31:07 mGn48zmS.net
5/10夜『NHKスペシャル』「新型コロナウイルス　出口戦略は」で
厚労省新型コロナ対策班西浦博北大教授と氏が分析中のノートPC画面が
映されていた。氏の使用解析ソフトウェア名は何というのでしょうか？

517:１３２人目の素数さん
20/05/11 01:36:00 P7wrhagU.net
西浦先生はRじゃないかな。
今週ぐらいに、実効再生産数を算出するRのコードを公開できるかもと言ってた。

火曜にはニコ生があるから、そこでたっぷりと聞けるはず。
URLﾘﾝｸ(sp.live.nicovideo.jp)

518:１３２人目の素数さん
20/05/11 03:07:28 6TI8KNr5.net
>>488
>11に数式があるけど

519:１３２人目の素数さん
20/05/11 03:58:21.10 v4rWY6J/.net
>>489
いや、与えられた何日分かの新規患者数から再生産数とか回復率とかを推定するための数式じゃないの？

520:１３２人目の素数さん
20/05/11 06:53:45 ruo6tAnf.net
>>490
SEIRより単純なReed-Frostモデルだよな
URLﾘﾝｸ(en.m.wikipedia.org)

521:１３２人目の素数さん
20/05/11 09:14:46.53 P7wrhagU.net
>>489
自分で計算してみた人ならわかるけど、日々の再生算数を出すにはA「感染してから他人にうつすまでの日数の分布」が必要。西浦先生はこれをまず求めていて、その結果は割合と世界中で使われている。
加えてB「感染してから発表の数字に載るまでの日数の分布」も必要で、発表の数字をBで逆畳み込み積分してC「感染推定日毎の数字」に変換し、CをAで畳み込み積分したものでCを割れば日々のRtが求められる。
とは言うものの、そのままやると誤差で数字が発散するし、逆畳み込みは一意ではないのでどう推定するかは色々と考えなくてはならない。多分日本独自の事情もコードに入れなきゃいけない。大変だろうなあとは思う。

522:１３２人目の素数さん
20/05/11 11:02:15.57 +2HA8Yn9.net
>>492
レスありがとうございます。
確かにSEIRモデルやSIRIモデルだと
「感染してから発表の数字に載るまでの日数の分布」って考慮されてないね。

523:１３２人目の素数さん
20/05/12 20:50:54 8HqG++pl.net
>>488
公開されたぞー。StanとRだ。

URLﾘﾝｸ(nbviewer.jupyter.org)

524:１３２人目の素数さん
20/05/12 22:32:45.27 9+i4T0w3.net
ウイルス感染のモデルも必要だと思うけど
社

525:会経済活動の影響や自粛解除した後の死者増加や自粛継続した場合の法人の倒産や治療薬やワクチンができた後の社会の経済や文化面の回復そこまで考慮してどういう政策を選択したら損失を最小化できるかという問題は解ける？制約付きの最小化問題だと思う数値化するのが難しい考慮要素もあるからその辺は仮の値とかで

526:１３２人目の素数さん
20/05/13 17:23:13 PBQsFM+W.net
>>495
モデルを精密複雑化すればするほど、必要なパラメータが増えて
それを弱情報事前分布にすると事後分布の信頼区間が広がるんだなぁと思う。

527:１３２人目の素数さん
20/05/14 08:00:23 kec+XbRE.net
>>494
これにある、
JapaneseDataCOVID19
ってどこかからダウンロードできるんだろうか？

528:１３２人目の素数さん
20/05/14 09:54:38 IN0uokww.net
>>497

URLﾘﾝｸ(github.com)

529:１３２人目の素数さん
20/05/14 11:47:52 kec+XbRE.net
>>498
ありがとうございます。

530:１３２人目の素数さん
20/05/14 11:51:11 kec+XbRE.net
親ディレクトリ（フォルダ）探せばよかったんだね。

URLﾘﾝｸ(nbviewer.jupyter.org)

531:１３２人目の素数さん
20/05/14 13:08:10.58 gLQVRit5.net
>>495 >>496
パラメータを増やせば増やすほど、どんな仮説も否定できなくなる。
実験系の学界でよく使う手口だよね。
おや、誰か来たようだ…

532:１３２人目の素数さん
20/05/14 13:58:09 kec+XbRE.net
>>494
これを走らせてみたい人いますか？

> datestar = as.Date("2020-05-10")
> datemin = as.Date("2019-12-25") # particular choice
> (tstar = as.numeric(datestar - datemin))
[1] 137

> (K = nrow(df_cases)) # 147
[1] 147

なので、
data {
int<lower = 1> K; //number of days
vector<lower = 0>[K] imported_backproj;
vector<lower = 0>[K] domestic_backproj;
int<lower = K> upper_bound;
の

int<lower = K> upper_bound;
だ
Error in new_CppObject_xp(fields$.module, fields$.pointer, ...) :
Exception: modelf2b01ab215_fit_infection_namespace::modelf2b01ab215_fit_infection: upper_bound is 137, but must be greater than or equal to 147 (in 'modelf2b01ab215_fit_infection' at line 53)

upper_bound 137の下限を K 147にしているからみたい。

533:１３２人目の素数さん
20/05/14 14:10:15 kec+XbRE.net
upper_boundの制限を外して

data {
// int<lower = K> upper_bound;
int upper_bound;

再生数の平均値を以下の出すブロックを加えて走らせてみた。
transformed parameters{
real mean_Rt;
real mean_Rt_adj;
mean_Rt = mean(Rt);
mean_Rt_adj = mean(Rt_adj);
}

その結果、
Inference for Stan model: fit_infection.
2 chains, each with iter=10000; warmup=2000; thin=5;
post-warmup draws per chain=1600, total post-warmup draws=3200.

mean se_mean sd 2.5% 25% 50% 75% 97.5% n_eff Rhat
mean_Rt 1.79 0 0.07 1.66 1.74 1.79 1.83 1.92 3122 1
mean_Rt_adj 1.79 0 0.07 1.66 1.74 1.79 1.84 1.93 3123 1

534:１３２人目の素数さん
20/05/14 16:35:35 kec+XbRE.net
再生算数を０～１０人の一様分布にすると、収束しない。

> print(fit_u)
Inference for Stan model: fit_infection_u.
4 chains, each with iter=10000; warmup=5000; thin=5;
post-warmup draws per chain=1000, total post-warmup draws=4000.

mean se_mean sd 2.5% 25% 50% 75% 97.5% n_eff Rhat
mean_Rt 2.15 0.05 0.10 1.98 2.06 2.16 2.23 2.30 3 1.99
mean_Rt_adj 2.13 0.07 0.11 1.93 2.06 2.13 2.21 2.36 3 2.27
lp__ -789.19 7.18 14.43 -820.19 -797.69 -787.44 -779.42 -762.53 4 1.89

traceplotやchainの分布はこんな感じ、
URLﾘﾝｸ(i.imgur.com)
URLﾘﾝｸ(i.imgur.com)

535:１３２人目の素数さん
20/05/14 17:00:26 1Kd4DHQt.net
>>501
否定できないけど実証もできないことになるのでは？
単純なモデルだと現実の問題を解決できない事もあるし

536:１３２人目の素数さん
20/05/14 17:23:23.34 kec+XbRE.net
>>494
モデルで再生産数の事前分布は　平均2.5　標準偏差2.0の正規分布に設定されていたので
平均と標準偏差を変化させて、再生産数の事後分布を描出してみた。
かなり、事前分布の影響を受けるみたい。
URLﾘﾝｸ(i.imgur.com)

537:１３２人目の素数さん
20/05/14 17:26:03.64 kec+XbRE.net
どうも、こういう境地だなぁ。
断定的な結論は出せないということを数字で確認しているだけｗ

538:１３２人目の素数さん
20/05/14 17:30:34 50GljeDM.net
基本再生算数はウイルスの特徴で決まるもので
実行再生算数は更に環境や人の行動の影響で変化するものだと理解している
実行再生算数を減らすようにするには
どう行動したらいいか
かつ経済活動を出来るだけ下げずに

539:１３２人目の素数さん
20/05/14 18:25:32 IN0uokww.net
西浦モデル、一度感染日ごとの人数を最尤法で確定して、そこからベイズを回してRtを求めてるんだよなあ。
本来は、日々の感染者数も確率的に揺れがあるはず。だからRtの誤差幅は発表よりも多く見積もるべきかもしれん。

540:１３２人目の素数さん
20/05/14 18:39:49 IN0uokww.net
コードを解説してる人
URLﾘﾝｸ(mikuhatsune.hatenadiary.com)

541:１３２人目の素数さん
20/05/14 19:09:54 kec+XbRE.net
再生産数の事前分布を色々かえて事後分布を出してみた。

URLﾘﾝｸ(i.imgur.com)

542:１３２人目の素数さん
20/05/15 08:46:23 qjCTzgxb.net
>>504
切断分布だと収束しないみたいなので、
一様分布[0,10]に近そうな正規分布[5,3]
URLﾘﾝｸ(i.imgur.com)
を事前分布にして走らせてみた。

URLﾘﾝｸ(i.imgur.com)

543:１３２人目の素数さん
20/05/15 09:56:20.25 qjCTzgxb.net
【新型コロナ】東京0.6％、東北6県0.4％陽性・・・抗体検査1000人実施 [影のたけし軍団★]
ｽﾚﾘﾝｸ(newsplus板)
複数の検査キットの性能評価と感染状況の確認が目的でしたが、東京都で献血した500人のうち3人、
東北6県で献血した500人のうち2人がいずれかの検査キットで陽性と判定されました。
満員電車など人との接触の多い東京とそうでない東北で陽性率に有意差はあるか？

544:１３２人目の素数さん
20/05/15 12:23:12 GeDvuMme.net
>>513
検査キットの特異度が99.5%以上あることが検証されました。
ってだけの話じゃね？

まぁ、東北６県と東京が同じってことは、特異度はそれより
高くはないってことだろうね。

545:１３２人目の素数さん
20/05/15 12:26:48 GeDvuMme.net
言い換えると、真の陽性率はわかりません、ってこと。

546:１３２人目の素数さん
20/05/15 16:53:27 qjCTzgxb.net
>>513
陽性率の確率分布を一様分布にすると事後分布は

URLﾘﾝｸ(i.imgur.com)

なるけど、重なりの部分の面積が差がないことの度合いを示していると考えていいかな？

547:１３２人目の素数さん
20/05/15 18:43:40 qjCTzgxb.net
これは、味気がないな。

> Epi::twoby2(x)
2 by 2 table analysis:
------------------------------------------------------
Outcome : Col 1
Comparing : Row 1 vs. Row 2

Col 1 Col 2 P(Col 1) 95% conf. interval
Row 1 3 497 0.006 0.0019 0.0184
Row 2 2 498 0.004 0.0010 0.0158

95% conf. interval
Relative Risk: 1.5000 0.2517 8.9384
Sample Odds R

548:atio: 1.5030 0.2501 9.0339 Conditional MLE Odds Ratio: 1.5024 0.1713 18.0536 Probability difference: 0.0020 -0.0092 0.0139 Exact P-value: 1.0000 Asymptotic P-value: 0.6561 ------------------------------------------------------

549:１３２人目の素数さん
20/05/16 07:59:05 /d9XIHEO.net
再生産数を計算するRのプログラムあったんだな

URLﾘﾝｸ(www.rdocumentation.org)

550:１３２人目の素数さん
20/05/16 08:16:33 28hwAVWs.net
>>509
後者の分析、RStan本の訳者が今やっているようだ。

URLﾘﾝｸ(twitter.com)
(deleted an unsolicited ad)

551:１３２人目の素数さん
20/05/16 08:17:55 28hwAVWs.net
>>519

URLﾘﾝｸ(twitter.com)
(deleted an unsolicited ad)

552:１３２人目の素数さん
20/05/16 08:36:22 /d9XIHEO.net
>>520
アヒル本の著者だね。俺も読んだ。

553:１３２人目の素数さん
20/05/16 12:36:46 cGFgpNwX.net
4/2の時点で感染者数を６０００くらいと見積もってるね。＞アヒル本の人
実数の三倍程度。いい線かもしれない。

554:１３２人目の素数さん
20/05/16 13:39:32 XSllT5Kn.net
URLﾘﾝｸ(github.com)

555:１３２人目の素数さん
20/05/16 14:29:29 BxGcLzV+.net
int<lower = K> upper_bound;

↓

int　upper_bound;

にしてもエラーがでる。

stan_dataで
upper_bound = 147 にすると動くけど、何をやってんのか自分でもよくわからん。

556:１３２人目の素数さん
20/05/16 16:47:14 UBjBTXVe.net
アヒル本ってなんですか？

557:１３２人目の素数さん
20/05/16 17:55:00 BxGcLzV+.net
>>525
名著として名高いStanの入門書

StanとRでベイズ統計モデリング (Wonderful R) (日本語) 単行本 ? 2016/10/25

表紙の色がアヒルのくちばしの色に似ているかららしい。

558:１３２人目の素数さん
20/05/16 17:56:04 BxGcLzV+.net
>>524
自己解決
select
↓
dplyr::select
でちゃんと動作した

559:１３２人目の素数さん
20/05/16 19:16:41 5/7mBSAW.net
>>526
thx

560:１３２人目の素数さん
20/05/16 19:28:52 BxGcLzV+.net
R に　EpiEstimというパッケージがあって、再生産数を算出する関数が搭載されている。
結局、infecterとinfecteeが発症するまでの期間serial intervalの分布をどう設定するかで結果が変わるみたいだなぁ。

Rのヘルプファイルを解読中。
Rのヘルプファイルは不親切設計で有名（理解できている人の備忘録みたいな性格だから）。

561:１３２人目の素数さん
20/05/16 20:49:50 5T7nYzW3.net
ここに居る人達って何者なの
学部の知識超えてるよね
統計でご飯食べてる人たち？

562:１３２人目の素数さん
20/05/16 21:03:16 YPW1s8+S.net
しかし、なんでも揃ってるなRって

563:１３２人目の素数さん
20/05/16 22:57:43 BxGcLzV+.net
>>529
Stanでの西浦モデルではinfecterとinfecteeが発症するまでの期間serial intervalの分布に

## Serial interval [Nishiura et al 2020 - only certain cases]
param1_SI = 2.305,
param2_SI = 5.452,

// serial interval
vector[K] gt = pweibull(param1_SI, param2_SI, K);

として使われているので、平均値などを出してみた。
乱数発生と理論値

> x=rweibull(1e5,param1_SI,param2_SI)
> mean(x) ; param2_SI*gamma(1+1/param1_SI)
[1] 4.829273
[1] 4.830129
> var(x) ; param2_SI^2*(gamma(1+2/param1_SI)-(gamma(1+1/param1_SI))^2)
[1] 4.907755
[1] 4.940682
> median(x) ; param2_SI*(log(2)^(1/param1_SI))
[1] 4.655777
[1] 4.6505
> density(x)$x[which.

564:max(density(x)$y)] ; param2_SI*(1-1/param1_SI)^(1/param1_SI) [1] 4.116837 [1] 4.259624 > optimise(function(x) dweibull(x,param1_SI,param2_SI),c(0,10),maximum = T)$max [1] 4.259623 グラフにしてみた。 https://i.imgur.com/9vvCJuZ.png 正規分布で近似してもよさそうな感じだな。

次ページ