統計学Part１５

統計学Part１５at MATH

統計学Part１５ - 暇つぶし2ch914:１３２人目の素数さん
14/05/10 19:01:25.62
何の問題もないよ。信頼度を落とせば、信頼区間は狭くなるだけ。
試行回数1000回を1万回にすれば精度もあがる。お好みでどうぞ。

915:１３２人目の素数さん
14/05/11 06:24:42.58
>>914
お好みでと言われるが、信頼区間幅を狭くして推定精度を上げても
その信頼度が60%なり50%なりだと、2回に1回はその推定値範囲内に
入らないわけで、算出はできるが実用にならないのではないか？

916:１３２人目の素数さん
14/05/11 12:35:09.39
それこそお好み

917:１３２人目の素数さん
14/05/11 18:09:00.07
このようなものは、χ^2検定が一般的
発生確率をp、試行回数をNとすると、
期待される成功回数はNpで、これをAと表すことにします。
失敗回数はN(1-p)で、これをBと表すことにします。
そして、実際試してみての成功回数がaで、失敗回数がb(=N-a)の時、χ^2と呼ばれる次の量
χ^2=(A-a)^2/A　+　(B-b)^2/B
を計算します。期待される量と、実際の回数が等しい場合は0になり、それからずれるほど
大きな値になるものです。これが、ある一定量を超えると、pがおかしいんじゃ無いかといえ、
今回の場合は自由度が１なので、3.84より大きいと危険度5%でおかしいといえるし、
6.63より大きくなると、危険度1%でおかしいといえる。

実際の計測が、1000回中10回ということなので、
発生確率を1%とすると、当然、χ^2=0で、おかしくない。
発生確率を1.5%とすると、χ^2=1.69で、おかしくない。
発生確率を2%とすると、χ^2=5.1で、危険度5%ならおかしいといえるが、危険度を1%にするとあり得る範囲となる。
発生確率を0.5%とすると、χ^2=5.025で、危険度5%ならおかしいといえるが、危険度を1%にするとあり得る範囲となる。
...
と、こんな感じで、危険度をある一定の値で決めれば、それに対応する発生確率の範囲を狭めることができる。

918:１３２人目の素数さん
14/05/12 17:19:53.25
これはカイ自乗分布に従わないですね。

919:１３２人目の素数さん
14/05/12 20:35:09.37
>>915
信頼度には、常用される99%か95%を採用すべきだろ。類似ケース例と
比較し易いから。
しかし99%か95%が常用値にされたのは、どういう根拠からなんだろ？
根拠を書いた統計本を、未だ見たことがない。

920:１３２人目の素数さん
14/05/12 20:53:25.98
キリがいいし、人間の心的傾向による区分だよ。
1%で起こる確率は人はめったにない、めずらしいこととか感じる。
5%ぐらいになると、たまにある、時々あると感じる。
σ=1の中ならだいたいそんな感じ、ふつうにあるみたいな。

921:１３２人目の素数さん
14/05/12 21:58:23.85
根拠はないだろう
1・5・10はちょうどいいってだけで気にしなくてもいい
目的に応じて調節すれば問題ない

922:１３２人目の素数さん
14/05/12 22:38:00.70
根拠は明白。きりがいいから。

94.133%とか99.273%とか使う馬鹿はいない。誰が見てもきりが悪い。

923:１３２人目の素数さん
14/05/13 06:44:07.04
>>921
1・5・10はちょうどいいと、最初に用いたのはピアソンだったっけ？

924:１３２人目の素数さん
14/05/13 23:09:59.99
その年一番よかった曲を投票で決める際、一人が好きな曲を１位～５位として投票することができる
投票した５曲は１位として選ばれたら10pt、５位なら6pt。と重み付けされて集計されて、
投票が終わったときに全員分のポイントが合計され、合計ポイントが高い順にランキングになる

こういう投票システムで、自分の選んだ曲を上位にするために多重投稿している奴がいてランキングが狂ってしまう場合
これを統計的に見破るにはどうしたらいいだろうか

1.多重投票者は特定の同一曲に複数回投票し、残りの曲をどうでもいい曲で埋める
2.多重投票者は同じ日、あるいはかなり近接した日に連続して投票する
3.多重投票する必要のない曲(多くの人が投票する曲)は多重投票する意味がないので投票されない

等、経験的な分析は考えられるもののいい処理の方法がわからん
何かうまい方法はないだろうか

925:１３２人目の素数さん
14/05/13 23:13:28.64
系列毎に決めればいいじゃないか。もちろん貢献度を考慮して。

926:１３２人目の素数さん
14/05/20 06:47:53.93
確率とか統計とか知りたいんですけどwikipediaの正規分布の項を見ても理解できないので
初歩の初歩だけでも教えてほしいのですが

エクセルで(1/6)^x*(5/6)^(1000-x)*COMBIN(1000,x)の式を
x=110～220で計算してこのグラフを作りました
URLﾘﾝｸ(i.imgur.com)
意味としてはサイコロを1000回振った時の1の出る回数の確率分布って感じなんですが
きれいな正規分布のように見えるのですがμとσがここからどう求まるのかが分かりません

このグラフ又は式からμ及びσの求め方を教えてください

927:１３２人目の素数さん
14/05/20 08:17:46.77
muは1000*1/6
sigmaはsqrt(1000*1/6*5/6)で近似できるだろうね
最尤推定で正規分布なら推定量は
muは標本平均
sigmaは標本標準偏差になるかな

928:１３２人目の素数さん
14/05/20 08:41:47.56
即レスありがとうございます
計算するとμ=166.7 σ=11.785くらいですね
なんとなくそれくらいなのはわかります
二項分布の公式のようなものが有るみたいですね
少し調べてます

929:１３２人目の素数さん
14/05/24 01:10:21.31
二項分布の検定で標本数が少なくnp> 5 nq> 5 を満たさない場合の
検定方法を教えてください。

930:１３２人目の素数さん
14/05/24 08:17:11.20
>>928
>二項分布の公式・・・・・・・・・・・・・・・・・
どういう公式のこと？そもそも正規分布>>926質疑に、何故
二項分布式なのか？

931:１３２人目の素数さん
14/05/25 00:32:57.06
>>930
すいません、よく理解してないんで変なこと書いちゃいましたかね？
Wikipediaで二項分布の項目に

期待値・分散[編集]
B(n, p)にしたがう確率変数X に対し、X の期待値E[X]は
E[X]=np
であり、分散Var[X]は
Var[X]=np(1-p)
となる。

とあるのが公式なのかなと思いました
nが十分に大きい二項分布は正規分布で近似できるともあるし
(1/6)^x*(5/6)^(1000-x)*COMBIN(1000,x)
はそもそも二項分布式です
>>927でグラフを云々でなく提示式の数字だけ出して答えてくださっていたので
二項分布の公式なんだろうなと>>928に書いたのでした

932:１３２人目の素数さん
14/05/25 12:11:10.78
平均と分散だけでいいだろ
何が公式なんだよww
頭おかしいんじゃないの？

933:１３２人目の素数さん
14/05/25 13:32:16.04
頭おかしい扱いされたのですが
公式という語句を使ったのがまずかったのですか？

934:１３２人目の素数さん
14/05/25 14:06:06.19
どうでもいいよ

935:１３２人目の素数さん
14/05/25 14:13:57.41
>>934＝>>932＝>>930？
なんかカチンと来る人ですね
そもそも最初の文章が読めてなかっただけなんじゃないですか？
数学できても日本語できない感じですか？

936:１３２人目の素数さん
14/05/25 14:36:34.30
すみません、熱くなって見苦しい言葉を書いてしまいました
こちらとしては中途半端な知識で来ているので
間違っている点があればきちんと正していただきたかったのですが残念です
これ以上ここにいるのは誰にとっても不利益だと思うので去ります
スレ汚し失礼いたしました

937:１３２人目の素数さん
14/05/25 14:57:32.79
漸近分布使うかどうかだろ？
そんなに熱くなることかよ
二度と来ないみたいだからいいけどw

938:１３２人目の素数さん
14/05/25 17:47:49.47
>>930
二項分布で簡単に解けるからだろ。

939:１３２人目の素数さん
14/05/25 19:36:35.00
>>926
> このグラフ又は式からμ及びσの求め方を教えてください
定義にあてはめて計算するだけです。
計算そのものは高校の数学Iとか数学IIのレベルです。
以上。

940:１３２人目の素数さん
14/05/26 17:00:52.04
0点。

941:１３２人目の素数さん
14/05/26 17:02:09.19
つまりあんたは数学Iすら分かってないわけだ。
あんまり背伸びせずに着実に足場を固める方がいいと思うぞ。

942:１３２人目の素数さん
14/05/26 17:08:51.75
平常点 -100点。

943:１３２人目の素数さん
14/05/28 04:48:48.32
>>930 はなぜ知ったかしたのか。

944:１３２人目の素数さん
14/06/02 03:47:28.41
二項分布の検定で標本数が少なく、np> 5 nq> 5 を満たさない場合の
検定方法を教えてください。

945:１３２人目の素数さん
14/06/02 13:18:07.01
>>945
URLﾘﾝｸ(www.press.tokai.ac.jp)
統計数学序論 - 東海大学出版会
7.4　百分率の検定
　　　　7.4.2　小標本のとき

946:１３２人目の素数さん
14/06/02 13:20:32.88
URLﾘﾝｸ(www.amazon.co.jp)

947:１３２人目の素数さん
14/06/02 21:50:14.20
そもそも何の検定なのかね

948:１３２人目の素数さん
14/06/03 00:59:49.14
実用数学検定じゃねえの？

949:１３２人目の素数さん
14/06/04 21:03:43.63
>>919
>しかし99%か95%が常用値にされたのは、どういう根拠からなんだろ？

フィッシャーさんが仕事をしていた所が農業試験場だったから。

950:１３２人目の素数さん
14/06/04 21:11:11.10
漁師だと思ってたよ。確率的に。

951:１３２人目の素数さん
14/06/05 07:52:57.07
「フィッシャーの統計理論」に書いてある。
フィッシャーは肥料や田んぼの作り方の効果を研究するだけでなく、
良い方法が見つかったら近所の百姓を説得してそれを実際に使って
もらうことも仕事だった。フィッシャーの得意な説得方法は次の二つ。

方法１：「今までお前らが経験したことのないほど麦がとれるぞ」
　麦は１年に１回、百姓は２０歳から４０歳までの２０年間働く。
だから２０分の１以下（５％以下）。

方法２：「百年に１回あるかないかの豊作を経験させてやるぞ」
　百年に１回あるかないかとは１００分の１以下（１％以下）。

952:１３２人目の素数さん
14/06/05 11:47:08.81
田んぼで麦を作ってたのか？

953:１３２人目の素数さん
14/06/05 20:17:24.22
フィッシャーは人を釣ってたのか

954:１３２人目の素数さん
14/06/06 02:27:26.96
フィッシャー、確かに釣り師っぽい名前だな

955:１３２人目の素数さん
14/06/25 22:35:58.88
「特異度」って言葉なんか変じゃね?　意味が逆のような気がすんだけど．．

特異度（とくいど）とは、臨床検査の性格を決める指標の1つで、ある検査について「陰性のものを正しく陰性と判定する確率」として定義される値である。
概要
特異度が高い、とは、「陰性のものを正しく陰性と判定する可能性が高い」、あるいは「陰性のものを間違って陽性と判定する可能性が低い」という意味である。

URLﾘﾝｸ(ja.wikipedia.org)

956:１３２人目の素数さん
14/06/26 21:35:08.87
だから何？

957:１３２人目の素数さん
14/06/26 21:48:33.26
逆というか・・わからんよな

958:１３２人目の素数さん
14/06/26 22:52:04.61
1-4群のカテゴリーに分けた説明変数が二値アウトカムに与える影響を知りたいので、
SPSSを用いてロジスティック回帰分析を行いました。
1群を対照にして2群から4群に数字が大きくなるにつれてオッズ比が大きくなるという結果なのですが、
これを傾向があると言うにはどうすればいいか悩んでいます

カテゴリーから多項式対比を利用してみましたがこれでいいのか、そしてよいならば結果の解釈はどうすればいいのか
さっぱりわかりません。統計素人なので罵倒されてもいいですから、私の悩みを解決してください
教えてくれたら脱ぎます。いや、嘘ですけど。

959:１３２人目の素数さん
14/06/27 19:41:19.97
虎ハンター・小林邦昭スレ

960:１３２人目の素数さん
14/07/07 22:38:31.18
統計学ってつまらなくね？行列計算をひたすらやるだけじゃん

961:１３２人目の素数さん
14/07/07 22:44:38.34
つまる／つまらないで学ぶ類のものではない
そうでしょう？

962:１３２人目の素数さん
14/07/09 09:35:26.53
そう。
学ぶ必要は大きいが、
全くつまらない。

963:１３２人目の素数さん
14/07/09 10:01:16.08
つまらないかそうでないか統計をとってみないとわかりません

964:１３２人目の素数さん
14/07/11 13:06:04.05
つまらん統計をやってるんだな

965:１３２人目の素数さん
14/08/10 23:47:54.27
すみません中卒です
n目のサイコロとo目のサイコロとp目のサイコロを同時に振った時の目の和の標準偏差はどう求めればいいのでしょうか？

966:１３２人目の素数さん
14/08/13 12:17:41.21
事象が独立ならば、「(A+B)の分散」は「Aの分散+Bの分散」

よって、n目のサイコロとo目のサイコロとp目のサイコロを同時に振った時の目の和の分散は
サイコロを1回降った時の分散の合計なので、これのルートが求める標準偏差

967:１３２人目の素数さん
14/08/15 07:56:04.05
ありがとう

968:１３２人目の素数さん
14/08/16 14:55:08.77
ペプシコーラとコカコーラの「どちらがオイシイ？」という味比べの広告、カイ2乗検定とかF検定まで行ってみないことには、全くもって意味がないと思う

969:１３２人目の素数さん
14/08/18 17:23:24.91
>>968
発想がアホすぎる
「統計的に意味がない」ところに「広告として意味がある」
あえて反論の余地を残すことで、広告倫理やコカコーラ社の反撃といった問題を回避できている

970:１３２人目の素数さん
14/08/19 06:48:05.68
コカコーラのほうが上手いのは当然だから、検定するまでもなくあれは間違いだよ

971:１３２人目の素数さん
14/08/19 20:18:00.63
平均の差が有意か調べたいのですが、

{1,2,3,4,5}と｛2,3,4,5,6}でP値は0.3466
観測値を1000倍して{1000,2000,3000,4000,5000}と{2000,3000,4000,5000,6000}としてもP値は同じになりませんか。

F1のピット作業時間みたいのは、全部差がないと出るような気がするんですが、どうしたらいいのでしょう？