14/05/10 19:01:25.62
何の問題もないよ。信頼度を落とせば、信頼区間は狭くなるだけ。
試行回数1000回を1万回にすれば精度もあがる。お好みでどうぞ。
915:132人目の素数さん
14/05/11 06:24:42.58
>>914
お好みでと言われるが、信頼区間幅を狭くして推定精度を上げても
その信頼度が60%なり50%なりだと、2回に1回はその推定値範囲内に
入らないわけで、算出はできるが実用にならないのではないか?
916:132人目の素数さん
14/05/11 12:35:09.39
それこそお好み
917:132人目の素数さん
14/05/11 18:09:00.07
このようなものは、χ^2検定が一般的
発生確率をp、試行回数をNとすると、
期待される成功回数はNpで、これをAと表すことにします。
失敗回数はN(1-p)で、これをBと表すことにします。
そして、実際試してみての成功回数がaで、失敗回数がb(=N-a)の時、χ^2と呼ばれる次の量
χ^2=(A-a)^2/A + (B-b)^2/B
を計算します。期待される量と、実際の回数が等しい場合は0になり、それからずれるほど
大きな値になるものです。これが、ある一定量を超えると、pがおかしいんじゃ無いかといえ、
今回の場合は自由度が1なので、3.84より大きいと危険度5%でおかしいといえるし、
6.63より大きくなると、危険度1%でおかしいといえる。
実際の計測が、1000回中10回ということなので、
発生確率を1%とすると、当然、χ^2=0で、おかしくない。
発生確率を1.5%とすると、χ^2=1.69で、おかしくない。
発生確率を2%とすると、χ^2=5.1で、危険度5%ならおかしいといえるが、危険度を1%にするとあり得る範囲となる。
発生確率を0.5%とすると、χ^2=5.025で、危険度5%ならおかしいといえるが、危険度を1%にするとあり得る範囲となる。
...
と、こんな感じで、危険度をある一定の値で決めれば、それに対応する発生確率の範囲を狭めることができる。
918:132人目の素数さん
14/05/12 17:19:53.25
これはカイ自乗分布に従わないですね。
919:132人目の素数さん
14/05/12 20:35:09.37
>>915
信頼度には、常用される99%か95%を採用すべきだろ。類似ケース例と
比較し易いから。
しかし99%か95%が常用値にされたのは、どういう根拠からなんだろ?
根拠を書いた統計本を、未だ見たことがない。
920:132人目の素数さん
14/05/12 20:53:25.98
キリがいいし、人間の心的傾向による区分だよ。
1%で起こる確率は人はめったにない、めずらしいこととか感じる。
5%ぐらいになると、たまにある、時々あると感じる。
σ=1の中ならだいたいそんな感じ、ふつうにあるみたいな。
921:132人目の素数さん
14/05/12 21:58:23.85
根拠はないだろう
1・5・10はちょうどいいってだけで気にしなくてもいい
目的に応じて調節すれば問題ない
922:132人目の素数さん
14/05/12 22:38:00.70
根拠は明白。きりがいいから。
94.133%とか99.273%とか使う馬鹿はいない。誰が見てもきりが悪い。
923:132人目の素数さん
14/05/13 06:44:07.04
>>921
1・5・10はちょうどいいと、最初に用いたのはピアソンだったっけ?
924:132人目の素数さん
14/05/13 23:09:59.99
その年一番よかった曲を投票で決める際、一人が好きな曲を1位~5位として投票することができる
投票した5曲は1位として選ばれたら10pt、5位なら6pt。と重み付けされて集計されて、
投票が終わったときに全員分のポイントが合計され、合計ポイントが高い順にランキングになる
こういう投票システムで、自分の選んだ曲を上位にするために多重投稿している奴がいてランキングが狂ってしまう場合
これを統計的に見破るにはどうしたらいいだろうか
1.多重投票者は特定の同一曲に複数回投票し、残りの曲をどうでもいい曲で埋める
2.多重投票者は同じ日、あるいはかなり近接した日に連続して投票する
3.多重投票する必要のない曲(多くの人が投票する曲)は多重投票する意味がないので投票されない
等、経験的な分析は考えられるもののいい処理の方法がわからん
何かうまい方法はないだろうか
925:132人目の素数さん
14/05/13 23:13:28.64
系列毎に決めればいいじゃないか。もちろん貢献度を考慮して。
926:132人目の素数さん
14/05/20 06:47:53.93
確率とか統計とか知りたいんですけどwikipediaの正規分布の項を見ても理解できないので
初歩の初歩だけでも教えてほしいのですが
エクセルで(1/6)^x*(5/6)^(1000-x)*COMBIN(1000,x)の式を
x=110~220で計算してこのグラフを作りました
URLリンク(i.imgur.com)
意味としてはサイコロを1000回振った時の1の出る回数の確率分布って感じなんですが
きれいな正規分布のように見えるのですがμとσがここからどう求まるのかが分かりません
このグラフ又は式からμ及びσの求め方を教えてください
927:132人目の素数さん
14/05/20 08:17:46.77
muは1000*1/6
sigmaはsqrt(1000*1/6*5/6)で近似できるだろうね
最尤推定で正規分布なら推定量は
muは標本平均
sigmaは標本標準偏差になるかな
928:132人目の素数さん
14/05/20 08:41:47.56
即レスありがとうございます
計算するとμ=166.7 σ=11.785くらいですね
なんとなくそれくらいなのはわかります
二項分布の公式のようなものが有るみたいですね
少し調べてます
929:132人目の素数さん
14/05/24 01:10:21.31
二項分布の検定で標本数が少なくnp> 5 nq> 5 を満たさない場合の
検定方法を教えてください。
930:132人目の素数さん
14/05/24 08:17:11.20
>>928
>二項分布の公式・・・・・・・・・・・・・・・・・
どういう公式のこと?そもそも正規分布>>926質疑に、何故
二項分布式なのか?
931:132人目の素数さん
14/05/25 00:32:57.06
>>930
すいません、よく理解してないんで変なこと書いちゃいましたかね?
Wikipediaで二項分布の項目に
期待値・分散[編集]
B(n, p)にしたがう確率変数X に対し、X の期待値E[X]は
E[X]=np
であり、分散Var[X]は
Var[X]=np(1-p)
となる。
とあるのが公式なのかなと思いました
nが十分に大きい二項分布は正規分布で近似できるともあるし
(1/6)^x*(5/6)^(1000-x)*COMBIN(1000,x)
はそもそも二項分布式です
>>927でグラフを云々でなく提示式の数字だけ出して答えてくださっていたので
二項分布の公式なんだろうなと>>928に書いたのでした
932:132人目の素数さん
14/05/25 12:11:10.78
平均と分散だけでいいだろ
何が公式なんだよww
頭おかしいんじゃないの?
933:132人目の素数さん
14/05/25 13:32:16.04
頭おかしい扱いされたのですが
公式という語句を使ったのがまずかったのですか?
934:132人目の素数さん
14/05/25 14:06:06.19
どうでもいいよ
935:132人目の素数さん
14/05/25 14:13:57.41
>>934=>>932=>>930?
なんかカチンと来る人ですね
そもそも最初の文章が読めてなかっただけなんじゃないですか?
数学できても日本語できない感じですか?
936:132人目の素数さん
14/05/25 14:36:34.30
すみません、熱くなって見苦しい言葉を書いてしまいました
こちらとしては中途半端な知識で来ているので
間違っている点があればきちんと正していただきたかったのですが残念です
これ以上ここにいるのは誰にとっても不利益だと思うので去ります
スレ汚し失礼いたしました
937:132人目の素数さん
14/05/25 14:57:32.79
漸近分布使うかどうかだろ?
そんなに熱くなることかよ
二度と来ないみたいだからいいけどw
938:132人目の素数さん
14/05/25 17:47:49.47
>>930
二項分布で簡単に解けるからだろ。
939:132人目の素数さん
14/05/25 19:36:35.00
>>926
> このグラフ又は式からμ及びσの求め方を教えてください
定義にあてはめて計算するだけです。
計算そのものは高校の数学Iとか数学IIのレベルです。
以上。
940:132人目の素数さん
14/05/26 17:00:52.04
0点。
941:132人目の素数さん
14/05/26 17:02:09.19
つまりあんたは数学Iすら分かってないわけだ。
あんまり背伸びせずに着実に足場を固める方がいいと思うぞ。
942:132人目の素数さん
14/05/26 17:08:51.75
平常点 -100点。
943:132人目の素数さん
14/05/28 04:48:48.32
>>930 はなぜ知ったかしたのか。
944:132人目の素数さん
14/06/02 03:47:28.41
二項分布の検定で標本数が少なく、np> 5 nq> 5 を満たさない場合の
検定方法を教えてください。
945:132人目の素数さん
14/06/02 13:18:07.01
>>945
URLリンク(www.press.tokai.ac.jp)
統計数学序論 - 東海大学出版会
7.4 百分率の検定
7.4.2 小標本のとき
946:132人目の素数さん
14/06/02 13:20:32.88
URLリンク(www.amazon.co.jp)
947:132人目の素数さん
14/06/02 21:50:14.20
そもそも何の検定なのかね
948:132人目の素数さん
14/06/03 00:59:49.14
実用数学検定じゃねえの?
949:132人目の素数さん
14/06/04 21:03:43.63
>>919
>しかし99%か95%が常用値にされたのは、どういう根拠からなんだろ?
フィッシャーさんが仕事をしていた所が農業試験場だったから。
950:132人目の素数さん
14/06/04 21:11:11.10
漁師だと思ってたよ。確率的に。
951:132人目の素数さん
14/06/05 07:52:57.07
「フィッシャーの統計理論」に書いてある。
フィッシャーは肥料や田んぼの作り方の効果を研究するだけでなく、
良い方法が見つかったら近所の百姓を説得してそれを実際に使って
もらうことも仕事だった。フィッシャーの得意な説得方法は次の二つ。
方法1:「今までお前らが経験したことのないほど麦がとれるぞ」
麦は1年に1回、百姓は20歳から40歳までの20年間働く。
だから20分の1以下(5%以下)。
方法2:「百年に1回あるかないかの豊作を経験させてやるぞ」
百年に1回あるかないかとは100分の1以下(1%以下)。
952:132人目の素数さん
14/06/05 11:47:08.81
田んぼで麦を作ってたのか?
953:132人目の素数さん
14/06/05 20:17:24.22
フィッシャーは人を釣ってたのか
954:132人目の素数さん
14/06/06 02:27:26.96
フィッシャー、確かに釣り師っぽい名前だな
955:132人目の素数さん
14/06/25 22:35:58.88
「特異度」って言葉なんか変じゃね? 意味が逆のような気がすんだけど..
特異度(とくいど)とは、臨床検査の性格を決める指標の1つで、ある検査について「陰性のものを正しく陰性と判定する確率」として定義される値である。
概要
特異度が高い、とは、「陰性のものを正しく陰性と判定する可能性が高い」、あるいは「陰性のものを間違って陽性と判定する可能性が低い」という意味である。
URLリンク(ja.wikipedia.org)
956:132人目の素数さん
14/06/26 21:35:08.87
だから何?
957:132人目の素数さん
14/06/26 21:48:33.26
逆というか・・わからんよな
958:132人目の素数さん
14/06/26 22:52:04.61
1-4群のカテゴリーに分けた説明変数が二値アウトカムに与える影響を知りたいので、
SPSSを用いてロジスティック回帰分析を行いました。
1群を対照にして2群から4群に数字が大きくなるにつれてオッズ比が大きくなるという結果なのですが、
これを傾向があると言うにはどうすればいいか悩んでいます
カテゴリーから多項式対比を利用してみましたがこれでいいのか、そしてよいならば結果の解釈はどうすればいいのか
さっぱりわかりません。統計素人なので罵倒されてもいいですから、私の悩みを解決してください
教えてくれたら脱ぎます。いや、嘘ですけど。
959:132人目の素数さん
14/06/27 19:41:19.97
虎ハンター・小林邦昭スレ
960:132人目の素数さん
14/07/07 22:38:31.18
統計学ってつまらなくね?行列計算をひたすらやるだけじゃん
961:132人目の素数さん
14/07/07 22:44:38.34
つまる/つまらないで学ぶ類のものではない
そうでしょう?
962:132人目の素数さん
14/07/09 09:35:26.53
そう。
学ぶ必要は大きいが、
全くつまらない。
963:132人目の素数さん
14/07/09 10:01:16.08
つまらないかそうでないか統計をとってみないとわかりません
964:132人目の素数さん
14/07/11 13:06:04.05
つまらん統計をやってるんだな
965:132人目の素数さん
14/08/10 23:47:54.27
すみません中卒です
n目のサイコロとo目のサイコロとp目のサイコロを同時に振った時の目の和の標準偏差はどう求めればいいのでしょうか?
966:132人目の素数さん
14/08/13 12:17:41.21
事象が独立ならば、「(A+B)の分散」は「Aの分散+Bの分散」
よって、n目のサイコロとo目のサイコロとp目のサイコロを同時に振った時の目の和の分散は
サイコロを1回降った時の分散の合計なので、これのルートが求める標準偏差
967:132人目の素数さん
14/08/15 07:56:04.05
ありがとう
968:132人目の素数さん
14/08/16 14:55:08.77
ペプシコーラとコカコーラの「どちらがオイシイ?」という味比べの広告、カイ2乗検定とかF検定まで行ってみないことには、全くもって意味がないと思う
969:132人目の素数さん
14/08/18 17:23:24.91
>>968
発想がアホすぎる
「統計的に意味がない」ところに「広告として意味がある」
あえて反論の余地を残すことで、広告倫理やコカコーラ社の反撃といった問題を回避できている
970:132人目の素数さん
14/08/19 06:48:05.68
コカコーラのほうが上手いのは当然だから、検定するまでもなくあれは間違いだよ
971:132人目の素数さん
14/08/19 20:18:00.63
平均の差が有意か調べたいのですが、
{1,2,3,4,5}と{2,3,4,5,6}でP値は0.3466
観測値を1000倍して{1000,2000,3000,4000,5000}と{2000,3000,4000,5000,6000}としてもP値は同じになりませんか。
F1のピット作業時間みたいのは、全部差がないと出るような気がするんですが、どうしたらいいのでしょう?