14/04/24 06:38:39.95
単なる変数変換だから
微積分の教科書読むといいよ
882:132人目の素数さん
14/04/24 13:14:10.39
「読者を馬鹿にしてる」と言われそうな本があるんかな
ここで書いても馬鹿にされそうだが
883:132人目の素数さん
14/04/24 16:46:02.27
>>880
まさかaを引いてbで割ったものを、bを掛けてaを足したら同じになる根拠はという質問?
標準化した信頼区間を元になる分布に対して見る場合は当然、bを掛けてaを足して元に戻すんだぞ。
884:847
14/04/24 23:03:33.44
>>883
いえ、aを引いてbで割ったものが違う値になることはわかっています。
ただ、対応する値の間の区間の積分値は一致していなければこの推定は成り立ちませんよね?
たとえば、
f(x)を正規分布する確率変数として、それを標準化したものをg(z)として、
変数xの区間[a, b]に対応する標準化変数zの区間が[z1, z2]だとすると、
∫[a, b]f(x)dx=∫[z1, z2]g(z)dz
が成り立っていなければいけないと思うんです。でもコレの証明を見たことがないということです。
自分で計算しようとしても、どうしても定積分の計算でつまずいてイコールにできません。
885:132人目の素数さん
14/04/24 23:20:39.05
確率変数と確率密度関数の定義もわからないでそんなこと考えてるのか
886:132人目の素数さん
14/04/25 00:20:57.87
積分のとこ変数変換したら成り立たなくないか
887:132人目の素数さん
14/04/25 00:30:57.49
ただ、対応する値の間の区間の積分値は一致していなければこの推定は成り立ちませんよね?
ここなぜそう考えたのかわからないので教えてください
888:132人目の素数さん
14/04/25 01:14:35.74
>>884
そのつまずいたという計算を書いてみ
889:132人目の素数さん
14/04/25 03:45:10.98
>>887
標準化する前も後も結局は同じ式、正規分布関数なのだから、
きっと、∫[(z1-μ)/σ, (z2-μ)/σ] 、∫[z1, z2]を正規分布関数で解けばいいんだよ。同じになるはず。
890:132人目の素数さん
14/04/25 21:24:23.58
これが分からん奴に何を説明しても無駄じゃない?
891:132人目の素数さん
14/04/25 21:37:59.38
数学の基本なしで統計やるとこうなる見本だな
892:132人目の素数さん
14/04/26 18:49:29.43
最低でも数IIICはしないとダメだなという典型例か
今はCないらしいが
893:132人目の素数さん
14/04/26 21:42:21.27
>>889
前半は元に戻すんだから∫[(z1σ+μ, z2σ+μ] だな。
正規累積分布関数なら代入するだけ。(x-μ)/√(2σ^2)の部分に代入するだけで、
簡単に同じ式になることが分る。
894:132人目の素数さん
14/04/29 20:49:01.01
条件付き確率分布でf(x|y;θ)とf(x|y,θ)という書き方を両方見る気がする
違いはあるのだろうか
895:132人目の素数さん
14/04/29 22:13:14.22
a, b, c という具合に変数やパラメータを並べる際、cだけがaやbとは別種のもののとき、その違いを強調するために a, b; c と書くことがある
云わば「強い区切り」としてセミコロンを使う
896:132人目の素数さん
14/04/29 22:15:42.00
数式にそんな曖昧なルールが本当にあるのか?
単純に処理系の違いじゃないのか。
897:132人目の素数さん
14/04/29 22:18:55.68
コンピュータに入力するわけじゃないんだから、数式の書き方なんて慣習頼みである程度の表記揺れはあるよ
見ればすぐに分かる程度の揺れだが
曖昧というのとは少し違う
898:132人目の素数さん
14/04/30 01:17:19.04
定義は厳密だが表記は人次第
899:132人目の素数さん
14/04/30 10:44:14.86
ニュートンの時代の話?
900:132人目の素数さん
14/04/30 11:13:14.34
>>899
???
901:132人目の素数さん
14/04/30 11:16:19.66
>強調するために a, b; c
ねーよ。
902:132人目の素数さん
14/04/30 13:17:34.48
いや、あるよ
別に数学だけの慣習ではなく、英語一般に通じる話なんだけど>強い区切り
903:132人目の素数さん
14/04/30 16:14:10.89
高校の英語でも習う話だな
904:132人目の素数さん
14/04/30 22:33:27.57
音楽の記号使うか
905:132人目の素数さん
14/04/30 22:51:56.80
>>894
そのケースでは、意味に差の無い
単なる「強い区切り」でしょ、たぶん。
楕円関数なんかだと、区切りの書き方によって
パラメータの表示方法が違ったりするから、
一応、文脈に沿った確認は必要だが、
おそらく >>895 の言うとおり。
906:132人目の素数さん
14/05/01 19:22:50.13
曖昧に強調するためとかいうから勘違いする奴が出てくる。
ならボールド体や斜体表記でもいいだろということになる。
論理的に明確にコンマと区別したいから使うものだろう。
複数の数列とか行列とかコンマだけなら意味が不明確になる場合に。
907:132人目の素数さん
14/05/01 20:33:02.37
アホ現る
908:132人目の素数さん
14/05/09 23:26:45.58
統計についてほとんどわからないのですが、
あるゲームの中のイベントが発生する確率を調べたいと思っています。
例えば1000回試して10回起きたとしたら普通に計算すると発生確率1%になりますが
この結果が偏りではなく、実際の発生確率とほぼ同じかどうかを検証する方法ってありますか?
909:132人目の素数さん
14/05/10 12:44:30.37
無限回試してみればいい
910:132人目の素数さん
14/05/10 13:02:04.24
直感的に無理だと思うが
911:132人目の素数さん
14/05/10 13:07:44.85
じゃあ直感で判断すればいい
912:132人目の素数さん
14/05/10 15:01:28.79
ランダムは偏る場合もあるし、偏らない場合もある。
それは諦めて普通に推定すればいい。ほぼ同じかどうか知りたいんだから、
信頼度99%とかで発生確率を推定すればいいだろう。
913:132人目の素数さん
14/05/10 16:34:37.71
>>912
>信頼度99%とかで・・・・・・・・・・・・・・・・
モンテカルロ法で発生確率>>908をシミュレーションするとして、推定に
適用する信頼水準は、常用する99%でも95%でもなく、常用しない80%とか
60%にすると推定理論上何か問題があるのでしたっけ?
914:132人目の素数さん
14/05/10 19:01:25.62
何の問題もないよ。信頼度を落とせば、信頼区間は狭くなるだけ。
試行回数1000回を1万回にすれば精度もあがる。お好みでどうぞ。
915:132人目の素数さん
14/05/11 06:24:42.58
>>914
お好みでと言われるが、信頼区間幅を狭くして推定精度を上げても
その信頼度が60%なり50%なりだと、2回に1回はその推定値範囲内に
入らないわけで、算出はできるが実用にならないのではないか?
916:132人目の素数さん
14/05/11 12:35:09.39
それこそお好み
917:132人目の素数さん
14/05/11 18:09:00.07
このようなものは、χ^2検定が一般的
発生確率をp、試行回数をNとすると、
期待される成功回数はNpで、これをAと表すことにします。
失敗回数はN(1-p)で、これをBと表すことにします。
そして、実際試してみての成功回数がaで、失敗回数がb(=N-a)の時、χ^2と呼ばれる次の量
χ^2=(A-a)^2/A + (B-b)^2/B
を計算します。期待される量と、実際の回数が等しい場合は0になり、それからずれるほど
大きな値になるものです。これが、ある一定量を超えると、pがおかしいんじゃ無いかといえ、
今回の場合は自由度が1なので、3.84より大きいと危険度5%でおかしいといえるし、
6.63より大きくなると、危険度1%でおかしいといえる。
実際の計測が、1000回中10回ということなので、
発生確率を1%とすると、当然、χ^2=0で、おかしくない。
発生確率を1.5%とすると、χ^2=1.69で、おかしくない。
発生確率を2%とすると、χ^2=5.1で、危険度5%ならおかしいといえるが、危険度を1%にするとあり得る範囲となる。
発生確率を0.5%とすると、χ^2=5.025で、危険度5%ならおかしいといえるが、危険度を1%にするとあり得る範囲となる。
...
と、こんな感じで、危険度をある一定の値で決めれば、それに対応する発生確率の範囲を狭めることができる。
918:132人目の素数さん
14/05/12 17:19:53.25
これはカイ自乗分布に従わないですね。
919:132人目の素数さん
14/05/12 20:35:09.37
>>915
信頼度には、常用される99%か95%を採用すべきだろ。類似ケース例と
比較し易いから。
しかし99%か95%が常用値にされたのは、どういう根拠からなんだろ?
根拠を書いた統計本を、未だ見たことがない。
920:132人目の素数さん
14/05/12 20:53:25.98
キリがいいし、人間の心的傾向による区分だよ。
1%で起こる確率は人はめったにない、めずらしいこととか感じる。
5%ぐらいになると、たまにある、時々あると感じる。
σ=1の中ならだいたいそんな感じ、ふつうにあるみたいな。
921:132人目の素数さん
14/05/12 21:58:23.85
根拠はないだろう
1・5・10はちょうどいいってだけで気にしなくてもいい
目的に応じて調節すれば問題ない
922:132人目の素数さん
14/05/12 22:38:00.70
根拠は明白。きりがいいから。
94.133%とか99.273%とか使う馬鹿はいない。誰が見てもきりが悪い。
923:132人目の素数さん
14/05/13 06:44:07.04
>>921
1・5・10はちょうどいいと、最初に用いたのはピアソンだったっけ?
924:132人目の素数さん
14/05/13 23:09:59.99
その年一番よかった曲を投票で決める際、一人が好きな曲を1位~5位として投票することができる
投票した5曲は1位として選ばれたら10pt、5位なら6pt。と重み付けされて集計されて、
投票が終わったときに全員分のポイントが合計され、合計ポイントが高い順にランキングになる
こういう投票システムで、自分の選んだ曲を上位にするために多重投稿している奴がいてランキングが狂ってしまう場合
これを統計的に見破るにはどうしたらいいだろうか
1.多重投票者は特定の同一曲に複数回投票し、残りの曲をどうでもいい曲で埋める
2.多重投票者は同じ日、あるいはかなり近接した日に連続して投票する
3.多重投票する必要のない曲(多くの人が投票する曲)は多重投票する意味がないので投票されない
等、経験的な分析は考えられるもののいい処理の方法がわからん
何かうまい方法はないだろうか
925:132人目の素数さん
14/05/13 23:13:28.64
系列毎に決めればいいじゃないか。もちろん貢献度を考慮して。
926:132人目の素数さん
14/05/20 06:47:53.93
確率とか統計とか知りたいんですけどwikipediaの正規分布の項を見ても理解できないので
初歩の初歩だけでも教えてほしいのですが
エクセルで(1/6)^x*(5/6)^(1000-x)*COMBIN(1000,x)の式を
x=110~220で計算してこのグラフを作りました
URLリンク(i.imgur.com)
意味としてはサイコロを1000回振った時の1の出る回数の確率分布って感じなんですが
きれいな正規分布のように見えるのですがμとσがここからどう求まるのかが分かりません
このグラフ又は式からμ及びσの求め方を教えてください
927:132人目の素数さん
14/05/20 08:17:46.77
muは1000*1/6
sigmaはsqrt(1000*1/6*5/6)で近似できるだろうね
最尤推定で正規分布なら推定量は
muは標本平均
sigmaは標本標準偏差になるかな
928:132人目の素数さん
14/05/20 08:41:47.56
即レスありがとうございます
計算するとμ=166.7 σ=11.785くらいですね
なんとなくそれくらいなのはわかります
二項分布の公式のようなものが有るみたいですね
少し調べてます
929:132人目の素数さん
14/05/24 01:10:21.31
二項分布の検定で標本数が少なくnp> 5 nq> 5 を満たさない場合の
検定方法を教えてください。
930:132人目の素数さん
14/05/24 08:17:11.20
>>928
>二項分布の公式・・・・・・・・・・・・・・・・・
どういう公式のこと?そもそも正規分布>>926質疑に、何故
二項分布式なのか?
931:132人目の素数さん
14/05/25 00:32:57.06
>>930
すいません、よく理解してないんで変なこと書いちゃいましたかね?
Wikipediaで二項分布の項目に
期待値・分散[編集]
B(n, p)にしたがう確率変数X に対し、X の期待値E[X]は
E[X]=np
であり、分散Var[X]は
Var[X]=np(1-p)
となる。
とあるのが公式なのかなと思いました
nが十分に大きい二項分布は正規分布で近似できるともあるし
(1/6)^x*(5/6)^(1000-x)*COMBIN(1000,x)
はそもそも二項分布式です
>>927でグラフを云々でなく提示式の数字だけ出して答えてくださっていたので
二項分布の公式なんだろうなと>>928に書いたのでした
932:132人目の素数さん
14/05/25 12:11:10.78
平均と分散だけでいいだろ
何が公式なんだよww
頭おかしいんじゃないの?
933:132人目の素数さん
14/05/25 13:32:16.04
頭おかしい扱いされたのですが
公式という語句を使ったのがまずかったのですか?
934:132人目の素数さん
14/05/25 14:06:06.19
どうでもいいよ
935:132人目の素数さん
14/05/25 14:13:57.41
>>934=>>932=>>930?
なんかカチンと来る人ですね
そもそも最初の文章が読めてなかっただけなんじゃないですか?
数学できても日本語できない感じですか?
936:132人目の素数さん
14/05/25 14:36:34.30
すみません、熱くなって見苦しい言葉を書いてしまいました
こちらとしては中途半端な知識で来ているので
間違っている点があればきちんと正していただきたかったのですが残念です
これ以上ここにいるのは誰にとっても不利益だと思うので去ります
スレ汚し失礼いたしました
937:132人目の素数さん
14/05/25 14:57:32.79
漸近分布使うかどうかだろ?
そんなに熱くなることかよ
二度と来ないみたいだからいいけどw
938:132人目の素数さん
14/05/25 17:47:49.47
>>930
二項分布で簡単に解けるからだろ。
939:132人目の素数さん
14/05/25 19:36:35.00
>>926
> このグラフ又は式からμ及びσの求め方を教えてください
定義にあてはめて計算するだけです。
計算そのものは高校の数学Iとか数学IIのレベルです。
以上。
940:132人目の素数さん
14/05/26 17:00:52.04
0点。
941:132人目の素数さん
14/05/26 17:02:09.19
つまりあんたは数学Iすら分かってないわけだ。
あんまり背伸びせずに着実に足場を固める方がいいと思うぞ。
942:132人目の素数さん
14/05/26 17:08:51.75
平常点 -100点。
943:132人目の素数さん
14/05/28 04:48:48.32
>>930 はなぜ知ったかしたのか。
944:132人目の素数さん
14/06/02 03:47:28.41
二項分布の検定で標本数が少なく、np> 5 nq> 5 を満たさない場合の
検定方法を教えてください。
945:132人目の素数さん
14/06/02 13:18:07.01
>>945
URLリンク(www.press.tokai.ac.jp)
統計数学序論 - 東海大学出版会
7.4 百分率の検定
7.4.2 小標本のとき
946:132人目の素数さん
14/06/02 13:20:32.88
URLリンク(www.amazon.co.jp)
947:132人目の素数さん
14/06/02 21:50:14.20
そもそも何の検定なのかね
948:132人目の素数さん
14/06/03 00:59:49.14
実用数学検定じゃねえの?
949:132人目の素数さん
14/06/04 21:03:43.63
>>919
>しかし99%か95%が常用値にされたのは、どういう根拠からなんだろ?
フィッシャーさんが仕事をしていた所が農業試験場だったから。
950:132人目の素数さん
14/06/04 21:11:11.10
漁師だと思ってたよ。確率的に。
951:132人目の素数さん
14/06/05 07:52:57.07
「フィッシャーの統計理論」に書いてある。
フィッシャーは肥料や田んぼの作り方の効果を研究するだけでなく、
良い方法が見つかったら近所の百姓を説得してそれを実際に使って
もらうことも仕事だった。フィッシャーの得意な説得方法は次の二つ。
方法1:「今までお前らが経験したことのないほど麦がとれるぞ」
麦は1年に1回、百姓は20歳から40歳までの20年間働く。
だから20分の1以下(5%以下)。
方法2:「百年に1回あるかないかの豊作を経験させてやるぞ」
百年に1回あるかないかとは100分の1以下(1%以下)。
952:132人目の素数さん
14/06/05 11:47:08.81
田んぼで麦を作ってたのか?
953:132人目の素数さん
14/06/05 20:17:24.22
フィッシャーは人を釣ってたのか
954:132人目の素数さん
14/06/06 02:27:26.96
フィッシャー、確かに釣り師っぽい名前だな
955:132人目の素数さん
14/06/25 22:35:58.88
「特異度」って言葉なんか変じゃね? 意味が逆のような気がすんだけど..
特異度(とくいど)とは、臨床検査の性格を決める指標の1つで、ある検査について「陰性のものを正しく陰性と判定する確率」として定義される値である。
概要
特異度が高い、とは、「陰性のものを正しく陰性と判定する可能性が高い」、あるいは「陰性のものを間違って陽性と判定する可能性が低い」という意味である。
URLリンク(ja.wikipedia.org)
956:132人目の素数さん
14/06/26 21:35:08.87
だから何?
957:132人目の素数さん
14/06/26 21:48:33.26
逆というか・・わからんよな
958:132人目の素数さん
14/06/26 22:52:04.61
1-4群のカテゴリーに分けた説明変数が二値アウトカムに与える影響を知りたいので、
SPSSを用いてロジスティック回帰分析を行いました。
1群を対照にして2群から4群に数字が大きくなるにつれてオッズ比が大きくなるという結果なのですが、
これを傾向があると言うにはどうすればいいか悩んでいます
カテゴリーから多項式対比を利用してみましたがこれでいいのか、そしてよいならば結果の解釈はどうすればいいのか
さっぱりわかりません。統計素人なので罵倒されてもいいですから、私の悩みを解決してください
教えてくれたら脱ぎます。いや、嘘ですけど。
959:132人目の素数さん
14/06/27 19:41:19.97
虎ハンター・小林邦昭スレ
960:132人目の素数さん
14/07/07 22:38:31.18
統計学ってつまらなくね?行列計算をひたすらやるだけじゃん
961:132人目の素数さん
14/07/07 22:44:38.34
つまる/つまらないで学ぶ類のものではない
そうでしょう?
962:132人目の素数さん
14/07/09 09:35:26.53
そう。
学ぶ必要は大きいが、
全くつまらない。
963:132人目の素数さん
14/07/09 10:01:16.08
つまらないかそうでないか統計をとってみないとわかりません
964:132人目の素数さん
14/07/11 13:06:04.05
つまらん統計をやってるんだな
965:132人目の素数さん
14/08/10 23:47:54.27
すみません中卒です
n目のサイコロとo目のサイコロとp目のサイコロを同時に振った時の目の和の標準偏差はどう求めればいいのでしょうか?
966:132人目の素数さん
14/08/13 12:17:41.21
事象が独立ならば、「(A+B)の分散」は「Aの分散+Bの分散」
よって、n目のサイコロとo目のサイコロとp目のサイコロを同時に振った時の目の和の分散は
サイコロを1回降った時の分散の合計なので、これのルートが求める標準偏差
967:132人目の素数さん
14/08/15 07:56:04.05
ありがとう
968:132人目の素数さん
14/08/16 14:55:08.77
ペプシコーラとコカコーラの「どちらがオイシイ?」という味比べの広告、カイ2乗検定とかF検定まで行ってみないことには、全くもって意味がないと思う
969:132人目の素数さん
14/08/18 17:23:24.91
>>968
発想がアホすぎる
「統計的に意味がない」ところに「広告として意味がある」
あえて反論の余地を残すことで、広告倫理やコカコーラ社の反撃といった問題を回避できている
970:132人目の素数さん
14/08/19 06:48:05.68
コカコーラのほうが上手いのは当然だから、検定するまでもなくあれは間違いだよ
971:132人目の素数さん
14/08/19 20:18:00.63
平均の差が有意か調べたいのですが、
{1,2,3,4,5}と{2,3,4,5,6}でP値は0.3466
観測値を1000倍して{1000,2000,3000,4000,5000}と{2000,3000,4000,5000,6000}としてもP値は同じになりませんか。
F1のピット作業時間みたいのは、全部差がないと出るような気がするんですが、どうしたらいいのでしょう?