統計学なんでもスレッド14at MATH
統計学なんでもスレッド14 - 暇つぶし2ch558:132人目の素数さん
12/08/25 15:18:34.20
野球統計学のセイバーメトリクス指標って専門的に統計学を勉強している方にとっては
参考になると思いますか?
xFIPとERAの乖離の分布について
URLリンク(www.baseballprospectus.com)
これが示すのは一定の乖離幅の選手がそれぞれ%いるという事実であって
個々の選手が一様に平均に収束するということではないだろう
xFIPとERAの差が運であるいうのはあくまでERAとxFIPの差が形成する分布の
どの位置に収まるかが運という意味であって毎年の分布状況が独立していると考えられるならば
前年xFIPよりERAが悪かった投手が今年はよくなるはずだなどとは言えないはず
xFIPが示すのはあくまで運の要素によってERAのテールが厚くなっているという事実を示しているだけ
と説明されてもイマイチ分からない

559:132人目の素数さん
12/08/25 15:30:10.42
参考になると思いますか?→統計有意性があって使える指標だと思いますか?

URLリンク(www.fangraphs.com)
ここ5年のデータ

xFIPやSIERAは運や球場の広さ、守備等が平均的に恵まれていた場合
その投手の防御率(ERA)がこのぐらいになるという、バイアスを除外して
投手力そのものを見ようとしたり、将来的な防御率を予想する指標みたいなもの


560:132人目の素数さん
12/08/25 22:20:10.39
「使える指標」とは何かを定義してくれないと
有意性があるかどうか判定しようが無い。

野球を知らないと、そもそもERAやFIPで何を測るつもりで、
どうなっていることを期待しているのかが分からないから、
仮説の立てようがなく、したがって検定もできない。

>>558の記事について言うなら、ERAは予測が難しい
指標であると主張したいように読めたが、
それが意味のある主張かどうかは知らない。

561:132人目の素数さん
12/08/26 14:04:53.13
>>560
ERA→投手の投球9イニング当たりの自責点率…自責点×投球イニング÷9
FIP→投手力以外の野手守備力・球場の広さ等の周囲環境や失点巡り合わせの運が平均的だった場合の
予想防御率(劣化・覚醒以外はこの防御率に近くなるだろうという)
ERA(防御率)を将来的に予測する指標のxFIPとSIERAが
ERAとの乖離度合いからして、統計的に参考にしても良い指標なのかどうか
有意性がなくても、ERAと比べてxFIPの乖離が大きい場合だと予想の目安として参考にしても良いものなのか


562:132人目の素数さん
12/08/26 23:28:21.78
>>561
ERAが実績値で他はERAの予測値と言う解釈なら、
それぞれの手法の誤差分布を見て一番良いものを
選ぶ以外に考え方は無い。

この例だとRMSEしか書いてないから、RMSEが一番
良いものが一番良い手法であり、そのRMSEで
「使える」とか「参考になる」とか判断するのは
使う人の問題。

統計的に有意かどうかという議論をするなら
各手法の誤差分布の差が有意かどうかとか
議論できなくも無いが、そういうことじゃないんだろう。

そもそもERAに運の要素があるから信じられないとか言う話なら、
ERAを精度良く予測しようとすること自体が間違っている。

563:132人目の素数さん
12/08/28 09:50:12.87
P(X=a ; Y=b | Z=c)
P( Z=c | X=a ; Y=b)
条件付確率でセミコロンが使われているんですけど
こんな表記法知りません。
上の2つの確率の意味をおしえてください。

564:544
12/08/28 23:04:07.57
>>546>>549>>550
皆さんありがとうございます。

きっかけは、

番組A 視聴率14.1%
番組B 視聴率13.1%

という視聴率データがあり、
私が「番組Aのほうが番組Bより視聴率は高いので一般人気がある」と主張したところ、
「視聴率は標本誤差というものがあって、この程度の差では誤差範囲内に
収まってしまうから、どちらの視聴率が高いとも断言できない。
強いて結論を言うなら、有意差はない。」と反論する人が現れました。

私としては、14.1%と13.1%という結果が出ているのに誤差というものを考えに
入れることに納得いかず、>>545のように
オリンピックの水泳のタイム、木星の直径の例えを出して反論しましたが、相手の返事は、

「普通、水泳のタイムは55秒67とか百分の一秒単位であらわされるが、
オリンピックで計時に使われる時計の誤差は百分の一秒なんてレベルじゃない、
もっとすごい精度だから、測定誤差は無視していい。」という返事でした。

URLリンク(blog.excite.co.jp)
> 1マイクロ秒(1秒の100万分の1)という精度を誇るクァンタム・タイマーとクァンタム・アクアティクス・タイマーは、オメガの計時製品に新しい時代の到来を告げるデバイスです。
> 精度は、これまでのデバイスの100倍におよぶ高精度です。クァンタムは0.1ppmの精度を提供します。つまり、最大偏差はわずか1000万分の1秒、つまり、1000秒毎に1000分の1秒しかありません。

木星の直径については、
「たしかにいまの計測技術の限界で天体直径の測定誤差はあるが、視聴率の場合もいまの計測法の限界ゆえに
代りに標本誤差が出る、というだけの話であり、木星の直径の誤差は標本誤差を無視していいという理由にはならない」
といわれました。

565:132人目の素数さん
12/08/28 23:18:01.93
私はまだ納得できなかったので、NHKが視聴率ランキング出してるのを見せて、

URLリンク(www.nhk.or.jp)
「NHKだって視聴率ランキング出してます。これは誤差を考慮しない証拠じゃないですか?
標本誤差があるからっていうんなら、ランキングする意味がなくなってしまいませんか?
ランキングしてるNHKはバカってことになりませんか?」

と反論したのですが、相手からは

「その視聴率ランキング1位は13.0%で、3位は12.3%。1位と3位はこれも誤差範囲でしかない。
したがって、勝ち負けを語るには意味のないランキングでしかない。
URLリンク(www.videor.co.jp)
視聴率の標本誤差の存在は視聴率を計測してるビデオリサーチが自分で認めているので、
ランキング1位というのは順位を保証した意味ではないだろう。」

と再反論されました。

566:132人目の素数さん
12/08/28 23:36:42.28
さらに相手が言うには、
URLリンク(www.nhk.or.jp)

>サンプル調査の結果は誤差を含むた
>め,2 つの数値を比較して統計的に意味のある
>差(有意差)がある場合は,文中では,「減少」
>「増加」など,有意差がない場合は「変化なし」
>「同程度」などと表現している。

>木曜のドラマ「バッテリー」の視聴率は5.3%で,
>前年「木曜時代劇・夏雲あがれ」(6.4%)と変わらない。


「NHK自身が分析レポートで誤差を考慮した視聴率分析を行っている。
そしてその結果、(5.3%と6.4%という1.1%の差があっても有意差はない)
という分析結果を出しているので、視聴率を比べるときは誤差を考慮するのが正しい
とみなされていることは明らかである。」
ということでした。


視聴率の数字の差だけでランキングしても意味はなく、
誤差を考えに入れて分析するのが正しいのだと相手は言いたいようなのですが、
皆さんの意見はどうなのでしょうか。
この相手の言ってることが正しいんでしょうか。

567:132人目の素数さん
12/08/28 23:37:53.33
コインを1回投げて表が出たときに
「このコインは表が出た」と言えば異論は無いけど、
「このコインは表が出る」と言ったら馬鹿だと思うだろ。
そういうことだよ。

水泳のタイムで反論するなら、選手のタイムは
試合ごとに10秒以上のばらつきがあるから
1回のタイムで順位を決めるのは意味が無い
くらいのことは言い返さないとダメだな。

568:132人目の素数さん
12/08/29 00:26:19.67
選手の能力のばらつきと計測誤差を一緒にしちゃだめだよ。

569:132人目の素数さん
12/08/29 00:35:46.22
一緒にしていないからこそ
それを使って反論しろといっているんだろうよ


570:132人目の素数さん
12/08/29 00:41:32.85
>>566
相手の主張がよくわからない。
相手は誤差はどのくらいあると主張しているのか?

視聴率14.1%  と13.1% は誤差の範囲に入ると言っているようだが
では14.1%に対してなら、なん%なら誤差の範囲ではないというのか?
それとも確率的に考えているのか? 

14.1%  と13.1% の番組の実際の順位が後者のほうが上の可能性のうが
高いということがあるのか? それとも統計の検定のように、前者の順位が
上である確率が95%や99%を超えないと有意差なしだと言うのか?

そのへんの主張がわからないので、正しいのか?と問われても
なんともいえない?



571:132人目の素数さん
12/08/31 02:04:53.10
一年にCDを10枚出して合計売り上げが110万枚になる歌手と
一年にCDを1枚出して合計売り上げが100万枚になる歌手

統計学的にはどっちが人気のある歌手になりますか?

572:132人目の素数さん
12/08/31 02:24:47.77
統計学には、歌手の人気についての公理や定理はありません。

573:132人目の素数さん
12/08/31 02:40:13.91
つまりこの案件に統計学を持ち出すこと自体が的外れということですね
ありがとうございました

574:132人目の素数さん
12/08/31 10:35:38.60
「人気のある歌手」を数学的に定義したら
統計学の出番もあるかもしれませんよ


575:132人目の素数さん
12/08/31 13:15:29.25
そろそろ>>563に回答をよろしくおねがいできませんでしょうか?

576:132人目の素数さん
12/08/31 20:52:48.71
SPSSを使わなければならなくなって石村貞夫先生の著書を購入したのですがちんぷんかんぷんです
どなたか教えてください

a、b、cからそれぞれ10回ずつデータを得ました
一年後(A、B、Cとします)再び10回ずつデータを得ました

a、b、c間に差がないこと
A、B、C間に差がないこと
a、b、cとA、B、Cとの間には差があることを示すには何をすればいいのでしょう
どなたか分かる方、教えてください(_ _)

577:132人目の素数さん
12/09/04 12:50:38.81
>>571
人気をCD買う人数で定義すれば統計学関係なく
前者は11万人、後者は100万人

578:132人目の素数さん
12/09/04 12:59:23.67
>>563
表記法などは各自が定義して勝手に使って良いので、本の前の方を見る事
おそらく X=a AND Y=b か X=a OR Y=b か X=a → Y=b か X=a XOR Y=b の意味だと思われる

579:132人目の素数さん
12/09/04 13:28:45.60
>>577
前者は、ファン全員が全部のCDを買うわけではない。
後者は、2枚買いするひとを考慮していない。


580:132人目の素数さん
12/09/05 01:09:08.77
考慮したらどうなるの?

581:132人目の素数さん
12/09/05 16:08:41.00
人数は不明

582:132人目の素数さん
12/09/06 01:15:33.45
2群間でネズミの体重を定期的に測っています。
個体によって測定期間1~3週までとばらつきがあります。

グループA
測定1wまで(n=10~15):day0,3,7終了
測定2wまで(n=10~15):day0,3,7,10,14終了
測定3wまで(n=10~15):day0,3,7,10,14,17,21終了

グループB
同上

各個体のday0体重を100%として変化を記録してます。

これら2群間で体重変化率に差があるかどうか(どのタイムポイントでも)調べるには、どんなテストをしたらいいでしょうか?
ちなみに、使用しているソフトは雑誌の付録についていたエクセル使用するystat2008.xlsで、
僕自身は統計理解は全くなく、なんとなく使用している程度です。

583:132人目の素数さん
12/09/06 10:18:35.83
質問です。

4クラス、合計300名の試験結果があります。
二科目あり、Aさん50/21、Bさん69/40…とのデータのみ。
満点、問題ごとの素点は分かりません。

何故か事務職の私に、分かる範囲で分析して、と上司から任されました。
何か分析方法がありましたら教えて頂きたいです。
平均でクラス別に比較する、位しか思いつきませんでした…
宜しくお願いします。

584:132人目の素数さん
12/09/06 11:46:33.70
>>583
「データ眺めて、直感的に思いつくことを挙げてみる」
なんですけど、まずはじめに
いわゆる「箱ひげ図」つくるといいですよ。

A科目の「箱ひげ図」を4クラス分並べると、
例えば、
1)平均点はクラスごとに微妙に違う
2)中央値はどのクラスも同じぐらい
3)このクラスはやたら最低点が低い
とか、ひとめでわかるので、
上司に見せるときに良い感じ。

分析軸としては、
「男子の平均が高い(性差)」とか
「運動部は低い(部活差)」とか
これは経験的にわかってるのを使えばいいのでは。

たとえば部活なら週あたり活動時間で、
A科目の得点を単回帰してみるとか

585:132人目の素数さん
12/09/08 01:04:52.07
箱ひげ図はいい案だけど問題はどんなソフトが使えるかだな。
EXCELしかないと書けないからな。

586:132人目の素数さん
12/09/08 21:58:08.08
一応箱ひげ図らしいものは作れるらしいけどな

587:132人目の素数さん
12/09/08 22:07:59.39
標準で?グラフ作成を見てもデータ分析を見てもそれらしいのはないんだけど。

588:132人目の素数さん
12/09/09 12:58:41.36
株価チャートもしくは積み上げ縦棒グラフで作るらしい
URLリンク(software.ssri.co.jp)
URLリンク(walking-elephant.blogspot.jp)


589:132人目の素数さん
12/09/09 15:02:03.04
外れ値なしの簡易版か。
参考にはなったけどマクロでも組まない限り使えるとは言えないな。
Rが使える人なら素直にRを使う方がいい。

590:132人目の素数さん
12/09/09 17:03:52.96
>>589
>>583がR使えるようになるまで上司が待ってくれるとは思えんが・・・

591:132人目の素数さん
12/09/09 17:44:32.73
中央値、最大値・最小値・四分位範囲とかが計算できるんだから、
描画くらいソフトでやらないで、グラフ用紙に手書きすればいいだろう。

592:544
12/09/10 21:05:13.75
少し時間が経ってしまいましたが
>>570さんの話を相手にぶつけてみました

>相手は誤差はどのくらいあると主張しているのか?

視聴率は日本ではビデオリサーチ社が独占的に計測していて、
そのビデオリサーチが自社のサイトで誤差の数式を公開してるのだから、
URLリンク(www.videor.co.jp)
これで計算した結果を誤差とするほかないだろう、との事でした。

>それとも確率的に考えているのか?

上のビデオリサーチのリンクを読むと、
 視聴率調査は、国や自治体、マスコミなどが実施する世論調査と同様に、統計理論に基づいた標本調査です。
 標本調査から得られる視聴率は、標本誤差(=統計上の誤差)を伴います。
と書いてあるので標本調査の誤差の問題である、との事。

>14.1%と13.1%の番組の実際の順位が後者のほうが上の可能性のうが
>高いということがあるのか?それとも統計の検定のように、前者の順位が
>上である確率が95%や99%を超えないと有意差なしだと言うのか?

上のビデオリサーチのリンクを読むと、
 標本数600の場合、信頼度95%(100回中95回はこの幅に収まる)で考えると、視聴率が10%での、考慮すべき標本誤差は±2.4%です。
と書いてある、との事。

593:132人目の素数さん
12/09/10 21:06:16.13
なんでも、ふつう視聴率として発表されるのは関東地区の視聴率で、
正確に計るなら関東の全部のテレビで視聴率を測定しなければならない。
これが計れるなら、文句のつけようがない正確な視聴率が出る。

でもビデオリサーチは関東地区から600世帯だけ選んで、その600世帯で
計った視聴率を公表してるので、この600世帯の視聴率が
本来知りたい全部のテレビの視聴率とピタリと一致する事は普通はない。
だから誤差を考慮する、とか。

594:132人目の素数さん
12/09/10 23:14:39.33
名前入れ忘れ

>>593=>>592です

595:132人目の素数さん
12/09/10 23:14:41.07
厳密なのかいい加減なのか良く分からん相手だな
まあ、基本的に544よりは相手の方がまともなこと言ってるみたいだし
もう少し相手の話を素直に聞いて勉強した方が良いんでないかね

596:132人目の素数さん
12/09/11 00:59:13.98
>>592
ならばやはり14.1%と13.1%の場合では14.1%のほうが1位である確率が高そうだよ。
なのになぜその比較は意味が無いというのだろう? 
統計的に考えているということなら、いくら誤差を含んでいても意味が無いというのは
言い過ぎだと思う。 
なぜ視聴率には統計的誤差を認めるのに、順位には統計的誤差を認めないのだろう?

それとも視聴率を含め、誤差のある統計にはそもそも意味が無いと考える人なのかな?



597:132人目の素数さん
12/09/11 10:03:16.53
>>596
「誤差のある統計にはそもそも意味が無いと考える人」
とか、ストローマン入ってきてるぞw

最初の
「どちらの視聴率が高いとも断言できない。 」
って言った相手の意見がすべてで、
「断言できない」を「意味がない」って脳内変換しちゃうのは
どうかと思うの

598:132人目の素数さん
12/09/11 15:41:00.10
「有意差はない」てのは「意味のある差はない」ってことじゃないの?

599:132人目の素数さん
12/09/11 16:00:08.02
おいおい

600:132人目の素数さん
12/09/11 20:24:43.24
件の彼がどのくらいの違いがあれば有意差があると思っているのかが気になる


601:132人目の素数さん
12/09/12 00:19:38.73
視聴率は600世帯しか調べてないから1%から99%まで差がないとか言うのもいそう。

602:132人目の素数さん
12/09/12 01:03:57.19
これに尽きると思う


> なぜ視聴率には統計的誤差を認めるのに、順位には統計的誤差を認めないのだろう


603:132人目の素数さん
12/09/12 19:57:33.30
誰かこれ教えてくれ

2011年~2012年にかけて、とある地域に住む18歳以下の男女36万人中、8万人をサンプリング調査した所、大変珍しい病気が1件見つかった。
1975年~2007年の統計データによると、この病気の罹患率は年間あたり0.18人/10万人だった。

問1)1975年~2007年の罹患率(10万人あたり0.18人)を用いて、罹患人数0~5人の範囲で確率分布を求め、8万人中1人が罹患するケースの確率を答えなさい。

問2)その結果から、1975年~2007年の罹患率と2011年~2012年の罹患率に変動があったと見做せるか、客観的に論じなさい。

604:132人目の素数さん
12/09/12 20:29:16.38
>>603
何その甲状腺がんwww

605:132人目の素数さん
12/09/12 21:51:00.91
「なぜ視聴率には統計的誤差を認めるのに、順位には統計的誤差を認めないのだろう?」

>>596氏のこの一文だが、544に対して言っているのか、544の相手に対して言っているのかが
判りにくいんだけど?
544は>>565のようにNHKの視聴率ランキングを相手に見せて反論してるくらいだから、
視聴率の順位の統計的誤差は認めないスタンスと考えられる。
544の相手のほうは、視聴率の誤差を認めているので視聴率ランキングを絶対視しない
スタンスと考えられる。

順位に誤差があるのを認めるとすると、誤差のせいで順位は正しいとは限らないという話に
なるわけだから、むしろ544の相手のほうを援護している格好になる。
となると、冒頭の一文がもし544の相手に向けられたものなら、その意図がわからない。

まず、順位の統計的誤差とは、どういう意味で言ってるのか?
視聴率順に並べただけの順位に、どういう誤差が発生するのか?

606:132人目の素数さん
12/09/12 21:58:19.04
例えばAKB48で誰が好きか順に書け、というアンケートを取ったとする。
そうやって得られたデータで、順位に統計的誤差を認めるべきというならわかるんだが、
視聴率の順位と言うのは数字の大きさ順でしかないはず。

607:132人目の素数さん
12/09/12 22:59:15.84
言葉の定義が定かでない人間が何を考えてるかなど分かるものではない
544をネタに擁護だの反論だの考察しても矛盾しか生じないのは当たり前だろう

608:132人目の素数さん
12/09/13 00:29:33.47
真の視聴率を元に付けた順位と
統計的計算上の視聴率を元に付けた順位の差
を順位の統計上の誤差と言っているように感じるが
それじゃだめなのか?



609:132人目の素数さん
12/09/13 01:51:50.08
俺もそう思う。
実際、順位の誤差による違いを気にすると順位をつけること自体に意味がなくなるから
仕方ないんだろうけどね。

610:132人目の素数さん
12/09/13 02:37:08.51
>>606
数字の大きさ順だと何か問題があるのか?
量を示さない値は好きじゃないとか?

611:132人目の素数さん
12/09/13 09:28:30.25
>>603
ポアソン分布だと仮定

罹患率0.18人/(10万人・年)なので、
8万人を2011~2012年の1年間(正確には1年半だけど)だと
ポアソン分布のパラメータλは0.18*0.8*1=0.144になる。

計算すると
P(0人)=86.6%
P(1人)=12.5%
P(2人)=0.9%
P(3人以上)=ほとんどゼロ

以上から、とりあえず、一人見つかっただけでは、なんとも言えない。
ただし、来年も同じように調査をして、やっぱり一人見つかったら、
その罹患率では考えにくくなる。(2つの調査が独立として1.55%)

もっとも、この場合、今まで同様の調査をしたことがなく、
真の罹患率はもっと違う値なのかもしれないので、
正直これだけではよくわからない。

それから、この「病気」(つーか、甲状腺がん)の特性で、
結論も変わってくる。
自覚症状がないので、このような調査をしなければ、
発見しにく。そこの部分のバイアスもある。
チェルノブイリでは甲状腺がんは被曝4年後ぐらいから増える
という結果だったので、それがどこまで正しいかも含めて
検証が必要。とにかく、継続調査が必要。

612:132人目の素数さん
12/09/17 16:17:37.09
相関係数が高くてもテールが広かったら意味が薄いって
どういうことですか?
標準偏差が大きいってこと?

613:132人目の素数さん
12/09/18 14:19:37.13
URLリンク(detail.chiebukuro.yahoo.co.jp)

この問題統計学ではどう解きますか??
なにか有効な方法思いつきますか?

614:132人目の素数さん
12/09/18 14:34:49.78
思いつくもなにも、なにを最適とするのかすら決まっていないものにどう答えろと。

615:132人目の素数さん
12/09/18 15:42:30.58
>>613
1日の各コース数は把握できてるんだから、
「各果物の一日あたりの総出数」を目的変数にして、
独立変数を以下の3つにして重回帰してみる
独立変数1:1日あたりの30品目コース注文数
独立変数2:1日あたりの50品目コース注文数
独立変数3:1日あたりの70品目コース注文数

基本的に、これで、
各コース注文数あたりの総出量が大体わかる。

あとは、経験的に、季節変動や曜日変動がありそうなので、
それをモデルに組み込むかどうか。
その部分は、「ここ一ヶ月平均」、つまり移動平均で
その都度計算することで組み込んでいるみたいだけど、
改善するとしたら、指数移動平均とか、
最近のデータに重みを付けて計算するとかかな

本当はコース注文数別に果物の総出量を知りたいっていうのは、
曜日ごとにコース別注文数予想がバラけてるっていう
現状があるんじゃないかと思われるよ

616:615
12/09/18 15:44:54.81
>>615
うわー、自分で書いといてなんだけど
多重共線性ェ……


617:132人目の素数さん
12/09/18 17:33:56.10
>614
多分無駄な仕入を減らし、かつ足りないってことのないようにってことでしょ。
一日の出数に近ければ近いほどいいけどその出し方はってことでしょ

618:132人目の素数さん
12/09/18 19:37:44.27
>>617
> 多分無駄な仕入を減らし、かつ足りないってことのないように

それはつまり果物ごとの出量を正確に予測したいということだわな。

正確なデータがあっても難しいものを
それなしでなんて夢のような望みだな。

619:132人目の素数さん
12/09/18 22:53:59.79
このコピペが地下板に貼られたのだが、妥当性が全く分からないのです。

一人の人間が大量投票できるAKB総選挙のシステム上、ベンフォードの法則を外れるのは当然とみるべきか?

それとも選挙後に、人為的な操作が加えられていると解釈すべきなのでしょうか?

もしよければご教示ください。

■2011年AKB総選挙は不正の疑いが濃厚
 得票数値に5の出現率が異常に高い
URLリンク(blogs.yahoo.co.jp)

AKB48 総選挙の得票数はベンフォードの法則に従うか検証してみた
URLリンク(hosohashi.blog59.fc2.com)

ベンフォードの法則はサンプル数25以上で成り立つ。
AKB総選挙のサンプル数40件。
URLリンク(isrm.co.jp)

620:132人目の素数さん
12/09/18 23:04:26.09
一番望ましいのは、各商品が各コースでどれくらい出ているかわかればよいのですが、

この考え方自体に必然性が無いな
各コースの客の比率は常に一定なんだから、どのコースで消費されようが
仕入れには一切関係ない
逆に仕入れの最適化問題として素直に考えれば多少はましな
手法が簡単に思いつくだろう

621:132人目の素数さん
12/09/18 23:14:57.62
>>619
得票数がべき乗側に従っているかから検証すべき
ていうか、2番目のリンクを読めばデータ数が少な過ぎて
妥当性は分からないってちゃんと書いてあるぞ

622:132人目の素数さん
12/09/18 23:24:47.55
>>619
データが25以上とはどこに根拠があるのだ?
適合度検定を行うなら各区分の期待値が5以上でないと近似が悪くなるというのが
定説だが、9の出現数でこれを満たすにはデータが約100必要となる。
それに目をつぶって検定しても2つ目のwebページで棄却されないことが
報告されている。1つ目のWebページは検定が理解できなかったのか
意図的なのかは分からないが、それを除いて述べている。
ベンフォードの法則が外れた証拠があるとは言えないだろう。


623:132人目の素数さん
12/09/18 23:37:24.76
>>621
すいません、書いてある内容がほとんど理解できませんでした。

べき乗則から分かっていませんが、計算方法の正統性は不明と理解をしておきます。

624:132人目の素数さん
12/09/19 00:01:26.98
>>622
総選挙の不正を暴く意図があるコピペなので、
三枚目のページ以下の文言を都合よく解釈したのだと思います

文)わずか25件のデータですが、ほぼこの法則に従っているといってもよいでしょう。

622さんの御意見だと、サンプル数が100はいると。

621さんと622さんの御意見を総合すると、
ベンフォードが外れたとは言えないが、検証方法とサンプル数不足のため、ベンフォードのとおり、総選挙の不正可能性が高いとも言えない
と言ったところですかね。

625:625
12/09/22 20:49:47.57
√625 = 25 = 5^2

6*2-5 = 2+5 = 5+2



626:132人目の素数さん
12/09/24 13:27:34.90
問題
5枚の札をもつポーカーの手に、10以上の札が少なくとも3枚あるとして
7以下の札が全く無い確率を求めよ■

解答
Aを10以上の札がすく無くとも3枚ある事象、Bを7以下の札が全く無い事象とする。
P(A)=Σ[i=3, 4 ,5 ] [16_C_i × 36_C_(i-5)] / 52_C_5
P(A AND B)=Σ[i=3, 4 ,5 ] [16_C_i × 8_C_(i-5) ]/ 52_C_5
P(B|A)=P(A AND B)/P(A)=103/1258■

になったんですけど答えを見ると161/1456になってました。
どこが間違っているのか分かりません。
おしえてください。

627:132人目の素数さん
12/09/24 14:39:22.71
>>626
検算したけど、同じ結果だった
なんらかのポーカーの役(フルハウスとかストレートとか)に
なってないといけないとかいう条件があるんじゃないの?

628:132人目の素数さん
12/09/24 14:48:13.45
>>626
でも、ノーペアも定義上「ポーカーの手」なんだな・・・
エースを10以上と扱って計算してもちがうしな・・・なんだろうな

629:132人目の素数さん
12/09/24 23:56:18.03
まさかジョーカー入りのデッキなんじゃ・・・

>>626のP(A&B)の8_C_(i-5)ってのはなんで?
7以下のカードって2~7の24枚じゃないの?
俺なんか勘違いしてる?

630:132人目の素数さん
12/09/25 01:20:36.03
スレチだな。確率の所にいけ。

631:132人目の素数さん
12/09/25 09:16:59.65
>>629
「7以下の札が全く無い」だから
組み合わせに含めるのは8と9が4種類の8枚

632:132人目の素数さん
12/09/25 09:27:11.69
>>627
有難うございます。
ソースは日本語訳の ホエール 数理統計入門っていうやつの問33です。
32のbの問題も答えが違っていました。
それ以前にも違う答えが一箇所ありました。

633:132人目の素数さん
12/09/25 09:42:18.42
絵札が少なくとも3枚だと答えになるそうです。

634:132人目の素数さん
12/09/25 15:09:45.75
>>633
その条件なら、答えが合ってた。
「絵札」の翻訳を「10以上」としたところの
ミスってことか。

635:132人目の素数さん
12/09/25 23:02:55.38
>>631
ああそりゃそうだ
ボケてたすまん

636:132人目の素数さん
12/09/27 14:26:47.37
TMT-A(トレイルメイキングテスト)で50人弱のタイムを2回測った
1回目にやったのと2回目にやったののタイムの差を出してその変化の率を出したいんだけど、
最初50秒だった人が30秒になったりするのと、20秒の人が15秒になるのとでは伸び代の面で全然違うと思うんだが
この変化率のようなものを出すにはどうしたらいいんでしょうか

637:132人目の素数さん
12/09/28 01:25:16.58
>>636
確かに最初の人は0.6倍縮めたといい、2番めの人は0.75倍縮めたというと
前者の方が優秀そうに見えますね。
記録には限度があると思うのでそれを基準にしてはどうでしょうか?
過去の最高記録が10秒だった場合、前者は50-10から30-10に縮めたので
0.5倍値詰めたことになり、後者は20-10から15-10でやはり0.5倍縮めたことに
なります。最高記録が14秒だった場合は後者がうんと頑張ったことになるでしょう。


638:132人目の素数さん
12/09/28 07:53:34.26
>>636
とりあえず、一回目の記録をX軸、二回目の記録をY軸にして散布図を描いて、
一回目の記録と二回目の記録の(平均的な)関係を把握するといいのでは。

639:132人目の素数さん
12/09/28 15:17:00.40
NTTデータがtwitterのつぶやきを機械処理するんだっつー話。
前にniftyも似たようなことやってたと思う。
ブログ時代はkizasiだったね。

640:132人目の素数さん
12/10/05 20:53:27.10
母比率レベルって意味わかる?

641:132人目の素数さん
12/10/05 21:37:58.10
ハイ、わかります。

642:132人目の素数さん
12/10/05 22:24:57.96
さすがだな
会社の資料に書いてあって見てるんだが誰もわからないんだ
母比率レベルが1/2以上と未満の違いはどうやって算出するか
あとあるところでの統計調査なんだけど対象人数、標本数、ほかに何の数字があればいいのか、もし良ければ教えていただけるとありがたいです


643:132人目の素数さん
12/10/06 16:23:26.37
統計学って、初歩の段階から既に直感的には理解できない学問らしいですね

644:132人目の素数さん
12/10/06 16:32:21.95
算数で躓いたような人でも大学に入ったら統計学を履修するからね

645:132人目の素数さん
12/10/06 17:22:24.17
「直感的に理解できない」ってのは
どういう意味なのかわからんな

統計的に宝くじ買うのは不合理
でも、実際には買う人が多い
ゆえに統計は直感に反する

とか、そういう感じなのか?

646:132人目の素数さん
12/10/06 17:42:15.86
確率分布の収束というものは大抵、弱い意味でしかも緩慢と収束するので直観を裏切りやすい

と考えることもできるが、>>644が言いたいことってこれ?

647:132人目の素数さん
12/10/06 17:43:32.22
ミスった

>>643が言いたいことってこれ?

648:132人目の素数さん
12/10/07 17:49:45.98
なんだ結局>>642はわかんねえのか


649:132人目の素数さん
12/10/11 01:51:22.54
回帰係数の検定の理論を理解している統計の先生は日本にいるのかな。

650:132人目の素数さん
12/10/11 13:49:09.29
回帰係数がt分布で検定できることの説明をお願いします

651:132人目の素数さん
12/10/11 19:38:17.34
そんなもんt分布を導いた理由だろ

652:132人目の素数さん
12/10/11 20:42:34.14
ガウスさんが、誤差が正規分布することを見つけて
最小二乗法に持ってって
ゴセットさんが、サンプル数少ないときに、
平均値の推定量って正規分布からどんだけずれた分布するの?
ってことで、後のt分布を発見して、
それをフィッシャーさんが「使えるぜぇ!」ってことで
t分布と名付けて応用しまくった。回帰分析にも使った。

もともとのスタートがガウスの誤差論であり、
回帰係数使ってt統計量が作れるのは、
ある意味、当然である……と、個人的には理解しているが
証明しろや!と言われると、他の方にお願いしたい。

653:132人目の素数さん
12/10/16 06:31:25.46
正規分布の歴史がかかれた一般向けの本で面白いものを教えてください。
「統計学という名の魔法の杖」っていうのが面白かったのですが。
よろしくお願いします。

654:132人目の素数さん
12/10/16 19:14:02.08

正規分布すること???

655:132人目の素数さん
12/10/17 10:07:53.64
>>653 正規分布限定ではなく統計学全般の歴史なら
Dサルツブルグ,統計学を拓いた異才たち,日本経済新聞社,2006
という割と分厚いのがお薦めぽい

正規分布限定という質問だと趣旨とずれてるかもしれないけどそしたらごめん


656:132人目の素数さん
12/10/17 20:08:31.58
>>655
ありがとうございます。さっそく注文してみました。

657:132人目の素数さん
12/10/17 23:55:27.56
統計理論の証明がある本は皆無だね。先生も証明を知らないで教えている人がほとんどだろうね。

658:あのこうちやんは始皇帝だった
12/10/18 00:34:41.23
          __ノ)-'´ ̄ ̄`ー- 、_
        , '´  _. -‐'''"二ニニ=-`ヽ、
      /   /:::::; -‐''"        `ーノ
     /   /:::::/           \
     /    /::::::/          | | |  |
     |   |:::::/ /     |  | | | |  |
      |   |::/ / / |  | ||  | | ,ハ .| ,ハ|
      |   |/ / / /| ,ハノ| /|ノレ,ニ|ル' 
     |   |  | / / レ',二、レ′ ,ィイ|゙/   
.     |   \ ∠イ  ,イイ|    ,`-' |      
     |     l^,人|  ` `-'     ゝ  |        何時もおんなじ事を書く
      |      ` -'\       ー'  人           馬鹿で無能のこうちゃんは
    |        /(l     __/  ヽ、            やっぱり只の糞キチガイ
     |       (:::::`‐-、__  |::::`、     ヒニニヽ、           ネコも大して変わらない   
    |      / `‐-、::::::::::`‐-、::::\   /,ニニ、\            反論出来ないこうちゃんは
   |      |::::::::::::::::::|` -、:::::::,ヘ ̄|'、  ヒニ二、 \             誰もが認めるクズでカス
.   |      /::::::::::::::::::|::::::::\/:::O`、::\   | '、   \
   |      /:::::::::::::::::::/:::::::::::::::::::::::::::::'、::::\ノ  ヽ、  |
  |      |:::::/:::::::::/:::::::::::::::::::::::::::::::::::'、',::::'、  /:\__/‐、
  |      |/:::::::::::/::::::::::::::::::::::::::::::::::O::| '、::| く::::::::::::: ̄|
   |     /_..-'´ ̄`ー-、:::::::::::::::::::::::::::::::::::|/:/`‐'::\;;;;;;;_|
   |    |/::::::::::::::::::::::\:::::::::::::::::::::::::::::|::/::::|::::/:::::::::::/
    |   /:::::::::::::::::::::::::::::::::|:::::::::::::::::::::O::|::|::::::|:::::::::::::::/

659:132人目の素数さん
12/10/18 00:42:46.80

こいつが数学版で一番邪魔なやつ
だよね

660:あのこうちやんは始皇帝だった
12/10/18 01:24:16.47
          __ノ)-'´ ̄ ̄`ー- 、_
        , '´  _. -‐'''"二ニニ=-`ヽ、
      /   /:::::; -‐''"        `ーノ
     /   /:::::/           \
     /    /::::::/          | | |  |
     |   |:::::/ /     |  | | | |  |
      |   |::/ / / |  | ||  | | ,ハ .| ,ハ|
      |   |/ / / /| ,ハノ| /|ノレ,ニ|ル' 
     |   |  | / / レ',二、レ′ ,ィイ|゙/   
.     |   \ ∠イ  ,イイ|    ,`-' |      
     |     l^,人|  ` `-'     ゝ  |        何時もおんなじ事を書く
      |      ` -'\       ー'  人           馬鹿で無能のこうちゃんは
    |        /(l     __/  ヽ、            やっぱり只の糞キチガイ
     |       (:::::`‐-、__  |::::`、     ヒニニヽ、           ネコも大して変わらない   
    |      / `‐-、::::::::::`‐-、::::\   /,ニニ、\            反論出来ないこうちゃんは
   |      |::::::::::::::::::|` -、:::::::,ヘ ̄|'、  ヒニ二、 \             誰もが認めるクズでカス
.   |      /::::::::::::::::::|::::::::\/:::O`、::\   | '、   \
   |      /:::::::::::::::::::/:::::::::::::::::::::::::::::'、::::\ノ  ヽ、  |
  |      |:::::/:::::::::/:::::::::::::::::::::::::::::::::::'、',::::'、  /:\__/‐、
  |      |/:::::::::::/::::::::::::::::::::::::::::::::::O::| '、::| く::::::::::::: ̄|
   |     /_..-'´ ̄`ー-、:::::::::::::::::::::::::::::::::::|/:/`‐'::\;;;;;;;_|
   |    |/::::::::::::::::::::::\:::::::::::::::::::::::::::::|::/::::|::::/:::::::::::/
    |   /:::::::::::::::::::::::::::::::::|:::::::::::::::::::::O::|::|::::::|:::::::::::::::/

661:132人目の素数さん
12/10/18 02:46:03.39
       __ノ)-'´ ̄ ̄`ー- 、_
        , '´  _. -‐'''"二ニニ=-`ヽ、
      /   /:::::; -‐''"        `ーノ
     /   /:::::/           \
     /    /::::::/          | | |  |
     |   |:::::/ /     |  | | | |  |
      |   |::/ / / |  | ||  | | ,ハ .| ,ハ|
      |   |/ / / /| ,ハノ| /|ノレ,ニ|ル' 
     |   |  | / / レ',二、レ′ ,ィイ|゙/   
.     |   \ ∠イ  ,イイ|    ,`-' |      
     |     l^,人|  ` `-'     ゝ  |       糞忌々しい数オタなんかに興味ないわ
      |      ` -'\       ー'  人           私そこまで暇人じゃないわよ
    |        /(l     __/  ヽ、            数オタなんて所詮変人よ、誰からも相手にされないわ
     |       (:::::`‐-、__  |::::`、     ヒニニヽ、           数オタと付き合うぐらいな死んだほうがましよ   
    |      / `‐-、::::::::::`‐-、::::\   /,ニニ、\            ド糞マスカキと数オタだけは絶対に相手にしちゃダメ
   |      |::::::::::::::::::|` -、:::::::,ヘ ̄|'、  ヒニ二、 \             死んだほうがよっぽどまだわ

662:132人目の素数さん
12/10/18 13:24:39.52
>>659
喜ぶから言っちゃダメ
無視が一番
無視設定で気にならないから

663:132人目の素数さん
12/10/19 23:52:17.15
>>657
そんなあなたは何者ですかね?

664:132人目の素数さん
12/10/20 02:06:55.06
誰でも自分と同じと思う人

665:132人目の素数さん
12/10/20 16:13:09.91
いつか統計理論の完全証明をつけた本を書こうと思っています

666:132人目の素数さん
12/10/20 16:23:58.15
666

667:あのこうちやんは始皇帝だった
12/10/20 20:06:03.94
          __ノ)-'´ ̄ ̄`ー- 、_
        , '´  _. -‐'''"二ニニ=-`ヽ、
      /   /:::::; -‐''"        `ーノ
     /   /:::::/           \
     /    /::::::/          | | |  |
     |   |:::::/ /     |  | | | |  |
      |   |::/ / / |  | ||  | | ,ハ .| ,ハ|
      |   |/ / / /| ,ハノ| /|ノレ,ニ|ル' 
     |   |  | / / レ',二、レ′ ,ィイ|゙/   
.     |   \ ∠イ  ,イイ|    ,`-' |      
     |     l^,人|  ` `-'     ゝ  |        何時もおんなじ事を書く
      |      ` -'\       ー'  人           馬鹿で無能のこうちゃんは
    |        /(l     __/  ヽ、            やっぱり只の糞キチガイ
     |       (:::::`‐-、__  |::::`、     ヒニニヽ、           ネコも大して変わらない   
    |      / `‐-、::::::::::`‐-、::::\   /,ニニ、\            反論出来ないこうちゃんは
   |      |::::::::::::::::::|` -、:::::::,ヘ ̄|'、  ヒニ二、 \             誰もが認めるクズでカス
.   |      /::::::::::::::::::|::::::::\/:::O`、::\   | '、   \
   |      /:::::::::::::::::::/:::::::::::::::::::::::::::::'、::::\ノ  ヽ、  |
  |      |:::::/:::::::::/:::::::::::::::::::::::::::::::::::'、',::::'、  /:\__/‐、
  |      |/:::::::::::/::::::::%

668:あのこうちやんは始皇帝だった
12/10/20 20:08:27.19
          __ノ)-'´ ̄ ̄`ー- 、_
        , '´  _. -‐'''"二ニニ=-`ヽ、
      /   /:::::; -‐''"        `ーノ
     /   /:::::/           \
     /    /::::::/          | | |  |
     |   |:::::/ /     |  | | | |  |
      |   |::/ / / |  | ||  | | ,ハ .| ,ハ|
      |   |/ / / /| ,ハノ| /|ノレ,ニ|ル' 
     |   |  | / / レ',二、レ′ ,ィイ|゙/   
.     |   \ ∠イ  ,イイ|    ,`-' |      
     |     l^,人|  ` `-'     ゝ  |        何時もおんなじ事を書く
      |      ` -'\       ー'  人           馬鹿で無能のこうちゃんは
    |        /(l     __/  ヽ、            やっぱり只の糞キチガイ
     |       (:::::`‐-、__  |::::`、     ヒニニヽ、           ネコも大して変わらない   
    |      / `‐-、::::::::::`‐-、::::\   /,ニニ、\            反論出来ないこうちゃんは
   |      |::::::::::::::::::|` -、:::::::,ヘ ̄|'、  ヒニ二、 \             誰もが認めるクズでカス
.   |      /::::::::::::::::::|::::::::\/:::O`、::\   | '、   \
   |      /:::::::::::::::::::/:::::::::::::::::::::::::::::'、::::\ノ  ヽ、  |
  |      |:::::/:::::::::/:::::::::::::::::::::::::::::::::::'、',::::'、  /:\__/‐、
  |      |/:::::::::::/::::::::::::::::::::::::::::::::::O::| '、::| く::::::::::::: ̄|
   |     /_..-'´ ̄`ー-、:::::::::::::::::::::::::::::::::::|/:/`‐'::\;;;;;;;_|
   |    |/::::::::::::::::::::::\:::::::::::::::::::::::::::::|::/::::|::::/:::::::::::/
    |   /:::::::::::::::::::::::::::::::::|:::::::::::::::::::::O::|::|::::::|:::::::::::::::/

669:333人目の描 ◆ghclfYsc82
12/10/22 23:32:33.56


>アホしかいない
>つまり、増田哲也自身がアホ
>
>しかも増田哲也は性犯罪者であり
>アホの中でも最底辺の者にだけ許される ジ・アホの称号を持っている
>


670:132人目の素数さん
12/10/25 06:34:14.47
正規分布って何で自然界に多く存在するんでしょうか?
そういったものを詳しく書いてある本ってありますか?

671:132人目の素数さん
12/10/25 08:18:28.42
正規分布が統計分野に多く存在する理由なら
中心極限定理で説明できる

自然界に多く存在するかは知らない

672:132人目の素数さん
12/10/25 08:44:59.82
めんどくさいときは正規分布を仮定するのが常識

673:132人目の素数さん
12/10/25 08:51:23.58
>>670
すごいことを発見したね、イグ・ネバリンナ賞ものだぞ

674:132人目の素数さん
12/11/03 09:06:32.55
来週11/5に、統計数理研究所でスポーツ統計話題講演会が、あるようです。
統計数理研究所公開講演会「スポーツがもっと面白くなる統計数理」
日時:2012年11月5日(月) 午後1:30〜4:30 (開場午後1:00)
場所:統計数理研究所 大会議室(190-8562東京都立川市緑町10-3)
入場無料
講演1:
 伊藤聡(統計数理研究所 教授)
 マジックナンバーの数理−優勝、昇格まであと何勝?
講演2:
 後藤健生(サッカージャーナリスト)
 数字でサッカーを語ることは可能か
講演3:
 鳥越規央(東海大学理学部 准教授)
 統計学で野球は進化できるのか 「マネーボール」の光と影
URLリンク(www.ism.ac.jp)

675:132人目の素数さん
12/11/03 09:16:51.56
>>672
対象データ群分布が正規分布か否かを判定したい場合、正規確率紙PLOT簡便法は
さておき、検定法のAnderson-Darling検定/Shapiro-Wilk検定のどちらが有効なの?

676:132人目の素数さん
12/11/03 18:18:13.37
>>674
素人なんですが、たまたま月曜日開いてます。
数理統計の入り口に行く価値はありますか。

どうかご享受ください。

677:132人目の素数さん
12/11/03 22:53:08.83
>>676
価値があるかどうかを決めるのは
描き地を引き出せるかどうか本人にかかっている


678:132人目の素数さん
12/11/04 01:10:53.94
なんちゅうかすごい字化け

679:132人目の素数さん
12/11/04 12:49:12.95
解読できない!

680:132人目の素数さん
12/11/04 16:55:04.65
単に「き」が多いだけだろ。
描(き)地=価値

681:132人目の素数さん
12/11/04 21:51:57.93
真上に正しい字があるのに間違えてるとは分からんかった~!
盲点だったわ謝謝


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch