統計学Part15at MATH
統計学Part15 - 暇つぶし2ch1:132人目の素数さん
13/04/05 23:35:41.08
前スレ

統計学なんでもスレッド14
スレリンク(math板)

2:132人目の素数さん
13/04/06 15:57:12.57
おまんこ女学院

3:あぼーん
あぼーん
あぼーん

4:あぼーん
あぼーん
あぼーん

5:あぼーん
あぼーん
あぼーん

6:132人目の素数さん
13/04/11 14:10:30.81
誰か書き込んでー

7:132人目の素数さん
13/04/11 16:01:15.32
7匹でもハチ

8:132人目の素数さん
13/04/11 16:09:48.89
実データ集計にヒストグラムなんぞ使うのは間違ってる
確率は累積分布関数が基本なんだから累積ヒストグラムを使うべきだ
ビン幅に依存しない最大限に正確な分析が出来る

9:132人目の素数さん
13/04/12 14:46:43.79
こちらの方々って、『N=95を統計処理』って言われただけで意味分かりますか?
ライザップってジムのバナー広告で、

めざせ-15kg! ※2
※2 N=95を統計処理した結果(2013年2月LM研究財団調べ)

ってのがあるのですが、何を言っているのかが分かりません。
その財団のサイトを探しても見つかりません。

10:132人目の素数さん
13/04/12 15:31:00.18
効果があったと言ってる人が95人いるってことだろ

11:132人目の素数さん
13/04/12 15:57:52.72
100%が痩せています※
※N=95を統計処理した結果(2013年LM研究財団調べ) 統計的な確立の表現であり、特異な例外はありえます。

統計「的」、あくまでも確立であって確率ではないところがポイントw

12:132人目の素数さん
13/04/12 18:25:20.61
>>10
そうしますと、
・母体数:95人
・95人が落とした体重の平均値:15kg
ってことでしょうか?
そんな簡単な計算を財団に依頼したとか言ってるんですか?

13:132人目の素数さん
13/04/12 23:56:37.28
仕事でクラメールのVを使うことになったのですが、クラメールのVが0以上1以下という証明が掲載されている本はないでしょうか?
検索したり自分で考えたりしてみたのですがわかりませんでした。

14:あぼーん
あぼーん
あぼーん

15:132人目の素数さん
13/04/13 11:33:02.13
>>12
言うのは勝手

16:132人目の素数さん
13/04/18 11:34:20.17
ガチでわからなくて困ってるんだけど教えてください
30分に平均1台の車が通る高速道路で、ある車が通過してから、(その車を含めて)5台目の車が通るまでの時間をXとする。
Xの平均と分散を求めよ。
まず何の分布(ポアソン分布だとか幾何分布だとか)なのかもよくわからなくて詰んでる。

17:132人目の素数さん
13/04/18 16:53:59.73
車と車の時間間隔は指数分布でそれが4つの和の分布は4つ畳込みだ
ポアソン分布は一定時間に通る車の数

18:132人目の素数さん
13/04/19 14:21:41.47
>>17
ってことは
平均で一時間に二台車が通るということだから
四台とおるのにx時間かかるとして、その確率は
f(x)=Γ(4,2)=(8/3)x^3*e^(-2x) (0<x<∞)
よって
E(x)=∮[0:∞]x*f(x) dx
=(1/12)*Γ(5)=(1/12)*4!=2(時間)
また、
V(x)=E(x^2)-(E(x))^2
=∮[0:∞]x^2*f(x) dx-2^2=(1/24)Γ(6)-4=(1/24)*5!-4=5-4=1
ということでよろしいですか?
確率難しすぎワロタ

19:132人目の素数さん
13/04/19 21:16:24.01
なんで5台あたり通る分布が4つの畳み込み積分?
車が2台あたり1時間通る分布がλ=2で
2*exp(-2*t)なのは解るけど、そこからどう導くんでしょうか。

20:132人目の素数さん
13/04/19 21:56:57.16
TEST

21:132人目の素数さん
13/04/19 22:09:52.94
>>1
スレ趣旨テンプレを省略するなよ。1000番間近で前スレは、何故にdat落ちしたのだろ?

以下のお約束を守った上で統計学について何でもどうぞ。
1)学校の宿題の丸投げはやめましょう。
2)質問者は質問の前に相当程度調べるなり、考えるなりしましょう。
3)荒らしは基本的にスルーでお願いします。

22:132人目の素数さん
13/04/19 22:13:22.88
>>2
過去スレ
統計学なんでもスレッド14  
スレリンク(math板)
統計学なんでもスレッド13
スレリンク(math板)
統計学なんでもスレッド12
スレリンク(math板)
統計学なんでもスレッド11
スレリンク(math板)
統計学なんでもスレッド10
スレリンク(math板)
統計学なんでもスレッド9
スレリンク(math板)
統計学なんでもスレッド8
スレリンク(math板)
統計学なんでもスレッド7
スレリンク(math板)
統計学なんでもスレッド6
スレリンク(math板)
統計学なんでもスレッド5
スレリンク(math板)
統計学なんでもスレッド4
スレリンク(math板)
統計学なんでもスレッド3
スレリンク(math板)
統計学なんでもスレッド2
スレリンク(math板)
統計学なんでもスレッド
スレリンク(math板)

23:132人目の素数さん
13/04/19 22:16:10.11
>>3
関連スレ1 ソフトウェア
【R言語】統計解析フリーソフトR 第4章【GNU R】
スレリンク(math板)
統計ソフトSTATAの部屋 Ver.2
スレリンク(math板)
統計・解析ソフトについて
スレリンク(bsoft板)
【統計分析】機械学習・データマイニング【集合知】
スレリンク(tech板)

関連スレ2 試験
【会計士】★統計学part2★【選択科目】
スレリンク(exam板)
【通信】  統計士・データ解析士  【高杉】
スレリンク(lic板)
統計・プログラミング選択あつまれー
スレリンク(kouri板)
センター数学2Bで統計選択のやつ集まれ~ 2011
スレリンク(kouri板)

関連スレ3 その他
統計学は低脳のやる学問?
スレリンク(math板)
心理統計学スレ
スレリンク(psycho板)
偏った標本調査・世論調査・統計を吊し上げるスレ
スレリンク(sim板)
【泰野くん】(独)統計センター2【藤田】
スレリンク(koumu板)
【さよなら】(独)統計センター3【ラスプーチン】
スレリンク(koumu板)

24:132人目の素数さん
13/04/19 22:20:02.26
>>4
関連スレ4 kamome鯖霧散消失前スレ
【統計学】統計的仮説検定!!
スレリンク(math板)
◆統計学について語るスレ
スレリンク(sim板)
生物学での統計学スレ
スレリンク(life板)
統計ソフト統合スレッド-SPSS・SAS以外
スレリンク(psycho板)
SASスレ
スレリンク(psycho板)
SPSSスレ
スレリンク(psycho板)

25:132人目の素数さん
13/04/19 22:28:40.71
>>5
関連スレ5 数学板現役スレ
統計学の分かりやすい本教えろください
スレリンク(math板)
【R言語】統計解析フリーソフトR 第4章【GNU R】
スレリンク(math板)
統計ソフトSTATAの部屋 Ver.2
スレリンク(math板)

26:132人目の素数さん
13/04/19 23:08:43.23
>>6
関連スレ4補 kamome鯖霧散消失前スレ
統計学なんて数学じゃないだろ
スレリンク(math板)
「今後一番セクシーな仕事は統計学者になるはずだ」
スレリンク(math板)
統計学的手法の数々の競馬への転用の実証
スレリンク(sim板)
統計学
スレリンク(sociology板)
経済学で使う統計学スレッド
スレリンク(economics板)

27:132人目の素数さん
13/04/19 23:16:16.49
>>896
>統計学の本なんて実践的な本しか見たこと無いけど・・・・・・
おいおい、これらの統計学初学者向けの名著を目にしたことはないのかね?
初等統計学(第4版) P.G.ホーエル 培風館 A5判 1981/01 
URLリンク(www.washin.co.jp)
はじめての統計学 鳥居泰彦 日本経済新聞社 A5判 1994.11
URLリンク(www.nikkeibook.com)

28:132人目の素数さん
13/04/21 13:46:36.11
前スレ質問を、再録です。
二項分布を正規分布で近似してるから>>>>933は、P(1-P)/n式の答でしょうが、
これがなぜ誤差分になるのかが知りたいのです。
932 : 132人目の素数さん[sage] : 投稿日:2013/03/18 21:48:52
>>924
nを導く統計学公式の元式
     μ<Xbar+1.96*SQRT(P(1-P)/n)
の右辺第2項即ち誤差項の成り立ちが、理解できません。
比率Pとその補数の積を標本数で割ったP(1-P)/nの平方根が、どうして誤差分に
なるのですか?

29:132人目の素数さん
13/04/21 15:35:28.01
調べるのメンドイから調べないけどw
チェビシェフの不等式に何か代入して、崩したら信頼区間の形になった気がする。
あと最初は標準正規分布の信頼区間から考えた方がいいと思われ。
それができたあとに、二項分布に中心極限定理使えばあなたが示す式になるかと。

何言ってるのかわけわかめなら数理統計学の入門書読んだ方が早い気がするお。
あと自分の持ってる数理統計の知識とかも書いてくれた方がレスつきやすいんじゃないかな。

30:132人目の素数さん
13/04/21 20:51:47.52
勉強もせずに問題やってるんだろ

31:28
13/04/23 23:21:39.86
>>29

32:28
13/04/23 23:52:33.71
>>29
助言有難うございます。当方は、統計学未修工学部卒の統計学習7年生です。
標準正規分布-->二項分布の2段階に分けて考えるわけですね。
  正規分布変数Xの標準化式 u=(X-μ)/σ ・・・・32-1)
  は理解できます。
  95%信頼区間上限値u=1.96を32-1)式に代入して、正規分布時の>>28式右辺が、
  導出されるのも理解できます。
理解できていないのが、>>28式の以下の2点です。
  Q1.平方根に変わるのは、何故?
  Q2.P(1-P)/nに、何故置換できるの?

33:132人目の素数さん
13/04/24 15:54:02.00
正規分布の標準かはX~ Norm(μ,sigma^2)のとき(X-μ)/σ ~ Norm(0,1)であってるけど

中心極限定理は
X~何らかの分布(BinでもPoissonでもWeibullでも、、)
のときlim n-> ∞で (X_bar - μ)/(sigma/sqrt(n)) ~ Z(0,1)がなりたつというもの。
試しにX_i ~ Bin(1,p)を公式に代入してみて。期待値はp、分散はp*(1-p)なので簡単。

34:132人目の素数さん
13/04/24 15:59:00.49
Z(0,1)じゃなくてNorm(0,1)ね。

それとサンプルの平均と分散を求めてみてください。
X_i ~iid~ BIn(1,p)としたとき
E[X] = p
Var[X] = p(1-p)ですが
E[X_bar]とVar[X_bar]はどうなるでしょうか。
ヒント:X_bar = (X_1 + X_2+ ,,,,+X_n)/n

35:132人目の素数さん
13/04/26 21:50:25.31
来月5/13に故田口玄一一周忌記念統計学シンポが、筑波大であるようです。
田口玄一博士一周忌シンポジウム-統計科学から見たタグチメソッドの現在・過去・未来-
【日時】 2013年5月13日(月)9:30~17:10
【場所】 筑波大学東京キャンパス
【主催】 統計数理研究所サービス科学研究センター 他
【定員】 150名
URLリンク(noe.ism.ac.jp)

36:132人目の素数さん
13/05/02 07:18:22.40
文系なんだが大学文理移転してで統計学極められるかな?

37:132人目の素数さん
13/05/02 12:24:55.42
能力次第

38:132人目の素数さん
13/05/02 20:31:33.94
>>36
ていうか、文系でも計量系はどっぷり統計学に漬かっているし、
その分野に固有の統計的問題に取り組んでいる。
文系理系は関係ないから、本人のやる気と能力次第。

39:132人目の素数さん
13/05/03 09:42:25.95
>>37-38
ありがと
希望持てたはW

40:132人目の素数さん
13/05/05 06:40:40.59
ベイズ統計学のおすすめの洋書ありましたら教えてくださいm(__)m

41:あぼーん
あぼーん
あぼーん

42:132人目の素数さん
13/05/08 14:56:13.69
仮説検定には帰無仮説と対立仮説がありますが、一般的にどちらの仮説がより重要なのでしょうか?

43:あぼーん
あぼーん
あぼーん

44:132人目の素数さん
13/05/08 21:38:59.46
それ尋ねてる時点で、定義が解ってない。
教科書はいつ読むの?今日でしょ。

45:132人目の素数さん
13/05/09 19:48:24.85
>>42
10円玉には裏と表がありますが、どちらがより10円なのでしょう?
と尋ねられたときと同じくらいインパクトのある質問だなw

46:132人目の素数さん
13/05/09 20:24:39.46
裏に決まってるだろ

47:132人目の素数さん
13/05/09 22:21:36.31
統計の分散分析ででてくる、
「対比」は、英語でなんと言いますか?

48:132人目の素数さん
13/05/09 22:34:16.79
contarst

49:あぼーん
あぼーん
あぼーん

50:132人目の素数さん
13/05/11 10:46:33.42
最近やっと簡単な統計学の教科書を一冊終えました。(有名な東京大学出版の赤と灰色が基調の本です)
そしてもう一段上の教科書に手を出してみたのですが。。。
測度論?が難しくて理解できませんでした。そこで測度論のための教科書を当たってみたのですが
これも数学記号が難しい。どなたか数学に詳しい人がいたらどの分野の順序で測度論を勉強すれば良いか教えてもらえると幸いです。

集合論→測度論
で良いんでしょうか。

51:132人目の素数さん
13/05/11 11:03:19.97
微積分は知ってるのか?

52:132人目の素数さん
13/05/11 11:31:23.51
微積分、線形代数、ベクトル解析、偏微分常微分はしってますが計算ができるくらいで。
εデルタ論法や写像などの数学科ぽい事は解りません。群環体とか現代数学ぽいのも
勉強した経験はないです。適当にググった所によると

Real and Complex Analysis Rudin
『はじめての確率論 測度から確率へ』 佐藤 担
講座数学の考え方 (20) 確率論 船木直久
が良いみたいですね。

53:132人目の素数さん
13/05/11 21:57:38.78
測度論はεδ論法を使いまくるぞ

54:132人目の素数さん
13/05/12 01:06:29.12
マジですか。結局勉強す順番としては
集合論→解析学(?)→測度論
でいいのかな。

55:132人目の素数さん
13/05/12 01:20:49.31
解析学を全部やると測度論を含んでしまうから
わからん言葉が出てきたら辞書みたいに調べる程度で良いが
εδ論法は良く理解する事

56:132人目の素数さん
13/05/13 21:09:16.71
統計をまなび初めて日が浅いのです。よろしければ教えてください。
平均=70、標準偏差=10の正規分布に従った。このとき
・競争率が10倍だったときの、合格最低点

という問題で、回答には正規分布表よりα(z)=0.4より、z=1.29がわかるので~→合格最低点83点と書いてあるのですが
0.4という数字や1.29という数字が出てきた理由がわからないです。教えてください。

57:132人目の素数さん
13/05/13 23:00:03.97
上位1割を合格とするときの最低点を求めよ

58:132人目の素数さん
13/05/14 00:19:34.51
標準偏差でよくでるσについて質問ですがσ=68%、2σ=95%、3σ=99%をどう扱えばいいか分かりません。
例えば棒の長さのばらつきを調べたい場合、標準偏差を計算したらσが2.2とかになったらどういうことなんでしょうか。

59:132人目の素数さん
13/05/15 03:44:18.20
仮に棒の長さの平均が5だとすると
棒の長さが5-2.2~5+2.2
つまり棒の長さが2.8~7.2にあるような棒の割合はおおよそ68%であるということ
また長さが5-2.2*2~5+2.2*2
つまり長さが0.6~9.4にあるのうな棒の割合はおおよそ95%であるということ

60:132人目の素数さん
13/05/18 03:20:26.70
>>18
f(x)=Γ(4,2)なのは X~expo(1/2)のとき、X~Γ(1,2)で4X ~ Γ(4,2)だから
という理解であってる?

61:132人目の素数さん
13/05/21 20:00:07.01
このニュース記事なのだが、同一大学・同一学部のデータを比較しないと意味がないと思う。

東大よ、その入試で大丈夫か
URLリンク(sankei.jp.msn.com)

ニュース内容は、推薦入試で入学すると所得が下がるという主張だが・・・。

学生数を確保するために推薦入試を多用する大学があり、
そういった所に入学すると所得が低くなるという結論でも良さそう。

同一大学内のデータで、推薦と一般入試で差が出るかは気になる。

62:132人目の素数さん
13/05/21 20:08:05.32
統計的な手段で得た推論を発表する前に、

「原因と結果が入れ替わっているのではないか??」

と考える事が重要だと思う。

「ローマ法王になると長生きできる」とかと同じ。

63:132人目の素数さん
13/05/21 20:11:32.06
「分数のできない大学生」に対抗して、「統計のできない大学教授」のタイトルで誰か本を書いてくれ!!

64:132人目の素数さん
13/05/21 20:46:36.51
こっちにも同じニュースあり。
新聞社は、基本的に学者の出張は吟味せずに鵜呑みなのかね。


東大よ、その入試で大丈夫か? “骨抜き受験”に見る所得格差…
URLリンク(headlines.yahoo.co.jp)

65:132人目の素数さん
13/05/22 17:47:04.74
>>61

持論に都合の良いデータだけ出してそう

66:あぼーん
あぼーん
あぼーん

67:132人目の素数さん
13/05/28 00:40:51.59
>>61

>同一大学内のデータ

これを示さないのがダメだな。

68:132人目の素数さん
13/05/28 21:47:25.45
すいません

野球で四球、単打、二塁打、HRとあります(三塁打は無視します)
ここでそれぞれ単独での得点との相関係数を左から、0.3、0.3.0.55、0.63としたとき

①正の相関性が強い指標になるほど、得点が増えやすい・・・という表現は正しいか?
(規則正しく得点が増えやすい=増える確率が高いという解釈でも可)

②仮に一番左の四球の相関係数がゼロだったとします
この時、四球と得点との関連性が見られないので得点に貢献してるとは言い難い、で合ってますか?

69:132人目の素数さん
13/05/28 22:04:33.98
ホームランと得点の相関が低いような指標でいいのか?
野球で得点に貢献するということの意味を考え直すべき

70:132人目の素数さん
13/05/28 22:15:35.83
>>68
1は合ってると思う
2はサンプル数が十分あれば言えると思う

71:132人目の素数さん
13/05/28 22:18:36.11
四球の多い投手に対して待球作戦をとって勝った場合、四球は勝利得点に貢献するが
打たないので大量点にはならず他の試合で打ちまくってると統計ではチーム得点と逆相関になる
この場合、得点に貢献してないと言うか?

72:68
13/05/28 22:39:08.44
うわぁ、返事が早くて感動w

>>69
全部合わせてOPS(長打率+出塁率)にすると、相関係数0.940くらいにはなります
(15年間くらいのNPBデータで)

>>70
ありがとうございます

>>71
勝敗は無視して、あくまで得点との相関だけです
膨大な試合数での話なんで、展開とかは無視してもいいような?

73:68
13/05/28 22:45:54.99
もう一つ質問です

得点に関係した指標で、四死球、安打・長打・盗塁などさまざまなものがあります
それぞれ単体での相関係数(影響度)が出ますよね?

この場合、各指標の得点への貢献度を比較する時、まず相関係数の高いものと
指標ごとの個数の多少を尊重する・・・こういう考えで合ってますか?

いやね、とある掲示板で

「指標ごとの相関係数と貢献度なんか全く関係ない!
仮に四球と得点の相関がゼロでも平均得点÷平均四死球が大きければ貢献度は高い」
とおっしゃる方がいまして・・・

僕の考えは
「相関係数がゼロならそもそも影響力がないと見て、貢献度を判断する価値がない」
と思ってるんですが、どっちが合ってます?

74:132人目の素数さん
13/05/28 23:17:53.07
得点との相関係数が高い指標から順番に見ることで
得点への貢献度が良く説明できるかと言う質問ならノー

得点との相関係数は低いが得点への影響力が
高い指標は作れるかと言う質問ならイエス

あなたの議論している指標が上の例に当てはまるかと言う
質問ならどちらとも言えない

75:68
13/05/28 23:29:54.52
>>74
ありがとうございます

①>得点との相関係数が高い指標から順番に見ることで
得点への貢献度が良く説明できるかと言う質問ならノー

②>得点との相関係数は低いが得点への影響力が
高い指標は作れるかと言う質問ならイエス

よろしければ、①と②についてそれぞれ理由を教えていただけたら嬉しいです

76:132人目の素数さん
13/05/29 00:55:35.58
敢えて極端な例を挙げる
現実との折り合いは自分で考えて

打撃力に関係する指標と得点との相関が軒並み0.8くらいだったとする
一方、走力に関係する指標の相関は軒並み0.3くらいだったとする
打撃力に関係する指標をいくら組み合わせても相関は0.8から大して
伸びないだろうが、走力も考慮することで得点能力の説明可能性が
上がると期待できる

日時、試合場、打順等から一意な数字を作る
この数字と得点との相関は限りなく0に近いだろうが、
この数字を指定されれば各打席における得点を誤差0で説明できる

77:132人目の素数さん
13/05/29 02:51:55.94
勝率への貢献度を無駄な得点への貢献度に摺り替えてるみたいだな

78:あぼーん
あぼーん
あぼーん

79:132人目の素数さん
13/05/30 17:48:57.47
統計始めたばかりのバカからの質問です

「あるデータが◯◯分布に従う」という根拠は何ですか?

80:132人目の素数さん
13/05/30 21:04:53.15
とくにない

81:132人目の素数さん
13/05/30 23:52:26.33
分布グラフを見て比べるくらいだな

82:132人目の素数さん
13/06/14 18:25:35.31
プロ野球のボールの反発係数は、0.4134~0.4374に収まるように
定められているが製造する際の目標値は下限の0.4134であった。
このときの不良率の推定値は?

83:132人目の素数さん
13/06/16 14:55:18.67
標準偏差について質問です
σとはばらつき具合を数字で現すと聞いたんですが
何を基準にばらつきが大きいとか小さいを決めてるんですか?

84:132人目の素数さん
13/06/16 17:31:17.29
例えば条件を変更した結果の比較とかはF検定を使う

85:132人目の素数さん
13/06/16 18:07:38.69
平均±σの範囲に入るデータが68%ってどういう意味ですか?
例えば100個のデータがあるとして平均±σの範囲にデータが50%しか入ってなかったらばらついてる、とかそういう意味ですか?

86:132人目の素数さん
13/06/16 22:00:01.74
>>85
ばらつけばばらつくほどσは大きくなるんだが

87:132人目の素数さん
13/06/16 22:46:26.30
つまりばらつきが小さかろうが大きかろうが平均±σの範囲には必ず68%のデータがあるということですか?

88:132人目の素数さん
13/06/16 23:14:19.00
正規分布していればな

89:132人目の素数さん
13/06/16 23:31:36.05
ありがとうございます。
だとすれば何を基準にばらつきがあるとかないとか言えばいいんですか?
計算してσを出して何をもって、何と比較してこのσは大きいからばらつきがある、とか言えるんでしょうか

90:132人目の素数さん
13/06/16 23:50:11.23
100は大きいのか?小さいのか?
何を基準にそう判断するのか?

91:132人目の素数さん
13/06/17 00:19:27.38
>>89
ばらつきなんて相対的なもので、
比較するものがなければ、そもそも大きいとも小さいとも言えない。
だから「何を基準に」と言われても、
逆に「貴方の基準は何ですか?」と逆質問するしかない。

92:132人目の素数さん
13/06/17 08:03:01.68
>>82
1σ=0.4373-0.4134のとき約66%
2σ=0.4373-0.4134のとき約52%
3σ=0.4373-0.4134のとき約50%

93:132人目の素数さん
13/06/20 23:52:41.91
統計学は破綻している学問だと前に聞いたことがあるんだが
本当なの?

94:132人目の素数さん
13/06/21 00:32:10.58
何をもって破綻しているのか分からないけど
モデル選択をミスって理論と現実がかけ離れてしまうってのはよくあること

95:132人目の素数さん
13/06/21 01:10:05.92
デタラメ言って気を引こうとする奴はどこにでもいるな
常識で判断できる事だ

96:132人目の素数さん
13/06/21 01:33:10.09
ちょっと質問です。
2つの変数の値の分布がどんな感じになってるかを表す指標がほしいなと思って
wikipediaで相関係数のページ見てみたんだけど、ページ右上の画像を見ると分布が全然違うのに
相関係数が同じだったりして、あんまり良くないなと思いました。
分布における形やばらつきのような、分布の特徴を表す指標ってどういうのがいいんでしょう?
1つポンと数値がでなくても複数組み合わせでもいいんですが、何かありますか?

97:132人目の素数さん
13/06/21 02:17:22.30
2次元分布見れば

98:132人目の素数さん
13/06/21 02:28:26.82
>>95
どういうこと?

99:132人目の素数さん
13/06/21 09:03:10.50
>>96
1変数の関数がどんな感じになってるかを表す指標と同じでいいよ

100:132人目の素数さん
13/06/26 21:42:41.23
>>89
>だとすれば何を基準にばらつきがあるとかないとか・・・・・・・・・・・・
工業製品の場合、ばらつきが大きい・小さいの基準は、その品質規格だ。
規格上下限範囲より大きければばらつき大・小さければばらつき小だよ。

101:132人目の素数さん
13/06/29 11:28:51.92
ジョエル・ベストのこのイカサマ統計警鐘新刊は、一読に価しますか?
前著「統計はこうしてウソをつく」よりも、秀作ですか?
「あやしい統計フィールドガイド―ニュースのウソの見抜き方」 J・ベスト 白揚社 2011.12
URLリンク(www.hakuyo-sha.co.jp)

102:132人目の素数さん
13/07/01 NY:AN:NY.AN
すみません、初学者ですが、例えばt検定の解説でt分布の山形のグラフが描かれて、有意水準5%ならこっからここまでの面積を足すと5%だからここに入ったら棄却ですねと説明されますが、
5%の線を引いたとき、ちょうどその線上にt値がきたときは、どうするのでしょうか?
稀だし、そんなきわどい値になるなら実験とかやり直した方がいいとは思うのですが、棄却域を求める計算の際に、t>=●●としてもt>●●としても、
tの確率密度は連続関数だから意味は同じであるといった解説もあり、はて線上の扱いはどうなるんだろうと気になったものですm(_ _)m

103:132人目の素数さん
13/07/02 NY:AN:NY.AN
有意水準5%はどう決めたのか?

104:132人目の素数さん
13/07/03 NY:AN:NY.AN
スピアマンの順位相関を使って分析したのですが、事後分析として検定力を算出したいと思っています。
ピアソンrの場合と同様に計算してはいけない気がするのですが、どなたかご存知でしたら教えてください。

105:132人目の素数さん
13/07/03 NY:AN:NY.AN
>>104
ちょうとあなたと同じ質問をした人がいるよ。
URLリンク(www.stata.com)

で、参考になるかも知れない論文
URLリンク(biostat.georgiahealth.edu)

106:132人目の素数さん
13/07/03 NY:AN:NY.AN
しっぽ確率ってそんなに便利かな
しっぽ確率使わないでゴリ押し計算で十分な気がしてきた
それともしっぽ確率使わないとヤバイような計算があるのかな

107:132人目の素数さん
13/07/03 NY:AN:NY.AN
>>105 ありがとうございます。
ただ、これはSTATAというソフトを使った解答かと思うのですが・・・
いったん読んでみます。

108:132人目の素数さん
13/07/03 NY:AN:NY.AN
きょうコレあやたんキタ━━(゚∀゚)━━!!

109:132人目の素数さん
13/07/03 NY:AN:NY.AN
>>107
統計ソフトの種類とかが本質的な訳ではなく、
「事後に検出力の計算なんかしてんじゃねーよ、
だいたいSpearmanで分析する前にサンプルサイズはどうやって計算したんだ」
って質問者が怒られているのが問題の核心。

110:132人目の素数さん
13/07/04 NY:AN:NY.AN
>>109 
仰るとおりです。
ただ、もともとはピアソンrでやるつもりだったので。
パラメトリックの前提が確認できなかったためやむなくスピアマンにしたのです。
問題の核心よりも、できれば事後にスピアマンで検定力を出す方法を教えていただきたいです。

111:132人目の素数さん
13/07/08 NY:AN:NY.AN
以下のようなことをしたいのですが、何か手法がないか分かる方はいないでしょうか。

いくつかの変数からなる100レコードや1000レコードのローデータを
複数のグループに可能な限り均等に分けたいです。

例えば男性70人、女性30人のデータがあったとして、これを5グループに分けたい場合、
各グループとも男性14人、女性6人の20人×5グループ。

さらにある変数の値がAの人が50、Bの人が50ならば男性女性の均等配分をなるべく維持したまま
各グループとも男性14人、女性6人、A10人、B10人の20人×5グループ。

ただし、当然ながらクロスを取れば男女とABの偏りがあるはずなので、
この例のようにぴったりな配分にはなりません。

均等配分したい変数は5つの時もあれば7つの時もあり、
分けたいグループ数も3の時もあれば6の時もあります。

全ての変数を完全に均等になるようにグループ分けすることは不可能でも、
各グループの総人数はきれいに分けて、その内訳の変数の値は
可能な限り均等に近い最適化された分類にしたいです。


色々調べたら層別ランダム化とか最小化法動的割付とか、そんな言葉が出てきて
それが近い結果を出せるのかという気がしたんですが。
SPSSで可能でしょうか?

112:132人目の素数さん
13/07/08 NY:AN:NY.AN
>>111
層別化無作為抽出で正解。
Rなら出来るけどSPSSはしらん

113:132人目の素数さん
13/07/11 NY:AN:NY.AN
>>112
Rですか、使ったことがないです。
コマンドラインで動くからちょっとこれだけやりたい、というには難しそうですね。
とりあえずRスレに行ってみます。

114:132人目の素数さん
13/07/12 NY:AN:NY.AN
線形変換って何の為にあるの?

115:132人目の素数さん
13/07/13 NY:AN:NY.AN
例えば平均μ,分散σ^2の正規分布から平均0、分散1の標準正規分布に変換するのだって
線型変換だし他にもいろいろ使い道あるんじゃない?多変数になってくると特に
嘘だったらごめんね☆

116:132人目の素数さん
13/07/16 NY:AN:NY.AN
味噌汁の味見のように一事をもって万事を量るのが統計学の任務ですが、
世論調査などではちゃんとかき混ぜているのでしょうか?

117:132人目の素数さん
13/07/16 NY:AN:NY.AN
>>116
そんなものは調査デザインによる。
固有の調査名とその調査デザインが提示されない限り、
意味のない質問。

118:132人目の素数さん
13/07/17 NY:AN:NY.AN
測度論を使ってないから分りやすい統計学の本っていうけど
測度論を使った統計学の本なんてみたことないんだけど
本当にあるの?

119:132人目の素数さん
13/07/17 NY:AN:NY.AN
測度論そのものかは知らないけどLebesgue&amp;#8211;Stieltjes integrationとかなら普通にあるんじゃね?
ただ理論そのものは俺も見たことはないなあ(^q^)オワッ

120:132人目の素数さん
13/07/18 NY:AN:NY.AN
コルモゴロフ本は確率を測度で定義してたと思うが不満か?

121:132人目の素数さん
13/07/18 NY:AN:NY.AN
確率論と統計学は違うだろ。

122:132人目の素数さん
13/07/18 NY:AN:NY.AN
>>119
マジかよ。その本教えろよ。
ルベーグステルチェス積分ってリーマンステルチェス積分とは違って
ルベーグ積分のステルチェス測度を使った積分だぞ?

123:132人目の素数さん
13/07/18 NY:AN:NY.AN
7/4宵、NHK「クローズアップ現代」曰く、目下統計学ブームだとか。番組冒頭には、狩野裕
阪大教授の講義光景が出てきた。統計家に企業求人が引く手数多というのは本当なのか?
”統計学を使いこなす「データサイエンティスト」が、多くの企業から引く手あまたの状況・・・・・・・・・・”
クローズアップ現代 「数字のカラクリ・データの真実~統計学ブームのヒミツ~」
ゲスト:サイエンス作家…竹内薫,成蹊大学教授・統計学者…岩崎学  キャスタ:国谷裕子
URLリンク(www.nhk.or.jp)

124:132人目の素数さん
13/07/19 NY:AN:NY.AN
最近ビッグデータビッグデータって喧しいけど
データ分析で使う統計学に何か本質的な違いあるんですか?

125:132人目の素数さん
13/07/19 NY:AN:NY.AN
IT屋のビジネスだよ。
おまけでログのテキスト分析が付いていてそっちは原則統計だね。
ただ学術的に怪しい式が結構混じってる。

126:132人目の素数さん
13/07/19 NY:AN:NY.AN
>>125
ビッグデータビッグデータと喧伝し始めたのは、IT企業でなく
マーケティング業界でなかったか?
SNS上やInternet上に溢れるカテゴリデータを、商売にどう使おうかと。
学術的に怪しい式というのは、何を求める式のことなの?

127:132人目の素数さん
13/07/21 NY:AN:NY.AN
7/21NHK7時のニュースで臙脂色ワンピミニスカ江崎史恵アナが、国内宿泊旅行
統計棒グラフを指し示して、ここ10年で国民の国内宿泊旅行回数が年平均
1.5回から1.2回に漸減し続けており、その原因が斯く斯く然々と微笑みながら
説明していた。その棒グラフには、年代別折れ線グラフが重ね描きされた。
こういう統計って、誰がどのように採っておるのだろ?
Web検索すると、観光庁の「宿泊旅行統計調査」がhitしたんだが、調査対象が
旅館・ホテル事業者とあってニュースのとは違っていた。  

128:132人目の素数さん
13/07/21 NY:AN:NY.AN
旅行・観光消費動向調査

129:132人目の素数さん
13/07/23 NY:AN:NY.AN
朝倉書店の「ロジスティック回帰分析―SASを利用した統計解析の実際」を読むと、プロファイル(変数の組み合わせパターン別の発生件数とか)を作ってから係数を最尤推定するとあります。
一方Rのglm関数ではプロファイルは作らず観測値からIRLSで係数を推定するとありますが、この2つの方法での推定値って一致するんでしょうか?

130:132人目の素数さん
13/07/23 NY:AN:NY.AN
自分でやればわかるやろ

131:132人目の素数さん
13/07/23 NY:AN:NY.AN
2、 区間推定(分散):地域経済
我が国の都道府県別納税者1人当たりの課税対象所得額(万円/人)は正規母集団N(μ、σ2)を呈することが予想されている。いま任意の10都道府県についてこの値を調査したところ下記の数値を得た
 199.4, 177.9, 190.8, 241.9, 246.8, 213.9, 224.4, 226.1, 184.0, 200.5
1)このとき、全国平均μが未知であるとして母分散σ2を信頼係数95%で推定せよ
2)また、全国平均μが207.2万円であるとして母分散σ2を信頼係数95%で推定せよ

お前らの力を見せてみろ

132:132人目の素数さん
13/07/23 NY:AN:NY.AN
ふと思ったんだけど、中央値の逐次更新(オンライン処理)ってどうやるんだろう?
平均値とか分散ならちょっと計算したら漸化式にできるけど

133:132人目の素数さん
13/07/23 NY:AN:NY.AN
過去データ全部抱えていないと無理でね?

134:132人目の素数さん
13/07/23 NY:AN:NY.AN
収束する前提なら適当に分散推定しながら
中央付近のビンだけ更新しとけばできそうだな

135:132人目の素数さん
13/07/23 NY:AN:NY.AN
ある企業の発売以降の月次売上数(金額ではない)が、基本、対数近似を描くようだが、そんなこと、一般的に証明する方法はありますか?

136:あぼーん
あぼーん
あぼーん

137:132人目の素数さん
13/07/24 NY:AN:NY.AN
>>131
なんだこのカス問は
>>136
ヤりたいですぅ!!

138:132人目の素数さん
13/07/24 NY:AN:NY.AN
対数近似を描くってなんぞ

139:132人目の素数さん
13/07/24 NY:AN:NY.AN
1月から4月までの売上数があれば、一年先の売上数が、対数近似を使うことである程度予測で来る

140:132人目の素数さん
13/07/24 NY:AN:NY.AN
>>135
>>139を過去のデータ使って確かめたらええやん

141:132人目の素数さん
13/07/24 NY:AN:NY.AN
過去データはエクセルで調べた
だいたい(9割程度)が対数近似のグラプに準ずる(一部累乗近似、線形も)

これって『統計学的に対数近似のグラフを描く』と言ってもいいのだろうか?

142:132人目の素数さん
13/07/24 NY:AN:NY.AN
対数近似って対数とると線形になるってことかな

143:132人目の素数さん
13/07/24 NY:AN:NY.AN
y = a × ln(x) + b
かな

144:132人目の素数さん
13/07/27 NY:AN:NY.AN
誰かいますか?

145:132人目の素数さん
13/07/27 NY:AN:NY.AN
>>141
予測区間の決定係数がその位なら問題ないだろ

146:132人目の素数さん
13/07/28 NY:AN:NY.AN
>>145
ありがとう!

147:132人目の素数さん
13/07/29 NY:AN:NY.AN
2つの母平均の差の検定で分散未知ですがn>30以上ならば、σの代わりに普遍分散で代用してZ検定するのと、等分散でなかった場合に用いるウェルチの検定の式は同じでしょうか?

Z=XbarA-XbarB/√SA2/nA+SB2/nB  →SA2はAの不偏分散です

そうすると、大標本であった場合は、先に等分散の検定をしなくてもこの公式に当てはめて計算してもかまわないのでしょうか?

148:132人目の素数さん
13/07/31 NY:AN:NY.AN
χ二乗検定の際に各セルの値が小さいとき連続修正を行う
とありますが、セルの期待度数が小さいとモデルへの当てはまりが悪いためであり
この修正によってモデルへの当てまりがよくなると言うことでした。
なぜ当てはまりがよくなるんですか?
統計素人なんでもしかすると超絶基本を聞いているかもと恐れながらも質問してしまいます。
どなたかよろしくお願いします

149:132人目の素数さん
13/08/01 NY:AN:NY.AN
一般論としてサンプル数が小さいとばらつきが大きい
つまり、たまたま外れる確率が高くなるということ

さらにサンプル数が小さいと分解能が悪いから精度が下がり易い
期待度数が0.5回なら観測頻度が0回でも1回でも誤差50%

150:132人目の素数さん
13/08/22 NY:AN:NY.AN
些細な名称とかに拘らず独自の統計学をとれば良いと思うんだよね
習った知識ばかりじゃカチンコチン過ぎて統計学止まりだね
統計で思考停止したいなら良いけど

151:132人目の素数さん
13/08/23 NY:AN:NY.AN
>>149
>さらにサンプル数が小さいと分解能が悪いから精度が下がり易い・・・・・・・・・・・・
サンプル数ってサンプルサイズ?分解能が悪いって、使用計測器の
性能問題?何が言いたいの?いったい何番の質疑へのレスなの?

152:132人目の素数さん
13/08/24 NY:AN:NY.AN
8/24NHK朝7時のニュースで鮭肉色膝上丈ワンピスカ江崎史恵アナが、国民の
スポーツ習慣統計調査の年代別頻度結果を円グラフ・帯グラフを使って
紹介していた。国が、国民3000人に訊ねて1800余人から有効回答の結果とも。
この手のアンケート調査の抜取標本数は、どういう計算式で決めているのだろ?

153:132人目の素数さん
13/08/26 NY:AN:NY.AN
ある無限集団のサンプルとしてなら3000で十分だと思うが、その調査で3000は意味が無いな。

おそらくは、老若男女、収入や労働環境、地域性や病気の有無、季節性その他で、
スポーツ習慣は違ったものになってしまうだろうからな。

そしたものを全部一緒にして年代だけ分けてドヤ顔するのは偏向報道のチョンNHKらしいな。

154:カナリア
13/08/26 NY:AN:NY.AN
質問させてください!
正規分布していないデータ(単純反応時間など)と正規分布しているデータ(IQなど)の相関を出そうとした場合、ピアソン積率相関係数ではだめですよね???
でも結構それで論文でてたりするんですが、いかがなものですか?
厳密にいうとだめってレベルなのでしょうか?
教えてくださーい

155:132人目の素数さん
13/08/27 NY:AN:NY.AN
>>153
無限集団というのは、幾つ以上をいうのですか?スポーツ習慣統計
調査>>152の場合、母集団は10代以上の日本国民ですから1億人以上
ですが、1億人では有限集団ということですね?
なお調査機関は、NHKでなく国と江崎史恵アナは云っておりました。

156:132人目の素数さん
13/08/28 NY:AN:NY.AN
統計学って全てのサンプルを調べられて
パソコンで計算可能なら確率論でしかないですよね?

157:132人目の素数さん
13/08/28 NY:AN:NY.AN
>>156
それのどこに確率的な要素があるの?

158:132人目の素数さん
13/08/28 NY:AN:NY.AN
平均値、標準偏差ね。
つまりヒストグラム=確率分布となるわけだよね。

159:pH7.74
13/08/29 NY:AN:NY.AN
SPSSによるロジスティック回帰の出力について質問失礼します(SPSS&元データ非所持)
(例) 応答変数:発病するか否か、説明変数:体重(量的変数)、場所(質的変数)
       B   標準誤差  Wald  自由度 …
体重   .087    0.44   3.858    1
場所               14.294   2
場所(1) 1.435   .461    9.687   1

場所のWaldの欄にある統計量は一体何でどのように算出されたものなのか、教えていただけますと幸いです

160:132人目の素数さん
13/08/29 NY:AN:NY.AN
>>159
「Wald検定量 ロジスティック回帰」で検索してはいかがでしょうか。
算出方法など詳しい解説がすぐに見つかると思います。

161:132人目の素数さん
13/09/01 23:20:52.89
あんまり数学がわかっていない人間ですが、質問させてください。
ある、時系列データがあり、過去の変動が次の変動にどのような影響を与えるか推測する方法はどんなものが基本でしょうか?
よろしくお願いいたします。

162:132人目の素数さん
13/09/01 23:40:01.31
ノバルティスの問題も、つまるところ当該の医学者に統計学の素養がないことが発端だろ?
迷惑だから、統計学勉強しないで税金使って論文書くの本当にやめて欲しい。
学問として論文を書くのであれば、測度論とまでは言わないが、統計学の前提となる確率論、確率論の前提となる積分ぐらい勉強すべき。これ、語学とおなじくらい重要と思うのだが。

163:132人目の素数さん
13/09/01 23:40:16.75
自己回帰モデル

164:132人目の素数さん
13/09/02 01:12:02.14
>>161
自己相関

165:159
13/09/02 11:41:26.81
>>160
返信遅れまして申し訳ございません、少し説明不足でした

体重や場所(1)のWaldに関しては、傾きや切片の推定値がゼロと
異なっているかを推定するためのWald統計量ということで理解できるのですが、
場所のWald欄にある統計量が一体何なのかが解らず困っております
私自身は解析にRを用いているのですが、その場合カテゴリカル変数一つに対して一つの
Wald統計量が算出されるため、上記のような統計量と遭遇したことがなく、どなたか教えていただけますと助かります

166:159
13/09/02 15:10:19.98
>>159下から2行目訂正失礼します
カテゴリカル変数一つに対して一つの > カテゴリカル変数の各水準に対して各一つずつの

167:132人目の素数さん
13/09/03 15:24:35.67
>>165-166
自己解決しました
Wald統計量は自由度2以上でも普通に算出できるのですね、失礼しました

168:132人目の素数さん
13/09/06 18:54:39.01
ときお
まどりっど
イスタンプール

169:カナリア
13/09/08 17:23:02.99
グラフにエラーバー(SD)をつけました。
縦軸に正答率をとると、80~90程度の平均値ですので、エラーバーが100を超えます。
個人的には100でとめたいのですが、だめっていう意見もあります。
皆さんの意見をお聞かせください。

170:132人目の素数さん
13/09/22 16:02:21.69
DCC-GARCHについて勉強したいのですが、日本語で詳しく説明されている論文、テキストなど教えてください。

171:132人目の素数さん
13/09/22 16:32:33.61
日本語あてにしてたらアカンやろ

172:132人目の素数さん
13/09/23 00:46:34.67
すいません初学者なのですが、2つの水準の平均値差を検定する場合に、t検定を行った場合と、分散分析を行った場合では、意味合いは違うと理解してよろしいのでしょうか?(教科書では分散分析は3群以上比較する場合に使うと書いてありますがあえて2群でやった場合です)
t検定のtと、分散分析のFは、計算式も違いますし分布の形状も違いますが、いくつかのサンプルデータで統計ソフトをつかって計算したところ、t検定でも分散分析でも有意確率が同じ値になりました。これはたまたまでしょうか?

173:132人目の素数さん
13/09/23 10:25:13.75
現実的な最低点は、max(0,70-3.5*10)

174:132人目の素数さん
13/09/26 00:59:32.90
おまえら
シグマっていったら。

やっぱり
σ の方か?

175:132人目の素数さん
13/09/27 22:32:18.33
大文字小文字両方

176:132人目の素数さん
13/09/27 22:37:19.24
URLリンク(www.bun-eido.co.jp)

177:132人目の素数さん
13/09/28 00:26:45.06
統計学に必要な数学の知識ってなに?

微積分と線形代数学分かってればいいの?

178:132人目の素数さん
13/09/28 03:13:21.26
大学1年レベルの微積と線形代数わかってるとかなり便利
もちろんもっと高度な知識も必要な場合もあるけど目的次第かな

179:132人目の素数さん
13/09/28 03:36:38.64
>>178
ありがとう
こちとら文系で数2Bしかやってないもんだから
今から小島寛之の微積分と線形代数やろうかなぁと思いまして
本当はチャートとか高校生が使うようなもので勉強した方がいいのかな?

180:132人目の素数さん
13/09/28 03:48:33.82
>>179
高校数学はIIICまではある程度理解しておいたほうがいいのは確か
でもチャートとかは量が多すぎるからなぁ…
IIBやってたなら小島寛之の本にもついていけるかも

181:132人目の素数さん
13/09/28 10:15:04.78
>>177
そんなあなたにマセマ

182:132人目の素数さん
13/09/28 17:39:01.41
 
統計学って数学じゃないだろコレ

183:132人目の素数さん
13/09/28 18:54:23.30
「プログラミングのための確率統計」(オーム社)これ、近年まれにみる良書。
タイトルからのイメージとは全く異なり、プログラム技法は何も記されていない。
しかし、初学者に確率統計のかんどころを理解させようとする著者の工夫と執念を感じる。

184:132人目の素数さん
13/09/28 20:52:19.06
>>182
統計学は数学じゃなく算数だね 経験則

185:132人目の素数さん
13/09/29 05:19:32.19
吉田朋広の数理統計学ぐらいだと普通に数学と思うけどなぁ

186:132人目の素数さん
13/09/29 19:23:38.93
統計学は数学を使う

187:132人目の素数さん
13/09/29 20:14:45.15
応用算数でしょ普通の統計学は

188:132人目の素数さん
13/10/01 01:25:11.85
算数レベルで公式が出せるか

189:132人目の素数さん
13/10/01 01:57:19.89
算数レベルの統計しか知らないってことか

190:132人目の素数さん
13/10/01 04:21:56.72
標本数の少ない2項分布の母集団の差の検定ってどうやればいい?
標本数少ないから正規近似が出来ないのだけど。

191:132人目の素数さん
13/10/01 07:55:34.87
>>190
マクネマー検定でいいんじゃない。

192:132人目の素数さん
13/10/02 00:24:59.73
 
古典統計学⊂ベイズ統計学 だよね?

193:132人目の素数さん
13/10/02 13:16:11.78
東京大学教養学部統計学教室編『基礎統計学』(全3巻)はどうですか?

194:132人目の素数さん
13/10/02 23:23:36.53
>>193
全部買って読んだけど、独学するには解説が足りない気がするが、ネットで調べながらならOKだと思う
個人的には第2巻いらんかった。

195:132人目の素数さん
13/10/03 10:43:02.09
全三巻じゃないし・・・・
バラバラに買うやつだろ。

196:132人目の素数さん
13/10/11 13:15:08.34
ポアソン分布とかガンマ分布とか出てくるけど、あれも算数?

197:132人目の素数さん
13/10/11 15:32:38.62
学校の課題で会計士への連絡内容書くやつあるんだけどどうな風に書けばいいの?
ぐぐっても分からないので教えてください

例題
会計士にアイスの平均販売個数の値を連絡する

198:132人目の素数さん
13/10/11 17:01:30.33
>>197
10月11日 今日は暑かったのでアイス100個売れました。

199:132人目の素数さん
13/10/12 19:52:25.56
スレリンク(part板:574番)

偏差値の部分、勢いで書いちまったんだけど、間違ってないよな?

200:132人目の素数さん
13/10/12 20:45:28.23
偏差値50=平均値ってこと?あってるよ

201:132人目の素数さん
13/10/12 21:39:14.58
だよな?
偏差値50は平均だから、偏差値50レベルの大学には半分が受かるってことでいいんだよな?

202:132人目の素数さん
13/10/12 22:07:16.12
分布に偏りがある場合は偏差値50でも半分受からないことはあるぞ

203:132人目の素数さん
13/10/12 22:17:47.12
平均と中央値は違うからね

204:132人目の素数さん
13/10/12 22:19:59.01
>>199
そのスレの581の方が正しいな
対称正規分布とかいう言い方は意味わからんけど

205:132人目の素数さん
13/10/12 22:43:27.86
対称でさえあれば正規分布である必要はないけどな

206:132人目の素数さん
13/10/13 16:00:01.08
偏差値は母集団が正規分布に近いときに有効だからかな
変な分布なら偏差値を使う意味が薄れる

207:132人目の素数さん
13/10/13 18:16:36.27
最近の学力の分布は二極化が激しいからなあ
偏差値50で等分できるかは怪しいぞ

208:132人目の素数さん
13/10/13 18:27:16.35
???

209:132人目の素数さん
13/10/16 09:23:56.28
URLリンク(ebsa.ism.ac.jp)
統計学の絶版の本が無料で沢山読める
ホームページ見つけたよ。
お礼はいいからね。

210:132人目の素数さん
13/10/16 09:34:53.46
danke

211:132人目の素数さん
13/10/16 12:52:45.86
なにこれめっちゃいいじゃん

212:132人目の素数さん
13/10/18 00:04:58.09
「古典統計学⊂ベイズ統計学」ということでいいの?

213:132人目の素数さん
13/10/18 02:20:44.56
いいわけないだろ、あほか

214:132人目の素数さん
13/10/18 23:18:06.31
それじゃイコールってこと?

215:132人目の素数さん
13/10/18 23:26:31.82
ナイーブな質問なのか、はたまた・・・

216:132人目の素数さん
13/10/18 23:32:32.52
統計学初心者です。両者の本質的な関係が知りたいです。

217:132人目の素数さん
13/10/18 23:38:38.30
古典統計学、ベイズ統計学も勉強したことがない初心者が本質を知りたいとな

218:132人目の素数さん
13/10/19 00:55:07.95
初心者でも本質は知りたいだろ

219:132人目の素数さん
13/10/19 00:56:03.04
いや、多少はかじっていますよ 統計物理とかも

220:132人目の素数さん
13/10/19 06:17:54.31
統計力学てなんですかてとうしろうに聞かれたら答えられる?

221:132人目の素数さん
13/10/19 06:36:59.48
>>218
おまえが答えろよ

222:132人目の素数さん
13/10/19 08:57:18.17
ソーバーの「科学と証拠」とか読めばいいんじゃね

223:132人目の素数さん
13/10/19 10:09:59.34
いい本紹介してもらった ありがとう

224:132人目の素数さん
13/10/19 21:58:29.62
>>221
あほ?

225:132人目の素数さん
13/10/20 07:06:19.89
>>224
おはよう、アホ

226:132人目の素数さん
13/10/20 11:15:00.69
>>224>>225
邪魔だ

227:132人目の素数さん
13/10/22 09:47:13.46
教えてください。

ある仮説H0を検定する統計量としてT1とT2があり、T1は通常のカイ2乗分布、
T2はカイ2乗変数の加重和で表される非標準的な分布に従っているとします。
このとき、T1とT2の検出力を理論的に比較することは可能でしょうか?
シミュレーションだと簡単なのですが。。。

228:132人目の素数さん
13/10/23 19:09:29.26
宅建試験の統計データなんだけど、
こういう過去のデータとの相関関係とか信頼性?推定?とかって統計学でちゃんと出るのかな?
数学にぜんぜん疎いんだけど、よかったら教えてください

平成19年:LECサンプル数1499名、平均34.4点。合格点35点。
平成20年:LECサンプル数2023名、平均33.2点。合格点33点。
平成21年:LECサンプル数1719名、平均33.8点。合格点33点。
平成22年:LECサンプル数2038名、平均36.3点。合格点36点。
平成23年:LECサンプル数2162名、平均35.7点。合格点36点。
平成24年:LECサンプル数2362名、平均33.2点。合格点33点。

平成20年:U-CAN平均29.8点 合格点33点
平成21年:U-CAN平均30.4点 合格点33点
平成22年:U-CAN平均32.1点 合格点36点
平成23年:U-CAN平均33.05点 合格点36点
平成24年:U-CAN平均29.77点 合格点33点

229:228
13/10/23 19:10:23.31
えっと、つまり、こういう予備校のサンプル数から、
今年の合格点の推定をどの程度の信頼度で出せるのかってことですが

230:132人目の素数さん
13/10/23 23:27:46.50
このデータ数だとサンプル数で重みつけて回帰するくらいかな
予備校の中の人なら分散も分かるだろうからもう少しましだろうけど

231:132人目の素数さん
13/10/24 22:52:52.13
マンガでわかる統計学、結構面白かったでござる
オオカミと羊の方じゃなくて、女子高生の奴ね。

232:132人目の素数さん
13/10/25 10:18:43.92
新世社の「入門統計解析」って本があったからやってみるわ。

233:132人目の素数さん
13/10/28 07:47:46.58
 
結局「古典統計学⊂ベイズ統計学」ということでいいんだよね?

234:132人目の素数さん
13/10/28 10:39:17.11
excelで散布図に2本の回帰直線を描く方法教えてくれ

235:132人目の素数さん
13/10/28 12:37:04.85
2本の回帰直線て何?
主軸の事か?

236:132人目の素数さん
13/10/28 19:46:13.53
統計学なのかも良く分からないのですが分かったら教えて下さい。
サッカーのパスが成功する確率の平均が3/4のチームと4/5のチームが
対戦したとするとボールのポゼッション割合は数学的にはどうなりますか?
料チームの他の体力とかの条件は同じで無視すると考えて下さい。

237:132人目の素数さん
13/10/28 22:56:06.28
パスの平均連続成功回数は1/(1-p)になるので
お互い10秒に一回パスするというような状況を考えれば
支配率は4:5に収束するような気がする

238:132人目の素数さん
13/10/28 23:09:09.42
P[n+1]=0.75P[n]+0.2Q[n]、Q[n+1]=0.25P[n]+0.8Q[n]
(P[n],Q[n])→(4/9,5/9) (n→∞)

239:132人目の素数さん
13/10/29 04:56:27.03
236です。
ありがとうございました。
意外に差が出ないんですね。自分としては差が拡がるものと推測してました。
これなら少し確率は落ちてもより効果的であろうパスを出す方が得点には
結び付き易いように思えますね。

240:132人目の素数さん
13/10/30 03:19:28.64
統計学を独学でやろうと思ってるんですが文系でまったく数学が出来ません
そこで中高の数学からやり直そうと思ってるんですがその場合どの単元をやり直す
必要がありますか?

241:132人目の素数さん
13/10/30 10:08:56.85
数と式・場合の数・確率・微積分
このへんかな

242:132人目の素数さん
13/10/30 13:50:35.04
詳しくありがとうございました。
また中学数学から再勉強します。

243:132人目の素数さん
13/10/30 23:32:04.36
12種類のビールについて、下表にある、
消費者の知覚による評価値を得た。
「高価格/低価格」は数値が正符号が大きいほど、
高価格であると知覚され、負で大きい値ほど、
低価格であると知覚された事を示している。
「のどごし/コク,キレ」では、正値がコクであることを意味し、
負値がキレを意味する。得点は-10点から10点の間で評価され、0点はどちらでもない事を意味する。
ここから、プロダクトマップを作成して、解釈せよ。

製品 高価格/低価格 のどごし(コク/キレ)
A -6.5 5
B 8 8.6
C 2.3 8.5
D 9 8
E -5.7 -6.1
F -3.1 -2.6
G -9 -9
H 8 -9
I -7.2 9
J 6.7 -9.1
K -8.2 1.2
L -8.6 0.5
何とかやっと表はできたんですが、誰かこれ、解釈してくれませんか??

高価格なビールにはコクがある。
だと短すぎますし。
URLリンク(imepic.jp)

244:132人目の素数さん
13/10/31 02:07:01.33
せんせえおながいしまつ。

ワイブルプロットによる寿命予測で、実測データから不信頼度 F(t) を求める際メジアンランク法 F(t)=(i-0.3)/(N+0.4) を使いますが、式の根拠が良くわかりません。
総数N個のサンプルでi番目の不良の発生確率と不信頼度の関係がベータ分布に従う事から、発生確率50%(中央値)とした際の不信頼度(=不良率)を求める近似式、というところまでは分かった?のですが、、、

実測データとして得られる統計量は、例えば「たまたま最初の不良が起きた時刻」であるのに対して、モデルは「発生確率50%、つまり時刻はばらつきの中央値」という前提で計算するのは問題無いんでしょうか?
何か勘違いしている?

245:132人目の素数さん
13/10/31 02:56:09.05
100本のクジがあり当りが1本あります。 1本引いては戻す形で100回引きます。
100回引いてるさいに当たりが出たら、再度100回引けます。 100回引いて当りが出なかったら終了

というときに、クジを引ける平均回数はどのように求めればよいのでしょうか。

板違いだったら、申し訳ないですが、どなたかご存知の方いましたらよろしくお願いします。

246:132人目の素数さん
13/10/31 08:02:09.05
仮説検定ってあるじゃないですか。
あれって凄く仮説が違っているとき以外、
仮説が違ってても仮設が正しいになりますよね。
どういう風に役立つんですか?

247:132人目の素数さん
13/10/31 16:12:04.31
 
で、「古典統計学⊂ベイズ統計学」ということでいいんだよね?

248:132人目の素数さん
13/10/31 18:49:48.11
>>243を誰か

249:132人目の素数さん
13/11/01 20:55:26.43
>>147
大標本・小標本と書いて、続けてその境界数を付記した教科書を見たことが
ないんだが、30が境界数なのですか?
それとも場合場合で、具体数が変動するから付記しないのですか?

250:132人目の素数さん
13/11/02 05:16:05.67
>>248
どうせ学校の課題かなんかだろうけど、とりあえず、オーム社の漫画でも買って読んでみたら?
プロット見ても、相関係数が0.07589016を見ても、
「高価格なビールにはコクがある」なんて言えないことくらい分かるだろ。
あと、データは解析しやすいように書いてくれないと、Rを回すにも面倒だから。

251:132人目の素数さん
13/11/02 17:16:46.76
検定統計量って簡単に求められますか?

無相関検定とか等平均仮説の検定(母分散既知・未知とかで5種類くらいある?)の統計量とか覚えられそうにありません...

ちなみに理系大学生で高校数学、大学教養レベルの数学は分かります

252:132人目の素数さん
13/11/02 17:21:47.37
種牡馬データはサンプルが少ない方が、傾向を掴む上では役に立つことが多い」と発言したことを
取り上げて叩いている人が少なからずいて、統計学を知らないのか、などという声もあるようだ。

そりゃ私は無知ですから統計学なんて知らないですよ。でも競馬予想に統計学まで持ちだす必要はない。
それこそ、サンプルが溜まれば同じような傾向に収束してしまって、面白いデータにはなりえないし、
そもそもみんなが気付いていることには金脈がない。 

私があんなことを言ったのは、サンプルが少なくて、ハッキリした傾向が出ているということは、
極めて短いスパンで「乗れる」ケースが多いからだ。例えばスニッツェルのそれだったり、
ローエングリンのそれだったり、アドマイヤドンのそれだったりするわけで、
少ないサンプルから近未来に振れていく方向を想定する面白みがあるのだ。
統計がどうとかいうのとは、全く違う見地から言っているので、そこを理解する気がないなら無視していただきたい。

253:132人目の素数さん
13/11/02 17:23:11.15
>>249
ggrks

254:132人目の素数さん
13/11/02 18:28:30.02
どうでもいいけど、ベイズ統計の話題にみんなダンマリなのはどうして?

255:132人目の素数さん
13/11/03 00:20:13.49
じゃあおまえが語れよ

256:132人目の素数さん
13/11/03 23:07:07.64
ベイズ統計への偏見持ってるヤシ多過ぎw

257:132人目の素数さん
13/11/03 23:33:40.25
金融工学についてのブログ記事を書いたところ、謎理論を唱える変な奴に粘着されました。
お手数ですが、もしよければこのブログのコメント欄で、どちらの言い分が統計学的に正しいかジャッジをお願いします。
URLリンク(s.ameblo.jp)

258:132人目の素数さん
13/11/10 11:05:08.12
初歩的な質問ですが…
同じ被験者の中で色々条件を変えたときにはどういう検定をすればいいんでしょうか

例えば、立ってるとき、座っているとき、寝ているとき、うつ伏せているときの声の大きさや声を出していられる時間の長さなどを30人くらいで測定して検定したいときです

259:132人目の素数さん
13/11/11 00:51:33.96
>>258
分散分析、対応あり、被験者内で検索

260:132人目の素数さん
13/11/11 01:13:25.09
>>259
ありがとう
むちゃくちゃ初歩的なとこでしたね…

261:132人目の素数さん
13/11/11 12:37:22.25
とても単純なことなのですが、
自分で考えてもどうしても分からないので
質問させていただきます。

質問票にいくつか質問があり、
答えが「はい」と「いいえ」の選択肢しかない場合、
質問の数から答えの組み合わせの数を導き出すには
どのような方法がありますか。

よろしくお願いします。

262:132人目の素数さん
13/11/11 12:58:31.75
2^質問数かな。

263:132人目の素数さん
13/11/11 13:12:02.31
>262さん

「^」の正体は分かりませんが、
Excelに計算式を入れたらそれっぽい答えが出ました。
それほどとてつもない答えの組み合わせ数にはならないようで
ホッとしています。

これで仕事を軌道に乗せて進められそうです。
ありがとうございました。

264:132人目の素数さん
13/11/11 13:20:09.11
と思ったら、
質問数7までは「2^7=49」でまだ現実味のある数字でしたが、
質問が8つに増えると一気に「2^8=256」で
実務としては無茶な数字になるんですね。

質問数は何としても7までに抑えたいと思います。

265:132人目の素数さん
13/11/11 13:55:57.71
^はべき乗です。2^3 = 2 x 2 x 2 = 8です。
質問数が1増えたら2倍ずつ増えていくということです。

266:132人目の素数さん
13/11/11 14:13:08.46
>>265 さん

ご親切な回答ありがとうございます。

それで気づいたのですが、
先ほどの「2^7=49」は間違いでしたね。
と言うのもExcelに入力するのに2と7が入れ替わっても
答えは変わらないだろうと思い、
「=7^2」と入力していたからです。
「=2^7」で入力し直したら答えは128になり、
これで進めると私は正気を失うところでした。

質問数は何とか6つに抑え、
2^6=64の回答数で企画を進めたいと思います。
危ないところでした。

267:132人目の素数さん
13/11/12 00:53:16.38
何か根本的な思い違いをしている気がしてならない。
回答の組み合わせ総数を何に使うんだろう?

268:132人目の素数さん
13/11/12 08:51:47.27
Yes・Noの質問を6つ作るのではなく、質問は一つで選択肢を64個設けるに決まってんだろ言わせんな



え?

269:132人目の素数さん
13/11/12 17:55:03.78
データベース上からある人と似たデータを持つ人を選び出す方法があって
・一人あたり10種類のデータ(長さや角度)がある
・データベースには、50人分のデータがある
この時以下の式で求めた値がデータベース上で一番小さな人を選び出されます.

10
Σ{(Di-di)^2/σi^2}
i=1

Di(i=1~10)はデータベースの人の値,di(i=1~10)が調べたい人の値です.

この時分散で割っているのはどういう意味なんでしょうか?
10種類のデータそれぞれの重みを合わせているってことですか?

270:132人目の素数さん
13/11/12 19:34:44.00
そうだと思いますよ。
偏差値求めるときって標準偏差で割るので
偏差値に統一してるんじゃないでしょうか。

271:132人目の素数さん
13/11/12 19:50:40.58
269です

>>270
ありがとうございます
ちなみに、この方法なのですが、二乗平均平方根でやることもできますでしょうか?
こちらだと、重みが変わってきたりしますか?

272:132人目の素数さん
13/11/12 20:25:58.35
>>271
>二乗平均平方根でやる
とは?詳しく

273:269
13/11/12 21:01:46.29
>>272
調べていてこちらでも良いのかなと思ったのですが、自信はありません。

上の条件を当てはめるとこんな感じでしょうか

______________
/ N
√ (1/N) Σ(Di-di)^2
i=1

N=10
これは一人辺りの10種類のデータということです。
データベースと調べたい人の差を相加平均して平方根をつけました。

274:132人目の素数さん
13/11/12 21:13:57.63
>>273
それは Σ(Di-di)^2 と同じ、Σ{(Di-di)^2/σi^2} とは違う

275:269
13/11/13 09:35:09.48
>>274
回答ありがとうございます

文献で見かけて気になっていたところですので、スッキリしました。
ありがとうございました。

276:132人目の素数さん
13/11/15 12:50:25.09
確率分布から平均や標準偏差を求める場合に
モーメントという用語を使う場合があります

確率分布関数がF(x)である場合

0次モーメントが m0 = ΣF(x)
1次モーメントが m1 = Σ(x*F(x))/ΣF(x)
2次モーメント以上のn次モーメントが
mn = Σ((x-m1)^2*F(x))/ΣF(x)

で、0次と1次と2次以上で定義が変わって気持ち悪いです
0次と1次を含めたn次モーメントは本来どうやって定義するのでしょうか?

277:132人目の素数さん
13/11/15 19:05:55.21
確率分布関数を用いた定義は知らないけど、
n次モーメントはE[X^n]で定義されているのでは
n次の中心化モーメントはE[(X-E[X})^n]で定義されている
平均値はE[X]で1次のモーメントに相当し、分散Var[X]は1次のモーメントと2次のモーメントを用いて
Var[X]=E[X^2]-(E[X])^2で定義されています。
見当違いのこと言ってたらごめんなさい

278:132人目の素数さん
13/11/16 03:12:16.20
その前に >>276 のn次モーメントは
mn = Σ((x-m1)^n*F(x))/ΣF(x)
の打ち間違いでした。

>>277
分散が
>Var[X]=E[X^2]-(E[X])^2で定義されています。
という定義でもあるというは見たことはあります。
上の書き方だと
 Var = Σ(x^2*F(x))/ΣF(x) - (Σ(x*F(x))/ΣF(x))^2
一方で、重心周りの2次モーメントは
 m2 = Σ((x-m1)^2*F(x))/ΣF(x)
MatlabクローンのOctaveで正規分布のその分散とm2を計算してみると

mu=50;
> sg=10;
> xx=[0:0.1:100];
> yy=exp(-1.*(xx-mu).^2./(2*sg^2));
> m0=sum(yy);
> m1=sum(xx.*yy)/m0
m1 = 50.0000
> var=sum(xx.^2.*yy)/m0-(m1)^2
var = 99.9985
> m2=sum((xx-m1).^2.*yy)/m0
m2 = 99.9985

同じになります。でもたまたま合っただけのようにしか思えません。
重心周りの0次と1次モーメントの定義が知りたいのです。

279:132人目の素数さん
13/11/16 19:13:00.90
>>278
そのF(x)は確率分布関数ではなく普通は確率関数と呼ぶ
原点回りのn次モーメントはE[X^n]
平均周りのn次モーメントはE[(X-E(X))^n]
分散の定義は平均周りの2次モーメントV(X)=E[(X-E(X))^2]
公式としてV(X)=E[X^2]-E[X]^2が成り立つ
0次モーメントは原点回りでも平均周りでも1になる

280:132人目の素数さん
13/11/17 04:24:18.03
確率の問題なんやが
URLリンク(www.logsoku.com)

281:132人目の素数さん
13/11/18 07:10:09.08
重回帰分析したいのですがcsvファイルが見当たりません
喫煙率と肺がん、年齢などのデータはどう入手すればよいでしょうか

282:132人目の素数さん
13/11/18 21:28:48.79
先生が、全部、墓へ持って行ってしまいました。
そっち方面は、最初からやり直してください。

283:132人目の素数さん
13/11/19 09:13:37.79
こないだの日曜日、統計検定3級受けた人いる? 過去問より難しくなかった?

284:132人目の素数さん
13/11/19 13:40:19.56
すみません。卒論で気温や降水量の分析をしているのですが、気温どうしの分散、なら比べられるのですが、気温と降水量の分散は比べるには大体どうすればいいのでしょうか

285:132人目の素数さん
13/11/19 13:55:50.12
相関とか

286:132人目の素数さん
13/11/19 16:38:09.43
統計学の授業で困っています
助けてください
学内で食生活のアンケートを取りました
その結果と全国データを比べるのですが、解析の方法がわかりません

アンケート項目は
1.食生活に関心があるか
[関心がある][どちらかといえば関心がある][どちらかといえば関心がない][関心がない]
2.料理をするか
[毎日する][週に2,3日する][週に1日する][全くしない]

全国データでは「食生活に関心があるほど料理をする」というものでした
これと同じことが私の学校でも同じと言えるのか、言えないのか調べるためには、どうすればいいですか?

287:132人目の素数さん
13/11/19 18:00:39.65
>>286
>全国データでは「食生活に関心があるほど料理をする」というもの
この結論を得た解析と同じことをやるしかないんでは。

288:132人目の素数さん
13/11/19 18:31:40.67
関心度、料理頻度を適当に数値して相関係数を求めるとか

289:132人目の素数さん
13/11/19 23:55:17.27
杏「どうしてわかったんだ?」
ほむら「統計よ」

290:132人目の素数さん
13/11/20 03:39:34.04
>>283を受けたことは無いけど、試しに1級の過去問を見てみたけど、先日の1級の試験は照明問題が減ってる印象ね。

291:132人目の素数さん
13/11/20 20:22:11.29
>>283
2級受けてきたけど、2級も過去問より難化してたと思う。
解答速報も出たから採点してみたけど、7割ぐらいだった。合格ラインは何割ぐらいなんだろうか。

292:132人目の素数さん
13/11/20 23:38:43.74
Twitter見ると1級難化してるとか言ってたな

293:132人目の素数さん
13/11/23 04:57:07.95
>>292
検定Twitterって、資格スレには紹介されていないが?
品質管理検定(QC検定)1~4級 part11
スレリンク(lic板)

294:132人目の素数さん
13/11/23 05:04:43.21
>>293
統計検定
URLリンク(twitter.com)
URLリンク(twitter.com)

295:132人目の素数さん
13/11/23 05:26:39.29
TV番組で、日本人の1日当たりの塩分摂取量全国平均が男性11.8g、
女性10.1g、全国1位を男女とも山梨県が獲得と紹介していた。
厚労省統計値らしいんだが、聴取されても答えられぬ塩分摂取量統計
なんて、どのように採取集計するの?
「なぜ多い? 山梨県の塩分摂取量」  2013.11.05
URLリンク(textview.jp)

296:132人目の素数さん
13/11/23 05:44:01.12
>>295
記述式で1日3食×1週間の食事アンケート

外食の各メニューやスーパーで買った食材(魚の切身)とかの塩分量は厚労省もデータを取得済だから、概算値は十分に計算できるかと。

297:132人目の素数さん
13/11/23 06:08:06.00
>>296
即答有難うございます。アンケート記述式として県民平均摂取量はどの
ように集計するの?ラーメンスープを飲まない・飲干すとか醤油ふり
かけ量等の個人差や老若世代差や温暖・寒冷県差をどう加減するの?
到底科学的統計値になりえないと想像されるのですが?

298:132人目の素数さん
13/11/23 08:32:17.88
厚労省なら健康診断でも見てるんじゃないの

299:132人目の素数さん
13/11/23 10:57:41.92
集計は国民栄養調査とかじゃないかね。
あれは全国を単位区として無作為抽出してるから、
その都道府県あたりの平均や個人属性とかは出せるかと。
塩分の計算自体がアンケートからの概算という限界は変わらないけど。

300:132人目の素数さん
13/11/23 12:05:49.61
>>299
この厚労省統計だね。概要で例示されている血圧値なら測定値の県別大小
比較も首肯されるが、アンケートからの概算>>299塩分摂取量に対して、”全国
平均男性は11.8g、女性は10.1g・・・・山梨県は・・・男性は1.5g 、女性は1.1gも
多い”>>295などと同列に数値比較論議に不見識ではないのか?
平成22年国民健康・栄養調査結果の概要  厚生労働省  2012年1月
URLリンク(www.mhlw.go.jp)

301:132人目の素数さん
13/11/24 00:00:47.21
>>295
リンクを見ずに答えるが、>>299の言うように国民栄養調査のデータだろう。
厳密に計測するときは、24時間畜尿をやって尿中塩分濃度から摂取塩分を推定する。
でもそんなの何万人もの大規模調査で実施したら途方ない予算が必要。
国民栄養調査の調査方法については、厚労省のWebサイトで解説されているから、
参照して下さい。

302:132人目の素数さん
13/11/24 00:10:47.81
>>300
まぁ、それが栄養学の限界。ずっと議論されてているらしい。
それから血圧だって、日中変動や再現性に大きな問題があって、
「本当の値」は何かという問題がある。
綺麗な看護師とおばちゃんでは値が変わってしまうからね。

303:132人目の素数さん
13/11/24 12:17:45.92
精度が荒くてもないよりはいいじゃないか。

304:132人目の素数さん
13/11/24 13:16:54.26
誤差は付き物

305:132人目の素数さん
13/11/25 17:00:54.36
エクセルでグレンジャーの因果テストってできるのかな・・・
出来るのなら、やり方を教えてください!

306:132人目の素数さん
13/11/27 16:30:37.68
統計学の勉強はじめたいんだけど、
Amazonのレビュー見たら「数式が少なくてわかりやすい!」とか甘ったれた理由で星つけてるのばっかで
どれが良書なのかよくわからん
おすすめの入門書教えてくれ

307:132人目の素数さん
13/11/27 16:40:39.09
Amazonのレビューは嘘だらけだよ。
小島寛之の本には完全に騙された。詐欺レベル。

308:132人目の素数さん
13/11/28 01:12:42.91
統計検定3級 平成25年11月 問3

AチームとBチームのサッカーの試合において、じゃんけんで勝った方を先攻とし、あいこの場合はAチームを先攻と決めた。このとき、3回の試合の先攻を決める場合にあいこが1度も起きず、Bチームが少なくとも一度は先攻になる確率を、次の(1)~(5)のうちから一つ選べ。

(1) 1-1/3
(2) 1-(1/3)~3
(3) 3*(1/3)~3
(4) 7*(1/3)~3
(5) 8*(1/3)~3

【解答】(4)

解説お願いします。

309:132人目の素数さん
13/11/28 01:44:02.62
8-1=7

310:132人目の素数さん
13/11/28 06:57:34.01
>>309
レスありがとうございます。
8はどういう意味合いで出てくるものでしょうか。
理解がとろくてすみません… m(__)m

311:132人目の素数さん
13/11/28 08:42:31.41
3+3+1=7

312:132人目の素数さん
13/11/28 09:56:58.88
>>308

Bが○ならAは×
Bが×ならAは○
Bが△ならAは△

1回目:3通り
2回目:3通り
3回目:3通り

全部で 3*3*3通り
-----------------------
Bが3回とも先攻 ○○○
Bが2回のみ先攻 ○○×  ○×○ ×○○
Bが1回のみ先攻 ○××  ×○× ××○

条件を満たすのが 7通り
------------------------------------

あってる?

313:132人目の素数さん
13/11/28 10:20:39.99
>>312 さん

おお!分かりやすく説明いただき、ありがとうございました!!
納得できました!! ^ ^

314:132人目の素数さん
13/11/28 13:15:20.87
サッカーはコイントスなのに。

315:132人目の素数さん
13/11/28 15:01:06.00
>>306
誰かこれを頼む…ペーパーバックとかでも頑張って読むから

316:132人目の素数さん
13/11/29 05:27:19.81
>>315
数理統計学の入門書レベルでなく、『初等統計学』なんて銘打たれた教科書なら、
独学のための取っ掛かりとしてはよろしいんじゃないかな?

経験則では初等~の類には、まず積率母関数は触れていないカンジ。
だから、定理や法則の解説や例示されている証明に微分や級数展開が使われずに展開されている印象。
初等レベルを勉強し終えてから、今度は数理統計を謳った教科書で、同じ単元でもより深く勉強するなんてのは?

317:132人目の素数さん
13/11/29 09:20:31.21
>>316
ありがとう
amazonとか見ながら1冊買ったんだけど、式の解説が薄くて式の意味の理解が浅いままだった
だから統計学の概略は分かったんだけど、いろいろ腑に落ちないところが多かった
数理統計学っていうのが数学的にしっかりとしてるのなら、次はそっちのジャンルの本を買ってみる

318:132人目の素数さん
13/11/29 09:34:39.71
高校数学でわかる統計学」

319:132人目の素数さん
13/12/01 16:48:27.41
>>318
お奨め?

320:132人目の素数さん
13/12/01 17:16:15.93
ヤフー知恵袋でなく、2ちゃんのこんな板を見付けて書き込みに来るくらいの人間には満足できない超初心者向けの一冊なんじゃない?
本の題名的にも。

321:132人目の素数さん
13/12/01 18:11:44.77
>>307
ほんんとに?

322:132人目の素数さん
13/12/03 02:46:12.21
ブルーバックスの高校数学でわかるシリーズは結構いいよ
名前で判断してはいかん
Amazonのレビューみてみればわかるが

323:132人目の素数さん
13/12/03 13:24:29.03
へえ、今読んでる本終わったら読んでみようかな
文庫本サイズは手出しやすいし

324:132人目の素数さん
13/12/03 16:29:38.74
>>322
表紙のデザインがとっつきにくいなぁ

325:132人目の素数さん
13/12/04 12:37:55.44
「相関係数を求める」ことと「無相関検定」の役割的な違い
ってどうなのでしょうか。
二つの変数の相関を調べるだけなら、相関係数だけでいいかと
思うのですが、、。

326:132人目の素数さん
13/12/05 15:59:28.02
少し質問させてください
異なる計算方法の二種類の為替レートがあって、
その差が有意であるかを調べたい場合は
どのようにすれば良いのでしょうか?

たとえば計算方法1では、ユーロ=120 ドル=100 ポンド=150 と計算され、
計算方法2では、ユーロ=115 ドル=105 ポンド=152
などと計算される場合に、
両計算方法からでる結果に有意差があるかを知りたいです。
各通貨の平均をとってt検定しても意味がないように感じますが、
(各通貨ごとに平均値が大きく異なるので)
どうにか計算方法の違いを有意検定できる方法はありませんでしょうか?

よろしくお願いします。

327:132人目の素数さん
13/12/05 16:18:27.07
>>326
計算式が異なれば有意な差がでて当たり前じゃないの?
ユーロ vs ドルをn=100で計算してみた。

> f1 <- function(x) x * 100/120
> f2 <- function(x) x * 105/115
> x <- sample(10:100000, 100)
> t.test(f1(x), f2(x), paired = TRUE)

Paired t-test

data: f1(x) and f2(x)
t = -17.1435, df = 99, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-4471.794 -3544.030
sample estimates:
mean of the differences
-4007.912

328:132人目の素数さん
13/12/05 17:40:20.87
ありがとうございました、t検定でいけるのでしょうか?
>>326は数字は全くの適当ですが、
為替レートを計算するための複雑だけど正確な式と、
簡単だけど大雑把な式がありまして、
簡単なほうで計算をしても問題無いかどうかを知りたいと思っています。
言い換えれば、統計的に有意差が無い、ほうが好ましい結果となります。
本来の検定の考えかたとは異なると思いますが、
どのようにアプローチしていけばよいかわからず
困っております。

329:132人目の素数さん
13/12/05 21:13:33.15
検定の問題集みたいなので勉強になる本無い?

330:132人目の素数さん
13/12/05 22:03:05.53
>>328
非劣性検定で検索

331:132人目の素数さん
13/12/06 08:17:18.34
>>330
ありがとうございました!まさにこれでした。
そして、帰無仮説が棄却されなかったからといって、
帰無仮説を採択できるわけではない、
という初歩的なところを誤ってました。
ありがとうございました

332:132人目の素数さん
13/12/06 13:44:45.69
正規分布する確率変数の和の分布
とかでさ、
積分したら1のものと積分したら1の物を足したら、積分したら2になるじゃん。
そしたら積分したら1でなきゃいけない確率変数ではなくなるじゃん。
つまりどういうこと?

333:132人目の素数さん
13/12/06 13:55:31.57
は??

334:132人目の素数さん
13/12/06 14:01:03.37
もうちょっとわかりやすく疑問を投げかけてくれ
具体例出すとか

335:332
13/12/06 18:31:43.95
よくわかってないので、変なこときいたのかもしれないのだが。

正規分布の再生性 あたりの疑問で、たとえば、
URLリンク(bio-info.biz)
このページの一番下の図のようなことを考えていて、
赤と緑の面積は1だから、それの合わせた緑の面積は2になるじゃん。
だから、確率変数の和の分布はどうして2じゃ無いんだ?とか考えたわけだ。
まあ、正規分布の再生性 というのが、図にある’重ね合わせ’のようになんでならないかが
さっぱり根本的にわかっていないから、そう考えたんだろうけど。

結局のところ、確率変数を足すと、なんで重ね合わせのようにならんのだ?

336:132人目の素数さん
13/12/06 19:10:04.60
正規分布は確率密度関数のグラフであって、確率変数のグラフじゃないから

URLリンク(upload.wikimedia.org)
確率変数を足すと、この確率密度関数f(x)の中のσとμが足しあわされるだけで、
確率密度関数そのものが足しあわされてるわけじゃない

337:132人目の素数さん
13/12/07 17:05:59.42
十年前に数学科を出たものですが、統計学勉強したくなりました。
何から勉強すればいいですか?
教えろください。

338:132人目の素数さん
13/12/07 17:29:48.44
数学科出たのなら,「数式がない..」とかのうたい文句があるのはヤメた方がいい。
バッチリした教科書、確率まで踏み込んであるのが読めるならそれがいい。
あなたが数学科で代数とか幾何とか選考して、解析や確率を敬遠していたのなら、
昔の高校教科書「確率と統計」とか見てみると多分すんなり入れると思う。
たとえばちくま文庫から出てるような。それから、専門的な教科書に入るのはワリ
と易しいと思うよ。

以上似たような経歴のモンから。
ゼミで確率論なんかやってたのなら全く無用の助言でした。

339:132人目の素数さん
13/12/07 17:48:53.29
>>338
ありがとうございます。
ゼミでは、グラフ理論やってましたw
高校からやるのいいかもしれませんね。
専門的な教科書のおすすめってありますか~?

340:132人目の素数さん
13/12/07 18:41:38.97
そもそも統計学なんて数学科以前に教養課程で習うだろ
統計専攻の人でも学部レベルくらいまでなら、あれに毛が生えたようなレベルしか
勉強しないぞ
しいて言うなら、確率論に測度が入ってくるくらいか

341:132人目の素数さん
13/12/07 19:48:10.87
>>337
これでもガーとやれば
URLリンク(www.amazon.co.jp)

342:132人目の素数さん
13/12/07 20:10:49.89
大学院出るレベルで基礎からやりたいっていうなら
URLリンク(www.amazon.co.jp)
これが結構おすすめ

343:132人目の素数さん
13/12/08 04:53:21.60
みなさま教えてちょんまげ。
統計検定1級対策は何を勉強すればいいですか?
公式テキストだけじゃ足りないよな??

344:132人目の素数さん
13/12/08 17:30:55.13
>>337は実社会でも適応できないのだろうね

345:132人目の素数さん
13/12/11 22:15:25.47
344が進行とめたねw

346:132人目の素数さん
13/12/11 23:01:17.50
>>344
337は数学科卒にしては適応してる人だと思うよ
いまごろ統計やってみようとか感心感心
昔グラフやった人ならちょっとモチベがあれば
その辺の有象無象よりはあっというまにテイクオフだよ
がんばれ

347:132人目の素数さん
13/12/11 23:03:16.33
本人登場

348:132人目の素数さん
13/12/11 23:03:56.85
>>347
運営乙()

349:132人目の素数さん
13/12/12 13:35:49.23
momentとmoment generating functionがあるのは分かったけど、
なんでこれを導入すると有用なのかがイマイチ分からない…

350:132人目の素数さん
13/12/13 02:49:30.06
微分が簡単な指数関数で1回2回と微分すれば平均や分散が求まるってところから、
もっともっと深く意味を求めたいのなら、和訳の積率母関数でググればいっぱい説明してるサイトがみつかすよ。

勉強してる人が歪度や尖度をに対してどれくらい重要さをイメージしているか、次第かなと。

351:132人目の素数さん
13/12/13 22:36:24.02
>>349
関数の一致や関数列の収束などを示すために
ラプラス変換したもので考えたほうが計算が楽になることがある
例としては、中心極限定理の証明、分布の再生性の証明などなど

352:132人目の素数さん
13/12/17 00:26:59.91
nでわるのか
n-1でわるのか
分からなくなってきた。

353:132人目の素数さん
13/12/17 08:28:04.20
解答がマークシートの類でなく、設問ごとにある程度の余白が用意されている答案用紙だったら、
その問の解答途中で、
偏差平方和をn-1で割った値を標本分散とするならば~
みたいな一筆をあらかじめ入れておいて、計算を進めていけば、
仕上がった答案に対して採点者も原点ってカタチで文句を付けることは無いんじゃないかな?

354:132人目の素数さん
13/12/17 18:38:47.76
そんなこと書いても違いが分からないのならバツです。

355:132人目の素数さん
13/12/17 20:19:03.86
不偏分散という用語はあるが、
n で割ることを陽に示す言葉が無い
のは、不便ちゃ不便だな。
統計よりな人は、「分散」とだけ聞いて
不偏分散のことだと思ったりするからな。

356:132人目の素数さん
13/12/18 14:54:08.43
高校で習う標準偏差とか分散って、そりゃ、データがたまたま、
ああいう綺麗な真ん中で盛り上がってる綺麗な形なら使えるけどさ、

実際のデータは、もっとひん曲がった、右と左が非対称だったり、ぐにゃぐにゃな形だったりするんだから
実務的なリアルなシミュレーションするときは、あんまり使えなくないですか

それなら、数式もクソもない、ただ確率に応じて代表的な数字を返すだけの、素朴なプログラムのほうがよほどリアルな出力になる。
・・・と思うんですが、ぼくの認識はおかしいですかね。

357:132人目の素数さん
13/12/18 15:23:21.37
高校生かな?

もちろん全てのデータが正規分布に従うなんてことはなくて、
ひん曲がったぐにゃぐにゃな形があることなんて100年以上も昔から分かっているし、
もっと上級の統計学になるとそういう形に対応できる様々な分布を取り扱うようになる
ただ正規分布が、様々な分布の中でも一番基礎的で重要な分布なのは間違いないから、
高校では正規分布に絞って統計学のさわりを教えているんだと思う

実務的なリアルなシミュレーションでは、データに沿った分布を選択することになる

358:132人目の素数さん
13/12/18 19:04:39.93
>>357
そうですよねえ。正規分布は、そこそこ使える分布ながら、手計算しやすい=エデュケーション用途にもピッタリ
てなことだと思ってましたが、やはりそういうことでしたか。

ただ、私は、この手の分析の仕事は、コンピューター使ったほうが、複雑な関数を使わなくて済むぶん、
よほどシンプルになると思いました。 ご返答ありがとうございました。

359:132人目の素数さん
13/12/18 19:25:16.03
全然違うと思いますがそういう理解でいいんじゃないでしょうか。

360:132人目の素数さん
13/12/18 19:39:32.30
w

361:132人目の素数さん
13/12/18 20:17:23.98
>>358
> >>357

大数の法則といって、
もとがどんな分布であろうとも、標本をたくさんとればとるほど、正規分布に近づく
っていう数学の法則があるのです。


教育的な分かりやすさからいうと、二項分布とか分かりやすいし、身近な例への応用もやりやすい。

362:132人目の素数さん
13/12/18 20:56:01.36
そのコンピュータが結局ヒトにとって複雑な関数の計算を代行してくれているんじゃ荷ですかねえ

363:132人目の素数さん
13/12/19 01:14:21.85
>>361

標本平均の分布が正規分布に近づくのは中心極限定理では?

364:132人目の素数さん
13/12/19 01:40:02.50
その中心極限定理を保証するのが、要するに大数の法則かと

365:132人目の素数さん
13/12/19 05:15:57.17
大数の法則は、弱と強があって、確率収束と概収束に関連しています。
成立条件から言っても、中心極限定理とは別物です。

366:132人目の素数さん
13/12/19 10:16:06.89
どんな分布の母集団だろうとサンプルとった平均は正規分布するんだから、
逆算すれば母集団の平均が推定できるってことだな。

367:132人目の素数さん
13/12/19 10:23:55.30
>>366
> どんな分布の母集団だろうとサンプルとった平均は正規分布するんだから、

もっと統計用語は正確に書いた方がいい。正規分布するなんて、どの教科書にも
出てこないよ。

標本平均が正規分布に従うなんてことはない。
指数分布に従う母集団からの標本平均も正規分布に従うの?

368:132人目の素数さん
13/12/19 10:27:38.83
わざと一般人の理解向けに不明瞭に書いたんだよ。

369:132人目の素数さん
13/12/19 10:30:37.63
ここはひどいインターネッツですね。

370:132人目の素数さん
13/12/19 11:23:02.87
質問者の程度に合わせた回答を施してあげるのも、知性ある人間としての能力の一つだ。
同好の士同士の問答でもあるまいし、何でもかんでも難しく答えりゃイイってモンじゃない。

371:132人目の素数さん
13/12/19 11:45:32.69
正規分布は使えないという結論に至った初学者に
指数分布では~とか言ったらやはりおれの結論は正しかったになるよ。

372:132人目の素数さん
13/12/19 11:52:54.99
>>357
これが大体いい解答だと思う

373:132人目の素数さん
13/12/19 11:56:05.97
統計学って最初の壁が絶壁なんだよな。

374:132人目の素数さん
13/12/19 12:08:56.60
『唯一、社会に出てからも役に立つ数学』をウリにしておいて、とっつきにくさという実質的な足切り関門が存在しているというのも、改善すべき要素だと思うなあ

375:132人目の素数さん
13/12/19 12:32:38.23
この程度で「つきはなされた」と感じて混乱するような人は統計なんて使わない方がいいよ
他の人に任せなって

376:132人目の素数さん
13/12/19 13:22:43.16
>>366
正解
>>367
>指数分布に従う母集団からの標本平均も正規分布に従うの?
従う。
中心極限定理は母集団分布は何だっていいことを保証している。

377:132人目の素数さん
13/12/19 14:35:05.48
サンプルサイズが十分大きい時、中心極限定理が成立する。
です。

378:132人目の素数さん
13/12/19 14:37:32.31
信頼区間95%を素人に理解させるのは不可能。

379:132人目の素数さん
13/12/19 14:41:33.10
>>377
分散有限とかの条件があるよ

380:132人目の素数さん
13/12/19 14:46:51.47
>>378
視聴率のウィキペで説明したらわかってくれそうじゃない?
URLリンク(ja.wikipedia.org)

381:132人目の素数さん
13/12/19 15:12:18.77
2chではありがちなことだけど、
自分の中での結論ありきで議論を展開する奴に物事を理解させるのは不可能だから
その辺に見極めが重要

382:132人目の素数さん
13/12/19 16:57:19.21
何冊か読んだけどカイ二乗分布の説明がどれもこれも概念的すぎてよくわからん…

383:132人目の素数さん
13/12/19 17:40:17.13
カイ二乗分布は確率変数の二乗和が従う分布。
ただし、母集団の分布が正規分布で確率変数は独立である必要がある。

カイ二乗分布の存在意義は検定に使えるから。

384:132人目の素数さん
13/12/19 18:18:55.72
なんで正規分布じゃダメなの?って疑問。

385:132人目の素数さん
13/12/19 18:37:36.94
平均の検定なら正規分布やt分布でいいが、
標本分散は正規分布には従わない。

分散の場合は、カイ二乗分布に従うから、これを使う。

386:132人目の素数さん
13/12/19 18:48:33.23
本当に基本的なところで申し訳ないんだけど、分散を比較しなきゃいけないシチュエーションって
どういうシチュエーション?

387:132人目の素数さん
13/12/19 18:51:25.21
そういうことか。普通は平均だけで満足しちゃうから出番が少ないのか。
ありがとう。

388:132人目の素数さん
13/12/19 19:02:43.25
例えば、税理士の平均年収が600万円で弁護士の平均年収が650万円だったとする。
普通の人なら、税理士も弁護士もほとんど年収変わらないなら、税理士の方が得じゃない?と考えるだろう。

しかし、もしかすると、弁護士は新卒が多くて、給料あまりもらってない人が多く、高所得者も多いのでは?とか、仮説を立てる。すると、年収の分散も比較したくなるわけ。

じゃあ、税理士の分散と弁護士の分散を検定してみると、この仮説が検証できる。
このとき、分散比の検定でF分布(カイ二乗分布の親戚)を使う。

389:132人目の素数さん
13/12/19 20:10:36.51
なるほど。わかりやすい

390:132人目の素数さん
13/12/20 09:32:35.08
>>388
素晴らしい

391:132人目の素数さん
13/12/20 09:35:37.68
>>388
公認会計士、弁理士、医者は?

392:132人目の素数さん
13/12/20 13:33:11.96
アスぺ乙

393:132人目の素数さん
13/12/20 15:20:21.80
検定統計量っていろいろあるけど、どうやって算出するんだ?

394:132人目の素数さん
13/12/20 15:56:31.23
たいていはただの標準化だよ
教科書に導出とか載ってない?

395:132人目の素数さん
13/12/20 19:06:48.79
>>392
アスペクト比が問題なわけだな、分散の偏りだな、勉強になります

396:132人目の素数さん
13/12/20 19:55:16.86
>>391
3変数以上の検定には多重比較などを利用出来る。

397:132人目の素数さん
13/12/21 11:14:19.36
ピペット操作を複数回行い、得られた数値の平均値、標準偏差から変動係数は3%以内になった
変動係数が3%以内であれば測定値は正確な値だと言われている
なぜ3%以内なのか統計学の観点から考察せよ
という課題が出されたんですが、全くわからず、結局レポートを提出できませんでした
その後も答えをくれませんでしたし、参考書を見ても3%以内なら正確な値とは書かれてませんでした
どのような回答が正しかったのでしょうか

398:132人目の素数さん
13/12/21 11:58:29.21
>>397
「考察せよ」という課題に解答なんて存在するの?

399:132人目の素数さん
13/12/21 12:04:19.67
>>393
パラメトリックなときは、Neyman-Pearson fundamental lenma
ノンパラのときは、対立仮説と帰無仮説の差を表現できるものから検定統計量
作ります。

400:132人目の素数さん
13/12/21 13:13:44.85
「考察せよ」てのは問題自体も問題なんだよな

401:132人目の素数さん
13/12/21 13:34:30.09
正解がないなんて良問だろう。暗記問題じゃないということ。

402:132人目の素数さん
13/12/21 16:35:21.13
>>399
なるほど!

403:132人目の素数さん
13/12/21 17:25:22.60
>>397
読んでないけど、参考になるかも(wikipediaのreferenceより)
"Statistical quality control and routine data processing for radioimmunoassays and immunoradiometric assays."以下リンク
URLリンク(www.clinchem.org)

404:132人目の素数さん
13/12/21 22:56:36.44
考察せよ

考察しました

ご苦労さん

405:すみません数学得意な人この問題解いて下さいm(_ _)m
13/12/22 22:18:14.10
A.B.C.D.E.F.G.Hの8チームがトーナメント形式で戦う
一回戦の対戦相手はくじ引きで決めPからWまでのどこかに振り分けられる
Aが2回戦でBを倒し、3回戦でCを倒す確率は?
答えは336分の1なのですが納得出来ません
優勝
| |
ー ー
| | | |
ー ー ー ー
| | | | | | | |
P Q R S T U V W

406:132人目の素数さん
13/12/23 01:29:56.36
Aが2回戦でB、3回戦でCと当たるような配置になる確率:2/7*4/6
AとBが共に2回戦に進む確率:1/2*1/2
AがBに勝つ確率:1/2
Cが3回戦に進む確率:1/2*1/2
AがCに勝つ確率:1/2

これを全部掛け合わせる

407:132人目の素数さん
13/12/23 09:06:16.84
>>406
解決しましたありがとうございますm(_ _)m

408:132人目の素数さん
13/12/24 17:24:15.09
質問です
時系列データの標準偏差というのは定性的にいうとどういう意味があるのですか?
動きが激しいほど大きいとかですかね???


次ページ
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch