統計学なんでもスレッド 13at MATH
統計学なんでもスレッド 13 - 暇つぶし2ch2:132人目の素数さん
11/02/11 01:55:20
過去スレ
統計学なんでもスレッド11
スレリンク(math板)
統計学なんでもスレッド10
スレリンク(math板)
統計学なんでもスレッド9
スレリンク(math板)
統計学なんでもスレッド8
スレリンク(math板)
統計学なんでもスレッド7
スレリンク(math板)
統計学なんでもスレッド6
スレリンク(math板)
統計学なんでもスレッド5
スレリンク(math板)
統計学なんでもスレッド4
スレリンク(math板)
統計学なんでもスレッド3
スレリンク(math板)
統計学なんでもスレッド2
スレリンク(math板)
統計学なんでもスレッド
スレリンク(math板)

3:132人目の素数さん
11/02/11 02:07:28
関連スレ1 現行数学板
統計ソフトSTATAの部屋 Ver.2
スレリンク(math板)
【R言語】統計解析フリーソフトR 第4章【GNU R】
スレリンク(math板)

関連スレ2 2010.9以前の数学板
統計学なんて数学じゃないだろ
スレリンク(math板)
=統計解析= SASプログラミング
スレリンク(math板)
統計解析フリーソフト R 【第3章】
スレリンク(math板)

4:132人目の素数さん
11/02/11 02:09:34
関連スレ3 他板 
統計学
スレリンク(sociology板)
経済学で使う統計学スレッド
スレリンク(economics板)
生物学での統計学スレ
スレリンク(life板)
◆統計学について語るスレ
スレリンク(sim板)
統計・解析ソフトについて
スレリンク(bsoft板)

5:132人目の素数さん
11/02/11 02:11:49
テンプレ1
●学校の宿題の丸投げはやめましょう。
●質問者は質問の前に相当程度調べるなり、考えるなりしましょう。
●荒らしは基本的にスルーでお願いします。

6:132人目の素数さん
11/02/11 02:24:20
>>1
前スレのログから察するに、前スレは2010/09/07(火)の午後に20番レスまでで、
消失全損したようです。

7:132人目の素数さん
11/02/12 08:31:22
>>987
>最近はデータ数がバカみたいに多く集まることが多いので、統計的検定は無意味だと聞いたんですがホント?
>たしかにnが万単位あれば僅かな平均値差でもバリバリ有意になっちまいますね・・・・・
n=10000ケのデータに対し、統計的検定を行うことってあるのかな?
10000ケの抜取標本平均や標本不偏標準偏差の記述統計で、十分なのでは?

8:132人目の素数さん
11/02/12 22:16:31
>>987
>>7
目的がわからないので、検定は無意味か?と聞かれても
応えられないと思いますよ。


9:132人目の素数さん
11/02/13 00:44:35
>>7
消失スレに書いたけど円周率が乱数かという検定ならデータが多くても行う。
>>8が言うように目的次第。

10:132人目の素数さん
11/02/13 02:37:49
フリードマン検定は1要因の対応ある条件の比較のみに用いられるのですか?
2要因について用いられることはありませんか?

11:132人目の素数さん
11/02/14 05:53:58
質問です。とあるサイトからの引用なんですが、

>あたりくじが1つ、ハズレくじが9つのくじびきを10人で引く場合、
>数学でいえば、何番目にくじを引いても当たりくじを引ける確率は同じだが、
>統計学でいえば、実際に2千回、5千回、1万回試行をすると実は6番目が一番当たりくじを引きやすいという結果が得られる。

2行目の当りくじの確率は理解できるんですが、
3行目の6番目云々が良く理解できません。
実際の試行回数と偏差とかのデータは出してないんで、主張が正しいかどうかはわからないんですが、ありえるんですかね?

一応自分で考えたところでは、仮に1万回試行として、
10分の1の1万回試行、9分の1の(1万ー10分の1の当り回数)試行、・・・・(1万ー10分の1の当り回数ー9分の1の当り回数ー・・・・2分の1の当り回数)
の当り数の分布の比較ということになると思うのですが、
回数が安定するかどうかに違いはあっても、くじの引ける確率自体は同じである以上、統計上6番目が一番出やすいということは無いと思うのですが。

どうなんでしょう?

12:132人目の素数さん
11/02/14 08:38:21
>>11
1から10であたりがでるので、期待値は5.5。
そのことを、誰があたりを引くかと間違えて、6と書いてるのかな。

シミュレーションするなら、一様分布を前提に、毎回10人に順に引かせて誰が当たったかの結果をだして、その分布を確認だね。

13:132人目の素数さん
11/02/14 13:38:02
回帰統計
重相関 R 0.152278611
重決定 R2 0.023188775
補正 R2 -0.116355685
標準誤差 2.206272678
観測数 17

分散分析表
自由度 変動 分散 観測された分散比 有意 F
回帰 2 1.617758084 0.808879042 0.166174817 0.848544242
残差 14 68.1469478 4.867639128
合計 16 69.76470588

係数 標準誤差 t P-値 下限 95% 上限 95% 下限 95.0% 上限 95.0%
切片 10.4845444 6.609867644 1.586195816 0.135017062 -3.692211688 24.66130049 -3.692211688 24.66130049
52 -0.051129843 0.095080104 -0.537755434 0.599190715 -0.255056384 0.152796698 -0.255056384 0.152796698
31 -0.000651974 0.111476851 -0.00584851 0.995416112 -0.239746038 0.238442091 -0.239746038 0.238442091

重回帰分析なんだけど
これって有意差はなしってことでおk?

14:132人目の素数さん
11/02/14 19:30:28
>>11
>>12だけど、1000回のシミュレーションを5回してみた。
念のため分散分析もしてみたけど、結論としては6が出やすい
ということはないです。
まあ、以下の結果を見ると、6が多めに出てる場合があるので、
それを見て、統計学的に6が出ると判断しちゃったのでしょう。

シミュレーション結果(試行10,000回)

非復元抽出で当たりの位置を記録

01____989___1001___1027___1038___1026
02___1046____991___1016____994___1006
03____934____980___1020____999____966
04___1015___1001____978____996___1004
05___1010___1016____969____985___1001
06___1001___1053___1000___1065____955
07____993___1011____979____935___1058
08____949___1002____981___1031___1007
09___1034____950____975____978____969
10___1029____995___1055____979___1008
sum_10000__10000__10000__10000__10000

15:132人目の素数さん
11/02/14 19:31:31
>>14
10000回のを5回ね。w

16:132人目の素数さん
11/02/14 21:07:47
>>13
はあ?有意差?
ワロスw

17:132人目の素数さん
11/02/14 21:54:40
>>16
考えられるのは、ダミーとかを使って、係数が有意に影響するかを確かめてる可能性。

まあ、EXCELの結果をそのまま貼ってるのを見ても、ほうっておくのがいいんじゃないかな。

18:132人目の素数さん
11/02/15 00:05:10
>>3>>4
関連スレ2 2010.9以前の数学板
【統計学】統計的仮説検定!!
スレリンク(math板)

関連スレ3 他板
統計ソフト統合スレッド-SPSS・SAS以外
スレリンク(psycho板)
SASスレ
スレリンク(psycho板)
SPSSスレ
スレリンク(psycho板)
心理統計スレッド
スレリンク(psycho板)

19:132人目の素数さん
11/02/16 01:27:55
aとbがCに及ぼす影響を調べるためにはどの分析方法が最も適切でしょうか
t検定も分散分析も違うような気がするのですが…
ちなみにaとbは不変と可変、のように対になる変数です
よろしくお願いします

20:132人目の素数さん
11/02/16 10:35:21
不変と可変って何?

21:132人目の素数さん
11/02/16 22:35:17
>>19
Cが量的変数なら、重回帰分析か数量化Ⅰ類か実験計画法を使うのが普通だが。
「aとbは不変と可変」って、定数と変数ということですか?

22:11
11/02/16 22:53:01
>>14
レスありがとうございます。
わざわざ時間かけてもらってすいません。

結果を見ても、差は誤差と考えるのが妥当ですね。
すっきりしました。

23:132人目の素数さん
11/02/17 11:25:01
以下の四つのジャーナルの内、最もレスポンスが早いのはどれでしょうか?
また、ジャーナルの評価も聞かせて下さい。

・日本統計学会誌(英文)
・Communications in statistics
・Statistica Sinica
・Annals of institute of statistical mathematics

24:132人目の素数さん
11/02/17 23:13:28
全データが与えられてるのを度数分布標作って平均値などを求めたんですが間違いになりますか?

25:132人目の素数さん
11/02/18 16:33:21
>>23
投稿の内容とか、そのとき選ばれたレフェリーによっても全然違うから、
基本的には、レスポンスが早いかどうか全くわからないと言っていい。

聞いた話とか、おれやおれの友人が投稿した感じでは以下のように思う。

(おれは一度、日本統計学会誌で3ヶ月放置されたことがあるけどね)

・日本統計学会誌(英文)=二ヶ月以内ぐらいには返事があるはず。
・Communications in statistics=まあまあ早い。一ヶ月ぐらい?
・Statistica Sinica =早い。リジェクトの場合4,5日で返事が来ることも。
・Annals of institute of statistical mathematics =むちゃ遅いらしい。半年?


26:132人目の素数さん
11/02/18 19:11:13
>>24
その「全データ」というのは母集団のこと?
つまり分析したい対象ということ?
それとも何かの標本?


27:132人目の素数さん
11/02/18 21:22:50
統計学では高校数学のどの知識が必要ですか?

28:132人目の素数さん
11/02/19 20:54:07.72
>>27
高校の教科書を見直してみた。
どこまでやりたいかによるけど、
初等幾何以外はほとんど必要だと思う。


29:132人目の素数さん
11/02/19 22:13:05.42
>>27
ある程度きちんとやるなら、微積分の知識がいる。
統計的に分析する時に確率の知識が必要で、確率は面積なので積分がいる。
統計的分析をするためには微分もいる。

複数の変数を分析するには、線形代数(行列)の知識がいる。

ただ、EXCELとかで結果だけだせればよくて、手法はそれほど細かく
わからなくても、とりあえず分析したいだけなら、数学というよりも
常識があればOK。

30:132人目の素数さん
11/02/20 00:00:50.89
統計なんてバカのやること
高校生レベルで十分

31:132人目の素数さん
11/02/20 00:15:42.89
                             |
                             |
      ∩___∩             |
      | ノ  _,  ,_ ヽ        ((  | プラプラ
     /  ●   ● |         (=)
     |    ( _●_)  ミ _ (⌒)   J  ))
    彡、   |∪|  ノ
⊂⌒ヽ /    ヽノ  ヽ /⌒つ
  \ ヽ  /         ヽ /
   \_,,ノ      |、_ノ


32:132人目の素数さん
11/02/20 04:10:26.79
実務で統計やってる人って何やってるかはわかんなくてただブラックボックス的にやってんの?

33:132人目の素数さん
11/02/20 04:50:53.96
実務家で統計やってる人は、
ほとんどブラックボックスだね。
アフォばっかり。
学者は狭い範囲でいろいろやって喜んでいるだけ。

広く深く、しかも実践的なことが出来る人は
ごく少数しかいない。
おれからしたら日本には30人ぐらいしかいない。


34:132人目の素数さん
11/02/20 20:44:28.90
複数の映像を見せて「どちらが迫力があったか」「どちらが爽快感があったか」などの質問に5段階で回答してもらったのですが
標本数が少なくp<0.1でも差が出ません
何とかどちらかが良いという結果を出したいのですが
このようなアンケート調査の場合どの程度まで有意水準をあげてもよいのでしょうか?

35:132人目の素数さん
11/02/20 23:53:00.33
どこまででも行けばいい
信じる人が減るだけかな

36:132人目の素数さん
11/02/21 01:24:13.03
>>34
どんな検定したのか分からないけど0.1より上げるのはないな。
本当には差があると思ってるんだったら検定法を変えると差が出るかもしれん。


37:132人目の素数さん
11/02/22 16:13:03.01
45点満点のテストで平均点22点標準偏差6のとき
36点とった場合、偏差値はいくつになるのか、出現率(1000人中での順位)という
のはどれぐらいになるのでしょうか?

38:132人目の素数さん
11/02/22 17:21:31.71
偏差値:50+10*(36-22)/6=73.333...
出現率の定義はよくわからないが、1000中での順位というのであれば、
正規分布で、x>2.333...の面積は、0.009815...。1000倍して切り上げし、10位と言うのが妥当だろう。

39:132人目の素数さん
11/02/22 23:17:30.51
ありがとうございます。
偏差値73の成績と偏差値65の成績の二つの試験の合計での
出現率や総合偏差値というのは推計できるのでしょうか?

40:132人目の素数さん
11/02/23 01:34:25.91
>>39

>>38ではないが、複数の変数(複数の試験の結果)を合わせた分布を
計算するのには、>>39の情報だけではできない。

試験Aの成績がいい人が、試験Bの成績もいいという関係があるのか、
逆の関係があるのか、その関係はどれくらいなのか、両方の試験の結果
にはあまり関係が無いのか、といった情報がないと、分布の形が特定
できないので計算もできない。

単純に二つの点数を足したもので、総合の偏差値を計算することは可能
なので、それが簡単かもしれないけど、二つの試験の総合点の標準偏差
の数値なんて持ってないよね。

ちなみに、偏差値73と65における順位と、合計したものの順位は異なる。
偏差値73と65の順位というのは、73よりも成績がよく、65よりもいいと
いう両方の条件を満たす人。
総合した場合には、どちらかが下回っている人が総合点で上に来ることが
あるので結果が違ってくる。

41:132人目の素数さん
11/02/23 02:55:34.10
>>39

>>40 の書いていることは、

数学と英語の試験があって、
1)片方の成績がいいともう片方の成績もいいとすると、英語で高得点を
取った人は数学でも高得点を取ることになる。

2)英語と数学の成績にはマイナスの相関があると、英語の成績がいい人で
数学の成績のいい人は少なくなる。

つまり、1)と2)を比べると零点から200点の間に、1)の方が広く分布
してて、2)の方が平均点の所に多く分布していることになる。
そのため、1)と2)では1)の方が分散が大きくなる。

あと、3)として、両方の試験にまったく相関が無い場合。
これは、英語で10点取ってる人たちと、90点取ってる人たちを比べると、
数学の成績の分布が一緒だってこと。
どちらにも、数学で10点の人とか90点の人が、同じようにいる状況。

二つの試験の点数の関係で結果が変わるので、その情報が無いと、計算が
できない。

42:132人目の素数さん
11/02/23 09:13:04.87
世界最速2バスの曲 DIMMU BORGIRの"The Chosen Legacy"
290~300BPMの16ビート
URLリンク(detail.chiebukuro.yahoo.co.jp)
URLリンク(www.youtube.com)
DIMMU BORGIRの"The Chosen Legacy
URLリンク(www.youtube.com)

ドリームシアター64ビート   150BPMの64ビート
URLリンク(www.youtube.com)

64ビートとは世界最速ドラマー「ヘルハマー」の2倍のスピードとなる事が判明した!

43:132人目の素数さん
11/02/23 10:59:51.24
39です。>4041ありがとうございます。
正規分布の面積で順位を算出することがわかりました。二つの試験の
場合は相関関係がわからないとだめなようですね。ありがとうございます。

44:132人目の素数さん
11/02/25 18:17:46.83
質問します。
glmを使い,説明変数の数を変えて複数のモデルを作りました。
複数モデルの中から最もあてはまりの良いものを知りたいので
AICを比較しようと考えたのですが,AICがInfとなり,表示してくれませんでした。
使っているソフトはRです。
AICが非常に小さいくて(おそらく2以下?)表示されないと考えているのですが,
これでは比較できません。
対処法をご存じの方がいらっしゃいましたら,教えていただきたく存じます。

45:132人目の素数さん
11/02/26 00:04:38.76
>>44
小さいから表示されないということはありません。
Infですから無限大なのでしょう。
glm後の出力で係数は表示されているのにAICのところのみInfと
なるということですね?他のモデルではAICが表示されるのなら
少なくともそのモデルはだめという結論でよいように思います。
AICを小さくするモデルを探索しているのですから。

46:132人目の素数さん
11/02/27 23:33:43.39
ARモデルで共分散定常性が成り立たないときはOLSで推計をするのは
妥当ではないと本に書いてありましたが理由は書かれていませんでした。
どなたか理由を教えていただけないでしょうか。

47:132人目の素数さん
11/03/01 00:40:38.30
>>46
定常でない時系列でARモデルを当てはめるってそもそもどういう仮定で
どうやって解くのだろう?その本にはそもそもそういうときにどうすれば
いいのかも書かれていないんですよね?それならば理由は仮定を満たして
いないからということでは。

48:132人目の素数さん
11/03/06 18:40:50.90
証明問題をやってて
具体的にiが1~nまでみたいに決まってなくて
集合Aの範囲内のものを全て足し合わせるってことを書きたいんだけど

ΣAf(x) (Aは下に小さく書く)

って書き方でいいのかな?
それとも何か正しい書き方ってある?

49:132人目の素数さん
11/03/06 23:01:08.91
統計学会春季大会(立教大学)乙!
会場がちょいと寒かった。
暖房いれるとみんな寝ちゃうから?


50:132人目の素数さん
11/03/07 00:27:45.84
>>48
なんでここで訊いてるのか分からないが、TeXで書くと
\sum_{x \in A} f(x)
となるのでは?(\inは集合の含まれるの記号)

51:132人目の素数さん
11/03/17 00:25:55.53
>>49
これですね。興味深い発表は、どれでしたか?
第5回日本統計学会 春季集会
日 時:2011年3月6日 (日) 10:00 ~ 17:30
場 所:立教大学 (東京都豊島区西池袋3-34-1)
URLリンク(www.jss.gr.jp)

52:132人目の素数さん
11/03/18 07:53:20.20
質問します。
教科書に、大標本と小標本なる用語があるのですが、定義が載って
おりません。標本数何ケが境目なのですか?

53:132人目の素数さん
11/03/22 01:36:17.66
明確な境目はないですよ。
10だと確かに少ないし、100だと多い方ですが、
どんな分析をどんな精度でするのかにも依存しますし。

54:132人目の素数さん
11/03/29 15:50:34.70
偏差値って正規分布専用の指標?

55:132人目の素数さん
11/03/29 18:09:45.99
>>54
逆に聞くけど、SDって正規分布専用?

56:132人目の素数さん
11/03/29 23:34:19.30
日本統計学会、・・・・プッ

57:132人目の素数さん
11/04/01 22:41:27.66
すみません
試行A   成功
29       5

試行B   成功
36       9

の二つの試行は違うと言えるのかどうかの検定ってどういう検定でできますか?

58:52
11/04/02 03:27:09.67
>>53
応答ありがとうございます。
精度に依存するというのは、設定する許容誤差に連動するということですね。
許容誤差をαとすると、境目の標本数はどのような式で計算するのでしょうか?

59:57
11/04/02 11:02:17.11
誰か教えてくれ・・・

60:132人目の素数さん
11/04/02 14:22:25.84
極限の問題だと思います。
このような問題をやったことが無いので、出来るだけ詳しい説明をしていただけると嬉しいです。
①lim(θ→0) sin5θ/sin2θ
②lim(u→0) u・log{1+(3/u)}
③lim(x→-∞) x+1/{√(x^2+x+1)-x}

宜しくお願いします。



61:132人目の素数さん
11/04/02 14:24:01.03
↑数学何でもスレッドと勘違いしました。
申し訳ないです><。

62:132人目の素数さん
11/04/02 14:36:40.83
>>58
無いよ。

例えば、標準正規分布を用いた検定と、t分布を用いた検定を考える。

この時、サンプルが30くらいあれば、どちらの方法でも目的としてる精度で分析できるなら、簡単な方を使う。

それと同じように考えればいい。

ただし、検定によっては、大標本の特性は数学的にもとまっていても、小標本の特性はわかってない時がある。
そんなときは、シミュレーションでサンプルサイズによる特性を調べて、それを使う。それが無理なら、とりあえず大標本の結果を利用する。

63:132人目の素数さん
11/04/02 16:44:56.13
>>57
分割表の独立性の検定

64:132人目の素数さん
11/04/02 17:21:11.30
>>62
挙げている例が説明と合ってないよ。
正規分布を用いた検定とt分布を用いた検定ではt分布の方が常に精度がよい。
しかし、たとえば標本の大きさが100ぐらいになるとその差は大してないので
正規分布を用いた検定でよいと考えたりする。
この場合明確に精度の差を考えたら切り替え基準も作れなくはない。
ただ精度の差は応用で違うし、主観的にもなるのでそういう議論をすることは
ほとんどない。

一般的にはこういうように説明できる方が珍しく小標本の方法の特性が
分かっていなかったり単純に比べられなかったりする場合が多いことは確か。

65:132人目の素数さん
11/04/02 18:52:30.98
>>63
ありがとうございます
たいして違いないみたいですね。

66:132人目の素数さん
11/04/04 14:54:44.08
>>55
答えはNOという事ですね
あり^^

67:132人目の素数さん
11/04/06 14:29:57.53
もし、真剣にロト6を統計したら一番期待が持てるのってどれなんだろうか?
過去30回分とかで計算したことある人は結構いそうだけど過去全部で計算したことある人っているか?

68:132人目の素数さん
11/04/06 23:18:02.98
どれとは?一番期待値が高くなる組み合わせってこと?
過去全部でもすべての組み合わせが出ているわけではないので
一番は決められないのでは?

69:132人目の素数さん
11/04/07 19:24:30.11
さらに言うと第138回から使う玉が変更されました
さらに言うとA~Jセットまでがあって
頻度調整の為に恣意的に使われるセットが替わります
僕はデータベースにできる限りの情報を記録しています

70:132人目の素数さん
11/04/07 22:08:27.61
それってどのセットを使うのが事前には公表されないでしょ?
どのセットを使うかも予測するってこと?
セットを変えるのは本当に頻度調整のためなの?
(頻度調整となると出る玉に偏りがあることになるが、
それを立証できるの?)

71:132人目の素数さん
11/04/07 23:29:51.04
1レスに質問は一つにして下さい

72:132人目の素数さん
11/04/08 14:00:17.39
皆は学部どこ?
俺は経済学部なんだけど理学部数学科ばっかりか?

73:132人目の素数さん
11/04/09 14:30:26.09
統計解析についての質問。
企業がエクセルを導入したことによって、どのような統計解析が可能になったのか?
質問が雑であまりうまくまとめられてないので、すいません。
友人から「この質問を解答してくれ」と頼まれたので、宜しくお願いします。

74:132人目の素数さん
11/04/09 17:34:27.66
お断りします。

75:132人目の素数さん
11/04/11 19:11:17.73
>>73
エクセルを導入せずとも、実行可能な統計解析の存在を考えて、non-unique argumentで検討することにする。
1) 例えば、オープンソースのRが導入済みまたは導入可能であると仮定する。
2) エクセルにできて、Rにできない統計解析はない。
3) 従って、企業がエクセルを導入したとしても、新しく実行可能になる統計解析はない。
以上。

76:132人目の素数さん
11/04/11 20:49:10.68
1)が偽だったら何の意味もない議論だなw

77:132人目の素数さん
11/04/12 18:15:07.51
>>73
こういう本見て、そこの仕事と関係ある部分を箇条書きにすれば良いと思う。
URLリンク(www.amazon.co.jp)

78:132人目の素数さん
11/04/16 22:29:22.99
>>46
妥当ではないとは具体的に?

79:132人目の素数さん
11/04/16 22:36:56.43
非線形回帰モデル
y = a*x1 + a*b*x2 + u
において、y、x1、x2のデータがあるときにaとbの推定を考えます。
その方法として残差平方和u^2を最小にするようなaとbを直接求める方法と、
u^2をaとbに関して微分して0とおいた一階の条件を非線型方程式とみなして
求める方法はどちらがいいのでしょうか?


80:132人目の素数さん
11/04/17 00:31:45.15
>>79
それ非線形なの?
線型にしか見えないけど?


81:132人目の素数さん
11/04/17 02:11:01.55
>>80
パラメータaとbについては非線形だと思います。
パラメータaとbをデータの線形関数としてexplicitに表現できないと思いますので。
もちろん「変数」に関しては線形ですが。

82:132人目の素数さん
11/04/17 03:41:54.70
>>81
両辺をaで割れば、
y/a = x1 + b * x2 + u/a
となるんじゃないの?


83:132人目の素数さん
11/04/17 03:59:01.87
>>82
でもa自体が未知なので変換は不可能じゃない?

84:132人目の素数さん
11/04/17 15:07:32.72
y = a*x1 + a*b*x2 + u

のa*b = cとおいて、

y = a*x1 + c*x2 + u

とすれば普通の回帰分析と同じ。
そして、aとcを求めてから、
cをaで割るとbが求まります。
よって線型と同じです。


85:79
11/04/17 15:51:49.81
すみません、前に書いたモデルは一つの例で、あまり適切ではなかったようです。
実際は変数に関しては線形で、パラメータに関しては非線形なモデルで84が指摘しているような
簡単な方法では扱えないモデルです。
問題は目的関数を直接最小化するのと一階の条件を使うのとどちらが良いのかということです。

86:132人目の素数さん
11/04/17 16:44:18.49
>>84
そのように置いたらaとcは独立ではないよね。

87:132人目の素数さん
11/04/17 18:51:01.98
>>86
ええ。そうしなくても独立ではないですよね?

>>85
こういうのをやりたいということですか?
URLリンク(www.cs.osakafu-u.ac.jp)


88: 忍法帖【Lv=19,xxxPT】
11/04/17 19:46:06.04
通常用いられている統計学とは別にベイズ統計学とかいうのがあると知りました。
ベイズ統計学はどういうところで使われているんですか?
普通の統計学にたいして利点と欠点とかってあるんでしょうか?

89:79
11/04/17 20:12:17.21
具体的に言うと
y = (a+b_1+...+b_k)*x_0 + a*b_1*x_1 + ... + a*b_k*x_k + u
という回帰モデルでa,b_1,...b_kの推定を考えています。


90:132人目の素数さん
11/04/17 23:02:45.42
>>88
ベイズの公式を利用するものをベイズ統計学という。
どんな問題でも、常にベイズの公式を使う人のことを
ベイジアンといいます。
ベイズの公式は単純ですけど、奥が深いらしいです。

利点はベイズの公式を利用できることですかね?
欠点はないです。
だってベイジアンでないかぎり、ベイズの公式を使っても
使わなくてもいいんですから。


91:132人目の素数さん
11/04/17 23:17:48.07
>>90
>欠点はないです。
ベイズは概して計算量が増えます。

92:132人目の素数さん
11/04/17 23:37:54.83
>>89
y = (a+b_1+...+b_k)*x_0 + a*b_1*x_1 + ... + a*b_k*x_k + u

これを書き換えると

y=a*x_0 + (1+a)*b_1*(x_0 + x_1) + ... + (1+a)*b_k*(x_0 + x_k) + u

x_0、x_0 + x_1、...、x_0 + x_k って変数を作って、重回帰分析をして、
もとまった係数から、順番にb_1からb_kまでを決めていけばいい。

93:132人目の素数さん
11/04/17 23:40:48.41
あ、ごめん、見間違ってた。

94:132人目の素数さん
11/04/18 02:18:12.99
計量経済で言うコクランオーカット法の推定と同じような問題かな?

95:132人目の素数さん
11/04/18 18:11:22.42
CRFってわざわざ名前つけるほど特別な方法でもないじゃん
なんで騒がれてんのか不明だわ

96:132人目の素数さん
11/04/18 23:31:50.66
>>87
aとa*bはそりゃあ独立じゃないですよ。
aとbを別に求めたいから非線形ということですよね。

97:132人目の素数さん
11/04/22 09:25:33.58
データが「正規分布に従う」と言うためには何をすれば(何を示せば)いいですか?

98:132人目の素数さん
11/04/22 16:27:42.03
>>97
宿題?それとも試験中?

99:97
11/04/22 19:36:59.20
>>98
工学系の論文です。

100:132人目の素数さん
11/04/22 19:51:27.25
論文なのにこんなところで聞くのかw
参考文献に2chと書くのか?w

101:132人目の素数さん
11/04/22 19:54:52.25
胸が熱くなるな…

102:97
11/04/22 20:37:35.46
>>100
ここで概要を聞いた後に文献を引いて詳細を調べようと思います。

103:132人目の素数さん
11/04/22 21:34:04.74
>>102
データの分布について、正規分布かどうかの検定をする。
あたりまえすぎて、答えになるかな…

104:97
11/04/22 23:16:49.37
>>103
正規性検定の方法を調べてみたらいろいろ出てきましたが、
よく使われるものや使わない方がよいものはございますか?
- Anderson–Darling test
- Kolmogorov–Smirnov test
- Shapiro–Wilk test
- Smirnov–Cramér–von-Mises test

105:132人目の素数さん
11/04/22 23:18:35.61
>>104
概要を聞いたら、詳細に調べるんじゃなかったっけ。

106:97
11/04/23 01:20:54.07
>>105
はい、それぞれの手法の詳細は現在調べているところです。

最初に質問したときは「正規性の検定と言えばこれ」という
手法があると思っていましたが、いくつもの手法が出てきた
ため、定石があれば教えていただきたいと思い質問しました。

107:132人目の素数さん
11/04/23 08:13:17.77
>>106
統計の手法は、データの特性によって手法が違うので、自分のデータにあった手法を選ぶしかないね。
それは、各手法を調べればわかること。

108:97
11/04/23 10:11:01.86
>>107
ありがとうございます。
各手法の詳細を学んだ上で、自分のデータに最適な手法を選択します。

>>98, 103
お礼が遅くなりましたが、ありがとうございます。>>107と同じ方かも
しれませんが、違う方でしたらいろいろな方々にお世話になりました。

109:132人目の素数さん
11/04/24 21:20:58.83
ベキ分布でリスク管理のすすめ
URLリンク(f.blogos.livedoor.com)

110:132人目の素数さん
11/04/24 22:09:22.10
>>108
データ数が多いほど、正規性の検定で棄却されるから、
泣かないようにね。
もし、正規性の検定が研究の中心テーマでないなら、
検定なんかしなくて、ヒストグラムのみ示しておいて、
「正規分布と仮定して、、、」と進めればよいと思います。

棄却されないために、わざと検定しない奴多いんですよ。(爆
また、実験などでデータ数を調整できるような研究なら、
データは少なめにしたほうがいいかも?


111:132人目の素数さん
11/04/27 13:01:13.59
小説に歴史上の数学者を登場させたくて、
確率論、特に正規分布などの歴史について調べています。

Wikipedia以外で、ここが詳しい、というサイトがあったら教えてください。

112:132人目の素数さん
11/04/28 13:24:03.84
物書きに掲示板の情報をもとにネットで調べて済まそうという態度が見えて驚いた

113:132人目の素数さん
11/04/28 14:49:13.68
>>112
ニートなので出費はちょっと……。
最寄りの図書館にも数学史無かったし……まあ諦めます。

114:132人目の素数さん
11/04/28 21:49:10.37
>>113
ちょっと登場させるぐらいならWikipediaの情報で十分な気がするが。
正規分布はガウスが発見したが、Wikipedeiaのガウスのところは相当詳しいよ。

115:132人目の素数さん
11/04/28 22:38:47.02
>>114
おおっ。良くまとまっていますね!thanks!

116:132人目の素数さん
11/05/04 20:17:27.97
この問題はカイ二乗分布の表を使って解くのでしょうか?
どなたか詳しい解き方を教えて頂けたら嬉しいです。
なんかいまいち参考書を読んでも解き方がわからない...


正規分布に従う母集団から次の標本が存在する
66.303、15.102、84.942、53.234、93.443、63.132、45.295
この時、母集団の平均と分散を信頼係数95%で区間推定せよ。
(解答は小数点以下第4位まで求めよ)

117:132人目の素数さん
11/05/05 01:07:45.13
>>116
サンプルが与えられてて、サンプルサイズがわかってれば、信頼区間の式に入れるだけ。

118:132人目の素数さん
11/05/05 06:36:06.04
平成20年度文部科学省発表のいじめについての統計データを参考にレポートを書いているのですが、学校総数がわかりません。
統計表のどこを見ればわかるものなのでしょうか?

URLリンク(www.mext.go.jp)

119:132人目の素数さん
11/05/05 07:21:36.82
>>118
pdfは見ないで書くけど、ないなら他から探して持ってくる。

120:132人目の素数さん
11/05/05 11:45:02.47
>>116
平均の推定はt分布
分散の推定はχ二乗分布

121:132人目の素数さん
11/05/05 15:44:47.42
>>118
表の中に38698校とあるやつではないわけ?

122:132人目の素数さん
11/05/05 16:58:23.57
>>121
でも、(2ー1)では総数40285校なんですよね。
こういう調査って総数は一致しないものなのですね.


123:132人目の素数さん
11/05/06 19:58:32.59
>>122

>>119だけど、なんか適当なこと書いてるのでpdfを読んでみた。
とりあえず、統計資料使う時は「注」を読もうね。

私の学生が「こういう調査って総数は一致しないものなのですね」って
言ったら叱ってるw

まず、「(1-1)暴力行為の発生状況」と「(2-1)いじめの認知
学校数・認知件数」をみると(1-1)には特別支援学校が含まれていない
のでその分(2-1)が多い。

(2-1)の注を見ると「注3)学校総数のうち、高等学校の全定併置校は
全日制、定時制をそれぞれ1校(計2校)として計上しているため、学校基
本調査の数値と一致しない。」と一致しない理由が書いてある。

(1-1)では国立170、公立36242、私立2286で、(2-1)の数字から
特別支援学校を除くと、国立が170(=215-45)、公立36775(=37741-966)、
私立2314(=2329-15)となっていて、国立以外は(2-1)の数字が大きい
ので、その部分が全日制と定時制を両方やってる学校で、そういのは別の学校と
してデータを処理してるのがわかる。

また、(2-1)の注を見ると「(注4)休校等の学校があるため、認知した
学校数と認知していない学校数の合計は、学校総数と一致しない。」とあり、
学校総数40285に比べ、表の認知した学校及び認知していない学校の計は40082
と小さくなっているので、(1-1)を見るときも休校などが考慮されていない
と予想できる。

124:れが
11/05/06 21:56:57.84
問題:
三角形Ωから無作為に一点を抽出するという試行を考える。この試行に対する標本空間はΩそのものであるが、確率変数X,Y:Ω→Rをそれぞれω∈Ωに対して、X(ω)=ωのx座標、Y(ω)=ωのy座標で定義するとき、
1) P(Y>=1)=□、P(X^2+Y^2>=1)=□、

2) Xの確率密度関数f(X)はf(X)=□、E[X]=□、
   Yの確率密度関数g(y)はg(y)=□、E[Y]=□、

□を求める問題です。
図がなくて申し訳ありません。X座標が1、Y座標が2の三角形Ωです。
分かるかた教えてください。
よろしくお願いします。


125:132人目の素数さん
11/05/06 22:09:34.67
>>124
すぐに答える気はないんだけど

とりあえず、三角形の頂点の座標が
(0,0)、(1,0)、(0,2)
ってことかな?

126:れが
11/05/06 22:10:37.07
>>125
そうです。

127:132人目の素数さん
11/05/07 14:24:10.69
>>124
携帯だし詳しく書けないし、文系だしまちがっててもよければ。三角形の面積が1だから、面積がそのまま全確率になる。

1→三角形のうち、Pの中の式を満たす面積が答え。図を書けばいいと思う。

2→三角形の斜辺をxの式で書く。その式が答え。
でも、解答欄の□がでかいなら解答として「0≦x≦1のとき」としたほうがいい。
正確には「0>x,x>1のとき」はf(x)=0と場合分けする。次に∫x×f(x)dxを三角形がある範囲でする。
小さい解答欄にそれかくと空気読めてないと思われるかも。

同様にyの式で書く、∫y×f(y)dyを三角形がある範囲でする。


128:132人目の素数さん
11/05/07 14:57:56.77
>>127
>>125だけど、三角形なんだから、積分しなくても期待値はでるでしょ。高さに当たる方を半分にすればいい。

129:132人目の素数さん
11/05/07 20:42:58.13
>>117
>>120
ありがとうございます。

この問題の分散は、カイ二乗分布を使って標準偏差を出してそれを二乗すれば出る、
という認識で正しいでしょうか?

130:132人目の素数さん
11/05/08 23:35:11.89
どうしてそんな認識になるのか僕にはわけがわからないよ。

131:132人目の素数さん
11/05/09 01:48:21.68
>>130
多分、信頼区間ってものが全然わかってないんだと思う。

132:132人目の素数さん
11/05/09 11:37:29.77
こりゃ毎回生徒をいびりにくる先生から説教してもらわなな

133:132人目の素数さん
11/05/09 12:10:04.32
>>130 >>131 >>132

カイ二乗分布の母標準偏差の二乗が、カイ二乗分布の分散であるという記述を見たので、先ほどの問題で分散を求める際はこれに従えば良いと思っていました。

これはやはり誤りでしょうか?
教科書を読んでもこの程度しか理解できませんでした・・・

どなたかアドバイス頂けませんでしょうか。よろしくお願い致します。

134:132人目の素数さん
11/05/09 12:39:27.96
>>133
ある分布があって、その標準偏差は分散をルートしたものだから、標準偏差を2乗すれば分散になる。

でも君のデータはχ二乗分布なの?

平均値についての信頼区間は、データの平均を中心に信頼区間の式で区間を決めるよね。その時にt分布か標準正規分布を使う。

分散も同じように考えて、データからの分散を基準に分散についてぬ信頼区間の式で区間を求める。
その時に、信頼区間の設定(90%とか95%とか)に対応したχ二乗分布の値を使う。

135:132人目の素数さん
11/05/09 12:45:08.00
ついでに書くと、平均値についてはマイナスを取ることもあるから、データの平均値の両側にプラスマイナスで範囲を取ってもいいけど、分散はマイナスにならないから比で評価して、データの分散の何分の一とか何倍までという方法で信頼区間を決めてる。

とりあえず、分散の信頼区間の式をよく見るんだ!

136:132人目の素数さん
11/05/09 13:25:32.52
>>133
ストーリーがわかってないような気がした
分かっていたらすまん
数学的な話を抜きにして、発想の話

例えば、池の中の魚の身長の平均や分散を知りたい
→全部調べるのむり
→とりあえず10匹捕まえた(標本)、10匹の身長平均は10センチだった
→ひょっとして、池の魚の平均身長は10センチ?(点推定)
→でも、よくよく考えたら、次に10匹とってまた身長平均が10センチとはかぎらないよな
→でかいのが10匹とれたり、小さいのが10匹とれたりするかも
→サンプル平均は大小さまざまな値をとるな
→池全体の平均を10センチとドンピシャでよそうするのは怖い
→平均は8センチ~12センチにあるとか幅もたせて予想するか
→これが区間推定

サンプル平均やサンプル分散はどのような大小さまざまな値をとる
しかし、実はそれぞれ工夫をすれば特徴的な分布に従う
そして、その分布を見ながら95%の確率まであたるように予想範囲を広げる

137:132人目の素数さん
11/05/10 18:04:02.52
大数の法則のおかげでこんだけサンプルとれば
信頼に足る母集団の情報が得られますよって判るのか!

138:132人目の素数さん
11/05/10 18:26:25.60
>>137
んだ

139:132人目の素数さん
11/05/11 19:03:04.39
区間推定の信頼率って、本来は極限とった先での値だよね
有限の場合で考えても、極限にどれだけ近いか(オーダーじゃなくて、正確に数値で)わからないと、
95%なんて具体的な値を引き合いに出しても意味なくね?

140:132人目の素数さん
11/05/11 19:04:45.90
訂正

"(オーダーじゃなくて、正確に数値で)"は削除


141:132人目の素数さん
11/05/11 22:29:30.52
>>139
小標本特性についてはわかっていない場合が多いが、例えはt分布については特性が数学的にわかってる。
その代わり、母集団の分布に制限がある。

中心極限定理は、母集団に制限がないから凄いわけ。(特殊な分布を除く)

で、小標本特性がわかって無いのが多いので、シミュレーションでサンプルサイズが小さい時の特性を求めるか、仕方ないので極限を取って利用してる。

ということで、全く意味がないわけではない。

142:132人目の素数さん
11/05/11 22:50:42.61
>>139
まず、>>141に追加

>中心極限定理は、母集団に制限がないから凄いわけ。(特殊な分布を除く)
その代り、サンプル数が大きくないといけない。
ただし、実際には無限のサンプルサイズは取れないし、30とか50のサンプル
があれば実用上はそれほど問題がないこともわかっている。
t分布表と標準分布の表を比べてみるとわかるよ。

次にちょっと補足しておくと、小標本の場合は数学的(解析的)にサンプル
の分布の状態が求まらない。これは式で表せないということであって、少ない
サンプル数での分布は存在する。

なので、例えばサンプルサイズが10しか取れないなら、ある分布の母集団から
10個をサンプルサイズとして取った場合にどうなるかをたくさん試すことで、
10個の時の信頼区間がシミュレーションにより求まるから、それを使えばいい。

143:132人目の素数さん
11/05/12 13:22:18.88
(平均,分散)=(0,1)から10個取り出した10個の平均値は、
0±10なら、確率100% 、
0±3程度なら、ヤマカンなのだけど、確率68.3%だろう。

ところで、その逆(のようなこと)である、
10個の平均値が、zeroの場合の
元の分布(これが正規分布で分散1であると仮定し)
元の分布の平均(つまり母平均)の確率分布を求めたい。
どうもなんだか、すっきりしないから。

144:132人目の素数さん
11/05/14 09:55:16.63
URLリンク(up3.viploader.net)

145:132人目の素数さん
11/05/14 21:05:24.91
>>144
距離が近い分だけ放射能が高いが、すでに米ソの核実験が頻発していた
時代ぐらいまで下がったわけだ。このまま原発が安定してくれればね。

146:132人目の素数さん
11/05/15 10:52:52.19
【統計】女子大生の性体験率は62% 女子高生は30%でともに肉食化
スレリンク(dqnplus板)

147:132人目の素数さん
11/05/16 23:18:20.94
すいません。下記のような実験を行った場合、平均値や分散の有意差の有無を調査するにはどのような統計処理が普通なのでしょうか(実験誤差は正規分布に従うと仮定)
(1)条件A B Cで各条件10サンプルを並行して行いデータを取った。
(2)上記の実験を三回繰り返した(各条件10*3のデータ数)
二元配置で三回の繰り返し数を各水準にするのも変な感じがしました。ご教示お願いします。

148:132人目の素数さん
11/05/17 10:31:45.76
>>147
ABCで10サンプルx3なら
それぞれ30サンプルということでいいじゃん?

30サンプルのが3つある、ということで
ABCを比較すればいい。
条件は同じなんでしょ?


149:132人目の素数さん
11/05/18 23:43:29.31
>148 レスありがとうございます。はい。条件は同じです。

150:132人目の素数さん
11/05/19 20:23:43.52
質問があるのですが、どなたかご回答をお願いします。

平均点が58、分散16のとき、得点が65の人の偏差値はいくであるか?

自分の考えでは、10・(65-58)/16+50=54.357になりました。

分散と標準偏差値を同じように扱ってしまっています。
どなたかご教授お願いします。

151:132人目の素数さん
11/05/19 20:29:18.28
>>150
分散は標準偏差の二乗。
標準偏差は分散をルートしたもの。

152:132人目の素数さん
11/05/20 01:36:12.31
>>150
分散ちゅうのはテスト受けたやつらの点数のバラツキの指標や。

バラツキ知りたかったら、平均からAさん、Bさん、Cさん…がいくら離れてるかしらべる。
で平均から離れてた点数を合計して人数(もしくは人数-1)で割ったら大体のバラツキが分かりそうやろ。

でも、この計算には問題がある。平均よりマイナスのやつとプラスのやつそのまま足したら打ち消してまうやん。
2人しかおらんと仮定して、0点と100点、49点と51点のテスト結果のバラツキ指標が同じになってまう。
前者のほうが、実力バラついてるやろ。
だから平均から離れてた点数を2乗して合計してから人数(もしくは人数-1)で割るんや。それが分散。

でも2乗したまんまやと気持ち悪いやろ。単位が点の2乗とか意味不明やし。だから最後にルートしたくなる。それが標準偏差。
2乗したやつをルートして点ベースに戻してるから、大体平均から±○点くらいバラついてんやなって分かる。

さらに言えば、Aさん、Bさん、Cさん…の全員の点数から平均点をひいてみる。
当たり前やけど、引かれた点数をもとに平均点を出すと0点になるやろ。
さらに、Aさん、Bさん、Cさん…の点数を標準偏差で割ると、標準偏差が1になる。あんまりばらつかんようになる。
(100点満点のテストを10点満点にした感じ)

この発想が
(点数-平均)/標準偏差

みんなの点数をこの式にいれて、これを点数にしたら平均0で大体±1に収まるのではないかと発想したくなる。
その発想をもとに、偏差値はどういう指標なのかを考えてみては。
平均点とれば偏差値50とかの意味もわかると思う。

153:132人目の素数さん
11/05/20 02:06:38.32
その関西弁イラつくからやめて下さい

154:132人目の素数さん
11/05/20 08:33:36.99
というか、10・(65-58)/16+50=54.357 の式を書いてる段階でそれなりに
勉強はしてる。

>>152の説明だとかえってわからない、混乱させるよ。w

155:132人目の素数さん
11/05/20 10:21:36.72
>>152
自分は納得できました。
たまにくる教員の方?より分かりやすいです。

156:132人目の素数さん
11/05/20 11:07:32.00
>>155みたいに教科書を読んでも理解できないのが、
「マンガでわかる統計学」の購買層なんだろうなw

157:132人目の素数さん
11/05/20 12:04:01.23
>>154
あなたも理解が足りてませんね。
基準化するのに分散で割ってる人を学習が進んでると判断するあたり。
似てる式ですが意味が全く違いますよ。単位が違いますから。

標準正規分布を利用した検定推定。特に区間推定と基準化の関係。
さらには標準正規分布から派生するカイ二乗分布などでの式変換の意味がわかっていないということです。

式を丸暗記したり、似てるものを書ければ学習が進んでるとはいいませんよ。

158:132人目の素数さん
11/05/20 12:13:35.42
156は教員で悔しかったのかなw
ひさびさにワロタ

159:132人目の素数さん
11/05/20 12:46:50.63
いや、たまにくる教員は俺(>>154)だ。w

>>157
当人が、分散と標準偏差を同じに使ってると書いてるので、違いを教えておけばいい。

宿題や試験をそのまま聞くのがいるので、先ずはヒューリスティックな説明をして、わからなくてまた聞くようなら、追加で説明してるので、分かりづらいと思われるのは想定内。

160:132人目の素数さん
11/05/20 14:08:02.72
先生!
宿題ききにきて挙げ句ケンカする大学生をなんとかしてください!
ここはもはや動物園です
でも好きです

161:132人目の素数さん
11/05/20 15:14:25.55
私も好きなので、止める気はありません。
授業評価もないので、静かにさせなくても問題ないし。w

162:132人目の素数さん
11/05/21 00:45:12.43
すんません。
X~x^2(n)のとき
a*X~a*x^2(n) になりますか?

163:132人目の素数さん
11/05/21 09:57:37.52
x^2(n) って何?

164:132人目の素数さん
11/05/21 10:56:55.70
カイ二乗じゃないかな

165:132人目の素数さん
11/05/21 20:57:19.16
>>162です
そうですカイ二乗分布です
説明不足ですいません

166:132人目の素数さん
11/05/22 01:40:50.58
>>165
ならない。

χ二乗分布の確率密度関数と変数変換の公式で計算してみるといいよ。
綺麗な形にならないと思う。

167:132人目の素数さん
11/05/22 02:12:13.11
a*x^2(n)って何?カイ二乗分布のa倍?

168:132人目の素数さん
11/05/22 02:41:15.19
分布関数を考えて、それが元の型のa倍になるかを聞いてるんだと思う。

169:132人目の素数さん
11/05/22 02:46:47.72
xがn(μ,σ^2)の正規分布の時、y=(x-μ)/σ^2とすると、yはn(0,1^2)で、標準正規分布になるみたいなことを聞きたいんだと思う。


170:132人目の素数さん
11/05/22 07:42:10.64
>>169
y=(x-μ)/σ^2 じゃなくて、y=(x-μ)/σ に修正。

171:132人目の素数さん
11/05/22 13:43:58.12
>>168
それってa倍したものが再生性があるとか考えなくてよいなら
どんな分布でもそうなんじゃない?
>>169は再生性の話だよね。

172:132人目の素数さん
11/05/22 15:10:49.05
>>168
a倍した変数が従う分布「~a*x^2(n)」と書いてるので、
a倍した新しい変数の確率を考えるとこれはおかしい。
全ての確率が1になってない。

全ての確率が1になるような分布関数の形状の話ではなく、
対応関係だけを考えているなら、>>171のコメントもありかな。

Y=aX ってのは、新しい変数Yの分布を考えた時に、その値が
aXと等しければ、元の分布のXの時の確率が与えられる。

例えば、X=1の確率が0.5、X=2の確率が0.7だとして、Y=2Xで
新しい変数Yが与えられたら、Y=0.5で確率が0.5、Y=1で0.7。
(ここまでならあり)

ただ、普通は変数変換して、y=φ(x)という変換をした場合、
元の密度関数がf(x)ならば、yについての密度関数は、x=ξ(y)
として、g(y)=f(ξ(y))|dξ(y)/dy| となる。

χ二乗分布の場合、f(x)の中のガンマ関数部分は無視するとしても
X^(m/2-1)*e^(-X/2) という項があって、ここのXをY/aに置き換え
た物が出てくるので、積分して分布を考えても元のa倍にはならない。

173:132人目の素数さん
11/05/22 15:13:45.92
>>171
あ、肝心なことを答えてなかった。

>>168、169で書いたのは、再生性というよりも、変数変換した後の
分布の形状の話で、それは元の分布にaを掛けたものにはならない
ってことです。

174:132人目の素数さん
11/05/22 19:07:53.74
回答的には
確率変数 X が自由度 n のカイ自乗分布にしたがう時、
確率変数 Y = aX ( a > 0 ) の確率密度関数のグラフは
自由度 n のカイ自乗分布のグラフの横軸を a 倍、縦軸を 1/a 倍
したものになる。
でOK?

175:132人目の素数さん
11/05/22 20:18:53.89
>>174
正規分布ならそれでいいけど、χ二乗分布だとそうは言えない。>>172に書いたΓ分布以外の項があるので綺麗にならない。

例えは、自由度2のχ二乗分布の累積密度関数で、0の値(高さ)を計算すると、0.5になる。
これは、y=axで変換しても、y=0で高さが0.5になるってこと。

まあ、χ二乗分布は自由度が高くなれば、漸近的に正規分布に近づくので、そういう意味では、だいたい1/aの高さになると考えてもいいけどね。

176:132人目の素数さん
11/05/22 22:04:16.43
あ、例えで、嘘書いたかも。w

177:132人目の素数さん
11/05/23 00:09:54.43
例えだけでなく一般論的にも嘘というか勘違いだけど

178:132人目の素数さん
11/05/23 00:11:01.74
0の値の高さは半分になるよね。
また、変数変換ではy=axならx=y/aでg(y)=f(y/a)/aだよね。
だから変換後の分布はカイ二乗分布にはならないけど
密度関数でいえば>>174で正解だね。

179:132人目の素数さん
11/05/23 01:04:12.14
>>178
g(y)=f(y/a)/a の処理で、悩んでたんだけど、χ二乗分布か
どうかって話を別にすれば、分布の形は高さが1/a になった
ものだね。

χ二乗分布にこだわりすぎて、単純なところで勘違いしました。
ありがとうございます。

180:132人目の素数さん
11/06/01 00:30:09.00
多頻度飽和アイテム集合と多頻度アイテム集合との違いがいまいち
分からないのですがご教授下さい。
聞く場所が分からないのでスレチかもですが。。

181:132人目の素数さん
11/06/01 10:35:54.89
データマイニングの用語のようだね。
ここで反応あるかな?

182:132人目の素数さん
11/06/01 11:18:43.31
宿題でましたので教えて頂きたいです
問い→日本人の血液型A、B、O、ABの比率は4:3:2:1であることが知られている。
110人の学生の血液型を調べたところ、その比率は52人:35人:18人:5人であった。
この学生達の血液型比率は日本人の血液型比率に適合していると言って良いか?
有意水準5%でこれを検定せよ。

お願いします

183:132人目の素数さん
11/06/01 12:26:50.74
>>182
適合度検定でググると、具体例も含んだ説明がたくさんあるよ。

184:132人目の素数さん
11/06/02 05:42:09.96
統計学会の一般講演申し込み締め切り間近です。
今年は申し込み少ないみたいです。
番号がまだ2桁だし。。。


185:132人目の素数さん
11/06/02 07:11:47.94
場所が九州大学の伊都キャンパスという、
鳥も通わぬド僻地なので、誰も行きたがらない?

なぜ伊都のようなド僻地に移転したのか?
九州にありがちな賄賂と政治とヤクザと、(ry


186:132人目の素数さん
11/06/02 11:11:51.81
鳥はたくさんいますが。

187:132人目の素数さん
11/06/02 13:56:13.00
僻地といっても空港から1時間。
東京から京大に行くのと伊都キャンパスに行くのでは
ほとんどかかる時間は変わらないのだ。

188:あんでぃは無能 ◆AdkZFxa49I
11/06/02 16:34:08.86
あんでぃ

189:132人目の素数さん
11/06/02 17:12:23.06
アンディ・フグのかかと落しは強烈だった。

190:132人目の素数さん
11/06/04 02:18:28.65
博多って一度もいったことないから全然わからない。
どこらへんに泊まるといいの?


191:132人目の素数さん
11/06/04 21:54:20.67
LOTO6の出目の出る間隔を確率分布で表すと
Χ二乗分布?

192:132人目の素数さん
11/06/05 12:44:21.92
統計士の講座の内容は、質どう?

193:132人目の素数さん
11/06/05 17:16:30.36
>>191
出目の出る間隔って、どこのこといってるの?
例えば、1と10がでたら差が9とか、そういう意味?


194:132人目の素数さん
11/06/05 22:36:51.98
教えてください お願いします
ある東京都内のA医大病院は,収容される救急患者数Xがλ=2.5のポアソン分布Po(2.5)に従う.救急患者のために常時何床の空きベッドを確保すればよいか,ベッドが不足する確率を求めることで考察する.なお,エクセルの計算では関数「=EXP()」を用いよ.

( i )ある時点で,救急患者がちょうど一人もいない確率,救急患者によってベッドがちょうど1床埋まっている確率,ちょうど2床,ちょうど3床,ちょうど4床埋まっている確率,計5通りを求めよ.
(ii )救急患者のために,2床の空きベッドを確保しているとき,3床の空きベッドを確保しているとき,4床の空きベッドを確保しているとき,それぞれにおいて,ベッドが不足する確率を求めよ

具体的な解き方を教えてください
たぶん当てはめる式は同じだと思うので、
( i )ある時点で,救急患者がちょうど一人もいない確率
(ii )救急患者のために,2床の空きベッドを確保しているとき
の2通りについてのみの詳細な解き方をおしえてください


195:132人目の素数さん
11/06/06 00:00:38.06
>>194
分かったので却下します

196:猫 ◆MuKUnGPXAY
11/06/06 00:18:47.83
>理由があるかどうかはともかく、痴漢で懲戒免職後に受け入れてくれる大学などないだろう。
>未練があろうが、日本の大学への復活は無理。
>最近の研究業績はいまいちなので、海外の大学で給料をもらうのも無理。




197:132人目の素数さん
11/06/06 00:21:56.02
貼り付けただけで逃げようとする猫はウジ虫。
現実を直視できない悲しさ。


198:あんでぃ ◆AdkZFxa49I
11/06/06 00:22:28.33
あんでぃ

199:132人目の素数さん
11/06/13 21:59:40.04
>>193
いえ
第n回が 1 4 10 18 22 40 43 (15)
第n+1回が 4 14 19 23 41 42 (11)
第n+2回が 1 12 13 27 37 38 (9)
としたら
1の間隔は2
4の間隔は1
とみなします


指数分布ですか?

200:132人目の素数さん
11/06/14 01:16:07.91
負の二項分布じゃないすか?

201:132人目の素数さん
11/06/14 03:48:49.63
マジすか?

202:132人目の素数さん
11/06/14 20:16:32.89
統計士ってなに?アクチュアリー?

203:132人目の素数さん
11/06/15 00:24:20.05
民間の講座だな。
講座を終了したらもらえるそうだからあまり意味がなさそうだな。

204:132人目の素数さん
11/06/16 01:04:33.27
統計勉強してみたいと思ってるんですが、入門書でお薦めってありますか?
漫画で分かる!とか絵で見て分かる統計学!みたいな、全くゼロの状態からとりあえず取っつきに、って感じのがあれば是非お願いします。
あとついでにそれが終わってちゃんと始めるならこれ、みたいなのもお願いします。

205:191
11/06/16 17:46:29.41
>>200
ああやっぱこれっすね
あり^^

206:132人目の素数さん
11/06/16 20:45:03.79
すいません誰か教えてください


      肺炎患者    インフルエンザ      
A地区    3人       1人
B地区    8人       5人
C地区    6人       1人
D地区   12人       4人
E地区    7人       3人
F地区   10人       4人


この時地区によってインフルエンザの割合に偏りがあるかどうか
確認するにはどうしたらいいですか? 

207:191
11/06/16 20:56:11.80
ああ というか 幾何分布ですね

208:132人目の素数さん
11/06/17 01:22:42.49
>>206
偏りはないと思われ。

209:132人目の素数さん
11/06/17 05:43:57.27
>>206
各地区の人口データを入手しろ。話はそれからだ。

210:206
11/06/17 18:33:04.88
これだけじゃ無理ですかね・・・
もうちょっとデータ集めて考えてみます
ありがとうございます


211:132人目の素数さん
11/06/21 10:01:54.00
ロジットモデルとロジスティック回帰モデルの違いを教えて下さい。

212:132人目の素数さん
11/06/21 12:04:36.79
>>211
本質的には一緒。
関数の特定化の違い。

213:132人目の素数さん
11/06/23 21:34:28.01
教えて下さい、お願いします

ある化学工場において、製品の収率(%)に影響を及ぼすと考えられる反応温度と
原料を因子として取り上げ、二元配置の実験を行つた。実験結果について解析せよ。
(収率は高い(数字が大きい)ほどよい)

         A1(40°) A2(45°) A3(50°) A4(55°)
Bl(精製品)    98.0      99.0    98.6     97.6
B2(普通品)    97.7      98.0    98.2     97.3
33(粗製品)    96.5      97.9    96.9     96.7

①構造模型に基づいて分解せよ(一般平均=総平均と仮定する)
②分散分析表を作成せよ
③Aの母平均の点推定値及び95%信頼限界を求めよ
④Bの母平均の点推定値及び95%信頼限界を求めよ

実験計画法によって道母数を推測するんだと思うんですかが表の書き方等が
いまいちよく分かりません……

214:132人目の素数さん
11/06/24 01:06:35.40
表の書き方って教科書の例題にでも載ってるだろ…。

215:132人目の素数さん
11/06/24 15:59:48.11
x、Mをそれぞれ相関のある確率変数ベクトル、対称行列とします。
このとき、2次形式x'M^{-1}xの期待値を計算したいのですが、
この期待値はどういう仮定の下で存在すると言えるでしょうか?
問題は逆行列が含まれているので、そこをどうすればいいのかわかりません。
よろしくお願いします。

216:132人目の素数さん
11/06/24 16:03:28.95
多変量正規分布の指数部分だよね

217:132人目の素数さん
11/06/24 16:49:21.93
215の補足です。
対称行列Mも確率変数です。

218:132人目の素数さん
11/06/24 17:04:12.44
Mが正定値とかいうことが知りたい?
質問がよくわからん

219:132人目の素数さん
11/06/24 21:58:42.78


220:132人目の素数さん
11/06/25 01:46:49.67
条件って「確率1でMが正定値である」でいいんでないか?


221:132人目の素数さん
11/06/25 05:23:53.35
>>218
説明不足ですみません。
E(x'M^{-1}x)が存在するための条件を知りたいということです。

別の例で言うと、相関のある確率変数XとYの比X/Yの期待値E(X/Y)を
計算したいのですが、そもそもこの期待値が存在するための条件は何か?
ということです。例えばXとYが独立で標準正規分布ならX/Yはコーシー分布
になりますが、期待値は存在しません。X/Yの期待値が存在するための条件を
知りたいということです。

222:132人目の素数さん
11/06/25 06:07:43.80
22222222222222222222222222222222222222222222222222222222222222222222
22222222222222222222222222222222222222222222222222222222222222222222
22222222222222222222222222222222222222222222222222222222222222222222
22222222222222222222222222222222222222222222222222222222222222222222
22222222222222222222222222222222222222222222222222222222222222222222
22222222222222222222222222222222222222222222222222222222222222222222
22222222222222222222222222222222222222222222222222222222222222222222
22222222222222222222222222222222222222222222222222222222222222222222

223:132人目の素数さん
11/06/25 21:18:37.33
不偏分散はなぜn-1で割るのか理解しようとして、このページを見ていたんですが
URLリンク(home.a02.itscom.net)

標本平均からの偏差平方和 = 真の平均からの偏差平方和 - 標本平均の分散*n

なので、1/nして分散にしようとすると、標本分散=真の分散-真の分散/n になるので
標本分散ではなく、標本分散*(n-1/n) = 標本平均からの偏差平方和/n-1

であることはわかりました。

ただこのWebページの説明の情報量という考え方については

Σ情報量 = Σ平均の情報量 + Σ偏差平方   は成立するけど

情報量 = 平均の情報量 +偏差平方 は成立しませんよね

この赤線ACで示す「実際に観測される測定値」って何のことなんでしょうか?
標本1つ1つの値を2乗して総和したものを√した辺の長さ(効果)って何か意味のある数値なんでしょうか?

224:132人目の素数さん
11/06/25 21:30:25.19
赤線ACw
誤字脱字ないか?

225:132人目の素数さん
11/06/25 21:43:44.32
赤い線分ACでいいですか

226: 忍法帖【Lv=12,xxxPT】
11/06/28 22:42:19.72
新しくできた飲食店に初めて入っておいしくなかったとき
サンプリング数N=1では判断できないと思ってもう一回入るんだが
ほとんどの場合やはりおいしくないという事象は統計的にどう説明できるのですか


227:132人目の素数さん
11/06/28 22:47:03.63
味のばらつきが小さいからN=1でも十分なんじゃない?

228: 忍法帖【Lv=12,xxxPT】
11/06/29 00:23:56.98
逆に女心はバラツキが大きいから試行回数を増やすことには意味がある

229:132人目の素数さん
11/06/29 08:07:13.73
>>226
それ、考え方が間違ってる。

製品を検査してみたら壊れてた。
いま検査した製品を、もう一度検査してもやっぱり壊れてる。

これは当たり前。
確認が終わったものについては、すでに統計的推測は関係ない。

ある大学の平均身長を知りたいから、サンプルを10調べる。数が少ないので、20にしてみる。これは意味がある。

でも、ある人の身長を測ったら、その人については終わりだよね。

230:132人目の素数さん
11/06/29 11:32:22.74
>>229
飲食店は、通常、複数の料理を扱うと思うが。
あるレストランでは、オムライスがまずかった。
次回に同じレストランに行って、ミートスパゲティをオーダーすると、
まずいだろうか、うまいだろうかという話かもしれない。

また、曜日によって調理するアルバイトが異なり、アルバイトの調理能力に
差がある場合もあるだろう。

さらに言えば、ある料理を1品食べたとしても、次に出される1品は、
同じ料理としても、同じ味とは限らない。

231:132人目の素数さん
11/06/29 17:15:35.74
X,Y,Zの3つの値があったとき、Yが100になるように標準化するとは、どういった手順を踏めばよいのでしょうか?

232:132人目の素数さん
11/06/29 17:30:49.10
そんなムツカシイ問題に回答できませんわ

233:132人目の素数さん
11/06/29 19:46:50.28
>>231
簡単なのは、Yで割って100倍。

234:132人目の素数さん
11/06/30 01:22:37.65
>>230
そうだよね。この問題は色々考えられるよね。

ある料理に限定した場合、個人的経験からすると別の日に行ったらおいしく
感じたという経験はない。やはりばらつきは小さいのかな?
でもおいしさは個人差が大きいようでそれをおいしいという人もいる。
味の数量化は無理なのか…。

235:132人目の素数さん
11/06/30 05:05:35.86
パターン認識の話になると思うのですが、
特徴量選択でSFS、SBS、SFFSについてご存知の方いらっしゃらないでしょうか?
これらのアルゴリズムについて簡単に説明してほしいのですが、、、

236:132人目の素数さん
11/06/30 06:45:09.30
>>235
機械学習スレへどうぞ。

【統計分析】機械学習・データマイニング【集合知】
スレリンク(tech板:371番)

237: 忍法帖【Lv=13,xxxPT】
11/06/30 21:21:50.35
女性の男性に対する感情も第一印象で決まるN=1の世界

238:132人目の素数さん
11/06/30 22:39:14.40
世の中に本当に正規分布しているものなど絶対存在しないから

239:132人目の素数さん
11/06/30 22:44:46.81
確率統計には絶対はないから。
数学的に0%でも絶対にないかと聞けばあると答えるのが数学者。

240:132人目の素数さん
11/07/01 03:45:57.41
今、統計学で流行ってるのってなんだろ?

241:132人目の素数さん
11/07/01 17:16:17.06
FXシステムトレーディングじゃねえの

242:132人目の素数さん
11/07/02 10:42:09.63
すみませんが、考えてもどうにも分からないので教えてください

 
    我が校の自宅外学生のうち無作為抽出により30人にアンケート調査したところ,家賃の平均は50000円,標本標準偏差は10000円であった.
この標本平均による,我が校の自宅外学生家賃平均の95%信頼区間,および99%信頼区間を求めよ.(これは求まりました)
    ただし,我が校の自宅外学生の家賃は正規分布にしたがっているものとする.
    上記のアンケートを,本統計学受講者の自宅外学生に対しておこなったとする.このとき,標本抽出に関する問題点を述べよ

問題点が分からないのです。

243:132人目の素数さん
11/07/02 16:46:06.51
統計学受講者の家賃の分布をみるのが目的なら
妥当なサンプリング数とれば問題ないんじゃねえの

244:132人目の素数さん
11/07/02 16:46:07.13
無作為抽出ではない。

245:132人目の素数さん
11/07/02 19:06:32.52
>>243
母集団を変えるということね。

>>244
「統計学受講者の自宅外学生」の家賃は、
正規分布かどうかはわからないってことね。


246:132人目の素数さん
11/07/02 19:48:58.36
というか、前期の宿題かもしれないんだから、少しは放っておけ。

247:132人目の素数さん
11/07/02 20:03:55.60
宿題かもしれないけど、
このスレなかなか伸びないから。

何か書きたくなるわけ。
>>246さんがいろんなこと書いてくれ。


248:132人目の素数さん
11/07/03 09:20:08.35
確かに正規分布してるものなど存在しないが
統計学は正規分布してると思い込まないと成り立たない

249:132人目の素数さん
11/07/03 12:25:12.13
>>248
ん?

中心極限定理を誤解してないか。

250:132人目の素数さん
11/07/03 12:29:50.66
余計なお世話かもしれないけど、
正規分布している
という表現止めた方がいいよ。
正規分布に従っている
の方がいいよ。

先日、frpのメーリングリストでも標本数という言葉が問題になったけど、
言葉は正しく使おうよ。

帰無仮説を採択する
という表現のある教科書を排除しようと、図書館でうろついていたら、
あまりにも該当する本が多くて、頭が痛くなってきた。

251:132人目の素数さん
11/07/03 12:58:10.15
>>248
正規分布表なめんな

252:132人目の素数さん
11/07/04 16:15:44.16
>>242
その先生は統計学取ってる学生はビンボーだと思ってるんじゃないの。
断固抗議すべき

253:132人目の素数さん
11/07/04 18:57:00.67
統計学受講者

そんなの全数調査しろよって言ってやれ

254:132人目の素数さん
11/07/04 22:57:16.30
統計学の問題がわかりません。(確率密度関数、期待値など・・)

全くわからないんで教えてください。
あるバス亭での発車時刻は毎時5分、15分、35分、50分となっている
このバス亭に発車時刻を知らずにきた人が発車まで待つ時間をX分とする

(a)Xの確率密度変数を求めよ
(b)Xが10以上となる確率を求めよ
(c)Xの期待値を求めよ。。

おねがいいたします。。

255:132人目の素数さん
11/07/05 08:29:05.22
>>254
教科書に書いてある、確率密度関数と期待値の定義を書いてください。
で、どこがわからないか聞いてください。

256:132人目の素数さん
11/07/05 19:40:00.31
誰か授業の問題演習の答え教えてください 手も足も出ません 謝礼払います
詳しくはtedted_002@mail.goo.ne.jpまで 捨アドです


257:132人目の素数さん
11/07/05 19:49:39.94
昭和3年1月関東州大連市生まれ。
昭和28年3月京都大学理学部植物学科卒業。
昭和32年9月大阪市立大学理工学部助手。

258:132人目の素数さん
11/07/05 19:57:59.30
あげとくわw

259:猫は卑屈 ◆MuKUnGPXAY
11/07/05 20:40:40.52
南部陽一郎先生、西島和彦先生や梅棹忠夫先生に嫉妬した当代きっての
馬鹿男ですね。もし嫉妬スルにしても相手が完全に違うと思いますけど。

まあお気の毒な事で。




260:132人目の素数さん
11/07/05 20:47:44.70
増田芳雄さんは世界的な植物学者ですよ
そんなことも知らないのか

261:猫はオッサン ◆MuKUnGPXAY
11/07/05 21:08:53.48
>>260
そんなツマラナイ事は私は知りませんね。でも『もし世界的』というの
であれば客観的に認められる証拠を提出して下さいまし。何も知らない
ド素人が騙されて貴方の主張を鵜呑みにしたらとても困りますから。




262:猫はオッサン ◆MuKUnGPXAY
11/07/05 21:15:15.90
>>260
そもそもその人はどんな研究で業績を挙げた人なのでしょうか? 貴方
が『世界的である』という主張をスルのであれば、ソコは貴方がきちん
と責任を持って説明をしなければなりません。

お返事をお待ちします。




263:132人目の素数さん
11/07/05 21:23:42.15
君に質問権はないよ

264:猫はオッサン ◆MuKUnGPXAY
11/07/05 21:27:46.23
>>263
では今後は私は貴方に対して徹底的に喰い下がり、執拗に追跡を行います。
なお>>260に記述がアル主張を私が認める事は絶対にアリマセン。




265:猫はオッサン ◆MuKUnGPXAY
11/07/05 21:31:23.28
>>263
『何故私には質問権がないのか』を論理的に説明願います。お返事をお待
ちします。




266:東大生
11/07/06 07:57:14.12
昭和3年1月関東州大連市生まれ。
昭和28年3月京都大学理学部植物学科卒業。
昭和32年9月大阪市立大学理工学部助手。

この経歴の偉大な生物学者は誰ですか?

267:猫は虚偽院生を叩く ◆MuKUnGPXAY
11/07/06 11:09:02.78
>>266
東大生サン、

現代数学の重要性とその展望に関する談話を迅速にお願いします。貴方
のその『豊富な知識と深い理解』が行かされる瞬間ですから、我々下々
に希望の光を貴方の知性で与えて下さいまし。




268:猫は虚偽院生を叩く ◆MuKUnGPXAY
11/07/06 11:10:40.57
>>266
経歴は偉大でも頭はカラッポ、知性は皆無。井の中の蛙。




269:132人目の素数さん
11/07/06 12:53:58.45
>>266
ん、25歳で大学卒業?
芳雄さんは浪人とか留年してたの?

270:猫は虚偽院生を叩く ◆MuKUnGPXAY
11/07/06 13:24:55.91
>>269
芳雄サンって誰や?




271:132人目の素数さん
11/07/06 13:31:21.43
>>269
京都大学が昭和24年から新制大学になったのを機会に進学したのでは?
戦争からまもない昭和21~22年は進学できる状況でなくても不思議はないし
昭和23年に進学した人は学制改革で放り出されて新制大学再受験が必要でした。

学制改革
URLリンク(ja.wikipedia.org)

272:132人目の素数さん
11/07/06 13:37:01.04
へぇ、芳雄っちは苦労したんやな~

273:猫は虚偽院生を叩く ◆MuKUnGPXAY
11/07/06 13:41:39.00
幾ら苦労しても能力が無ければ馬鹿のまま。そういう人が息子の教育を
スルのは誤り。そもそも「ああいう不見識」は子供を持つべきではない。




274:132人目の素数さん
11/07/06 13:45:00.37
芳雄っちは京大卒業かすごいなぁ
息子は阪大らしいが…

275:猫は虚偽院生を叩く ◆MuKUnGPXAY
11/07/06 14:11:13.86
ハハハ、京大は凄いんですか。ほんで阪大は何なんですかね~




276:132人目の素数さん
11/07/06 14:14:55.12
京大>阪大だから、芳雄さんのほうが優れていますね

277:猫は虚偽院生を叩く ◆MuKUnGPXAY
11/07/06 14:18:16.16
>>276
その芳雄サンって誰や? アホの見本かァ?




278:132人目の素数さん
11/07/06 14:20:12.81
>>277
君に質問権はないよ

279:猫は虚偽院生を叩く ◆MuKUnGPXAY
11/07/06 14:43:13.55
>>276
その芳雄サンっちゅうんは誰や? 馬鹿の見本かァ?




280:132人目の素数さん
11/07/06 14:45:56.69
>>279
人類史上例をみない天才かつ努力家の見本だよ

281:猫は虚偽院生を叩く ◆MuKUnGPXAY
11/07/06 16:33:58.04
>>280
そうですか。何十年にも亘って身内からの攻撃に耐えて生き長らえた、
という様な事なんですかね。まあ頭が極端に悪くても、でも馬鹿な努力
だけは出来た、という様な事ですかね。猪突猛進の阿呆。




282:東大生
11/07/06 18:35:54.34
だからその努力家の息子は痴漢ということでいいんですね?

283:猫は虚偽院生を叩く ◆MuKUnGPXAY
11/07/06 18:44:22.21
>>282
東大生サン、

現代数学の重要性とその展望に関する有難いお話しを賜わりたく存じます。
その溢れんばかりの知性と教養に裏打ちされた『豊富な知識と深い理解』
を是非ともこの場でご披露なさって下さいませ。

お返事をお待ち申し上げまする。




284:猫は虚偽院生を叩く ◆MuKUnGPXAY
11/07/06 19:02:27.56
>>282
東大生サン、

スマートでカッコイイお返事をお待ち申し上げます。是非とも頭がキレ
る所をこの場で我々下々にお見せ下さいませ。




285:132人目の素数さん
11/07/06 20:38:20.54
なんで学部学生に粘着しているのか?
学部生に現代数学なぞ触れた事もないだろ?

286:132人目の素数さん
11/07/07 23:51:10.60
>>276
昨夜のNHK「ためしてガッテン」に、狩野裕阪大教授が登場しておりましたね。
広告で見かける「お客様満足度98%」等の統計のトリックを解説していました。
いわく「サンプルの偏り」に要注意と。
応用統計学に関しては、京大<<阪大じゃないのかな?
ためしてガッテン 数字トリック見破り術 ゲスト:狩野裕阪大教授
URLリンク(www9.nhk.or.jp)

287:132人目の素数さん
11/07/08 00:26:13.20
>>286
まてまて。
当たり前の内容をテレビで話しただけで大学に差をつける根拠にしちゃだめでしょ。

288:132人目の素数さん
11/07/08 00:46:39.33
サンプルはためしてガッテンだけですが何か。

289:132人目の素数さん
11/07/08 01:07:40.48
>>288
そのサンプルは適切なのかね?

290:132人目の素数さん
11/07/09 15:26:33.82
文系の学部の数理統計の練習問題がとけなくてこまってます 3万円払うので
誰か教えてください 詳しくはtedted_002@mail.goo.ne.jp

291:132人目の素数さん
11/07/19 22:17:27.68
統計学できる人、誰か居る?

292:132人目の素数さん
11/07/19 22:39:09.94
なんかよう?

293:132人目の素数さん
11/07/19 23:50:42.12
>>286
狩野裕教授の学科が、統計学の助教を公募中のようですね。
==大阪大学 大学院基礎工学研究科 助教公募(統計学)のお知らせ==
1. 公募人員: 助教1名
2. 勤務形態: 常勤 任期なし
3. 所  属: 大阪大学 大学院基礎工学研究科・システム創成専攻・数理科学領域・
          統計数理講座(基礎工学部 情報科学科 数理科学コースを兼担)
4. 研究分野: 統計科学・数理統計学
5. 希望する人材: 熱意をもって教育・研究にあたり,統計数理・数理科学の発展に
            貢献して下さる方を求めます.数学・統計学の演習科目と計算機を
            使った実習科目等を担当して頂きます.
6. 応募資格: 博士の学位を有する方,または研究上の業績がこれと同等以上と認められる方
7. 着任時期: 平成23年10月1日以降のなるべく早い時期
9. 応募締切: 平成23年8月18日(木)必着
URLリンク(www.es.osaka-u.ac.jp)

294:132人目の素数さん
11/07/20 00:32:46.10
>>213
>④Bの母平均の点推定値及び95%信頼限界を・・・・・
この例題って、以下の2点が訝しいんだが。
A因子を4水準も採っているが、普通は3水準で十分だろ?
A,B各因子の母平均の推定値を求めよ...とあるが、求めるべきは、
特性値(収率)を最適値にする因子組合わせでの収率の点推定と区間推定値だろ?
この配置実験計画法例題は、何という科目で出題された問題なの?

295:132人目の素数さん
11/07/20 02:19:23.82
>>292
すまん解決した。。。

296:132人目の素数さん
11/07/25 12:51:46.80
統計ソフト、JMP 8使ってるんですが、Mac のOSをLionにアップしていいものか
分かる人いたら教えてください。

297:132人目の素数さん
11/07/25 13:19:23.53
統計ソフト、JMP 8使ってるんですが、Mac のOSをLionにアップしていいものか
分かる人いたら教えてください。

298:132人目の素数さん
11/07/25 13:19:35.43
マイナーなOSだから、開発元に問い合わせたほうがいい。

299:132人目の素数さん
11/07/25 15:11:09.60
>298
296/297です。(すみません、ダブルで書き込んでました)
開発元は、JMP9しかサポートしてなくてJMP8はサポート外だとバッサリ切られました。
もし情報お持ちの方がいたら教えてください。

300:132人目の素数さん
11/07/25 15:11:37.55
>298
296/297です。(すみません、ダブルで書き込んでました)
開発元は、JMP9しかサポートしてなくてJMP8はサポート外だとバッサリ切られました。
もし情報お持ちの方がいたら教えてください。

301:132人目の素数さん
11/07/25 15:12:52.74
JMP 9を購入するか、Rをインストールしろよ

302:132人目の素数さん
11/07/25 16:10:33.64
>301
自分のPCであればすぐにJMP9にするのですが、PC自体がラボの所有なのですぐには出来ないのです。


303:132人目の素数さん
11/07/25 17:32:58.91
>>302
ラボのMacなら勝手にLionにしたらダメだろ

304:132人目の素数さん
11/07/25 17:59:49.07
>303
すみませんが、僕の質問とは論点がずれています。

どなたかOSX Lion + JMP 8 の動作確認していたら教えてください。

305:132人目の素数さん
11/07/25 23:45:43.59
>>304
MACの会議室に移動した方が早いと思うよ。

URLリンク(hibari.2ch.net)

306:132人目の素数さん
11/07/26 13:27:58.02
>>304
動くよ。


307:132人目の素数さん
11/07/26 18:54:47.30
マカーってほんと馬鹿だな。

308:132人目の素数さん
11/07/26 23:48:42.61
悪いのはマカーじゃなくてMACなんだよ。
みんな騙されてるだけなんだ。
目を覚ましなよ!

309:132人目の素数さん
11/07/27 05:18:35.80
MACで統計学とか統計学を馬鹿にしてるとしか思えない。

310:132人目の素数さん
11/07/27 10:03:01.77
内挿(interpolate)と外挿(extrapolate)の違いって何ですか?

311:132人目の素数さん
11/07/27 10:05:32.04
補間と補外のとか?

312:132人目の素数さん
11/07/27 11:08:46.17
>>309
SASのJohn Sallに同じこと言ってみろ!

313:蛙-かわづ- ◆NxYIfSaetA
11/07/29 14:45:25.73
あんでぃ、早く。

314:132人目の素数さん
11/07/31 08:43:20.56
1000頭の牛がいたとして汚染牛が混じってないかチェックするには何頭検査すればいいの?


315:132人目の素数さん
11/07/31 08:59:39.82
>>314
確率(どれくらい間違ってもいいか)を何%以下にしたいかで変わってくる
けど、ゼロにしたかったら全部調べるしかないよ。

抜き取り検査だと、検査した個体に汚染された牛がいても残りにはいない
可能性があるし、逆に検査した個体に汚染された牛がいなくても残りには
いる可能性がある。

この場合の確実な方法(絶対に流通する牛に汚染されたものがいない方法)
は、出荷しようと思う個体を全て調べて、汚染されていない個体を出荷する
こと。

316:132人目の素数さん
11/07/31 11:16:26.73
>>315
統計学的にはそうだけど、実践的には、「検査は100%正しく結果を出す」という前提が間違いだから、
検査の感度と特異度を考慮しなくてはならない。

317:132人目の素数さん
11/07/31 17:38:51.38
統計学でも検査のすり抜けはもちろん考えるよ。
ただがん検診とかと違って放射性物質汚染の方が
確度は高いだろう。そもそも315は全頭検査と言っているのだから
がん検診のように2回以上検査しろっていうのか?

318:132人目の素数さん
11/07/31 19:10:54.46
図書館のPCの利用率が
①8:00~9:30 79%
②9:30~11:00 81%
③11:00~12:30 84%
④12:30~2:00 63%
⑤2:00~3:30 78%
のとき④の時間帯は利用率が低い・有意差があるというには何検定を使うのが妥当ですか?
実際には①~⑤に分かれているのではなく、15分刻みの16個に分かれているのですが・・・



319:132人目の素数さん
11/08/02 11:53:30.79
全利用者とサンプルはそれぞれ何人くらいいるんだ?
全数調査か?

320:132人目の素数さん
11/08/02 13:19:15.44
利用者じゃなくてPCの台数ベースの全数調査じゃないの

321:132人目の素数さん
11/08/02 19:36:58.24
比率の差の検定で多重比較の検定はありますでしょうか。

成功か失敗かの実験で、n=30で、
条件A 成功率80%、条件B 成功率70%、条件C 成功率50% で
α=0.05で多重比較を行いたいのです。

322:132人目の素数さん
11/08/03 01:15:45.18
>>317
なるほど利用率てのはPCの稼働率のことなのか

323:132人目の素数さん
11/08/03 09:58:59.92
>>321
特に比率と考える必要もないと思います

324:132人目の素数さん
11/08/03 13:21:37.00
>>318
PCの台数はわからないの?


325:132人目の素数さん
11/08/03 17:15:04.05
PCの台数は書かれてないけど、%出してるわけだから時間帯毎に全何台中
何台稼働ってデータがあるわけでしょ。要するに検定の必要なし。

326:132人目の素数さん
11/08/04 15:56:01.73
>>305
紹介されたmac板 URLリンク(hibari.2ch.net)にJMPスレなんぞ、見あたらないぞ。
そもそもまともな統計家は、Macなんぞ使わないのでは?

327:132人目の素数さん
11/08/04 18:53:05.65
>>326
JMPってわざわざMac向けに開発されたパッケージ。

328:132人目の素数さん
11/08/04 19:10:35.68
どおりで旧バージョンのサポートをあっさり捨てるんだな。
アップルと同じだな。

329:132人目の素数さん
11/08/04 19:17:58.83
>>328
ただし現在のユーザー人口は圧倒的にWindowsってSASの人がセミナーで言ってた。

330:132人目の素数さん
11/08/04 19:36:30.39
Adobeと同じだな。

331:132人目の素数さん
11/08/05 07:12:44.95
>>326
JMPの専用のスレがあるってことじゃなくて、MAC使いが少ない
ここで聞くよりもMAC使いに聞いた方が早いんじゃないかってこと。

332:132人目の素数さん
11/08/05 11:23:12.13
>>327
そうかあ、JMPってマウス機能なんかが他のWindows用ビジネスアプリとは毛色が
違うなと感じていたんだが、元々はExcel同様にMAC用に開発されたアプリだった
のか。出生地がMAC環境だったんだね。

333:132人目の素数さん
11/08/05 21:07:35.70
SPSSもSASもツイッターやってんだな

URLリンク(twitter.com)
URLリンク(twitter.com)

334:132人目の素数さん
11/08/06 02:43:08.18
わかる人教えてください

Aという細胞郡とBという細胞郡を用意します。

それに対して薬品CとDで処理をしてある値を3回ずつ計測します。

つまり AC1 AC2 AC3 BC1 BC2 BC3 
    AD1 AD2 AD3 BD1 BD2 BD3 

という実験結果をえます。

それぞれ3回ずつの値の平均 μAC=(AC1+AC2+AC3)/3 として

平均のRatio RA=μAC/μAD     RB=μBC/μBD と定義します。

この平均の比率 RAとRBについて優位差検定をしたいのですが、そのような検定方法はございますでしょうか?

教えてください。

335:334
11/08/06 05:41:55.83
補足

薬品CとDは濃度が違うだけで同じ薬品です。

なので比を取っています。

336:132人目の素数さん
11/08/06 13:59:09.69
>>334
「フィッシャーの正確確率検定」
でググってみてください。



337:132人目の素数さん
11/08/06 21:04:36.39
>>332
JMPといえば、慶應大の公認データ解析ソフトですね。SPSS>>333より、有能なの?
URLリンク(www.dsci.sfc.keio.ac.jp)

338:132人目の素数さん
11/08/06 23:00:46.81
マウスを多用する解析が好ましいと感じる人がいるようだ。
MAC好きと同じだな。

339:132人目の素数さん
11/08/07 00:56:23.84
MAC好きって馬鹿が多いよね。
なぜだろう?


340:132人目の素数さん
11/08/07 01:15:09.39
米農家を侮辱した東海テレビにあの方がお怒りのようです

URLリンク(www.youtube.com)

341:132人目の素数さん
11/08/09 17:38:47.29
>>339
自分の周囲を見てると分からないでもないが、p=0.1くらいの主張だな。

342:132人目の素数さん
11/08/10 21:57:18.84
>>334
何か難しいこと考えるんだね
自分なら、細胞の種類(ダミー)と薬品の濃度、その交互作用を独立変数にして
「ある値」を従属変数にして回帰分析。
交互作用が有意なら細胞によって薬品に対する反応が異なる、つまり、あなたの言葉で言うRAとRBに差がある。
有意でないのなら差はない。
といくかな。
交互作用が「比」に相当するとしてよいように思うけど。

343:132人目の素数さん
11/08/13 22:15:03.93
カイ2乗検定で

帰無仮説H0:~と~は独立だ
対立仮説H1:~と~は独立でない

としてH0を棄却して独立でないことを示す例が多いけど、

逆はできないんだよね?
つまり独立でないことを帰無仮説として、
カイ2乗統計量が小さいことを根拠に帰無仮説を棄却し、
独立であることを示すってことは無理だよね?


344:132人目の素数さん
11/08/15 10:26:41.77
独立でない、と仮定したときの貝2錠推計量をどうやって計算するつもりなんだ??

345:132人目の素数さん
11/08/15 14:28:39.87
こういうことじゃないの。

URLリンク(aoki2.si.gunma-u.ac.jp)
の1.1の最後の方にある
もう一つ付け加えておく。比率の差をχ2 分布を用いて検定するときに,左側の例えば 0.05% は何を意味するであろうか。
それは,「偶然とは思えないほど差がない」ということである。これは比率の差の検定ではあまり取り上げられないが,
適合度の検定(これも比率の差の検定としても解釈できる)の場合には「データがねつ造された可能性」を示唆するものとして
取り上げられることがある。すなわち,χ2 分布の左側は「理論に一致しすぎる」,右側は「理論と乖離しすぎる」ということである。
中庸がもっともあり得るという立場から検定すれば,「χ2 検定の場合にも両側検定はあり得る」。
(適当に改行)



346:132人目の素数さん
11/08/15 15:11:19.49
>>345
>中庸がもっともあり得るという立場から検定すれば,「χ2 検定の場合にも
>両側検定はあり得る」

って一般的な考え方かな?

347:132人目の素数さん
11/08/15 17:34:26.01
>>339,>>341
私の周りでもそうだから、
P=0.9になってしまうね。
反論はないのかな?


348:132人目の素数さん
11/08/15 19:34:02.90
>>347
私の周りでもそうだからp値が小さくなるって言わなきゃいけないんじゃないの


349:132人目の素数さん
11/08/15 20:04:14.93
>>346
一般的じゃない。
対立仮説として「データ捏造」をさらに加えた時の話だよね。
どんな検定基準を作っても、捏造者はそれをクリアーしてくる。
なので「データ捏造」は統計学の枠には入らない

350:132人目の素数さん
11/08/17 19:47:15.88
基準を知られたら何でも無理なのは確か。
ただ過去の捏造話では簡単に見破れるほどひどいのが多いけどね。
(見破られていない完全犯罪的な捏造があるのかもしれんが)

351:132人目の素数さん
11/08/23 23:23:46.04
ついでにχ^2検定について1つ質問

m*nの分割表の自由度は(m-1)(n-1)で計算になるというのは分かるのだけど、
7*2の表と4*3の表の自由度が6となって
推計量が同じ分布に従うことが納得いかない。
分かりやすい説明ない?



352:132人目の素数さん
11/08/24 00:19:25.41
計算は理解しているのになぜ納得いかないかが分からない。

353:132人目の素数さん
11/08/24 13:44:37.19
>自由度は(m-1)(n-1)で計算になるというのは
>  「 分 か る 」 
>のだけど

 
   ↓


>7*2の表と4*3の表の自由度が6となって 同じが 納得いかない。


本当に 分かっているとは 思えない。
つまらん見栄、はるなよ。

354:132人目の素数さん
11/08/24 18:54:14.87
自由度の「式は知ってる」と言いたかったんだろう。意味じゃなくてね

355:132人目の素数さん
11/08/24 22:58:06.11
SBICが資料によっていろいろ違ってるような気がする

356:132人目の素数さん
11/08/24 23:08:12.92
>>352->>354
そうです。
計算式は知ってるけど意味が分かりません

357:132人目の素数さん
11/08/25 00:49:17.27
分割表は周辺固定。なんで1引くのか考えてみてよ。

358:132人目の素数さん
11/08/25 06:43:36.03
ヒント:以下の2×2分割表の(1)(2)(3)欄を x の式で表しなさい。
             計
    x    (1)   10
    (2)   (3)   40
計  20   30   50

359:132人目の素数さん
11/08/25 17:59:49.85
知っている人がいたら教えて欲しいのですが
シェッフェの一対比較法で
-2から2の5点系や-3から3の7点系は見るんですが
-1から1の3点系ってあるんですか?

360:132人目の素数さん
11/08/25 23:22:58.14
>>358
だから、計算は知ってるんだって。

361:132人目の素数さん
11/08/25 23:37:28.87
>>360
だから、>>358をみると、2×2の場合には1個情報が与えられてしまえば
他の情報は決定されてしまう。つまり自由に決めれる自由度が1個。

その考え方を、>>351の7×2と4×3にも当てはめて見れば、自由になる数
の個数はどうなる?

362:132人目の素数さん
11/08/25 23:39:56.81
>>361
その自由になる個数の数ってのは分かってるよ。
計算式の途中で7*2は14項、4*3は12項出てくるじゃん。
それが各項が独立ではないから自由度6のカイ2乗分布に従うんだろうってことは分かるけど、
直感的に違和感を感じるから詳しい人に説明してもらいたいんだよ。


363:132人目の素数さん
11/08/26 13:21:18.15

こんなことで、直感的に違和感を感じる人には
 統計学は無理じゃないかな。。。
 
 普通、直感的に理解できることなので…
 

 

364:132人目の素数さん
11/08/26 21:13:14.73
具体的に数式を変形して
(~)^2 + (~)^2 + (~)^2 + (~)^2 + (~)^2 + (~)^2
の形に変型して見せてよ。

違和感感じてるの項数だけなんだから。

あと、学問として統計学をやっていこうという気はないです。
ただのツールなので。

365:132人目の素数さん
11/08/26 22:52:34.40
>>364
ただのツールなら、それこそ気にしなくていいよ。

それに、ただのツールと言う人のために時間を割いて書き込みしても無駄でしょう。

366:132人目の素数さん
11/08/26 23:01:45.70
信用して使えるものなのか気になる

367:132人目の素数さん
11/08/27 00:07:00.15
>>366
そういう点が気になるなら、「学問」として自分で勉強しましょうね。

368:132人目の素数さん
11/08/27 00:10:12.47
2*2の場合、とてもきれいな公式があったので、
それより大きな表の場合を知りたかったのですけどね。
私の計算力では無理でした。
残念です。



369:132人目の素数さん
11/08/27 09:17:42.05
JUMPかRで、三群以上の実験データについて比率の差の検定の
多重測定はできますでしょうか

370:132人目の素数さん
11/08/27 09:19:37.91
できます。


371:132人目の素数さん
11/08/27 11:24:16.89
>>368

>>368>>351かな?
最初から、
「2*2で自由度についてこういう展開式があってわかりやすいんだけど、
3*4とか7*2みたいな場合はどうなるのかわかるひといるかな。
私の計算力では無理だった」
と書けば答えてくれた人もいると思う。

質問の仕方と受け答えを間違ったね。


次ページ
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch