13/12/28 00:23:03.44
>>411
ガンマ関数やゼータ関数を用いて説明しなくちゃならないってことになったら、
大半の読み手のことを考えたら、理論的背景を敬遠するんじゃないかな。
425:132人目の素数さん
13/12/28 01:46:30.47
>>422
いや、p値じゃなく検出力
確かに、有意水準を複数記載されるより、p値を書いてもらったほうがありがたい。
けど、検定で最も大事なのは第一種の過誤と第二種の過誤がどのくらいの確率で起こるかを知ることだから、検出力の記載は必要かと。
426:132人目の素数さん
13/12/28 02:29:41.82
>>424さま
411ではありませんが,ガンマやゼータ使って議論出来るんですね
それは面白い,いずれ暇ができたら勉強します.
やっぱり本だけではなく,論文読んだり,その筋の人達と
しゃべらないと分かんないですよね.
427:132人目の素数さん
13/12/28 10:03:35.38
>>423
t分布が完全に経験則ってこと?そんなわけないだろ
そう勘違いする人が居るってこと自体、巷に出回ってる統計の参考書は不十分ってことだよ
428:132人目の素数さん
13/12/28 15:04:30.55
統計数理研究所の広大出身の河村敏彦助教ってのは、
書いている本が全く意味不明だし、
馬鹿のくせに自分の業績自慢ばかりしてる。
気に入らないとずっと怒鳴ってるし、
まったくキチガイとしかいいようがない。
なぜ河村敏彦のようなキチガイが
助教になれたんだ?
コネしか考えられないんだが、将来的には
河村敏彦のキチガイ野郎がコネで大学教授とかに
なるのか?
信じられん!
429:132人目の素数さん
13/12/28 15:09:02.09
なんとかして誰かを傷つけてやりたい、ってアンチの書き込みは、それが強すぎて
逆効果になってることってあるよね。
430:132人目の素数さん
13/12/28 15:35:29.34
なんとかって助教が馬鹿かはわからんが、>>428は間違いなく馬鹿
431:132人目の素数さん
13/12/28 19:25:48.80
人を攻撃するくせに自分は『スレ上では』完全匿名というのも卑怯だよね
432:132人目の素数さん
13/12/29 00:03:38.23
あまり強い言葉を遣うなよ 弱く見えるぞ
433:132人目の素数さん
13/12/29 04:33:00.12
>>428
河村君の能力では助教以上のアカポスに就くのは不可能だろう
だから放っとけばいい
434:132人目の素数さん
13/12/29 04:41:57.52
ID非表示の板なら、日付変わらなくても工作活動が自由自在ね
435:132人目の素数さん
13/12/29 12:05:32.05
ここのサークルの統計本ってどうなの?
URLリンク(www.pixiv.net)
436:132人目の素数さん
13/12/29 13:34:54.83
河村君が2chばかりやっているといううわさが
本当だということは確かめられた
そんなヒマがあったらほんの少しでも勉強したほうがいい
それでなくても駅弁で頭も悪く、性格はすごく悪いと評判なのだから
437:132人目の素数さん
13/12/29 14:06:24.15
キチガイにストーキングされると大変だね
438:132人目の素数さん
13/12/29 15:31:27.03
河村敏彦助教がストーキングしてるのかね?
あいつならやりそうだ(笑
439:132人目の素数さん
13/12/30 11:35:01.74
あ、本当に河村が書かれてる
440:132人目の素数さん
14/01/02 05:54:57.73
441:132人目の素数さん
14/01/02 06:04:34.68
質問させてもらいます。
試行回数をn、的中率をp、回収率をk%とすると、
真の回収率=k × (p ± 2×平方根((1-p)×p/n) )/p
※1と2の真の回収率はいくつになるのでしょうか?お願いいたします。
※1 試行回数485 的中率5.8% 回収率181.3%
※2 485 11.5% 123.9%
442:132人目の素数さん
14/01/02 11:41:26.75
起こりにくい事象を毎日計測して曜日毎に平均回数を出してλ_sun, λ_mon, ・・・, λ_sat を作り、全て足し合わせたものをパラメータにポアソン分布を作ります
これは曜日なんて考えないで単純に毎日計測して平均回数を7倍したパラメータで作ったポアソン分布に一致しますか?
443:132人目の素数さん
14/01/03 07:52:01.90
質問があります。私は経済学部1年です。
1. 普通、回帰曲線は残差平方和を最小にする曲線だと思いますが、経済かその他の現象で、残差平方の加重平均か指数移動平均を最小にする曲線に意味があることはありますか?
2. よく個人投資家の株やfxで、現在価格とは違う、真の価値として単純移動平均や指数移動平均が出てきますが、これは有効ですか?
真の価値より低いときに買い、高いときに売るそうです。二項格子モデルでは無意味で、ブラック=ショールズモデルでは逆効果だと思うのですが。
時系列分析とか勉強してません。これからするつもりです。
444:132人目の素数さん
14/01/04 15:14:19.70
1.最小二乗法のことだと思うけど、その曲線に意味はない。
2.有効ではない。
とだけ、言っておこう。
証券の真の価値とかそんなもんデタラメだから、信じない方が良いと思います。
445:132人目の素数さん
14/01/04 17:37:59.71
>>444
はい
446:132人目の素数さん
14/01/04 17:42:29.51
fxのブログ見たら頭悪そうなのばっかり
447:132人目の素数さん
14/01/04 23:24:06.89
「改訂増補版紅魔館の統計学なティータイム」買った。
まあいい本だと思うが、もうこうなると別に東方のキャラ使う意味なくね?
448:132人目の素数さん
14/01/04 23:27:40.40
有名キャラを使えば、話のタネにしたい人やコレクターが買うんだろう
449:132人目の素数さん
14/01/04 23:49:20.66
興味ない人間からすると、逆にそういうの絡ませちゃうといい本でも手を出しづらくなるけどな
450:132人目の素数さん
14/01/05 17:54:45.18
クズがクソ本の宣伝
451:132人目の素数さん
14/01/05 21:40:00.32
クズ代表の俺から言わせてもらうと、他人をあからさまに
クズ形容する人に本物はいない。ソツのない秀才タイプが多い。
ソツがないということは、自分の手を汚そうとしない。けれど
真実を掴み取ろうと思ったら、自分で泥をかぶりその中にしか
ダイヤの原石のような本物は無い事に気付くことだ。クズの俺は
そんなことすらまだ出来ないw
452:132人目の素数さん
14/01/05 21:41:12.53
n数が1では正しさを評価しようがないな
453:132人目の素数さん
14/01/05 23:06:42.01
クズを無作為抽出→あなたは本物ですか?と質問→母比率の検定
454:132人目の素数さん
14/01/05 23:30:53.27
母集団は2ch
455:132人目の素数さん
14/01/06 01:26:03.23
キチガイがクズ本の宣伝しても
2chらしくていいんじゃないか?
456:132人目の素数さん
14/01/06 03:07:11.84
母集団の母数は何ですか(初心者)
集団のサイズwwwwwww
457:132人目の素数さん
14/01/07 19:53:54.79
『朝まで生テレビ』アンケートで7割が靖国参拝支持 社会学者「統計的に意味のない数字」
URLリンク(blog.livedoor.jp)
コレって意味ないの?
458:132人目の素数さん
14/01/07 21:18:34.63
無作為抽出とは程遠いから意味無いね
459:132人目の素数さん
14/01/07 21:23:22.46
ただ解ってるならアンケートやる前に言えよって話
460:132人目の素数さん
14/01/07 21:32:09.70
小学校3年生から英語を習わせるように、統計ってヤツも算数の段階からリテラシーを育成する意味でも教育に重きを置くべきなんじゃねーの?
461:132人目の素数さん
14/01/07 21:37:00.90
小学校で「割合」の概念を扱うのが、確か5年か6年の頃ですわ
462:132人目の素数さん
14/01/07 23:57:19.00
世論を推定するには価値のないアンケートだが、
朝生見てる奴はこういう奴らという統計量としては意味がある。
463:132人目の素数さん
14/01/08 00:04:50.78
むしろこの偏ったデータを修正するためにどの程度の規模でどのような調査を実施すべきなのか
464:132人目の素数さん
14/01/08 00:11:52.84
普通の新聞の世論調査で十分だよ。
465:132人目の素数さん
14/01/08 02:12:40.94
>>464
無作為で発生させた数字列を電話番号に見立てて、それで電話をかけて実際に出た人に対して、世論調査に協力。
いきなりの電話でイタズラ電話だと思う人も多いから、回答率は60%程度ではあるけれど、そんな無作為標本から得られた調査結果ならば、世論調査として安心できるわな。
政治問題に無関心な層に関しても、1-0.6≒0.4という数字デからも判断できるから、回答率100%のいびつな電話FAXアンケートよりも信頼に値する調査結果だし。
466:132人目の素数さん
14/01/08 14:21:36.72
「イタズラ電話にわざわざ回答する」というフィルターが恣意的ではないとは思えない
467:132人目の素数さん
14/01/08 17:15:41.53
URLリンク(www.nhk.or.jp)
NHKではこんな風に抽出してるらしい
468:132人目の素数さん
14/01/08 23:42:50.70
>>466
実際こういう世論調査における回答拒否ってどう扱えばいいんだろう?
テレビなんかだと回答内容の内訳のグラフとか出したりするけど、あれに回答拒否を加えたら意味あるのかね
469:132人目の素数さん
14/01/08 23:52:25.23
そもそも日中に家の電話に出られるヒマ人って段階で到底無作為とはいえないんじゃないか?
470:132人目の素数さん
14/01/08 23:54:20.63
まともな世論調査では有効回答とか回答率とか数値も出してる。
マスゴミの信用度と取るか世論の民度と取るか調査した会社の態度の悪さと取るかは
また別のアンケートが必要だな。
471:132人目の素数さん
14/01/12 18:13:49.95
例挙げて質問します
車のアクセルペダルの踏み込み量によって車の走り方がどう変わるかという実験をしたとします
踏み込み量を因子として、20%40%60%80%100%の5条件とします
測定データを加速度、最高速度、燃費、回転数とします
踏み込み量と車の走り方の関係性を検討するにはどういった検定を行えばよいでしょうか?
472:132人目の素数さん
14/01/16 23:07:55.05
仮説検定の対立仮説(H_1)と帰無仮説(H_0)について質問です
H_1:μ>m と H_0:μ=mについての検定ってよく書かれているんですが、
帰無仮説って必ずしもμ=mでなければならないんでしょうか?
μ<mとかでもよいのでしょうか
473:132人目の素数さん
14/01/17 04:45:41.68
>>472
帰無仮説は否定されてこそナンボ
イコールであるコトを否定する方が検定作業は簡単。
474:132人目の素数さん
14/01/18 00:09:42.96
キム仮説ってなんか韓国人の仮説みたいだ
475:132人目の素数さん
14/01/18 08:53:02.44
ある事象が韓国発祥であるという仮説
確かに否定されてナンボだ
476:132人目の素数さん
14/01/18 12:55:31.99
もともと金さんが発見したから金仮説だろ
統計学の発祥は韓国
477:132人目の素数さん
14/01/18 17:47:40.88
大学で統計学やってるんだが質問いい?
問、(有意水準5%として)「有意水準」とは確率である。確率であるということはある試行を無限回繰り返した時に何が起こる確率が5%なのか?
また上でなされた判断(ある試験の母平均が50点であるかどうかの仮説検定)は、現実に観測された結果をどのように考えた結果なされたものかについて述べよ
説明が上手くできないから教えてくだされ
m(_ _)m
478:132人目の素数さん
14/01/20 12:44:19.29
>>477
有意水準=危険率って教えてる先生も多い。
やさしい解説書にもそういう記述が多いんじゃないかな?
否定されてナンボのキム仮説が「実はまさかの真実であった!という確率→"有意水準0.05"
ato,
天気予報の降水確率と関連付けると、何となくわかり易いって教わった。
479:132人目の素数さん
14/01/20 20:16:20.57
URLリンク(imgur.com)
このZは何をさしてるのか教えて下さい(´・ω・`)
独立2群の差の検定で求めたものです
480:132人目の素数さん
14/01/21 18:35:55.91
ももクロっぽさ
481:132人目の素数さん
14/01/23 00:25:18.24
独立でない正規分布の和、例えばX+Yみたいなのって正規分布に従う?
各平均、分散に加えて共分散さえわかれば、平均も分散は出せるけど分布も正規分布なのか?
適当に調べたんだが独立な場合に畳み込みやら再生性って話はあるけど、従属な時がわかりゃせん
482:132人目の素数さん
14/01/23 00:29:33.47
従属の仕方による
483:132人目の素数さん
14/01/23 00:45:50.69
>>482
なんかヒントください
共分散0.5みたいな感じだと正規分布になります?
484:132人目の素数さん
14/01/23 08:03:12.82
日本の学歴の相対評価
5(07%) 院卒・一流大卒
4(24%) 四大卒
3(38%) 短大卒・専門卒
2(24%) 高卒
1(07%) 中卒
これって大体あってますか?
485:132人目の素数さん
14/01/23 09:07:31.80
それで大体合うように大学を格付けすればいいんじゃないですかね
486:132人目の素数さん
14/01/23 09:10:02.78
大学院こそ学歴と実力との相関が大きい気がする
487:132人目の素数さん
14/01/23 10:43:20.60
>>481
従属なときは正規分布しないでしょ。
多次元正規分布は変数同士は独立が仮定にある。
独立じゃないと確率密度関数はめちゃ複雑な形になり、正規分布ではなくなる。
488:132人目の素数さん
14/01/23 11:17:21.98
X が正規分布するとき、
X と X は?
489:132人目の素数さん
14/01/23 11:30:53.09
ネトウヨがよく言う「韓国語は英語より平均点がめちゃくちゃ高いので
在日特権!(キリリッ」を検証するためには
1.大学入試センターが得点分布を公表し
2.その得点分布が正規分布に従うと言えるか検定
3.韓国語と英語の得点差に有意性があるかさらに検定
する必要があるんdが
あ の 隠 蔽 体 質 を 考 え る と ム リ ポ
490:132人目の素数さん
14/01/23 13:08:29.14
あえて英語じゃなくて第二外国語を選ぶっていうことは、
その言語に対してリテラシーがあるってことだから、平均点が高くなるのは当たり前
だから難易度に格差があるかどうかは第二外国語間の比較で論ずるのが妥当だと思う
491:132人目の素数さん
14/01/23 13:15:15.24
>>488
2Xの正規分布
492:132人目の素数さん
14/01/23 14:19:11.40
>>491
Xを確率変数としたとき
X+Xと2Xは違うんだぜ
493:132人目の素数さん
14/01/23 14:53:02.62
マジで!?
494:売国新聞排除
14/01/23 15:01:24.55
新聞購読を止めて、月3000~4000円、年間36000~48000円の節約
特に日本と日本人を貶める売国新聞を購読することは売国行為に加担するに等しい
新聞を購読することは止めて自分の頭で考えるようになろう
495:132人目の素数さん
14/01/23 15:22:44.12
あ、iidじゃないのか。なら2X。
496:132人目の素数さん
14/01/23 21:35:35.27
分散=E(x^2)-E(x)^2
になるのどうしてですか?
分散は期待値u周りの二次元のモーメントなので、
分散=∫(x-u)^2・f(x)dx
=∫x^2・f(x)dx-2u∫x・f(x)dx+u^2∫f(x)dx
=∫x^2・f(x)dx-2u・u+u^2
=∫x^2・f(x)dx-u^2
ここで∫x^2・f(x)dxをどうすればE(x^2)に変形できるのですか?
497:132人目の素数さん
14/01/23 21:39:56.88
Eという記号の定義より
498:132人目の素数さん
14/01/23 21:46:03.28
E(x^2)って∫x^2・f(x^2)dx
じゃないの?
499:132人目の素数さん
14/01/23 21:48:04.55
f(x)はf(x)
例えばサイコロの出る目の二乗の期待値E(x^2)は
∑x^2・p(x^2)じゃなくて∑x^2・p(x)だろ?
500:132人目の素数さん
14/01/23 21:56:05.89
あm分かりました。ありがとうございます
501:132人目の素数さん
14/01/23 22:27:33.27
xの期待値は連続分布のとき∫x・f(x)dxで与えられるが、
このときxについての任意の関数g(x)の期待値は∫g(x)・f(x)dxになる
502:132人目の素数さん
14/01/24 00:02:07.06
これは良い正規分布
URLリンク(twicsy.com)
503:132人目の素数さん
14/01/24 17:02:58.68
綺麗な正規分布を描く試験はダメな試験
良い試験は出来る層と出来ない層で山が2つ出来る。
今年のセンター国語はアホが作ったんだな。
504:132人目の素数さん
14/01/24 17:50:50.25
2つ山ができたら良いテストなの?何故?
505:132人目の素数さん
14/01/24 18:00:14.28
出来る層(十分な国語の学力を持つ層)と出来ない層(十分な国語の学力を持たない層)の基準が大学によって異なる
ということに考えが至らないようでは…
506:132人目の素数さん
14/01/24 18:16:50.65
センターの場合、受験者が多いのと、学力にバラツキがあるから、
良いセンター試験は台形型の分布になるだろうな。
507:132人目の素数さん
14/01/24 18:28:06.87
>>504
テストの目的って、賢いやつと賢くないやつを分類することだろ?
今年のセンター国語は賢いやつと賢くないやつを分けれてないな。
こんな正規分布だと国語出来ない奴も出来る奴も中央値に向かいやすくなる。
つまり、国語出来ない奴にはお得な試験で、出来る奴には辛い試験だったという
ことが分布から分かるんだな~
508:132人目の素数さん
14/01/24 18:29:42.93
「十分に賢い」の基準が大学によって異なる
509:132人目の素数さん
14/01/24 18:33:03.99
教育界は横並び志向だから、
そっちのほうが「よい試験」。
偏差値を偏重するのも、
正規分布が念頭にあるから。
510:132人目の素数さん
14/01/24 18:33:08.99
>テストの目的って、賢いやつと賢くないやつを分類することだろ?
この時点で疑問符がつく
上のような意図の試験も一つの形ではあるだろうが、細かくランク分けすることが好ましい場合もある
ましてやそれが、レベルが様々な全国の大学の共通試験ともなれば、一層疑問の色が濃くなる
511:132人目の素数さん
14/01/24 19:17:22.37
>>510
その場合、分散がでかくなるから、裾の広い分布になるだろ。
尖度の大きい分布にはならないはず。
512:132人目の素数さん
14/01/24 19:21:48.05
正規分布になるのが良い試験だとは言ってないよ
山が2つ出来るのが良い試験なのか?と疑義を投げかけている
513:132人目の素数さん
14/01/24 19:26:38.04
ちなみに、センターは基礎学力を見る試験だから、細かい能力の差を見る試験ではない。
より精密な順位をつけるために2次試験があるんだろ。
514:132人目の素数さん
14/01/24 19:30:09.08
合格、不合格の2値で判定される試験では、山2つが良い試験。
515:132人目の素数さん
14/01/24 20:41:14.14
>>507
テストの目的は能力を測ることだと思う
516:515
14/01/24 20:47:04.47
その上で能力を推定することを考えると
問題単位で考えると能力に対して正答率が50%くらいの問題を与えるのが情報量が多くて一番良いと聞いたことはあるんだけど、その問題の集合をテストとしたときに得点分布はどんなふうになるんだろう
517:515
14/01/24 21:56:24.41
>>516
これ得点分布考えても意味なさそうですね
考えるなら能力の分布ですかね
518:132人目の素数さん
14/01/24 23:47:48.78
え、二つ山より、正規分布になる方がいい試験だと思ってたけど違うの?
519:132人目の素数さん
14/01/25 07:48:16.70
>>516
テスト理論は統計学を使った方法がある。TOEICやTOEFLみたいな試験で採用されている。
この方法では、まず正答率が高い人を抽出する。
正答率が高い人だけが正解する問題は、出来る人を検出する問題ということで良い問題。
こいういう問題は配点が高くなる設定になる。
逆に正答率が高い人でも解けない問題というのは、誰も解けないじゃん。ということで悪問扱いで配点は低い。
あと、みんなが解ける問題というのも能力を測れていないので、配点は低い。
520:132人目の素数さん
14/01/25 07:51:19.54
>>515
能力を測る場合でも、分散がでかくなるような分布が理想。
521:132人目の素数さん
14/01/25 07:59:49.69
>>518
TOEICやセンターなど点数に意味のある試験では分散のでかい分布が良い試験。
間違っても、今年のセンター国語のような正規分布良い試験ではない。
2択まで絞って、そこからは運って試験が平均100点の正規分布となるが、センター国語はまさにそんな試験。
2次試験では合格、不合格に分類したいわけだから、山2つを目指して、試験を作る。
522:132人目の素数さん
14/01/25 09:44:15.55
それ合格者と不合格者が明確に異なる平均・分散からなる母集団に区分けされるってこと?
あり得ないだろそんなのw
ましてやセンター試験みたいな母集団が大きくて受ける大学もバラバラな試験じゃあね
523:132人目の素数さん
14/01/25 10:13:30.64
合否の分かれ目の点数に大量の受験者がいたら
運が合否の分かれ目の試験になってしまうな。よくない試験と言える。
524:132人目の素数さん
14/01/25 10:53:18.76
まず
良い試験
悪い試験
の定義から始めなよ
525:132人目の素数さん
14/01/25 11:37:34.71
>>522
統計学が分かってるやつらが作った試験(数学、物理)とそうでない奴らが作った試験(国語、歴史など)の分布を
見比べてみなよ。
国語や歴史は正規分布型に近いはず。
これは、科目の性質を表しているんじゃなくて、出題者の意図の違いだよ。
数学や物理は難しい問題を出そうと思ったらいくらでも出せるけど、
それでは出来る奴を判別する試験にはならないから、あえてそうしないだけ。
526:132人目の素数さん
14/01/25 12:24:45.43
適当に画像検索してみたが2つ山になんてなってねーじゃねーかw
デタラメばっか言うなよ
527:132人目の素数さん
14/01/25 13:14:44.81
物理や数学のセンター試験は山が2つあるとでも思ったのか?
だから、山2つ出来るのは2次試験だって何度も言ってるだろ。
528:132人目の素数さん
14/01/25 13:17:33.88
URLリンク(monoist.atmarkit.co.jp)
529:132人目の素数さん
14/01/25 13:28:45.63
センター試験に端を発してるのにその論理はもうグチャグチャだろ
だったら初めから口はさむなと言いたい
530:132人目の素数さん
14/01/25 13:55:21.72
統計の話じゃねーだろ
531:132人目の素数さん
14/01/25 14:25:24.82
>>529
センター試験の話がしたいなら受験サロンでもお逝きなさい
532:132人目の素数さん
14/01/25 15:10:00.86
得点が正規分布しない方が受験用としては良い試験というのは勉強になった。
533:132人目の素数さん
14/01/25 15:26:38.40
お口直しに
URLリンク(www.msi.co.jp)
534:132人目の素数さん
14/01/25 20:04:09.97
統計リテラシーが身につくといろんな知識が蓄えられるな
535:132人目の素数さん
14/01/26 03:34:41.01
数学がちょっと好きな文系1年です。(統計2級うかったけど1級落ちました(T_T))
質問があります。
標本比率から母比率を検定する方法についてです。
n: 標本サイズ p: 母比率 r: 標本比率
大標本のとき、比率の分布がN(np, np(1-p))に近似できると本や学校で習いました。
そこまではいいんですが、検定するときにpをrで代用してp~N(nr, nr(1-r))に近似するという方法をやりました。
p≒rの話だと思うのですが、母比率の分布は厳密には少し0.5の方に歪んでますよね?(最尤値はrかな?)なんていう分布か教えてください。
それとレヴィ分布についても教えて下さい。
立ち読みした本に、正規分布を酔っ払いがホテルで自分の部屋から行き着く部屋とすると、
レヴィ分布は酔っぱらいが横に長い壁に向かって銃を撃ったときに銃弾があたる場所の分布だと書いてありました。
これってθ~Nのときの1/tanθの分布って意味ですか?
536:132人目の素数さん
14/01/26 05:52:34.57
勉強した人は高い平均の分布、してない人は低い平均の分布で、結果は2つ山。
これを2人でなく1000人で考えると、多峰性の分布や一様分布になるが、さすがに0点や
100点は少ないので両端とれて台形の分布になるのでは。上のレスであるように。
537:535
14/01/26 06:01:44.34
N(np, np(1-p))は数の分布だった
N(p, p(1-p)/n)です
538:132人目の素数さん
14/01/26 06:13:18.36
なんかわかりにくいので式にすると単に
X|μ ~ normal(mean =μ,sd =5)ぐらいで
μ~uniform(10,80)
の分布を考えると台形になるんじゃ。μ~normal(mean=50,sd=10)はどうなんかな。
Xがセンター試験の得点分布で、μが受験者の実力分布としたばあいね
539:132人目の素数さん
14/01/26 17:36:42.97
>>535
歪んでんの?へぇー
なぜ1/tanθだと思うの?
540:132人目の素数さん
14/01/26 20:18:38.68
r=0のとき明らかにpの平均値・中央値は0より大。r=1のときも1より小。
ただしpの最頻値がrであると思ったから。
それ以外は想像。
まずレヴィ分布について知らないから、よっぱらいの銃が壁にあたったところってあるから
URLリンク(i.imgur.com)
だとおもった。
θがランダムで、y=tanθとy=1の交点の分布を考えた。
541:132人目の素数さん
14/01/27 19:05:08.02
F分布のことかな?
それ、正規分布になると思うよ?
レヴィ分布は右に裾を引く分布だね。金融工学とかで使ってるよ。
542:535
14/01/27 21:21:13.51
F分布ですか。母比率についてF分布にしたがう統計量あってびっくりです。
正規分布の比の分布はコーシー分布、正規分布の二乗和の分布はカイ二乗分布みたいな、狭義レヴィ分布の説明ってありますか?
543:132人目の素数さん
14/01/27 21:42:55.63
パラメタ不明のn個の正規分布{N(μ_i, σ_i^2) | i ∈ [1,n]}から
それぞれm個ずつ独立に値をサンプリングして、
そのmn個の値をもとに平均の和(Σμ_i)の信頼区間を作りたいのですが、良い方法はありますか?
n個の分布に従う変数の和の分布を考えれば、標本数=mのt検定ができることは分かるのですが、
そこまで情報を捨てないで済むものを探しています
n=2の場合は片方を符号反転してWelchのt検定でよさそうなんですが、
一般の場合にも似たような手法が使えるのでしょうか
また、分散が一部共通の2n個の正規分布{N(μ_i_j, σ_i^2) | i ∈ [1,n], j ∈ [1,2]}の標本から
(Σ(μ_i_1 - μ_i_2))の信頼区間を作りたい場合に良い方法はありますか
544:132人目の素数さん
14/01/28 05:01:20.79
標本数?
545:132人目の素数さん
14/01/28 05:48:14.24
すいませんsample sizeのつもりでした
546:132人目の素数さん
14/01/28 09:09:10.97
sample size mのt検定はないでしょ。
547:132人目の素数さん
14/01/28 11:13:27.30
>>543
正規分布の再生性 じゃダメ?
それに平均の和(Σμ_i)の表記はΣX_iとかにすべきじゃ。もし
パラメータの信頼区間を求めたいなら別だけど。
548:132人目の素数さん
14/01/28 12:39:05.56
>>542
レヴィ分布は確率過程や確率解析の本を見たら乗ってると思う。
統計より確率論の話。
549:132人目の素数さん
14/01/28 15:41:50.93
こんなとこで聞かないで図書館行って調べろよ
何でもかんでも人に聞く癖を直せ
大学生なら最終的には教授に聞け
550:132人目の素数さん
14/01/28 21:27:49.76
>>547
再生性を使うより良い方法があるかと思って質問したのですが、無理そうでしたか
ありがとうございます
>それに平均の和(Σμ_i)の表記はΣX_iとかにすべきじゃ。もし
>パラメータの信頼区間を求めたいなら別だけど。
パラメータの推定が目的なので、パラメータの信頼区間を求めたいです
551:535
14/01/28 23:20:40.64
>>548 PRMLとかですか?
どうりで入門書でも数理統計の本で見なかったと思いました。
552:132人目の素数さん
14/01/28 23:22:14.09
prmlは確率過程じゃなかった
553:132人目の素数さん
14/01/29 04:16:50.94
統計学をやろうとおもうのですが、高校数学の平面図形の知識は必要ですか。
重点的にやっおいたほうがいいという分野がアレばお願いします
554:132人目の素数さん
14/01/29 06:28:53.08
統計学をやればいいと思います
555:132人目の素数さん
14/01/29 07:51:02.21
必要になる度に復習せえ
とんでもない量になって結局、高校数学全て見直す娘とになるがな
556:132人目の素数さん
14/01/29 08:17:42.21
確率は見直しとくとスムーズ
557:132人目の素数さん
14/01/29 09:57:22.23
機械学習と統計学の違いは何?
どっちが難しい?
どっちが実用的?
統計学が最強の~では機械学習はあまり触れられていませんでしたが。
558:132人目の素数さん
14/01/29 10:04:44.07
>553
一変数の微積と高校程度の確率の話が分かってれば大体なんとかなる
559:132人目の素数さん
14/01/29 10:12:04.76
>>557
かぶる部分も多いけど、統計の方が難しい。
統計家は機械学習できるけど、情報屋は数理統計学で詰む。
実用的なのは機械学習。
ビッグデータでも使えるし。
従来の頻度論統計学はデータ量が多いと使えない。
560:132人目の素数さん
14/01/29 11:43:49.36
>>559
どうもです。機械学習のほうが難しいのだと思っていました。
統計学よりも数学的知識を前提にしているようですし。
データ量が多いと統計学が使えないのは初めて知りました。
統計学はデータ量が多いほど分析が簡単になるのでは?
561:132人目の素数さん
14/01/29 13:56:10.22
統計学の本来の目的って、標本から母集団を推定したり・検定することにある。
標本が1000とか1万とかのデータ数だと、それはもう母集団といえる規模。
推定は一致し、検定は有意な差しか出なくなる。
ビッグデータに古典的な推定や検定を使ってたら、分析者を殴っていい。
562:132人目の素数さん
14/01/29 17:51:50.00
>>561
どこまでを統計学というの?
また、ビッグ・データとは何?
563:132人目の素数さん
14/01/29 18:06:18.39
>>543
解決しました
検定統計量を
√(Σ(s_i^2/m))
(ただしs_iは標本標準偏差)とし、実効自由度を
(Σ(s_i^2/m))^2/(Σ((s_i^2/m)^2/(m-1)))
としたt検定でいけるようです
564:132人目の素数さん
14/01/29 20:31:10.73
>>562
明確な定義はない。
565:132人目の素数さん
14/01/30 14:57:27.25
>>561
有意な差がでるのは良くないことなんですね。つまり
有意な差がでやすい大きな標本を統計学では使うべきではない、
ということですね。わかりました。
566:132人目の素数さん
14/01/30 21:55:20.32
釣られてあげようか?
567:132人目の素数さん
14/01/30 22:10:41.80
>>565
そうだよ。
推測統計ではデータが少なすぎるのも問題だけど、多すぎるものに使うのも問題。
568:132人目の素数さん
14/01/30 22:12:01.89
多すぎると何が問題なんですか?
569:132人目の素数さん
14/01/30 22:17:32.41
ベイズ統計スレを新たに建てたら?
570:132人目の素数さん
14/01/30 22:32:32.04
>>567
例えば、データ数が1000の相関係数が0.06だった場合、普通は相関無しと思うが、
相関係数の検定をすると有意差が生まれる。
これは、検定がもともとデータ数が少ない場合に使うことを前提にして作られたから起きる問題。
URLリンク(www.urano-ken.com)
571:132人目の素数さん
14/01/31 03:31:41.68
そのpdf,「きわめて小さな差でも“(統計的には)有意である”という結果になる可能性が
高まります。」と書いてるけど、それで何が問題なのかわからないです。。
むしろ極めて小さな差でもデータ数が多ければ、その差が偶然出ないことがハッキリして
よかったね、というふう好意的に解釈してしまいました。
572:132人目の素数さん
14/01/31 06:47:42.46
適切な標本数って母集団の大きさと目標とする誤差で変わってくるんでは
政府統計だと標本数10万人規模だったりするし
573:132人目の素数さん
14/01/31 08:30:10.36
標本数
574:132人目の素数さん
14/01/31 08:45:25.91
標本の大きさというべきでありました・・・
575:132人目の素数さん
14/01/31 12:11:15.00
で
結局データ数が多い場合には極めて小さな差でも有意にできるのは問題なん?
問題ないん?どっち?
576:132人目の素数さん
14/01/31 12:55:36.73
問題無い
577:132人目の素数さん
14/01/31 18:45:32.96
>>570
問題の意味が分らない。誰か説明して。
578:132人目の素数さん
14/01/31 19:09:28.32
>>575
問題ありだろ。
例えば、イケメン度合い(y)を2chに書き込んだ回数(x)で回帰分析する場合を考える。
普通この2変数に相関はないだろう。
しかし、「2chに書き込めばイケメンになれるんだということを世間に知らしめたいとする」
その場合、標本数を1000以上とってくる。
そして、回帰モデルの検定を行う。
すると、p値に有意差が生まれて、このモデルは統計的に意味のあるモデルと言うことが出来る。
ただ、正の相関か負の相関かは標本次第w
579:132人目の素数さん
14/01/31 19:13:06.08
基本的に思考停止な検定を始める奴は統計学に向いていない
580:132人目の素数さん
14/01/31 20:41:22.58
質問です。
ここにいる皆さんは仕事をするときに統計学をがっつり使っていますか?
現在就活中で大学で統計学を専攻しているのでそれを活かせる職業を探しています。
因みに私立文系でプログラミングは出来ません。
よろしくお願いします。
581:132人目の素数さん
14/01/31 20:43:07.34
>>580
大学はどこ?
582:132人目の素数さん
14/01/31 20:50:17.70
>>581
早慶です
583:132人目の素数さん
14/01/31 21:10:32.93
基本的にプログラミングの知識を使わないで統計の知識だけ使うってことはほとんど無いよ
新卒なら入社してから覚えさせられることになるし、
現時点でバリバリプログラミングが出来る必要はないけど、
そういう仕事やりたいんならちょっとかじるくらいではプログラミングに触れておいたほうがいいかも
584:132人目の素数さん
14/01/31 21:11:29.97
↑自己アピールができる、という意味でね
ただ入社以降もプログラミングには触れたくない!って言うのならおすすめはしない
585:132人目の素数さん
14/01/31 21:25:45.95
>>582
早稲田は文系でも統計の研究室いくつかあるけど、そこ出身かな?!
マーケティングの統計職ならあまりプログラミングはないと思うけど。
586:132人目の素数さん
14/01/31 21:29:12.16
なんで学生課に行かずにここで聞くのかな
587:132人目の素数さん
14/01/31 22:33:48.65
Rぐらいでも十分じゃないかなあ。
自分でコーティングは、しないでしょ。
588:132人目の素数さん
14/01/31 23:20:36.36
手段として統計を使う仕事はいくらでもあるが
目的として統計を使う仕事はほとんどない
手段に秀でているだけの人材は下請けで間に合う
589:132人目の素数さん
14/01/31 23:22:38.72
大学の教授に聞けよ
なんでもかんでも他人に丸投げしないで自分から動け
590:132人目の素数さん
14/01/31 23:27:55.18
私大の文系だと数Ⅲもできないだろうし理屈から始めるにはもう遅いかもな
591:132人目の素数さん
14/01/31 23:34:11.44
統計学専攻なら文系でも線型代数とか簡単な解析学ぐらいはやるだろう
592:132人目の素数さん
14/01/31 23:43:19.97
統計専攻って言うくらいだから、数理統計学はやってるだろう
593:132人目の素数さん
14/01/31 23:45:03.51
文系なら技術屋になるより、そいつらを使う側に回った方が良い気がするけどな。
594:535
14/02/01 00:29:28.40
私大文系だけど、今日の統計のテスト、カイ二乗検定とt検定しかなかったわ
595:132人目の素数さん
14/02/01 00:30:19.31
名前まちがえた
596:132人目の素数さん
14/02/01 00:46:55.27
皆さんありがとうございます。
>>580です。
ここにいる人達が普段のお仕事の中で統計学をいかに使っているのかを知りたかったので、質問しました。
とりあえず、明日就職課に聞いてみます。
597:132人目の素数さん
14/02/01 01:35:49.77
>>596
統計を人を騙す道具として使ってる企業多いから気をつけてね。
例えば、製薬とか被験者の取り方でいくらでも効く薬や副作用の少ない薬作ることが可能だから。
まともな人は病むかも。
マーケティングや調査会社も如何わしい。お客さんが喜べば何しても良いと思ってる。
そういう意味では、事業会社の統計職が良いかもね。いろんな部署と協力して出来るし。
本当に統計が好きなら、統計の大学教授になることだよ。一番まともに統計使って、さらに作ってる人たち。
598:132人目の素数さん
14/02/01 01:43:00.44
伸びてるから面白い話題かと思ったのに
599:132人目の素数さん
14/02/01 06:30:20.07
やっぱり有意という言葉が良くないと思う。代わりに標準偏差と推定量だけ、
t統計量もp値も各自で計算して、有意という言葉は廃止にした方がいい気がス。つかってていいこと一つもないし。
600:132人目の素数さん
14/02/01 12:07:08.15
質問させてください。完備統計量はどういう意味があるんでしょうか?
E[h(T)]=0ならばh(t)=0が定義なのですが、なぜこんな量を求めるのかが
よくわかりません。
それに妙に線形代数の線形結合の定義と似ている気もするのですが関連があるのでしょうか。
601:132人目の素数さん
14/02/01 13:14:56.94
良く使った最小自乗法は、統計的推定と称するけど統計を使ってる意識はないなー
602:132人目の素数さん
14/02/01 13:21:22.05
>>600
その成分だけで全部決まるという意味だからベクトル空間の基底と同じ性質だわな
603:132人目の素数さん
14/02/01 13:46:06.42
>>597
日本の企業で統計使うって品質管理分野ばかりなんだけどね。
604:132人目の素数さん
14/02/01 14:47:18.07
>>603
そんなことはありえない。
だって、統計関連学会で知り合う人はメーカーから製薬、金融まで幅広いぞ。
605:132人目の素数さん
14/02/01 15:25:06.33
>>603-604
は?
606:132人目の素数さん
14/02/01 15:34:29.86
>>602
どうもです。ということはコレは線形結合の場合に係数c1,c2,,,cnが一意的に決まる
のと同じと考えていいんですね。
例えばE[h(T)]=12のような値になる場合必ずh(T)=1/4Tに一意的にきまる、というふうに。
607:132人目の素数さん
14/02/04 13:49:50.04
ちょっと統計学から離れちゃうかもしれないけど、
積率って元々どんな学問分野で、どんな目的で産まれた概念なの?
608:132人目の素数さん
14/02/04 17:48:53.04
梃子じゃない?
609:132人目の素数さん
14/02/04 17:54:37.65
疑問に思っちゃんだ、どうしてかな?
610:132人目の素数さん
14/02/04 18:39:57.94
数理統計学の本読んでいたら
「離散確率変数Xの分布の積率は次のように用意に定義できる」
っていう記述が出てきたんだけど、なんか突飛に感じたから。
結果的には積率っていう道具を導入することで、
分布の記述に利があるということはわかるんだけど、
そもそも積率そのものの意味がよくわからないから、なんとなくもやもやした。
それで、積率というものが元々どんな分野のどんな要件を満たすために産まれた概念なのかがわかれば、
なんでここで積率を導入するのか、しようと思ったのかが理解しやすいかな、って思ったから聞いてみた。
スレ違いだったらごめん。
611:132人目の素数さん
14/02/04 23:12:14.41
「利」があることが分かってんなら十分だろ
612:132人目の素数さん
14/02/04 23:30:40.14
お前は学問向いてないな
613:132人目の素数さん
14/02/04 23:51:44.35
統計学の課題を出されたのですが、まったく解らず困っています。
誰か考え方だけでも教えてもらえないでしょうか。
よろしくお願いいたします。
614:132人目の素数さん
14/02/05 04:57:32.20
確か積率母関数の積率がモーメントのことで実際テイラー展開すると
モーメントの線形結合がわんさか出てくるから母関数だとマセマに
書いてあったよ。
615:132人目の素数さん
14/02/05 23:55:03.57
キュムラント展開か、統計で役にたつのかな、物理なら分かるが
616:132人目の素数さん
14/02/06 21:53:36.67
誤差付きのデータの扱いに関して質問があります。
誤差付きのデータの平均をとるときにエラーの大きさに応じて重みを付けるのはわかるのですが、
データの標本分散を求めるときには重みってつけなくていいのでしょうか??
Xってパラメータの標本があったとして(それぞれ誤差σがついてる)、X_iのデータの重みをw_i = 1/σ_i^2とすると分散は
V=sum(w_i*(<X>-X_i)^2)/sum(w_i)
にした方がいいのかなと考えたのですが見当違いですか?sum()が()内の総和で、<X>はXの加重平均です。
調べても加重平均の標準偏差しか出てこなくて誤差のついた標本の分布全体の標準偏差ってのが出てこなくて困った挙句物理板で聞いたらここを紹介されました。
どなたか教えていただけないでしょうか
617:132人目の素数さん
14/02/06 22:31:27.90
標準偏差を求めるために標準偏差で規格化したら意味が無かろう
618:132人目の素数さん
14/02/06 23:51:35.27
>>617
ごめんなさい、なんか自分がわけのわからないことをしようとしていたことに気付いたかもです。
なんか異なるいくつかの母集団それぞれの平均と標準偏差からそれら全体を母集団とする集団の平均と標準偏差を求めようとしてたんですけど、もともとそれぞれ違うものなんだから重み付けるのがそもそも間違ってるような気がしてきました。
例えると、蟻、犬、芋虫、猫、人、象って種の体長とその標準偏差をそれぞれ求めて、じゃあそれらの動物全体の平均体長とそのばらつきをそこからそれぞれの標準偏差で重み付けて求めようとしてました。
この場合、重みをつけるべきではないですよね?
619:132人目の素数さん
14/02/07 08:49:08.24
正規化すればいいんじゃない?
620:132人目の素数さん
14/02/10 11:29:37.40
1分に1回事件が起こるってポワソン分布に従って、乱数で件数を返す関数Aがあったとして
それを60回足し合わせたら
60分に60回ってポワソン分布に従って件数を返す関数Bと同じようなものになるの?
初学者なのでヘンテコな質問になってるかもしれないが
621:132人目の素数さん
14/02/10 16:41:47.30
せめて確率変数と言ってはどうか
1分に平均で1回の~確率変数を60個足し合わせると60分に平均で60回の~になる
622:132人目の素数さん
14/02/10 18:08:40.15
すまんなトンクス
うまいことできてんなぁ
623:132人目の素数さん
14/02/12 03:12:16.12
1個のサイコロを600回投げたら1の目が118回出た。
このサイコロは正常ではないか、有意水準5%で推定せよ
↑この問題から、z=1.84<1.96 よって、正常でないとは言えない
この答の出し方がわからないんだが、どういう考え方でやってるんだ?
624:132人目の素数さん
14/02/12 03:18:55.59
2行目、推定じゃなくて検定か
平均E=100,偏差σ=9.13を出して、
E-1.96*9.13 , E+1.96*9.13で有効な範囲出すだけじゃダメなんかな
625:132人目の素数さん
14/02/12 04:10:27.21
標準化するんでしょ?
しかし問題合ってるか?これ
626:132人目の素数さん
14/02/12 05:15:13.90
やっぱり問題(答え?)が間違ってるのかな?
(118-100)/9.13 >1.96
よって、正常ではない
やりかたはこれであってるのかな?
627:132人目の素数さん
14/02/12 23:13:56.67
>>597
> 統計を人を騙す道具として使ってる企業多いから気をつけてね。
お前が人を騙しているんだろうがクズが。
詐欺師のくせに数学板にくるんじゃない馬鹿が!
628:132人目の素数さん
14/02/17 00:40:42.15
execel2007の分散検定で「繰り返しのある分散検定」というのがありますが、
「対応のある分散検定」と同意でしょうか?
629:132人目の素数さん
14/02/19 02:42:00.85
洋書の教科書を買いたいのですがオススメはなんでしょう?
unbiased, efficient, precise estimatorについて述べてあるもので
630:132人目の素数さん
14/02/23 00:46:19.69
私立文系のアホですが統計やる事になり困ってます
中高の数学だと何の単元が統計学には必要でしょうか?
631:132人目の素数さん
14/02/23 01:24:40.92
記述統計なら、数学よりむしろエクセル勉強。
推測統計なら、場合の数(数学A)、確率(数学A)、数列(数学B)、積分(数学Ⅱ)かな。
あと多分ならってないだろうけど、統計とコンピュータ(数学B)、確率分布(数学C)、統計処理(数学C)
は、目を通しとけば。
632:132人目の素数さん
14/02/23 02:24:09.41
四則演算を覚えたら後は大学の統計を勉強すればよい
633:132人目の素数さん
14/02/23 11:37:51.64
>>631
詳しくありがとうございます
634:132人目の素数さん
14/02/23 13:25:11.13
大学で習う統計学を、高校数学の教養無しで学ぶのは無理じゃね。
635:132人目の素数さん
14/02/23 14:17:35.69
自分の場合中学数学からやる必要があるorz
636:132人目の素数さん
14/02/23 21:07:40.18
文型の統計学なら、理論より実践的なものを学ぶんじゃね。
経済統計とか社会統計とかさ。
調査票のとり方とか、そういうのかもよ。
確率分布とか、そういったものじゃない気がする。
経験者俺。
637:132人目の素数さん
14/02/25 13:35:48.53
中学数学だとどこら辺の単元をやる必要がありますか?
638:132人目の素数さん
14/02/25 19:41:34.40
ちょいと教えていただきたい
選挙みたいなやつの出口調査と実際の結果がどの程度一致するものなのか調べてみたいんだが
そういう場合は全候補者にそれぞれの得票数でχ二乗検定をすればいいのか
それとも単に順位相関を求めればいいのか
どうも何をどう適用すればいいか十分には理解してなくて
639:132人目の素数さん
14/02/25 22:58:28.19
明日の16時39分頃に気をつけて下さい。
日本にも世界にも巨大地震が起きませんように。
皆さんも一緒に祈って下さい。
太陽フレアのXが発生しました。
太陽黒点数の100越えが24日間継続しているようです。
640:132人目の素数さん
14/02/26 23:33:48.35
中学レベルの数学からやり直すのは、良いことかも知れんが。
正直その勉強が直接統計学に役立つようには思えないんだが。
とりあえず、「エクセルで学ぶ統計学」みたいな本でパソコンに打ち込んでいけば?
641:132人目の素数さん
14/02/27 21:06:41.09
>>640
偏微分が理解できる様にしておけと言われていますが
正直偏微分が何が何だか状態です
642:132人目の素数さん
14/02/27 22:02:08.39
あきらめろ。
中学の3年間で数学の初歩を学び、高校で2年目でやっと基本の微積を学ぶ。
5年もの時間をかけて身につけるものを、数日で理解できるわけがない。
643:132人目の素数さん
14/02/27 22:34:48.01
確率変数をlogXと変換するのと、Xの確率密度関数にlog xを代入するのって何が違うの?前者は確率密度関数に1/xがつくのは知ってはいるけど
644:132人目の素数さん
14/02/28 02:02:37.78
>>629におねがいします
645:132人目の素数さん
14/02/28 05:34:14.71
偏微分は最小二乗法で使うからかな?
あれぐらいならすぐにわかる
646:132人目の素数さん
14/02/28 20:35:57.10
>>642
猶予としては1年間くらいあります
647:132人目の素数さん
14/03/01 04:30:58.21
来年から統計学を学ぶんだけど、標準偏差って二乗するよね?
たとえば、
1、2、3、4、5は平均3で、標準偏差は√10になると思うんだけど、
0、3、3、3、6は平均3で、標準偏差は√18になるよね?
平均とのズレの合計は同じ6なのに下の例の方が標準偏差が大きいけど、つまり同じ平均とのズレでも、差が大きいものを抱えている方が標準偏差が大きくなるってこと?
だから二乗するの?
648:132人目の素数さん
14/03/01 04:47:30.82
分散「」
649:132人目の素数さん
14/03/01 19:44:10.76
>>647
>差が大きいものを抱えている方が標準偏差が大きくなるってこと?
そだよ~
>だから二乗するの?
そりゃ関係ないよ~
数学では、絶対値を付けた差をとって計算するより
二乗して計算すれば計算が楽だから。楽というのは、そういう計算の
やり方が昔からしっかりと証明され、そろっているという意味。
ということで、二乗する事情はそういう事情。
二つの隔たりとかそういうのを数学的に計算しやすい。
平均だって、ふつうの平均(算術平均)もあれば、幾何平均なんてのも
あるでしょ。距離を計算するときにだって単なる差だけじゃ~ないのよ。
なにしろ、犬がお父さんやる時代だからね。
650:132人目の素数さん
14/03/01 23:05:09.21
でも二乗しないと大きい差を持つほど大きくならないよね?
絶対値だけでやったら、差が大きいものがあるほど大きくならないと思うんだけど!
651:132人目の素数さん
14/03/02 00:42:06.62
絶対値より二乗の方がいいのは、計算が簡単だからというのと、
二乗にルートをとった標準偏差σの1σがちょうど標準正規分布の転換点にあたるから、
って訊いたことがある。
652:132人目の素数さん
14/03/02 03:46:30.05
二乗するのは、平均より離れた数値を持っているとより標準偏差が大きくなるからですよ
絶対値だと、平均との差の和が同じなら、例を挙げれば
2、2、3、4、4(平均3、平均との差の和は4)
1、3、3、3、5(平均3、平均との差の和は4)も同じになってしまいますが、
二乗したものを足せば、上が4、下が8になります。
つまり下の方が、ばらつきが大きいということなのです。
653:132人目の素数さん
14/03/02 06:03:58.55
>>651
標準正規分布は、その前にすでに偏差平方和の考えがあるから
出てきてるんじゃないのかな?
だから、転換点に当たるからというのは、後からの話という
ことになる気がするぞ。ちがうかな?
計算が簡単とよく言われるけど、その簡単というのは何を言っているんだろう
といつも思う。単純に考えると絶対値をとってしまえばあとはなにも難しくないと思う。
したがって、簡単という意味は、もっと別な意味を持っていると思うんだけど
それってなんだろう?
大昔の数学者たちがいろいろやって、その中で >>642 の形が最もうまく
差を表せるということになって、偏差平方和ととる方向になっていった
という形なのかな?
654:132人目の素数さん
14/03/02 06:06:52.65
>>653で訂正
その中で >>642 の形が最もうまく
⇒ その中で >>652 の形が最もうまく
655:132人目の素数さん
14/03/02 09:52:39.40
>>653
絶対値の計算って難しいだろ。
656:132人目の素数さん
14/03/02 10:01:35.48
絶対値にしてしまったら、
そのあとの難しさってなに?
657:132人目の素数さん
14/03/02 10:09:07.91
計算済みの絶対値にしてしまえないからみんな面倒、難しいっていってんだよ。
どこでもドアがあったら簡単にハワイに行けますねと言ってるようなもの。
658:132人目の素数さん
14/03/02 10:24:50.87
MAEが既知の分布の和のMAEとか計算したら発狂する
659:132人目の素数さん
14/03/02 10:35:02.82
>>657
>計算済みの絶対値にしてしまえないからみんな
絶対値をとること自体、難しい部分ってある?
なんども質問で申し訳ない。いやみで聞いてないから、お願い。
660:132人目の素数さん
14/03/02 10:45:45.49
なぜ聞いているかというと、知っている人間に聞いても
「絶対値の計算は大変だから」
という言葉で終わって、そのあとどうして大変なのか
ということを聞いても、答えが出てこないもので。
私も、聞かれたときにどうこたえていいかがわからない。
という経緯があります。
661:132人目の素数さん
14/03/02 10:53:29.91
私なりには、単に差分をとったり分散や標準偏差にかかわらず、
その後の処理で、最小二乗など数学的枠組みが現在の
統計解析以前に確立していたので、その枠組みをつかう
ことが可能なため、というのが背景にあったためなのかな。
と思うんですが。間違いでしょうかね?
そもそも、>>652 のように、単なる差分だとうまく表せない
という問題がありますけど。
662:132人目の素数さん
14/03/02 10:55:18.05
統計勉強すれば分かるよ
その程度の知識では無理
663:132人目の素数さん
14/03/02 11:09:24.42
そうかなー
そもそも差分の枠組みでやることなく
既存の枠組みで覚えてゆくので、じゃあどこか問題かという
こと自体を考えることもないと思うんだけど。
664:132人目の素数さん
14/03/02 11:12:39.03
問題を感じてないなら無理に知る必要もないだろう
微積を知らなくたってたいていの人は生きていける
>>658みたいな例も出てるけど意味が分からんのだろ?
665:132人目の素数さん
14/03/02 11:19:32.02
>>660
自分で計算しても楽だったのなら
キミは数学の天才だからそれていいんじゃないだろうか。
666:132人目の素数さん
14/03/02 11:24:01.05
>>664
>>658の例は、それで大変に良いと思う。
要は説明時に、どこでも「絶対値の扱いは面倒なので」という言葉
だけで飛ばしてしまっている。
分かっている人には良いが、入り口の人たちからすると、
コンピューターの発達した今では、絶対値をとって計算なんか
簡単じゃないか。どうしてなんだ。という考えが出てくる。
そこで、絶対値をとった場合、次に出てくる問題は何か、だから
二乗して使っている。
というような流で説明ができないものかと。
>>647 のような質問は、そういうことが前段階にあるために
出てくる問題じゃないかと思っている。
667:132人目の素数さん
14/03/02 11:31:51.78
絶対値のついた関数の微分とか微分不可能な点ばかりでコンピューターどうのこうのという問題ではないんじゃ
よく知らんけど
668:132人目の素数さん
14/03/02 11:56:49.57
前人が分布関数という考えに至った時
その段階で数学の枠組みを利用するためには
絶対値ではできないから
というのが背景にありそうですね。
統計解析の発展の歴史のような書物をみても
どういう経緯でそこに至ったかがうまく書かれた
ものが見つからなかったので。
669:132人目の素数さん
14/03/02 11:59:58.64
y=|x|のグラフを書いて、
この関数が式のあっちこっちに埋め込まれて簡単だと言えるのならやはり天才だ。
670:132人目の素数さん
14/03/02 12:23:09.31
コンピュータ時の昨今ではモンテカルロ法がもてはやされたりもするしな
やりたいことをやれるようにやった結果が現状だと言ってしまえばそれまでだ
671:132人目の素数さん
14/03/02 12:34:00.71
>>669
X自体を正として扱えば
そういうグラフにすること自体ないだろ
672:132人目の素数さん
14/03/02 12:39:59.52
その論法では足し算は簡単ですと言っているだけなのだが
673:132人目の素数さん
14/03/02 12:46:25.79
絶対値を理解していないっぽいな
絶対値の否定か?
674:132人目の素数さん
14/03/02 12:47:53.40
だって二乗しているのも正にするためが
理由の一つでしょう。
だからそれが本質じゃないだろう
675:132人目の素数さん
14/03/02 12:57:19.21
>X自体を正として扱えば
これどういう意味なんだろうか
676:132人目の素数さん
14/03/02 13:09:27.36
サンプルと母集団の違いとか統計量に対する演算とか
そういったことを気にしない世界ならいいんじゃないの
値を計算するだけならマンハッタン距離でもレーベンシュタイン距離でも
小学生レベルの簡単な計算だからね
677:132人目の素数さん
14/03/02 13:59:23.83
共分散とかどうすんのかね
分散共分散行列とかもあるし
678:132人目の素数さん
14/03/02 18:10:20.83
>>676
ありがとうございます。
分布を考える世界への導入を想定したときに
出てくるということですね。
なんかすっきりです。
>>677
それは既存の数学的枠具があることが前提なので
単純な差分からの場合は、そもそもそういうものに
発展し得るのか(別な考え方がでてくるかもしれないけど)
どうかさえ分からないですから、まあ心配無用でね。
あくまで、統計始めた人から、そういう質問が出てきたとき
どう答えたらスッキリしてもらえるか?という悩みでしたので。
679:132人目の素数さん
14/03/02 18:41:57.97
分散や標準偏差の概念が見つかるずっと前に解析学や線型代数は発達してたから
その利用をしようと思うのは当然だと思うがなんか変なこと言ってるかな?
680:132人目の素数さん
14/03/02 18:46:01.77
うん
681:132人目の素数さん
14/03/02 19:02:23.29
>>679
それはその通りでおかしくない。
それを前提に考えたからこそ二乗するという手段を使用した。
そういう風にはっきりと説明することで理解してもらえる
ことにつながります。
682:132人目の素数さん
14/03/02 20:03:36.55
どれが>>652かさっぱり分からん
683:681
14/03/02 20:08:12.09
>>682
最初の質問者のことなら
>>652じゃなく>>647でしょ
>>647は出てないと思うけど。
おれは、>>647をみて、そういえば初めに統計を学ぶ人に似た
ようなことを聞かれる場面有るな~とおもって、
さあ、どう答えたらいいのかと思い、いろいろみんなに聞いた。
684:132人目の素数さん
14/03/02 20:15:59.02
答えは簡単
偏差E(|x-m|^α)のメリット、デメリットを議論すればいいだけ
>>647にそれをいっても無駄、わからんだろう
685:132人目の素数さん
14/03/02 20:41:02.08
二乗するのは差が大きいほど大きくするためだって先生に聞いたけど
まさにその通りでしょ
絶対値だと1、2、3、4、5も0、3、3、3、6も同じになるという前に言ってる人がいるのと同じ
686:132人目の素数さん
14/03/02 20:44:07.24
1.馬鹿は引っ込んでろ
2.半年ロムれ
3.過去ログ読めよ
好きなの選べ
687:132人目の素数さん
14/03/02 20:45:17.11
>>684
私は理解させられませんという告白になっちゃうよ
688:132人目の素数さん
14/03/02 20:46:51.94
>>687
馬鹿には無理 FAQ
689:132人目の素数さん
14/03/02 20:51:08.74
>>688
じゃあなく、あなたの告白ということ
690:132人目の素数さん
14/03/02 20:52:23.67
とりあえずのりで突っ込みました、たいがいこれでだいじょうななはず、てかー
691:681
14/03/02 21:03:18.90
お、その後も変な風に続いてるな。
>>685 それで、そっかーと思ってくれる相手であれば、なんも問題ない。
ともかくどうしようもなく素人が統計入門の際にわかりやすく。
そーだよねーと、思って通り過ぎてもらえばいい部分なんで
その説明方法であればよかったので、とりあえず俺は終了。
692:132人目の素数さん
14/03/02 21:04:30.06
意味負は去った
693:132人目の素数さん
14/03/02 21:12:30.48
そして忘れ去られる質問たち
694:132人目の素数さん
14/03/02 21:16:08.03
[訂正]
意味負は逃走
695:132人目の素数さん
14/03/02 22:11:20.47
>>685
こいつの言うとおりじゃね
大体あってると思う
696:132人目の素数さん
14/03/02 22:13:52.97
>>685
こいつの言うとおりじゃね
大体あってると思う
697:132人目の素数さん
14/03/02 22:23:42.86
大きくしたいならガンマ関数がお勧め
698:132人目の素数さん
14/03/02 23:37:25.87
統計の最初は、分散や標準偏差を習うもんな。
そのとき、絶対値じゃだめなの?って当然思うわな。
699:132人目の素数さん
14/03/03 00:13:05.67
うん
700:132人目の素数さん
14/03/03 03:20:51.62
>分かっている人には良いが、入り口の人たちからすると、
>コンピューターの発達した今では、絶対値をとって計算なんか
>簡単じゃないか。どうしてなんだ。という考えが出てくる。
こんな考えなかなか出てこないと思うわw
高校1年以上なら絶対値=面倒くさいというのが普通だろう
>X自体を正として扱えば
>そういうグラフにすること自体ないだろ
ここはもうめちゃくちゃ
701:132人目の素数さん
14/03/03 05:32:22.09
自分も似たような感想を持った
そもそも二乗したら2→9、3→9と実際の差よりも大きくなってしまって何も論理的に語れなくなるんじゃないかと思ったんだけど
どうなの?
702:132人目の素数さん
14/03/03 05:49:22.15
最近話題の緑本だけど何故対数変換がダメなのか、それと
なぜ割り算値を説明変数にするのがダメなのかがよくわからなかった。
詳しい人解説おねがいします。
703:132人目の素数さん
14/03/03 07:58:56.37
>高校1年以上なら絶対値=面倒くさいというのが普通だろう
そういうやつは、2乗も面倒じゃないか?
704:132人目の素数さん
14/03/03 08:35:38.28
少なくとも面倒かどうか知らないということは
中高のときに数学をほとんど勉強していないのではないか。
計算経験がほとんどない。
705:132人目の素数さん
14/03/03 08:53:32.01
この場合、単に距離としての扱いだから
別に面倒でもない気がするな
706:132人目の素数さん
14/03/03 09:13:21.27
やはり統計学をきちんと理解するには数学を勉強してないと難しいよ。
距離とか次元とかノルムとか空間とか概念を理解していないと、意味不明な議論になる。
距離といっても、ピタゴラスの定理しか思い浮かばないようだとやはり厳しい。
「微分可能性」だけ考えても、絶対値は不利だということはすぐわかる。
もっとも、記述統計学内の議論ならば、絶対値もありかなとは思う。
推測統計学まがいの議論をするくらいだったらね。
707:132人目の素数さん
14/03/03 09:23:02.40
あ~
前の議論の延長としての話なんで
すれ違ってたね
708:132人目の素数さん
14/03/03 10:08:57.08
住人のレベルが分かる議論
709:132人目の素数さん
14/03/03 11:29:52.62
おまえもなー
710:132人目の素数さん
14/03/03 11:32:54.38
おれのレベルがわかる発言はしていない、ふふふ
711:132人目の素数さん
14/03/03 14:41:44.39
L^1空間よりもL^2空間の方が何かと都合がいい
712:132人目の素数さん
14/03/03 15:02:59.40
>>711
既に書いた
>>684
713:132人目の素数さん
14/03/03 15:04:15.21
そういえば俺も二乗する理由を教わってなかったな。
つまるところどういうことなの?
714:132人目の素数さん
14/03/03 15:09:30.19
>>713
既に書いた
>>662
715:132人目の素数さん
14/03/03 15:21:07.42
流石にその答えじゃ納得せんやろうなあ
716:132人目の素数さん
14/03/03 15:28:26.60
>>715
おまえがどうぞ
717:132人目の素数さん
14/03/03 15:31:46.48
その答えしかないってことね
なら仕方ないか
718:132人目の素数さん
14/03/03 15:34:05.70
>>717
遠慮すんなよ
719:132人目の素数さん
14/03/03 15:37:30.79
あなたに出来ないのなら誰にもできないよ
仕方ないことだ
720:132人目の素数さん
14/03/03 22:32:59.41
支那竹みたいだな
721:132人目の素数さん
14/03/04 03:26:27.60
統計学二乗は確かに難しいな。
誰かここには分かってるやつはいないのか?
722:132人目の素数さん
14/03/04 04:29:48.75
L1って理論値求めるとき大変そう
723:132人目の素数さん
14/03/04 09:42:21.68
じゃ、「計算しやすいから」がここの総意ってことでFA?
724:132人目の素数さん
14/03/04 09:47:56.42
いつまで粘着してんだよ
725:132人目の素数さん
14/03/04 16:49:04.85
計算しやすいだけじゃ何の意味もないのは自明だろ
ユークリッド距離と同型なら同様に自然で蓄積された知識が流用できて都合が良いだけさ
726:132人目の素数さん
14/03/04 17:09:07.98
違うよ。
簡単に言うなら >>685
手法にはフォーカスしてない。
727:132人目の素数さん
14/03/04 17:24:32.46
絶対値>ニ乗>四乗>六乗>八乗てか
728:132人目の素数さん
14/03/04 17:25:47.21
逆だな
絶対値<ニ乗<四乗<六乗<八乗てか
729:132人目の素数さん
14/03/04 20:29:50.26
>>647, 685
>絶対値だと1、2、3、4、5も0、3、3、3、6も同じになる
??
分子のみだけど、
> sum(abs((1:5)-mean(1:5)))
[1] 6
> sum(abs(c(0,3,3,3,6)-mean(0,3,3,3,6)))
[1] 15
そもそも全然違うのだけど。
730:132人目の素数さん
14/03/04 20:39:33.89
おいw
731:132人目の素数さん
14/03/04 20:40:12.36
>>729
なにそれ。
732:729
14/03/04 20:55:18.23
ごめん、やっぱり合ってたわ。タイポした。
> sum(abs(c(0,3,3,3,6)-mean(c(0,3,3,3,6))))
[1] 6
733:132人目の素数さん
14/03/04 21:14:50.53
数学会の世界を揺るがす小保方さん出現か!とおもった。
734:132人目の素数さん
14/03/04 21:19:30.65
このスレのレベルをよく表しているじゃないか
735:132人目の素数さん
14/03/05 08:08:36.75
誰か>>702の解答おねがいしまう
736:132人目の素数さん
14/03/05 08:28:22.52
緑本は知らんが特異点を持つ変換は嫌われる
737:132人目の素数さん
14/03/05 14:33:28.95
いろんな問題集があるんだね
738:132人目の素数さん
14/03/05 16:47:51.75
記述統計の側から眺めていても、
なぜ絶対偏差でなく2乗なのか
なぜ3乗や4乗でないのかの
スッキリした説明は出てこない。
標準偏差の生まれは正規分布のパラメータであって、
標本標準偏差はデータを正規分布からの標本と
見た場合の正規分布の推定量と考えれば、
2乗でなければいけない理由づけができる。
正規分布が登場する理由は、中心極限定理。
739:132人目の素数さん
14/03/05 17:31:04.61
だとすると、
大学で統計入門時によく使われる説明、
「絶対値は扱いづらから」という旧来の説明は
必ずしも正しくないということになるのかな?
740:132人目の素数さん
14/03/05 17:37:10.17
えっ、何がどうして「だとすると」になるの
741:132人目の素数さん
14/03/05 17:54:16.48
上の方で、「絶対値は扱いづらい」からと言っている
流れから。おかしいかな?
742:132人目の素数さん
14/03/05 17:58:31.69
すごくおかしい
743:132人目の素数さん
14/03/05 18:03:32.98
不偏標準偏差でなく標本標準偏差を使う理由とか
計算が楽だからとしか言いようがない部分もあるが、
なぜ2乗か?に必然性を持たせようとするならば、
正規分布を経由したほうが物語性があるだろう。
「歴史的経緯で」じゃ、あまりにもツマラナイし。
744:132人目の素数さん
14/03/05 18:07:35.69
なんで、言葉に、引っかかってるのがわからない。
あなたの言っている通りでしょ。
だから、絶対値は扱いづらい。という言葉で済ますのは良くないし
歴史的経緯で済ますのは良くないでしょ。
どこに引っかかったの?
745:132人目の素数さん
14/03/05 18:13:11.35
>>743
言っていることは正しいと思うんだけど
困ったことに、正規分布は歴史的に後から出てきてるよね。
正規分布にこだわらずなんじゃないだろうか。
746:132人目の素数さん
14/03/05 19:53:37.14
標準偏差だの正規分布だのが
アリガタがられる理由は、
中心極限定理以外に
思いつかないんだがなあ。
747:132人目の素数さん
14/03/05 19:56:29.40
もう諦めて答えを見てはどうか。
748:132人目の素数さん
14/03/05 20:10:58.60
歴史的には標準偏差の方が、正規分布や中心極限定理より後に出てきたらしいが。
正規分布や中心極限定理は、ド・モアブル、ラプラス、ガウスあたり。
標準偏差はピアソン。
749:132人目の素数さん
14/03/05 21:43:27.00
二乗にも、いろいろ事情があるもんだ
750:132人目の素数さん
14/03/05 22:58:24.62
ざぶとん
751:132人目の素数さん
14/03/05 22:59:49.30
いくつぐらいになったらオヤジギャグに笑えるようになるかという統計データがほしいです。
752:132人目の素数さん
14/03/05 23:55:00.73
ここは
この板のレベルが分かる書き込みだな
だろう
753:132人目の素数さん
14/03/06 00:12:31.79
>>749
数学において難解な二乗は
「愛の事情」
弱ったことにマイナスしか出てこない
754:132人目の素数さん
14/03/06 23:29:11.45
平均値と、中央値、(もしくは最大値、最小値も加えて)から
最頻値mode を推定することができますか?
755:132人目の素数さん
14/03/07 00:42:33.41
無理
756:132人目の素数さん
14/03/07 01:00:44.42
>>754
分布がわかってれば
できることもあるけど
757:132人目の素数さん
14/03/07 01:19:19.24
正規分布でも仮定するんだろ
母集団平均の推定と同じだが
758:132人目の素数さん
14/03/07 01:55:46.82
まさか平均0で標準偏差1の場合だったりして
759:132人目の素数さん
14/03/07 03:18:38.62
>>757
エスパーさんか
760:754
14/03/07 13:02:30.53
ありがとうございます。やはり無理そうですかねえ。
分布は正規分布ではないですが、偏りのある一峰の山のある分布を前提としています。
何故、このようの事を考えているのかといいますと。
Rで計算をしていますが、modeが標準の関数にないということ。(パッケージがあるのは承知しています)
正しくmodeを計算するには、ヒストグラム(度数分布)を求めないといけなくて、サンプルセット数(サンプル数でなく)
が多くて計算量が多くなりすぎること。ビン幅も個別に設定しなければならないこと。
以上のことから、もっと簡易にmodeが求められたらいいのにと思った次第です。
すくなくとも、(最大値-中央値)=Aか、(中央値-最小値)=Bとすると、AかBかの
小さい方の範囲にmodeがあるはずです。
また、平均値と中央値の差が大きければ、modeも中央値より離れていると想定できます。
そのあたり何かアイデアがないでしょうか。
761:132人目の素数さん
14/03/07 14:07:00.02
ヒストグラムなんぞ使うな、累積分布にしとけ
累積分布ならビン幅などいらんぞ
ヒストグラムより本質的な累積分布を軽視するのは教育の欠陥だ
762:132人目の素数さん
14/03/07 18:31:15.29
すきにすればいいだろ
763:132人目の素数さん
14/03/07 19:22:54.06
当然だ、自業自得にすぎん
764:132人目の素数さん
14/03/07 20:09:37.43
>>761質問の意味解っているなら、答えてやれよ。
765:132人目の素数さん
14/03/07 20:32:45.80
これ結構難しいんじゃないの
766:132人目の素数さん
14/03/07 23:01:01.56
様々な一峰の分布を調べて、
(最頻値-中央値) と (中央値 - 平均値) の相関を求めて、相関があるといえるなら、
(最頻値-平均値) ÷ (中央値 - 平均値) を計算しそれをAとする。
求める 最頻値 は、A × (中央値 - 平均値)
でどう?
767:132人目の素数さん
14/03/07 23:35:21.81
>>760
平均値と中央値と最頻値は独立に指定できる
768:132人目の素数さん
14/03/08 00:49:52.87
モードのオンライン更新ってできまいのかな
769:132人目の素数さん
14/03/08 09:38:56.41
例えば1,2,2,1,1,2,2,...みたいにモードが収束しないサンプル列に対して
何らかの意味で効率的なオンライン更新則が作れるか考えてみたらいい
770:132人目の素数さん
14/03/15 07:25:39.51
大学の数学の教科書、あまりの誤植の多さはポアソン分布に従っているとはとてもじゃないけど思えない。
刊行後も出版社のサイトで気軽に正誤表をアップできちゃえるからって、著者も出版社側も書籍作りに対して甘え過ぎだ。
771:132人目の素数さん
14/03/15 13:26:29.01
身内の個人出版感覚なのかもシレン
教授が執筆した小部数書籍に校閲のプロを雇うのは予算的に無理だろうし
772:132人目の素数さん
14/03/15 13:51:50.89
大学数学レベルだと正誤を判断できる人が少ないしなぁ
出版前にミス減らすのは難しいだろう
773:132人目の素数さん
14/03/15 14:57:44.21
>>770
tex使って書いて、校正も自分でやってるんじゃないの?
774:132人目の素数さん
14/03/15 16:10:52.76
大学の数学関係なく、日本の出版は誤植だらけ。
大半がマカーだから仕方がない。
775:132人目の素数さん
14/03/15 22:24:51.54
つめが甘いのは、糖尿病だからだ。
研究職の人は、運動しないから。
776:132人目の素数さん
14/03/16 03:08:27.56
アル中かニコチン中だから集中力が続かないんだよ。
777:132人目の素数さん
14/03/16 22:46:25.66
アルコール中毒と
アルコール依存症は
別のもの。
778:132人目の素数さん
14/03/17 10:34:44.88
比較的易しめな教科書を使って統計学を自習してるんだが、天下り的に書いてあることが、「定理」なのか「法則」なのか「経験的にうまくいく手法」なのか書いて無くてもやもやする。
例えば、「母分散が未知な商標本の推定/検定にはt分布を用いる」と書いてあって、それはt分布はそのような推定を正しく行えるという定理なのか?それともt分布を使うとうまくいくと経験的に知られているということなのか?
数学的に厳密な本を読めばちゃんと書いてあるのかな?
779:132人目の素数さん
14/03/17 10:35:43.41
あ、改行してなかったごめん
780:132人目の素数さん
14/03/17 13:47:43.56
書いてあるわけねー
定理は書いてるだろうが、定理と法則の違いは何だ?
781:132人目の素数さん
14/03/17 18:34:18.60
定理じゃないか
782:132人目の素数さん
14/03/18 00:13:43.73
ちゃんと書いてあるよ
○○が正規分布に従うとき××はt分布に従う
自由度nのt分布はn→∞で正規分布に弱収束する
とかね
予備知識として測度論を仮定するけど
783:132人目の素数さん
14/03/18 00:51:57.22
すっきりしたいならルベーグ積分まで勉強してから吉田朋広の数理統計学を読むといいぞ
784:132人目の素数さん
14/03/19 14:56:35.88
例えば、0~100の範囲の実数を考えます。
Aは、1,5,10,12,40,42,43,70,75,76 (10個)
Bは、2,4,6,10,12,41,43,74(8個)
Cは、5,6,22,23,50,51,52,55,62,63,70(11個)
以上のようなデータがあります。
これらABCのデータの相関関係を調べたいのですが
それぞれのデータ総数はことなっています。
ですのでエクセルでいうところのcorrel関数は
使えません。
だからといって、それぞれ相関がないとも言えません。
AとBの方が、AとCの相関より高い気がします。
こういったデータの数の異なる場合の相関の求め方を教えてください。
または、Rでの関数がありましたらお教えください。
785:132人目の素数さん
14/03/19 15:31:28.09
個数が違うのに相関がある…?
別の分析方法を模索すべきでは
786:132人目の素数さん
14/03/19 15:41:10.68
なるほど、相関とは言えないのですね。
各ABCがそれぞれ似ている度合を調べたいのです。
どういう方法がありますでしょうか?
787:132人目の素数さん
14/03/22 01:24:58.62
似ているとは何か
788:132人目の素数さん
14/03/22 23:51:23.93
>>787
質問に質問返しとな?あほですか。
>>784
とりあえず、ABCの集合について、0から100を10で区切り、
ヒストグラムを求める。
10で区切った分布の数を、ABCで相関係数で求める。
以上。
789:132人目の素数さん
14/03/23 13:07:48.14
>>784
A,B,Cのそれぞれの近さを見るとしたら
分布の類似度を見るということにして
カルバックライブラーあるいはエントロピーあたりの
情報量を利用したほうがいいんじゃないだろうか。
790:132人目の素数さん
14/03/24 15:46:49.50
質問です。
ロジスティック回帰と二項ロジットモデルの違いについて教えてください。
同じ、としているものや微妙に違う、としているものがあって困ってます。
791:132人目の素数さん
14/03/25 00:19:26.68
同じでいいと思う派
あえて言うならロジスティクス回帰の一つに二項ロジットがあるって感じかな
792:132人目の素数さん
14/03/27 21:52:46.28
質問です。
AグループとBグループの2つのグループがあるとします。
それぞれのグループの2種類の要素を抜き出し、
その要素間を比較した際に、ABグループに
有意差があるかどうかを見たいのですが、
正規分布するかどうかは予想できない物として、
どのような検定が見合っているのでしょうか?
設問が抽象的なのでもうちょっと具体的な例示をすると、
和食(Aグループ)と洋食(Bグループ)で、
それぞれ「食事量」「怪我の治る日数」という要素を抜き出し、
「食事量が多いほど、怪我の治りが早い。
特に洋食グループほうが、やや治りが早い」
というように、ABグループのもつ要因(食事量)が、
最終的に「怪我の治り」に影響するかどうか、
みたいなことを調べたいのです。
793:132人目の素数さん
14/03/28 14:34:03.30
学部1年からやり直しなさい
794:132人目の素数さん
14/03/28 14:48:15.29
>>792
>具体的な例示をすると、
めちゃくちゃ
795:132人目の素数さん
14/03/28 15:27:23.57
めちゃくちゃ、とか書かれても何のヒントにもならないんだけど、
例が悪いってことかな?
じゃあ、別の例を設定すると、
ある遺伝病を持つグループ(Aグループ)と持たないグループ(Bグループ)があり、
ある程度相関認められている第一要因と第二要因について、
特定の治療後に第一要因と第二要因を測定した場合、
Aグループの第二要因の平均改善率のみ高いとする。
この場合に、その上昇を誤差であるのか、有意差であるのかを検定する場合に
どんな検定法が考えられるのか、が知りたいのです。
遺伝病の有無をダミー変数化して、3要因に対してフリードマン検定をかけ、有意差が拾えた場合に多重比較する、という手順であってますか?
上司の論文用のデータを揃えるために統計学を今年から独習し始めたのですが、
完全独習なので周りに先生といえる人が存在せず(上司自体も統計が得意ではない)、
自分のロジックがあっているのかどうかが判断できなくて困ってるんです。
796:132人目の素数さん
14/03/28 17:13:15.83
めちゃくちゃなのは君の上司w
797:132人目の素数さん
14/03/28 19:03:29.63
exactly
798:132人目の素数さん
14/03/29 10:38:04.02
>>792
件数がどれくらいかわからないけど、
クロスとってカイ二乗の値みて、違いの有無を
判断したらどう?
データ件数が、すご~く多いと、なんでも有意になっちゃうけど。
799:132人目の素数さん
14/03/29 10:42:50.93
上司に相談してセミナーに参加するなり、大学の先生を紹介してもらえ
そうしないと今流行の捏造になります、といえば
800:132人目の素数さん
14/03/29 21:16:16.26
>>798
結局、第一要因と第二要因の比率をとり、
A群、B群間の比率を比較することにしました。
ありがとうございました。
801:132人目の素数さん
14/03/29 21:49:47.78
>>800
まあ、同じことですね
802:132人目の素数さん
14/03/31 00:49:09.14
overall standard deviationとwithin standard deviationとの違いを教えてください
803:132人目の素数さん
14/04/01 00:39:27.60
>>802
名詞句と副詞句
804:132人目の素数さん
14/04/01 07:15:16.63
e+πが無理数であることを証明できた!!!苦節5年ううう
805:132人目の素数さん
14/04/01 07:28:53.06
>>802
まさに言葉のとおり
まとめて見るか
グループごとに見るか
806:132人目の素数さん
14/04/01 08:53:52.96
>>804
俺には、むりっすう
807:132人目の素数さん
14/04/01 13:10:38.57
>>804ええ?e+πが無理数であることを証明?eが有理数であろうが無理数であろうが、πが無理数なら足せば無理数なのは自明ではないか?
808:132人目の素数さん
14/04/01 13:21:06.67
無理数+無理数は有理数にもなる
809:132人目の素数さん
14/04/01 13:57:59.68
>>807
e+π:無理数は未だに証明されてないんだ.
たしか証明されているのは,e+π,eπの少なくとも一つは超越数であるということだけ.
810:132人目の素数さん
14/04/01 14:05:17.36
今日はエイプリル・フールということもあり、真に受けない方がいいぞ。
統計のスレで数論の話がいきなり出ることは何か不自然だろ。
811:132人目の素数さん
14/04/01 14:15:02.77
群論から統計に来た先生知ってる
812:132人目の素数さん
14/04/01 14:17:13.06
エイプリル・フールって本当はエイプリルフールという表記でいいのか。
「・」が必要なのかと思ってた。
813:132人目の素数さん
14/04/01 14:22:50.91
>>811
多分、グラフ理論とか組合せ論の間違いだろ。
組合せ論関係なら、有限群関係で大多数の人が組合せ論に移ったという事実がある。
814:132人目の素数さん
14/04/01 14:30:25.95
>>813 中学生の時に通ってた有名高校受験塾でやらされた青チャート数学Ⅰ(現在の赤チャート)で順列組み合わせをやって、面白いパズルみたいだと思ったことがある。
815:132人目の素数さん
14/04/01 14:32:03.82
有名高校受験塾に通ってたんですか
それはようございましたね
816:132人目の素数さん
14/04/01 14:37:03.95
>>814
本格的な組合せ論になると、有限群の表現論とか解析とか用いるようになる。
受験数学とは感覚が全く異なる。
色々なモノを用いる数学というか何というか。
817:132人目の素数さん
14/04/01 17:54:37.06
>>804
エイプリルフールの誤爆でした
818:132人目の素数さん
14/04/02 09:37:15.52
>>811
>>804
エイプリルフールの誤爆でした
819:132人目の素数さん
14/04/02 21:10:24.91
>>412
>最強の「学問」だ・・・・・・・・・・・・・
と、2013年に吹聴した東大医学部卒だが医学科でなく生物統計学専攻とか
のたまう胡散な御仁が、今度は『全国民のための統計解析』を宣教し
始めたようだが、傾聴に値するのかな?
1億人のための統計解析 仮説は最初に立てるな! 2014年3月25日
URLリンク(business.nikkeibp.co.jp)
820:132人目の素数さん
14/04/02 23:22:43.98
医学科にいたら統計なんて下々の学問に手を染めたりしないだろうから
経歴としてはむしろ妥当なんじゃないかと思うが、読むに値するかは知らん。
ビジネス啓蒙書なら整理術とか記憶術とかと同じ枠で考えて判断すれば?
821:132人目の素数さん
14/04/02 23:28:29.86
>>819
医学部だった?学部の時は計数工学あたりかと思ってた。
822:132人目の素数さん
14/04/03 09:35:01.29
>>819
医学部「保健学科」
823:132人目の素数さん
14/04/03 15:32:48.45
>>822
医学部看護学科だよ。
824:132人目の素数さん
14/04/03 19:17:35.95
衛看か、俺の頃は唯一女子学生しか居ないところだったが
825:132人目の素数さん
14/04/03 19:30:48.01
八田ちゃんか
826:132人目の素数さん
14/04/03 22:03:16.05
>>823
東大看護学科卒ということは、八田亜矢子、小正裕佳子同様に理Ⅱ
入学組ということか?
827:132人目の素数さん
14/04/04 09:30:25.66
>>824は多分大昔の話、理?、文?とか別枠で衛生看護学科(4年生)
入学資格女子のみ、ただし最初の2年は駒場で一般教養をやってたから
女性の少ないあの頃の東大生は初恋の相手が彼女達というのが多かった。
詳しくはwikiへ
828:132人目の素数さん
14/04/04 20:37:32.94
そう、大きく変わってるからね。
統計に関しても、国内の一つの柱になってる。
829:132人目の素数さん
14/04/05 07:41:06.63
>>821
あづまぶる東大じゃ応用統計学を、計数工学と称するのか?関西じゃ
耳にせぬ名称だな。すると計量工学もあるのか?京大じゃ数理工学科、
阪大じゃ基礎工応用数学科だったか。
830:132人目の素数さん
14/04/05 09:46:22.65
>>829
「計測+数理」からの造語なんで「計量」の対義語じゃないみたいね。
関西に限らず、たしかに計数工学という科は東大以外あまり聞かないね。
まあ、実務の世界で活躍している人を多数輩出してるので
看板の一つだろうな。
そういえば工学部自体が世界最古だった
831:132人目の素数さん
14/04/05 18:30:56.35
昔は(50年くらい前、今も?)数学が好きで理学部数学科に行きたいが
数学者になれるかどうか不安、とか親が工学部に行けと言うから、
という安全志向に押されてここに行った学生がかなり居た
実際理数卒より生涯収入は平均多いだろう
それぞれの教授になった連中は収入は同じようなもんだが、居心地はどっちがよかったか
まあ、性格は大分違ったね(後天的かもしれんが)
832:132人目の素数さん
14/04/05 20:39:10.45
工学系は、他人がやっていない新しいことを探し出しやすいので
そういうのが好きな人は楽しいんじゃないかな。
院の生物統計も(医薬・看護系)で西欧は盛んでも日本には専門が
無いということで、計数工学出身の教授が新たに作りたいという
事から始まったから、新しいもの好きに向きなのかも。、
833:132人目の素数さん
14/04/07 22:41:29.72
>>832
生物統計を始めた計数工学出身の医学部教授というのは、
大橋教授のことですね?
東大 医学部健康総合科学科 大橋 靖雄 教授
URLリンク(www.hn.m.u-tokyo.ac.jp)
834:132人目の素数さん
14/04/09 12:12:37.52
すみません、誰か教えてください。
適合度の検定で有意差が出て、どこに差があったのか多重比較を行う場合、
ライアン法を使っても構わないですか?
某オンライン統計サイトでは、自動的にライアン法で多重比較までやってくれますが、
ライアン法は「k×2分割表の比率」のみに使用できる、と書かれている場合もあります。
835:132人目の素数さん
14/04/13 20:51:10.51
独学で統計を学びたいのですが、一冊目におすすめの本を教えて下さい。
スレチだったらすみません。
836:132人目の素数さん
14/04/14 01:16:37.80
完全独習統計学
837:132人目の素数さん
14/04/15 07:52:08.12
統計学入門 (東大出版会)
838:132人目の素数さん
14/04/15 08:49:25.19
誘導されてやってきますた
スレリンク(math板:295番)
839:132人目の素数さん
14/04/15 09:01:31.73
日本の大学で教えている確率・統計学じゃ使いものにならない気がするわ
物理の統計力学とかランダム行列とかまでやらないと
計数工学科は数理科学の工学版みたいなもんだろ
工学向けの数学に関する専門学科って感じだな
840:132人目の素数さん
14/04/15 09:29:35.41
なぜ統計力学が出てくるのか
841:132人目の素数さん
14/04/15 15:54:29.26
言葉が似てるからだろ
842:132人目の素数さん
14/04/16 00:06:46.19
>>835
入門は放送大学つかえば?
ちょうど新学期の放送始まったばかりだから
843:132人目の素数さん
14/04/16 00:21:04.83
>>842
放送大学良さそうですね。
此方まだ高校生なので理解に足りるかわかりませんが、一度みてみます。
844:132人目の素数さん
14/04/16 00:29:59.69
確率・統計 (理工系の数学入門コース 7) 薩摩順吉
これを超える統計学入門書は存在しない。
845:132人目の素数さん
14/04/16 01:27:21.12
放送大学の統計はプロ野球の公式戦でのダルビッシュや松坂の投球内容がやたらとデータ化されて教材として使用されてる
846:132人目の素数さん
14/04/16 23:39:30.73
それは基礎科目の「身近な統計」の方か
専門科目の統計学はラジオなんだな。知らなかった
847:132人目の素数さん
14/04/17 07:34:56.89
区間推定に関して質問です。
正規分布する観測量の平均値を推定するとき、標準化して標準正規分布の数値表から信頼区間を求めますよね。
この時、元になる分布とそれを標準化した標準正規分布の信頼区間が対応するとする根拠はなんでしょうか?
848:132人目の素数さん
14/04/17 12:52:37.51
元側の確率変数に対し、同一の母平均の値を引いて、さらに同一の標準偏差で割ったのが、新しく生成された標準化された確率変数なのだから、
信頼区間内に含まれている標本群の特性は何ら変わらずに、標準化前→標準化後にそのまんま引き継がれていて当然なのでは?
849:132人目の素数さん
14/04/17 18:39:03.63
平均値が最大値と最小値の間にあること。
中央値が平均値の2倍以下であること。(ただしデータは非負とする)
という2題を証明せよ、という問題なのですが、どういう方針で証明すればいいんでしょうか?
850:132人目の素数さん
14/04/17 18:47:21.04
確率変数Xが平均μ分散σ2の正規分布に従うとき、
aX+bは平均μ+b分散a2σ2の正規分布に従う。
これの証明は、簡単で、多くの教科書に載っている。
思弁的な説明は、数学の範囲外にある。哲認定。
851:132人目の素数さん
14/04/17 18:52:51.59
>>849
一行目:最大値と最小値を別々に証明すれば良い
二行目:データの半分は中央値より大きい
852:847
14/04/17 19:07:33.94
>>848
感覚的にはわかるのですが、数学的に厳密な証明を知りたいです。自分で定積分計算しようともしましたができませんでした。
>>850
aX+bは平均μ+b分散a2σ2の正規分布に従うということと、対応する区間内での積分値が一致することが繋がりません
853:132人目の素数さん
14/04/17 19:22:46.16
少しは自分で式を書いてみろ
854:132人目の素数さん
14/04/17 19:23:40.64
>>849
なるほど、わけて考えるんですね。
ありがとうございました。頑張って解いてみます。
855:132人目の素数さん
14/04/17 22:21:55.63
文系の大学生で基礎統計をやるんですけど
文系数学の知識ではできないところってありますか?
856:132人目の素数さん
14/04/17 22:28:23.31
何やるのか知らんが、まともな内容なら、exp(x)ってなあに?だと正規分布すら分からないから無理
たのしいえくせる♪みたいな内容だったら文系だろうが問題ないでしょ
857:132人目の素数さん
14/04/17 22:31:58.40
理系も混じってるからがちだと思う
新世社の入門統計解析ってのが教科書
微分積分の勉強すればいい?
858:847
14/04/17 23:32:36.87
>>853
ん~自分でも式書いて証明こころみてるんですが、単純に積分してイコールになるっていう方法以外思いつかないんですよね。
で、積分するにしても∫[0,a]e^(x^2)dxは手計算では不可能らしいということが分かりましたし。。どうにも厳密な証明にたどりつかないんです
859:132人目の素数さん
14/04/18 00:06:36.61
本当に書いただけだな
860:132人目の素数さん
14/04/18 00:09:47.66
というか母平均を推定するときって標準化するっけ
861:132人目の素数さん
14/04/18 01:51:24.32
>>860
そら正規分布表を読んで得られた数値って、標準正規分布という前提で色々計算された結果なんだし
862:132人目の素数さん
14/04/18 02:10:51.53
意味も考えず計算するという奴か
863:132人目の素数さん
14/04/18 10:28:13.67
うちの教授は統計は理論を理解するより
何度も計算して手続きを覚えろと教えてたな。
864:132人目の素数さん
14/04/18 16:02:24.45
それで済む人はここに来る必要はない
865:132人目の素数さん
14/04/18 20:12:05.19
そんな高度な議論をしていたとは今まで全く気づかなかった。それは失礼した。
866:132人目の素数さん
14/04/19 00:33:31.53
高度だなんて誰が言った?
867:132人目の素数さん
14/04/19 00:47:58.52
いやみ、皮肉でしょ
868:132人目の素数さん
14/04/19 01:05:05.32
いや、おそらく864が863の意味を反対に捉えてしまったんだろう
869:132人目の素数さん
14/04/19 12:54:59.50
どっちの意味でも同じじゃない?
870:132人目の素数さん
14/04/19 13:20:42.61
正規分布って誰が発見したんですか?
871:132人目の素数さん
14/04/19 13:23:12.23
ガウス
872:132人目の素数さん
14/04/19 13:40:05.59
>>871
先生がガウスじゃないって言ってました。
名前は忘れたんですが思い出せなくて。
何人かの数学者が同じ頃に発見していたというように
いってたと思います。
873:132人目の素数さん
14/04/19 13:45:08.74
あっ、そう
874:132人目の素数さん
14/04/19 14:25:54.78
正規分布の意義を研究したからガウス分布と言うのさ
875:132人目の素数さん
14/04/19 14:56:27.60
数学や物理はいつも同時発見が多いのは、発見されることが必然だからさ。
876:132人目の素数さん
14/04/22 11:48:02.43
問題ではないのですが表を作る上でわからないことがあるため質問させて下さい。
点数と順位の表を作り、その内容から何点取れば何位程度になれるかという表を作りたいです。
サンプル数は非常に少ないのですが、例えば
40点 120位
65点 50位
というサンプルがある場合、80点取れば何位程度が想定できるかという表を作りたいです。
これはどのように表にすることが出来るでしょうか。
877:132人目の素数さん
14/04/22 11:49:37.18
引っ越すならここじゃなくてポエムスレだろ
878:132人目の素数さん
14/04/22 15:17:09.10
表とグラフは一応別物だと思っているんだが・・・回帰直線のグラフじゃだめなのかい?
879:132人目の素数さん
14/04/22 18:22:23.30
>>876
スレリンク(math板:351番)
880:847
14/04/24 05:59:52.08
>>847には答えてもらえなそうですかね~証明が載ってる本を紹介してもらうだけでもいいんですが
881:132人目の素数さん
14/04/24 06:38:39.95
単なる変数変換だから
微積分の教科書読むといいよ
882:132人目の素数さん
14/04/24 13:14:10.39
「読者を馬鹿にしてる」と言われそうな本があるんかな
ここで書いても馬鹿にされそうだが
883:132人目の素数さん
14/04/24 16:46:02.27
>>880
まさかaを引いてbで割ったものを、bを掛けてaを足したら同じになる根拠はという質問?
標準化した信頼区間を元になる分布に対して見る場合は当然、bを掛けてaを足して元に戻すんだぞ。
884:847
14/04/24 23:03:33.44
>>883
いえ、aを引いてbで割ったものが違う値になることはわかっています。
ただ、対応する値の間の区間の積分値は一致していなければこの推定は成り立ちませんよね?
たとえば、
f(x)を正規分布する確率変数として、それを標準化したものをg(z)として、
変数xの区間[a, b]に対応する標準化変数zの区間が[z1, z2]だとすると、
∫[a, b]f(x)dx=∫[z1, z2]g(z)dz
が成り立っていなければいけないと思うんです。でもコレの証明を見たことがないということです。
自分で計算しようとしても、どうしても定積分の計算でつまずいてイコールにできません。
885:132人目の素数さん
14/04/24 23:20:39.05
確率変数と確率密度関数の定義もわからないでそんなこと考えてるのか
886:132人目の素数さん
14/04/25 00:20:57.87
積分のとこ変数変換したら成り立たなくないか
887:132人目の素数さん
14/04/25 00:30:57.49
ただ、対応する値の間の区間の積分値は一致していなければこの推定は成り立ちませんよね?
ここなぜそう考えたのかわからないので教えてください
888:132人目の素数さん
14/04/25 01:14:35.74
>>884
そのつまずいたという計算を書いてみ
889:132人目の素数さん
14/04/25 03:45:10.98
>>887
標準化する前も後も結局は同じ式、正規分布関数なのだから、
きっと、∫[(z1-μ)/σ, (z2-μ)/σ] 、∫[z1, z2]を正規分布関数で解けばいいんだよ。同じになるはず。
890:132人目の素数さん
14/04/25 21:24:23.58
これが分からん奴に何を説明しても無駄じゃない?
891:132人目の素数さん
14/04/25 21:37:59.38
数学の基本なしで統計やるとこうなる見本だな
892:132人目の素数さん
14/04/26 18:49:29.43
最低でも数IIICはしないとダメだなという典型例か
今はCないらしいが
893:132人目の素数さん
14/04/26 21:42:21.27
>>889
前半は元に戻すんだから∫[(z1σ+μ, z2σ+μ] だな。
正規累積分布関数なら代入するだけ。(x-μ)/√(2σ^2)の部分に代入するだけで、
簡単に同じ式になることが分る。
894:132人目の素数さん
14/04/29 20:49:01.01
条件付き確率分布でf(x|y;θ)とf(x|y,θ)という書き方を両方見る気がする
違いはあるのだろうか
895:132人目の素数さん
14/04/29 22:13:14.22
a, b, c という具合に変数やパラメータを並べる際、cだけがaやbとは別種のもののとき、その違いを強調するために a, b; c と書くことがある
云わば「強い区切り」としてセミコロンを使う
896:132人目の素数さん
14/04/29 22:15:42.00
数式にそんな曖昧なルールが本当にあるのか?
単純に処理系の違いじゃないのか。
897:132人目の素数さん
14/04/29 22:18:55.68
コンピュータに入力するわけじゃないんだから、数式の書き方なんて慣習頼みである程度の表記揺れはあるよ
見ればすぐに分かる程度の揺れだが
曖昧というのとは少し違う
898:132人目の素数さん
14/04/30 01:17:19.04
定義は厳密だが表記は人次第
899:132人目の素数さん
14/04/30 10:44:14.86
ニュートンの時代の話?
900:132人目の素数さん
14/04/30 11:13:14.34
>>899
???
901:132人目の素数さん
14/04/30 11:16:19.66
>強調するために a, b; c
ねーよ。
902:132人目の素数さん
14/04/30 13:17:34.48
いや、あるよ
別に数学だけの慣習ではなく、英語一般に通じる話なんだけど>強い区切り
903:132人目の素数さん
14/04/30 16:14:10.89
高校の英語でも習う話だな
904:132人目の素数さん
14/04/30 22:33:27.57
音楽の記号使うか
905:132人目の素数さん
14/04/30 22:51:56.80
>>894
そのケースでは、意味に差の無い
単なる「強い区切り」でしょ、たぶん。
楕円関数なんかだと、区切りの書き方によって
パラメータの表示方法が違ったりするから、
一応、文脈に沿った確認は必要だが、
おそらく >>895 の言うとおり。
906:132人目の素数さん
14/05/01 19:22:50.13
曖昧に強調するためとかいうから勘違いする奴が出てくる。
ならボールド体や斜体表記でもいいだろということになる。
論理的に明確にコンマと区別したいから使うものだろう。
複数の数列とか行列とかコンマだけなら意味が不明確になる場合に。