統計学Part１５

統計学Part１５at MATH

統計学Part１５ - 暇つぶし2ch150:１３２人目の素数さん
13/08/22 NY:AN:NY.AN
些細な名称とかに拘らず独自の統計学をとれば良いと思うんだよね
習った知識ばかりじゃカチンコチン過ぎて統計学止まりだね
統計で思考停止したいなら良いけど

151:１３２人目の素数さん
13/08/23 NY:AN:NY.AN
>>149
>さらにサンプル数が小さいと分解能が悪いから精度が下がり易い・・・・・・・・・・・・
サンプル数ってサンプルサイズ？分解能が悪いって、使用計測器の
性能問題？何が言いたいの？いったい何番の質疑へのレスなの？

152:１３２人目の素数さん
13/08/24 NY:AN:NY.AN
8/24NHK朝7時のニュースで鮭肉色膝上丈ワンピスカ江崎史恵アナが、国民の
スポーツ習慣統計調査の年代別頻度結果を円グラフ・帯グラフを使って
紹介していた。国が、国民3000人に訊ねて1800余人から有効回答の結果とも。
この手のアンケート調査の抜取標本数は、どういう計算式で決めているのだろ？

153:１３２人目の素数さん
13/08/26 NY:AN:NY.AN
ある無限集団のサンプルとしてなら3000で十分だと思うが、その調査で3000は意味が無いな。

おそらくは、老若男女、収入や労働環境、地域性や病気の有無、季節性その他で、
スポーツ習慣は違ったものになってしまうだろうからな。

そしたものを全部一緒にして年代だけ分けてドヤ顔するのは偏向報道のチョンNHKらしいな。

154:カナリア
13/08/26 NY:AN:NY.AN
質問させてください！
正規分布していないデータ（単純反応時間など）と正規分布しているデータ（IQなど）の相関を出そうとした場合、ピアソン積率相関係数ではだめですよね？？？
でも結構それで論文でてたりするんですが、いかがなものですか？
厳密にいうとだめってレベルなのでしょうか？
教えてくださーい

155:１３２人目の素数さん
13/08/27 NY:AN:NY.AN
>>153
無限集団というのは、幾つ以上をいうのですか？スポーツ習慣統計
調査>>152の場合、母集団は10代以上の日本国民ですから１億人以上
ですが、１億人では有限集団ということですね？
なお調査機関は、NHKでなく国と江崎史恵アナは云っておりました。

156:１３２人目の素数さん
13/08/28 NY:AN:NY.AN
統計学って全てのサンプルを調べられて
パソコンで計算可能なら確率論でしかないですよね？

157:１３２人目の素数さん
13/08/28 NY:AN:NY.AN
>>156
それのどこに確率的な要素があるの？

158:１３２人目の素数さん
13/08/28 NY:AN:NY.AN
平均値、標準偏差ね。
つまりヒストグラム＝確率分布となるわけだよね。

159:pH7.74
13/08/29 NY:AN:NY.AN
SPSSによるロジスティック回帰の出力について質問失礼します(SPSS&元データ非所持)
(例) 応答変数：発病するか否か、説明変数：体重(量的変数)、場所(質的変数)
　　　　　　　B 　　標準誤差　　Wald　　自由度　…
体重　　　.087　　　　0.44　　　3.858　　　　1
場所　　　　　　　　　　　　　　　14.294　　　2
場所(1)　1.435　　　.461　　　　9.687　　　1
…
場所のWaldの欄にある統計量は一体何でどのように算出されたものなのか、教えていただけますと幸いです

160:１３２人目の素数さん
13/08/29 NY:AN:NY.AN
>>159
「Wald検定量　ロジスティック回帰」で検索してはいかがでしょうか。
算出方法など詳しい解説がすぐに見つかると思います。

161:１３２人目の素数さん
13/09/01 23:20:52.89
あんまり数学がわかっていない人間ですが、質問させてください。
ある、時系列データがあり、過去の変動が次の変動にどのような影響を与えるか推測する方法はどんなものが基本でしょうか？
よろしくお願いいたします。

162:１３２人目の素数さん
13/09/01 23:40:01.31
ノバルティスの問題も、つまるところ当該の医学者に統計学の素養がないことが発端だろ？
迷惑だから、統計学勉強しないで税金使って論文書くの本当にやめて欲しい。
学問として論文を書くのであれば、測度論とまでは言わないが、統計学の前提となる確率論、確率論の前提となる積分ぐらい勉強すべき。これ、語学とおなじくらい重要と思うのだが。

163:１３２人目の素数さん
13/09/01 23:40:16.75
自己回帰モデル

164:１３２人目の素数さん
13/09/02 01:12:02.14
>>161
自己相関

165:159
13/09/02 11:41:26.81
>>160
返信遅れまして申し訳ございません、少し説明不足でした

体重や場所(1)のWaldに関しては、傾きや切片の推定値がゼロと
異なっているかを推定するためのWald統計量ということで理解できるのですが、
場所のWald欄にある統計量が一体何なのかが解らず困っております
私自身は解析にRを用いているのですが、その場合カテゴリカル変数一つに対して一つの
Wald統計量が算出されるため、上記のような統計量と遭遇したことがなく、どなたか教えていただけますと助かります

166:159
13/09/02 15:10:19.98
>>159下から2行目訂正失礼します
カテゴリカル変数一つに対して一つの　＞　カテゴリカル変数の各水準に対して各一つずつの

167:１３２人目の素数さん
13/09/03 15:24:35.67
>>165-166
自己解決しました
Wald統計量は自由度2以上でも普通に算出できるのですね、失礼しました

168:１３２人目の素数さん
13/09/06 18:54:39.01
ときお
まどりっど
イスタンプール

169:カナリア
13/09/08 17:23:02.99
グラフにエラーバー（SD）をつけました。
縦軸に正答率をとると、80~90程度の平均値ですので、エラーバーが100を超えます。
個人的には100でとめたいのですが、だめっていう意見もあります。
皆さんの意見をお聞かせください。

170:１３２人目の素数さん
13/09/22 16:02:21.69
DCC-GARCHについて勉強したいのですが、日本語で詳しく説明されている論文、テキストなど教えてください。

171:１３２人目の素数さん
13/09/22 16:32:33.61
日本語あてにしてたらアカンやろ

172:１３２人目の素数さん
13/09/23 00:46:34.67
すいません初学者なのですが、２つの水準の平均値差を検定する場合に、t検定を行った場合と、分散分析を行った場合では、意味合いは違うと理解してよろしいのでしょうか？（教科書では分散分析は３群以上比較する場合に使うと書いてありますがあえて2群でやった場合です）
t検定のtと、分散分析のFは、計算式も違いますし分布の形状も違いますが、いくつかのサンプルデータで統計ソフトをつかって計算したところ、t検定でも分散分析でも有意確率が同じ値になりました。これはたまたまでしょうか？

173:１３２人目の素数さん
13/09/23 10:25:13.75
現実的な最低点は、max(0,70-3.5*10)

174:１３２人目の素数さん
13/09/26 00:59:32.90
おまえら
シグマっていったら。

やっぱり
σ　の方か？

175:１３２人目の素数さん
13/09/27 22:32:18.33
大文字小文字両方

176:１３２人目の素数さん
13/09/27 22:37:19.24
URLﾘﾝｸ(www.bun-eido.co.jp)

177:１３２人目の素数さん
13/09/28 00:26:45.06
統計学に必要な数学の知識ってなに？

微積分と線形代数学分かってればいいの？

178:１３２人目の素数さん
13/09/28 03:13:21.26
大学1年レベルの微積と線形代数わかってるとかなり便利
もちろんもっと高度な知識も必要な場合もあるけど目的次第かな

179:１３２人目の素数さん
13/09/28 03:36:38.64
>>178
ありがとう
こちとら文系で数2Bしかやってないもんだから
今から小島寛之の微積分と線形代数やろうかなぁと思いまして
本当はチャートとか高校生が使うようなもので勉強した方がいいのかな？

180:１３２人目の素数さん
13/09/28 03:48:33.82
>>179
高校数学はIIICまではある程度理解しておいたほうがいいのは確か
でもチャートとかは量が多すぎるからなぁ…
IIBやってたなら小島寛之の本にもついていけるかも

181:１３２人目の素数さん
13/09/28 10:15:04.78
>>177
そんなあなたにマセマ

182:１３２人目の素数さん
13/09/28 17:39:01.41
　
統計学って数学じゃないだろコレ

183:１３２人目の素数さん
13/09/28 18:54:23.30
「プログラミングのための確率統計」（オーム社）これ、近年まれにみる良書。
タイトルからのイメージとは全く異なり、プログラム技法は何も記されていない。
しかし、初学者に確率統計のかんどころを理解させようとする著者の工夫と執念を感じる。

184:１３２人目の素数さん
13/09/28 20:52:19.06
>>182
統計学は数学じゃなく算数だね　経験則

185:１３２人目の素数さん
13/09/29 05:19:32.19
吉田朋広の数理統計学ぐらいだと普通に数学と思うけどなぁ

186:１３２人目の素数さん
13/09/29 19:23:38.93
統計学は数学を使う

187:１３２人目の素数さん
13/09/29 20:14:45.15
応用算数でしょ普通の統計学は

188:１３２人目の素数さん
13/10/01 01:25:11.85
算数レベルで公式が出せるか

189:１３２人目の素数さん
13/10/01 01:57:19.89
算数レベルの統計しか知らないってことか

190:１３２人目の素数さん
13/10/01 04:21:56.72
標本数の少ない2項分布の母集団の差の検定ってどうやればいい？
標本数少ないから正規近似が出来ないのだけど。

191:１３２人目の素数さん
13/10/01 07:55:34.87
>>190
マクネマー検定でいいんじゃない。

192:１３２人目の素数さん
13/10/02 00:24:59.73
　
古典統計学⊂ベイズ統計学　だよね？

193:１３２人目の素数さん
13/10/02 13:16:11.78
東京大学教養学部統計学教室編『基礎統計学』(全3巻)はどうですか？

194:１３２人目の素数さん
13/10/02 23:23:36.53
>>193
全部買って読んだけど、独学するには解説が足りない気がするが、ネットで調べながらならOKだと思う
個人的には第２巻いらんかった。

195:１３２人目の素数さん
13/10/03 10:43:02.09
全三巻じゃないし・・・・
バラバラに買うやつだろ。

196:１３２人目の素数さん
13/10/11 13:15:08.34
ポアソン分布とかガンマ分布とか出てくるけど、あれも算数？

197:１３２人目の素数さん
13/10/11 15:32:38.62
学校の課題で会計士への連絡内容書くやつあるんだけどどうな風に書けばいいの？
ぐぐっても分からないので教えてください

例題
会計士にアイスの平均販売個数の値を連絡する

198:１３２人目の素数さん
13/10/11 17:01:30.33
>>197
１０月１１日　今日は暑かったのでアイス100個売れました。

199:１３２人目の素数さん
13/10/12 19:52:25.56
ｽﾚﾘﾝｸ(part板:574番)

偏差値の部分、勢いで書いちまったんだけど、間違ってないよな？

200:１３２人目の素数さん
13/10/12 20:45:28.23
偏差値50=平均値ってこと？あってるよ

201:１３２人目の素数さん
13/10/12 21:39:14.58
だよな？
偏差値50は平均だから、偏差値50レベルの大学には半分が受かるってことでいいんだよな？

202:１３２人目の素数さん
13/10/12 22:07:16.12
分布に偏りがある場合は偏差値50でも半分受からないことはあるぞ

203:１３２人目の素数さん
13/10/12 22:17:47.12
平均と中央値は違うからね

204:１３２人目の素数さん
13/10/12 22:19:59.01
>>199
そのスレの581の方が正しいな
対称正規分布とかいう言い方は意味わからんけど

205:１３２人目の素数さん
13/10/12 22:43:27.86
対称でさえあれば正規分布である必要はないけどな

206:１３２人目の素数さん
13/10/13 16:00:01.08
偏差値は母集団が正規分布に近いときに有効だからかな
変な分布なら偏差値を使う意味が薄れる

207:１３２人目の素数さん
13/10/13 18:16:36.27
最近の学力の分布は二極化が激しいからなあ
偏差値50で等分できるかは怪しいぞ

208:１３２人目の素数さん
13/10/13 18:27:16.35
？？？

209:１３２人目の素数さん
13/10/16 09:23:56.28
URLﾘﾝｸ(ebsa.ism.ac.jp)
統計学の絶版の本が無料で沢山読める
ホームページ見つけたよ。
お礼はいいからね。

210:１３２人目の素数さん
13/10/16 09:34:53.46
danke

211:１３２人目の素数さん
13/10/16 12:52:45.86
なにこれめっちゃいいじゃん

212:１３２人目の素数さん
13/10/18 00:04:58.09
「古典統計学⊂ベイズ統計学」ということでいいの？

213:１３２人目の素数さん
13/10/18 02:20:44.56
いいわけないだろ、あほか

214:１３２人目の素数さん
13/10/18 23:18:06.31
それじゃイコールってこと？

215:１３２人目の素数さん
13/10/18 23:26:31.82
ナイーブな質問なのか、はたまた・・・

216:１３２人目の素数さん
13/10/18 23:32:32.52
統計学初心者です。両者の本質的な関係が知りたいです。

217:１３２人目の素数さん
13/10/18 23:38:38.30
古典統計学、ベイズ統計学も勉強したことがない初心者が本質を知りたいとな

218:１３２人目の素数さん
13/10/19 00:55:07.95
初心者でも本質は知りたいだろ

219:１３２人目の素数さん
13/10/19 00:56:03.04
いや、多少はかじっていますよ　統計物理とかも

220:１３２人目の素数さん
13/10/19 06:17:54.31
統計力学てなんですかてとうしろうに聞かれたら答えられる？

221:１３２人目の素数さん
13/10/19 06:36:59.48
>>218
おまえが答えろよ

222:１３２人目の素数さん
13/10/19 08:57:18.17
ソーバーの「科学と証拠」とか読めばいいんじゃね

223:１３２人目の素数さん
13/10/19 10:09:59.34
いい本紹介してもらった　ありがとう

224:１３２人目の素数さん
13/10/19 21:58:29.62
>>221
あほ？

225:１３２人目の素数さん
13/10/20 07:06:19.89
>>224
おはよう、アホ

226:１３２人目の素数さん
13/10/20 11:15:00.69
>>224 >>225
邪魔だ

227:１３２人目の素数さん
13/10/22 09:47:13.46
教えてください。

ある仮説H0を検定する統計量としてT1とT2があり、T1は通常のカイ２乗分布、
T2はカイ２乗変数の加重和で表される非標準的な分布に従っているとします。
このとき、T1とT2の検出力を理論的に比較することは可能でしょうか？
シミュレーションだと簡単なのですが。。。

228:１３２人目の素数さん
13/10/23 19:09:29.26
宅建試験の統計データなんだけど、
こういう過去のデータとの相関関係とか信頼性？推定？とかって統計学でちゃんと出るのかな？
数学にぜんぜん疎いんだけど、よかったら教えてください

平成19年：LECサンプル数1499名、平均34.4点。合格点35点。
平成20年：LECサンプル数2023名、平均33.2点。合格点33点。
平成21年：LECサンプル数1719名、平均33.8点。合格点33点。
平成22年：LECサンプル数2038名、平均36.3点。合格点36点。
平成23年：LECサンプル数2162名、平均35.7点。合格点36点。
平成24年：LECサンプル数2362名、平均33.2点。合格点33点。

平成20年：U-CAN平均29.8点　合格点33点
平成21年：U-CAN平均30.4点　合格点33点
平成22年：U-CAN平均32.1点　合格点36点
平成23年：U-CAN平均33.05点合格点36点
平成24年：U-CAN平均29.77点合格点33点

229:２２８
13/10/23 19:10:23.31
えっと、つまり、こういう予備校のサンプル数から、
今年の合格点の推定をどの程度の信頼度で出せるのかってことですが

230:１３２人目の素数さん
13/10/23 23:27:46.50
このデータ数だとサンプル数で重みつけて回帰するくらいかな
予備校の中の人なら分散も分かるだろうからもう少しましだろうけど

231:１３２人目の素数さん
13/10/24 22:52:52.13
マンガでわかる統計学、結構面白かったでござる
オオカミと羊の方じゃなくて、女子高生の奴ね。

232:１３２人目の素数さん
13/10/25 10:18:43.92
新世社の「入門統計解析」って本があったからやってみるわ。

233:１３２人目の素数さん
13/10/28 07:47:46.58
　
結局「古典統計学⊂ベイズ統計学」ということでいいんだよね？

234:１３２人目の素数さん
13/10/28 10:39:17.11
excelで散布図に２本の回帰直線を描く方法教えてくれ

235:１３２人目の素数さん
13/10/28 12:37:04.85
２本の回帰直線て何？
主軸の事か？

236:１３２人目の素数さん
13/10/28 19:46:13.53
統計学なのかも良く分からないのですが分かったら教えて下さい。
サッカーのパスが成功する確率の平均が3/4のチームと4/5のチームが
対戦したとするとボールのポゼッション割合は数学的にはどうなりますか？
料チームの他の体力とかの条件は同じで無視すると考えて下さい。

237:１３２人目の素数さん
13/10/28 22:56:06.28
パスの平均連続成功回数は1/(1-p)になるので
お互い10秒に一回パスするというような状況を考えれば
支配率は4:5に収束するような気がする

238:１３２人目の素数さん
13/10/28 23:09:09.42
P[n+1]=0.75P[n]+0.2Q[n]、Q[n+1]=0.25P[n]+0.8Q[n]
(P[n],Q[n])→(4/9,5/9)　（n→∞)

239:１３２人目の素数さん
13/10/29 04:56:27.03
236です。
ありがとうございました。
意外に差が出ないんですね。自分としては差が拡がるものと推測してました。
これなら少し確率は落ちてもより効果的であろうパスを出す方が得点には
結び付き易いように思えますね。

240:１３２人目の素数さん
13/10/30 03:19:28.64
統計学を独学でやろうと思ってるんですが文系でまったく数学が出来ません
そこで中高の数学からやり直そうと思ってるんですがその場合どの単元をやり直す
必要がありますか？

241:１３２人目の素数さん
13/10/30 10:08:56.85
数と式・場合の数・確率・微積分
このへんかな

242:１３２人目の素数さん
13/10/30 13:50:35.04
詳しくありがとうございました。
また中学数学から再勉強します。

243:１３２人目の素数さん
13/10/30 23:32:04.36
12種類のビールについて、下表にある、
消費者の知覚による評価値を得た。
「高価格/低価格」は数値が正符号が大きいほど、
高価格であると知覚され、負で大きい値ほど、
低価格であると知覚された事を示している。
「のどごし/コク,キレ」では、正値がコクであることを意味し、
負値がキレを意味する。得点は-10点から10点の間で評価され、0点はどちらでもない事を意味する。
ここから、プロダクトマップを作成して、解釈せよ。

製品高価格/低価格のどごし(コク/キレ)
A -6.5 5
B 8 8.6
C 2.3 8.5
D 9 8
E -5.7 -6.1
F -3.1 -2.6
G -9 -9
H 8 -9
I -7.2 9
J 6.7 -9.1
K -8.2 1.2
L -8.6 0.5
何とかやっと表はできたんですが、誰かこれ、解釈してくれませんか??

高価格なビールにはコクがある。
だと短すぎますし。
URLﾘﾝｸ(imepic.jp)

244:１３２人目の素数さん
13/10/31 02:07:01.33
せんせえおながいしまつ。

ワイブルプロットによる寿命予測で、実測データから不信頼度 F(t) を求める際メジアンランク法 F(t)=(i-0.3)/(N+0.4) を使いますが、式の根拠が良くわかりません。
総数N個のサンプルでi番目の不良の発生確率と不信頼度の関係がベータ分布に従う事から、発生確率50%(中央値)とした際の不信頼度(=不良率)を求める近似式、というところまでは分かった？のですが、、、

実測データとして得られる統計量は、例えば「たまたま最初の不良が起きた時刻」であるのに対して、モデルは「発生確率50%、つまり時刻はばらつきの中央値」という前提で計算するのは問題無いんでしょうか？
何か勘違いしている？

245:１３２人目の素数さん
13/10/31 02:56:09.05
100本のクジがあり当りが1本あります。　1本引いては戻す形で100回引きます。
100回引いてるさいに当たりが出たら、再度100回引けます。　100回引いて当りが出なかったら終了

というときに、クジを引ける平均回数はどのように求めればよいのでしょうか。

板違いだったら、申し訳ないですが、どなたかご存知の方いましたらよろしくお願いします。

246:１３２人目の素数さん
13/10/31 08:02:09.05
仮説検定ってあるじゃないですか。
あれって凄く仮説が違っているとき以外、
仮説が違ってても仮設が正しいになりますよね。
どういう風に役立つんですか？

247:１３２人目の素数さん
13/10/31 16:12:04.31
　
で、「古典統計学⊂ベイズ統計学」ということでいいんだよね？

248:１３２人目の素数さん
13/10/31 18:49:48.11
>>243を誰か

249:１３２人目の素数さん
13/11/01 20:55:26.43
>>147
大標本・小標本と書いて、続けてその境界数を付記した教科書を見たことが
ないんだが、３０が境界数なのですか？
それとも場合場合で、具体数が変動するから付記しないのですか？

250:１３２人目の素数さん
13/11/02 05:16:05.67
>>248
どうせ学校の課題かなんかだろうけど、とりあえず、オーム社の漫画でも買って読んでみたら？
プロット見ても、相関係数が0.07589016を見ても、
「高価格なビールにはコクがある」なんて言えないことくらい分かるだろ。
あと、データは解析しやすいように書いてくれないと、Rを回すにも面倒だから。

251:１３２人目の素数さん
13/11/02 17:16:46.76
検定統計量って簡単に求められますか？

無相関検定とか等平均仮説の検定(母分散既知・未知とかで5種類くらいある？)の統計量とか覚えられそうにありません...

ちなみに理系大学生で高校数学、大学教養レベルの数学は分かります

252:１３２人目の素数さん
13/11/02 17:21:47.37
種牡馬データはサンプルが少ない方が、傾向を掴む上では役に立つことが多い」と発言したことを
取り上げて叩いている人が少なからずいて、統計学を知らないのか、などという声もあるようだ。

そりゃ私は無知ですから統計学なんて知らないですよ。でも競馬予想に統計学まで持ちだす必要はない。
それこそ、サンプルが溜まれば同じような傾向に収束してしまって、面白いデータにはなりえないし、
そもそもみんなが気付いていることには金脈がない。　

私があんなことを言ったのは、サンプルが少なくて、ハッキリした傾向が出ているということは、
極めて短いスパンで「乗れる」ケースが多いからだ。例えばスニッツェルのそれだったり、
ローエングリンのそれだったり、アドマイヤドンのそれだったりするわけで、
少ないサンプルから近未来に振れていく方向を想定する面白みがあるのだ。
統計がどうとかいうのとは、全く違う見地から言っているので、そこを理解する気がないなら無視していただきたい。

253:１３２人目の素数さん
13/11/02 17:23:11.15
>>249
ggrks

254:１３２人目の素数さん
13/11/02 18:28:30.02
どうでもいいけど、ベイズ統計の話題にみんなダンマリなのはどうして？

255:１３２人目の素数さん
13/11/03 00:20:13.49
じゃあおまえが語れよ

256:１３２人目の素数さん
13/11/03 23:07:07.64
ベイズ統計への偏見持ってるヤシ多過ぎｗ

257:１３２人目の素数さん
13/11/03 23:33:40.25
金融工学についてのブログ記事を書いたところ、謎理論を唱える変な奴に粘着されました。
お手数ですが、もしよければこのブログのコメント欄で、どちらの言い分が統計学的に正しいかジャッジをお願いします。
URLﾘﾝｸ(s.ameblo.jp)

258:１３２人目の素数さん
13/11/10 11:05:08.12
初歩的な質問ですが…
同じ被験者の中で色々条件を変えたときにはどういう検定をすればいいんでしょうか

例えば、立ってるとき、座っているとき、寝ているとき、うつ伏せているときの声の大きさや声を出していられる時間の長さなどを30人くらいで測定して検定したいときです

259:１３２人目の素数さん
13/11/11 00:51:33.96
>>258
分散分析、対応あり、被験者内で検索

260:１３２人目の素数さん
13/11/11 01:13:25.09
>>259
ありがとう
むちゃくちゃ初歩的なとこでしたね…

261:１３２人目の素数さん
13/11/11 12:37:22.25
とても単純なことなのですが、
自分で考えてもどうしても分からないので
質問させていただきます。

質問票にいくつか質問があり、
答えが「はい」と「いいえ」の選択肢しかない場合、
質問の数から答えの組み合わせの数を導き出すには
どのような方法がありますか。

よろしくお願いします。

262:１３２人目の素数さん
13/11/11 12:58:31.75
2^質問数かな。

263:１３２人目の素数さん
13/11/11 13:12:02.31
>262さん

「^」の正体は分かりませんが、
Excelに計算式を入れたらそれっぽい答えが出ました。
それほどとてつもない答えの組み合わせ数にはならないようで
ホッとしています。

これで仕事を軌道に乗せて進められそうです。
ありがとうございました。

264:１３２人目の素数さん
13/11/11 13:20:09.11
と思ったら、
質問数7までは「2^7=49」でまだ現実味のある数字でしたが、
質問が8つに増えると一気に「2^8=256」で
実務としては無茶な数字になるんですね。

質問数は何としても7までに抑えたいと思います。

265:１３２人目の素数さん
13/11/11 13:55:57.71
^はべき乗です。2^3 = 2 x 2 x 2 = 8です。
質問数が1増えたら２倍ずつ増えていくということです。

266:１３２人目の素数さん
13/11/11 14:13:08.46
>>265　さん

ご親切な回答ありがとうございます。

それで気づいたのですが、
先ほどの「2^7=49」は間違いでしたね。
と言うのもExcelに入力するのに2と7が入れ替わっても
答えは変わらないだろうと思い、
「=7^2」と入力していたからです。
「=2^7」で入力し直したら答えは128になり、
これで進めると私は正気を失うところでした。

質問数は何とか6つに抑え、
2^6=64の回答数で企画を進めたいと思います。
危ないところでした。

267:１３２人目の素数さん
13/11/12 00:53:16.38
何か根本的な思い違いをしている気がしてならない。
回答の組み合わせ総数を何に使うんだろう？

268:１３２人目の素数さん
13/11/12 08:51:47.27
Yes・Noの質問を６つ作るのではなく、質問は一つで選択肢を64個設けるに決まってんだろ言わせんな

え？

269:１３２人目の素数さん
13/11/12 17:55:03.78
データベース上からある人と似たデータを持つ人を選び出す方法があって
・一人あたり10種類のデータ(長さや角度)がある
・データベースには、50人分のデータがある
この時以下の式で求めた値がデータベース上で一番小さな人を選び出されます．

10
Σ{(Di-di)^2/σi^2}
i=1

Di(i=1~10)はデータベースの人の値，di(i=1~10)が調べたい人の値です．

この時分散で割っているのはどういう意味なんでしょうか？
10種類のデータそれぞれの重みを合わせているってことですか？

270:１３２人目の素数さん
13/11/12 19:34:44.00
そうだと思いますよ。
偏差値求めるときって標準偏差で割るので
偏差値に統一してるんじゃないでしょうか。

271:１３２人目の素数さん
13/11/12 19:50:40.58
269です

>>270
ありがとうございます
ちなみに、この方法なのですが、二乗平均平方根でやることもできますでしょうか？
こちらだと、重みが変わってきたりしますか？

272:１３２人目の素数さん
13/11/12 20:25:58.35
>>271
>二乗平均平方根でやる
とは？詳しく

273:269
13/11/12 21:01:46.29
>>272
調べていてこちらでも良いのかなと思ったのですが、自信はありません。

上の条件を当てはめるとこんな感じでしょうか

______________
/ N
√ (1/N) Σ(Di-di)^2
i=1

N=10
これは一人辺りの10種類のデータということです。
データベースと調べたい人の差を相加平均して平方根をつけました。

274:１３２人目の素数さん
13/11/12 21:13:57.63
>>273
それは Σ(Di-di)^2 と同じ、Σ{(Di-di)^2/σi^2} とは違う

275:269
13/11/13 09:35:09.48
>>274
回答ありがとうございます

文献で見かけて気になっていたところですので、スッキリしました。
ありがとうございました。

276:１３２人目の素数さん
13/11/15 12:50:25.09
確率分布から平均や標準偏差を求める場合に
モーメントという用語を使う場合があります

確率分布関数がF(x)である場合

０次モーメントが m0 = ΣF(x)
１次モーメントが m1 = Σ(x*F(x))/ΣF(x)
２次モーメント以上のn次モーメントが
mn = Σ((x-m1)^2*F(x))/ΣF(x)

で、０次と１次と２次以上で定義が変わって気持ち悪いです
０次と１次を含めたn次モーメントは本来どうやって定義するのでしょうか？

277:１３２人目の素数さん
13/11/15 19:05:55.21
確率分布関数を用いた定義は知らないけど、
n次モーメントはE[X^n]で定義されているのでは
n次の中心化モーメントはE[(X-E[X})^n]で定義されている
平均値はE[X]で1次のモーメントに相当し、分散Var[X]は1次のモーメントと2次のモーメントを用いて
Var[X]=E[X^2]-(E[X])^2で定義されています。
見当違いのこと言ってたらごめんなさい

278:１３２人目の素数さん
13/11/16 03:12:16.20
その前に >>276 のｎ次モーメントは
mn = Σ((x-m1)^n*F(x))/ΣF(x)
の打ち間違いでした。

>>277
分散が
＞Var[X]=E[X^2]-(E[X])^2で定義されています。
という定義でもあるというは見たことはあります。
上の書き方だと
　Var = Σ(x^2*F(x))/ΣF(x) - (Σ(x*F(x))/ΣF(x))^2
一方で、重心周りの2次モーメントは
　m2 = Σ((x-m1)^2*F(x))/ΣF(x)
MatlabクローンのOctaveで正規分布のその分散とm2を計算してみると

mu=50;
> sg=10;
> xx=[0:0.1:100];
> yy=exp(-1.*(xx-mu).^2./(2*sg^2));
> m0=sum(yy);
> m1=sum(xx.*yy)/m0
m1 = 50.0000
> var=sum(xx.^2.*yy)/m0-(m1)^2
var = 99.9985
> m2=sum((xx-m1).^2.*yy)/m0
m2 = 99.9985

同じになります。でもたまたま合っただけのようにしか思えません。
重心周りの0次と1次モーメントの定義が知りたいのです。

279:１３２人目の素数さん
13/11/16 19:13:00.90
>>278
そのF(x)は確率分布関数ではなく普通は確率関数と呼ぶ
原点回りのn次モーメントはE[X^n]
平均周りのn次モーメントはE[(X-E(X))^n]
分散の定義は平均周りの2次モーメントV(X)=E[(X-E(X))^2]
公式としてV(X)=E[X^2]-E[X]^2が成り立つ
0次モーメントは原点回りでも平均周りでも1になる

280:１３２人目の素数さん
13/11/17 04:24:18.03
確率の問題なんやが
URLﾘﾝｸ(www.logsoku.com)

281:１３２人目の素数さん
13/11/18 07:10:09.08
重回帰分析したいのですがcsvファイルが見当たりません
喫煙率と肺がん、年齢などのデータはどう入手すればよいでしょうか

282:１３２人目の素数さん
13/11/18 21:28:48.79
先生が、全部、墓へ持って行ってしまいました。
そっち方面は、最初からやり直してください。

283:１３２人目の素数さん
13/11/19 09:13:37.79
こないだの日曜日、統計検定3級受けた人いる？過去問より難しくなかった？

284:１３２人目の素数さん
13/11/19 13:40:19.56
すみません。卒論で気温や降水量の分析をしているのですが、気温どうしの分散、なら比べられるのですが、気温と降水量の分散は比べるには大体どうすればいいのでしょうか

285:１３２人目の素数さん
13/11/19 13:55:50.12
相関とか

286:１３２人目の素数さん
13/11/19 16:38:09.43
統計学の授業で困っています
助けてください
学内で食生活のアンケートを取りました
その結果と全国データを比べるのですが、解析の方法がわかりません

アンケート項目は
１．食生活に関心があるか
[関心がある][どちらかといえば関心がある][どちらかといえば関心がない][関心がない]
２．料理をするか
[毎日する][週に2，3日する][週に1日する][全くしない]

全国データでは「食生活に関心があるほど料理をする」というものでした
これと同じことが私の学校でも同じと言えるのか、言えないのか調べるためには、どうすればいいですか？

287:１３２人目の素数さん
13/11/19 18:00:39.65
>>286
>全国データでは「食生活に関心があるほど料理をする」というもの
この結論を得た解析と同じことをやるしかないんでは。

288:１３２人目の素数さん
13/11/19 18:31:40.67
関心度、料理頻度を適当に数値して相関係数を求めるとか

289:１３２人目の素数さん
13/11/19 23:55:17.27
杏「どうしてわかったんだ？」
ほむら「統計よ」

290:１３２人目の素数さん
13/11/20 03:39:34.04
>>283を受けたことは無いけど、試しに1級の過去問を見てみたけど、先日の1級の試験は照明問題が減ってる印象ね。

291:１３２人目の素数さん
13/11/20 20:22:11.29
>>283
2級受けてきたけど、2級も過去問より難化してたと思う。
解答速報も出たから採点してみたけど、7割ぐらいだった。合格ラインは何割ぐらいなんだろうか。

292:１３２人目の素数さん
13/11/20 23:38:43.74
Twitter見ると1級難化してるとか言ってたな

293:１３２人目の素数さん
13/11/23 04:57:07.95
>>292
検定Twitterって、資格スレには紹介されていないが？
品質管理検定（QC検定）1～4級 part11
ｽﾚﾘﾝｸ(lic板)

294:１３２人目の素数さん
13/11/23 05:04:43.21
>>293
統計検定
URLﾘﾝｸ(twitter.com)
URLﾘﾝｸ(twitter.com)

295:１３２人目の素数さん
13/11/23 05:26:39.29
ＴＶ番組で、日本人の1日当たりの塩分摂取量全国平均が男性11.8g、
女性10.1g、全国１位を男女とも山梨県が獲得と紹介していた。
厚労省統計値らしいんだが、聴取されても答えられぬ塩分摂取量統計
なんて、どのように採取集計するの？
「なぜ多い？　山梨県の塩分摂取量」　　2013.11.05
URLﾘﾝｸ(textview.jp)

296:１３２人目の素数さん
13/11/23 05:44:01.12
>>295
記述式で1日3食×1週間の食事アンケート

外食の各メニューやスーパーで買った食材(魚の切身)とかの塩分量は厚労省もデータを取得済だから、概算値は十分に計算できるかと。

297:１３２人目の素数さん
13/11/23 06:08:06.00
>>296
即答有難うございます。アンケート記述式として県民平均摂取量はどの
ように集計するの？ラーメンスープを飲まない・飲干すとか醤油ふり
かけ量等の個人差や老若世代差や温暖・寒冷県差をどう加減するの？
到底科学的統計値になりえないと想像されるのですが？

298:１３２人目の素数さん
13/11/23 08:32:17.88
厚労省なら健康診断でも見てるんじゃないの

299:１３２人目の素数さん
13/11/23 10:57:41.92
集計は国民栄養調査とかじゃないかね。
あれは全国を単位区として無作為抽出してるから、
その都道府県あたりの平均や個人属性とかは出せるかと。
塩分の計算自体がアンケートからの概算という限界は変わらないけど。

300:１３２人目の素数さん
13/11/23 12:05:49.61
>>299
この厚労省統計だね。概要で例示されている血圧値なら測定値の県別大小
比較も首肯されるが、アンケートからの概算>>299塩分摂取量に対して、”全国
平均男性は11.8g、女性は10.1g・・・・山梨県は・・・男性は1.5g 、女性は1.1gも
多い”>>295などと同列に数値比較論議に不見識ではないのか？
平成22年国民健康・栄養調査結果の概要　　厚生労働省　　2012年1月
URLﾘﾝｸ(www.mhlw.go.jp)

301:１３２人目の素数さん
13/11/24 00:00:47.21
>>295
リンクを見ずに答えるが、>>299の言うように国民栄養調査のデータだろう。
厳密に計測するときは、24時間畜尿をやって尿中塩分濃度から摂取塩分を推定する。
でもそんなの何万人もの大規模調査で実施したら途方ない予算が必要。
国民栄養調査の調査方法については、厚労省のWebサイトで解説されているから、
参照して下さい。

302:１３２人目の素数さん
13/11/24 00:10:47.81
>>300
まぁ、それが栄養学の限界。ずっと議論されてているらしい。
それから血圧だって、日中変動や再現性に大きな問題があって、
「本当の値」は何かという問題がある。
綺麗な看護師とおばちゃんでは値が変わってしまうからね。

303:１３２人目の素数さん
13/11/24 12:17:45.92
精度が荒くてもないよりはいいじゃないか。

304:１３２人目の素数さん
13/11/24 13:16:54.26
誤差は付き物

305:１３２人目の素数さん
13/11/25 17:00:54.36
エクセルでグレンジャーの因果テストってできるのかな・・・
出来るのなら、やり方を教えてください！

306:１３２人目の素数さん
13/11/27 16:30:37.68
統計学の勉強はじめたいんだけど、
Amazonのレビュー見たら「数式が少なくてわかりやすい！」とか甘ったれた理由で星つけてるのばっかで
どれが良書なのかよくわからん
おすすめの入門書教えてくれ

307:１３２人目の素数さん
13/11/27 16:40:39.09
Amazonのレビューは嘘だらけだよ。
小島寛之の本には完全に騙された。詐欺レベル。

308:１３２人目の素数さん
13/11/28 01:12:42.91
統計検定3級平成25年11月問3

AチームとBチームのサッカーの試合において、じゃんけんで勝った方を先攻とし、あいこの場合はAチームを先攻と決めた。このとき、3回の試合の先攻を決める場合にあいこが1度も起きず、Bチームが少なくとも一度は先攻になる確率を、次の(1)～(5)のうちから一つ選べ。

(1) 1-1/3
(2) 1-(1/3)~3
(3) 3*(1/3)~3
(4) 7*(1/3)~3
(5) 8*(1/3)~3

【解答】(4)

解説お願いします。

309:１３２人目の素数さん
13/11/28 01:44:02.62
8-1=7

310:１３２人目の素数さん
13/11/28 06:57:34.01
>>309
レスありがとうございます。
8はどういう意味合いで出てくるものでしょうか。
理解がとろくてすみません… m(__)m

311:１３２人目の素数さん
13/11/28 08:42:31.41
3+3+1=7

312:１３２人目の素数さん
13/11/28 09:56:58.88
>>308

Ｂが○ならＡは×
Ｂが×ならＡは○
Ｂが△ならＡは△

1回目：3通り
2回目：3通り
3回目：3通り

全部で　3*3*3通り
-----------------------
Ｂが３回とも先攻　○○○
Ｂが２回のみ先攻　○○×　　○×○　×○○
Ｂが１回のみ先攻　○××　　×○×　××○

条件を満たすのが７通り
------------------------------------

あってる？

313:１３２人目の素数さん
13/11/28 10:20:39.99
>>312 さん

おお！分かりやすく説明いただき、ありがとうございました！！
納得できました！！ ^ ^

314:１３２人目の素数さん
13/11/28 13:15:20.87
サッカーはコイントスなのに。

315:１３２人目の素数さん
13/11/28 15:01:06.00
>>306
誰かこれを頼む…ペーパーバックとかでも頑張って読むから

316:１３２人目の素数さん
13/11/29 05:27:19.81
>>315
数理統計学の入門書レベルでなく、『初等統計学』なんて銘打たれた教科書なら、
独学のための取っ掛かりとしてはよろしいんじゃないかな？

経験則では初等～の類には、まず積率母関数は触れていないカンジ。
だから、定理や法則の解説や例示されている証明に微分や級数展開が使われずに展開されている印象。
初等レベルを勉強し終えてから、今度は数理統計を謳った教科書で、同じ単元でもより深く勉強するなんてのは？

317:１３２人目の素数さん
13/11/29 09:20:31.21
>>316
ありがとう
amazonとか見ながら１冊買ったんだけど、式の解説が薄くて式の意味の理解が浅いままだった
だから統計学の概略は分かったんだけど、いろいろ腑に落ちないところが多かった
数理統計学っていうのが数学的にしっかりとしてるのなら、次はそっちのジャンルの本を買ってみる

318:１３２人目の素数さん
13/11/29 09:34:39.71
高校数学でわかる統計学」

319:１３２人目の素数さん
13/12/01 16:48:27.41
>>318
お奨め？

320:１３２人目の素数さん
13/12/01 17:16:15.93
ヤフー知恵袋でなく、2ちゃんのこんな板を見付けて書き込みに来るくらいの人間には満足できない超初心者向けの一冊なんじゃない？
本の題名的にも。

321:１３２人目の素数さん
13/12/01 18:11:44.77
>>307
ほんんとに？

322:１３２人目の素数さん
13/12/03 02:46:12.21
ブルーバックスの高校数学でわかるシリーズは結構いいよ
名前で判断してはいかん
Amazonのレビューみてみればわかるが

323:１３２人目の素数さん
13/12/03 13:24:29.03
へえ、今読んでる本終わったら読んでみようかな
文庫本サイズは手出しやすいし

324:１３２人目の素数さん
13/12/03 16:29:38.74
>>322
表紙のデザインがとっつきにくいなぁ

325:１３２人目の素数さん
13/12/04 12:37:55.44
「相関係数を求める」ことと「無相関検定」の役割的な違い
ってどうなのでしょうか。
二つの変数の相関を調べるだけなら、相関係数だけでいいかと
思うのですが、、。

326:１３２人目の素数さん
13/12/05 15:59:28.02
少し質問させてください
異なる計算方法の二種類の為替レートがあって、
その差が有意であるかを調べたい場合は
どのようにすれば良いのでしょうか？

たとえば計算方法1では、ユーロ=120 ドル=100 ポンド=150 と計算され、
計算方法2では、ユーロ=115 ドル=105 ポンド=152
などと計算される場合に、
両計算方法からでる結果に有意差があるかを知りたいです。
各通貨の平均をとってt検定しても意味がないように感じますが、
(各通貨ごとに平均値が大きく異なるので)
どうにか計算方法の違いを有意検定できる方法はありませんでしょうか？

よろしくお願いします。

327:１３２人目の素数さん
13/12/05 16:18:27.07
>>326
計算式が異なれば有意な差がでて当たり前じゃないの？
ユーロ vs ドルをn=100で計算してみた。

> f1 <- function(x) x * 100/120
> f2 <- function(x) x * 105/115
> x <- sample(10:100000, 100)
> t.test(f1(x), f2(x), paired = TRUE)

Paired t-test

data: f1(x) and f2(x)
t = -17.1435, df = 99, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-4471.794 -3544.030
sample estimates:
mean of the differences
-4007.912

328:１３２人目の素数さん
13/12/05 17:40:20.87
ありがとうございました、t検定でいけるのでしょうか？
>>326は数字は全くの適当ですが、
為替レートを計算するための複雑だけど正確な式と、
簡単だけど大雑把な式がありまして、
簡単なほうで計算をしても問題無いかどうかを知りたいと思っています。
言い換えれば、統計的に有意差が無い、ほうが好ましい結果となります。
本来の検定の考えかたとは異なると思いますが、
どのようにアプローチしていけばよいかわからず
困っております。

329:１３２人目の素数さん
13/12/05 21:13:33.15
検定の問題集みたいなので勉強になる本無い？

330:１３２人目の素数さん
13/12/05 22:03:05.53
>>328
非劣性検定で検索

331:１３２人目の素数さん
13/12/06 08:17:18.34
>>330
ありがとうございました！まさにこれでした。
そして、帰無仮説が棄却されなかったからといって、
帰無仮説を採択できるわけではない、
という初歩的なところを誤ってました。
ありがとうございました

332:１３２人目の素数さん
13/12/06 13:44:45.69
正規分布する確率変数の和の分布
とかでさ、
積分したら1のものと積分したら1の物を足したら、積分したら2になるじゃん。
そしたら積分したら1でなきゃいけない確率変数ではなくなるじゃん。
つまりどういうこと？

333:１３２人目の素数さん
13/12/06 13:55:31.57
は？？

334:１３２人目の素数さん
13/12/06 14:01:03.37
もうちょっとわかりやすく疑問を投げかけてくれ
具体例出すとか

335:332
13/12/06 18:31:43.95
よくわかってないので、変なこときいたのかもしれないのだが。

正規分布の再生性あたりの疑問で、たとえば、
URLﾘﾝｸ(bio-info.biz)
このページの一番下の図のようなことを考えていて、
赤と緑の面積は1だから、それの合わせた緑の面積は2になるじゃん。
だから、確率変数の和の分布はどうして2じゃ無いんだ？とか考えたわけだ。
まあ、正規分布の再生性というのが、図にある’重ね合わせ’のようになんでならないかが
さっぱり根本的にわかっていないから、そう考えたんだろうけど。

結局のところ、確率変数を足すと、なんで重ね合わせのようにならんのだ？

336:１３２人目の素数さん
13/12/06 19:10:04.60
正規分布は確率密度関数のグラフであって、確率変数のグラフじゃないから

URLﾘﾝｸ(upload.wikimedia.org)
確率変数を足すと、この確率密度関数f(x)の中のσとμが足しあわされるだけで、
確率密度関数そのものが足しあわされてるわけじゃない

337:１３２人目の素数さん
13/12/07 17:05:59.42
十年前に数学科を出たものですが、統計学勉強したくなりました。
何から勉強すればいいですか？
教えろください。

338:１３２人目の素数さん
13/12/07 17:29:48.44
数学科出たのなら，「数式がない．．」とかのうたい文句があるのはヤメた方がいい。
バッチリした教科書、確率まで踏み込んであるのが読めるならそれがいい。
あなたが数学科で代数とか幾何とか選考して、解析や確率を敬遠していたのなら、
昔の高校教科書「確率と統計」とか見てみると多分すんなり入れると思う。
たとえばちくま文庫から出てるような。それから、専門的な教科書に入るのはワリ
と易しいと思うよ。

以上似たような経歴のモンから。
ゼミで確率論なんかやってたのなら全く無用の助言でした。

339:１３２人目の素数さん
13/12/07 17:48:53.29
>>338
ありがとうございます。
ゼミでは、グラフ理論やってましたｗ
高校からやるのいいかもしれませんね。
専門的な教科書のおすすめってありますか～？

340:１３２人目の素数さん
13/12/07 18:41:38.97
そもそも統計学なんて数学科以前に教養課程で習うだろ
統計専攻の人でも学部レベルくらいまでなら、あれに毛が生えたようなレベルしか
勉強しないぞ
しいて言うなら、確率論に測度が入ってくるくらいか

341:１３２人目の素数さん
13/12/07 19:48:10.87
>>337
これでもガーとやれば
URLﾘﾝｸ(www.amazon.co.jp)

342:１３２人目の素数さん
13/12/07 20:10:49.89
大学院出るレベルで基礎からやりたいっていうなら
URLﾘﾝｸ(www.amazon.co.jp)
これが結構おすすめ

343:１３２人目の素数さん
13/12/08 04:53:21.60
みなさま教えてちょんまげ。
統計検定１級対策は何を勉強すればいいですか？
公式テキストだけじゃ足りないよな？？

344:１３２人目の素数さん
13/12/08 17:30:55.13
>>337は実社会でも適応できないのだろうね

345:１３２人目の素数さん
13/12/11 22:15:25.47
344が進行とめたねｗ

346:１３２人目の素数さん
13/12/11 23:01:17.50
>>344
337は数学科卒にしては適応してる人だと思うよ
いまごろ統計やってみようとか感心感心
昔グラフやった人ならちょっとモチベがあれば
その辺の有象無象よりはあっというまにテイクオフだよ
がんばれ

347:１３２人目の素数さん
13/12/11 23:03:16.33
本人登場

348:１３２人目の素数さん
13/12/11 23:03:56.85
>>347
運営乙()

349:１３２人目の素数さん
13/12/12 13:35:49.23
momentとmoment generating functionがあるのは分かったけど、
なんでこれを導入すると有用なのかがイマイチ分からない…

350:１３２人目の素数さん
13/12/13 02:49:30.06
微分が簡単な指数関数で1回2回と微分すれば平均や分散が求まるってところから、
もっともっと深く意味を求めたいのなら、和訳の積率母関数でググればいっぱい説明してるサイトがみつかすよ。

勉強してる人が歪度や尖度をに対してどれくらい重要さをイメージしているか、次第かなと。

351:１３２人目の素数さん
13/12/13 22:36:24.02
>>349
関数の一致や関数列の収束などを示すために
ラプラス変換したもので考えたほうが計算が楽になることがある
例としては、中心極限定理の証明、分布の再生性の証明などなど

352:１３２人目の素数さん
13/12/17 00:26:59.91
ｎでわるのか
n-1でわるのか
分からなくなってきた。

353:１３２人目の素数さん
13/12/17 08:28:04.20
解答がマークシートの類でなく、設問ごとにある程度の余白が用意されている答案用紙だったら、
その問の解答途中で、
偏差平方和をn-1で割った値を標本分散とするならば～
みたいな一筆をあらかじめ入れておいて、計算を進めていけば、
仕上がった答案に対して採点者も原点ってカタチで文句を付けることは無いんじゃないかな？

354:１３２人目の素数さん
13/12/17 18:38:47.76
そんなこと書いても違いが分からないのならバツです。

355:１３２人目の素数さん
13/12/17 20:19:03.86
不偏分散という用語はあるが、
n で割ることを陽に示す言葉が無い
のは、不便ちゃ不便だな。
統計よりな人は、「分散」とだけ聞いて
不偏分散のことだと思ったりするからな。

356:１３２人目の素数さん
13/12/18 14:54:08.43
高校で習う標準偏差とか分散って、そりゃ、データがたまたま、
ああいう綺麗な真ん中で盛り上がってる綺麗な形なら使えるけどさ、

実際のデータは、もっとひん曲がった、右と左が非対称だったり、ぐにゃぐにゃな形だったりするんだから
実務的なリアルなシミュレーションするときは、あんまり使えなくないですか

それなら、数式もクソもない、ただ確率に応じて代表的な数字を返すだけの、素朴なプログラムのほうがよほどリアルな出力になる。
・・・と思うんですが、ぼくの認識はおかしいですかね。

357:１３２人目の素数さん
13/12/18 15:23:21.37
高校生かな？

もちろん全てのデータが正規分布に従うなんてことはなくて、
ひん曲がったぐにゃぐにゃな形があることなんて100年以上も昔から分かっているし、
もっと上級の統計学になるとそういう形に対応できる様々な分布を取り扱うようになる
ただ正規分布が、様々な分布の中でも一番基礎的で重要な分布なのは間違いないから、
高校では正規分布に絞って統計学のさわりを教えているんだと思う

実務的なリアルなシミュレーションでは、データに沿った分布を選択することになる

358:１３２人目の素数さん
13/12/18 19:04:39.93
>>357
そうですよねえ。正規分布は、そこそこ使える分布ながら、手計算しやすい＝エデュケーション用途にもピッタリ
てなことだと思ってましたが、やはりそういうことでしたか。

ただ、私は、この手の分析の仕事は、コンピューター使ったほうが、複雑な関数を使わなくて済むぶん、
よほどシンプルになると思いました。　ご返答ありがとうございました。

359:１３２人目の素数さん
13/12/18 19:25:16.03
全然違うと思いますがそういう理解でいいんじゃないでしょうか。

360:１３２人目の素数さん
13/12/18 19:39:32.30
w

361:１３２人目の素数さん
13/12/18 20:17:23.98
>>358
> >>357

大数の法則といって、
もとがどんな分布であろうとも、標本をたくさんとればとるほど、正規分布に近づく
っていう数学の法則があるのです。

教育的な分かりやすさからいうと、二項分布とか分かりやすいし、身近な例への応用もやりやすい。

362:１３２人目の素数さん
13/12/18 20:56:01.36
そのコンピュータが結局ヒトにとって複雑な関数の計算を代行してくれているんじゃ荷ですかねえ

363:１３２人目の素数さん
13/12/19 01:14:21.85
>>361

標本平均の分布が正規分布に近づくのは中心極限定理では？

364:１３２人目の素数さん
13/12/19 01:40:02.50
その中心極限定理を保証するのが、要するに大数の法則かと

365:１３２人目の素数さん
13/12/19 05:15:57.17
大数の法則は、弱と強があって、確率収束と概収束に関連しています。
成立条件から言っても、中心極限定理とは別物です。

366:１３２人目の素数さん
13/12/19 10:16:06.89
どんな分布の母集団だろうとサンプルとった平均は正規分布するんだから、
逆算すれば母集団の平均が推定できるってことだな。

367:１３２人目の素数さん
13/12/19 10:23:55.30
>>366
> どんな分布の母集団だろうとサンプルとった平均は正規分布するんだから、

もっと統計用語は正確に書いた方がいい。正規分布するなんて、どの教科書にも
出てこないよ。

標本平均が正規分布に従うなんてことはない。
指数分布に従う母集団からの標本平均も正規分布に従うの？

368:１３２人目の素数さん
13/12/19 10:27:38.83
わざと一般人の理解向けに不明瞭に書いたんだよ。

369:１３２人目の素数さん
13/12/19 10:30:37.63
ここはひどいインターネッツですね。

370:１３２人目の素数さん
13/12/19 11:23:02.87
質問者の程度に合わせた回答を施してあげるのも、知性ある人間としての能力の一つだ。
同好の士同士の問答でもあるまいし、何でもかんでも難しく答えりゃイイってモンじゃない。

371:１３２人目の素数さん
13/12/19 11:45:32.69
正規分布は使えないという結論に至った初学者に
指数分布では～とか言ったらやはりおれの結論は正しかったになるよ。

372:１３２人目の素数さん
13/12/19 11:52:54.99
>>357
これが大体いい解答だと思う

373:１３２人目の素数さん
13/12/19 11:56:05.97
統計学って最初の壁が絶壁なんだよな。

374:１３２人目の素数さん
13/12/19 12:08:56.60
『唯一、社会に出てからも役に立つ数学』をウリにしておいて、とっつきにくさという実質的な足切り関門が存在しているというのも、改善すべき要素だと思うなあ

375:１３２人目の素数さん
13/12/19 12:32:38.23
この程度で「つきはなされた」と感じて混乱するような人は統計なんて使わない方がいいよ
他の人に任せなって

376:１３２人目の素数さん
13/12/19 13:22:43.16
>>366
正解
>>367
>指数分布に従う母集団からの標本平均も正規分布に従うの？
従う。
中心極限定理は母集団分布は何だっていいことを保証している。

377:１３２人目の素数さん
13/12/19 14:35:05.48
サンプルサイズが十分大きい時、中心極限定理が成立する。
です。

378:１３２人目の素数さん
13/12/19 14:37:32.31
信頼区間95%を素人に理解させるのは不可能。

379:１３２人目の素数さん
13/12/19 14:41:33.10
>>377
分散有限とかの条件があるよ

380:１３２人目の素数さん
13/12/19 14:46:51.47
>>378
視聴率のウィキペで説明したらわかってくれそうじゃない？
URLﾘﾝｸ(ja.wikipedia.org)

381:１３２人目の素数さん
13/12/19 15:12:18.77
2chではありがちなことだけど、
自分の中での結論ありきで議論を展開する奴に物事を理解させるのは不可能だから
その辺に見極めが重要

382:１３２人目の素数さん
13/12/19 16:57:19.21
何冊か読んだけどカイ二乗分布の説明がどれもこれも概念的すぎてよくわからん…

383:１３２人目の素数さん
13/12/19 17:40:17.13
カイ二乗分布は確率変数の二乗和が従う分布。
ただし、母集団の分布が正規分布で確率変数は独立である必要がある。

カイ二乗分布の存在意義は検定に使えるから。

384:１３２人目の素数さん
13/12/19 18:18:55.72
なんで正規分布じゃダメなの？って疑問。

385:１３２人目の素数さん
13/12/19 18:37:36.94
平均の検定なら正規分布やt分布でいいが、
標本分散は正規分布には従わない。

分散の場合は、カイ二乗分布に従うから、これを使う。

386:１３２人目の素数さん
13/12/19 18:48:33.23
本当に基本的なところで申し訳ないんだけど、分散を比較しなきゃいけないシチュエーションって
どういうシチュエーション？

387:１３２人目の素数さん
13/12/19 18:51:25.21
そういうことか。普通は平均だけで満足しちゃうから出番が少ないのか。
ありがとう。

388:１３２人目の素数さん
13/12/19 19:02:43.25
例えば、税理士の平均年収が600万円で弁護士の平均年収が650万円だったとする。
普通の人なら、税理士も弁護士もほとんど年収変わらないなら、税理士の方が得じゃない？と考えるだろう。

しかし、もしかすると、弁護士は新卒が多くて、給料あまりもらってない人が多く、高所得者も多いのでは？とか、仮説を立てる。すると、年収の分散も比較したくなるわけ。

じゃあ、税理士の分散と弁護士の分散を検定してみると、この仮説が検証できる。
このとき、分散比の検定でF分布（カイ二乗分布の親戚）を使う。

389:１３２人目の素数さん
13/12/19 20:10:36.51
なるほど。わかりやすい

390:１３２人目の素数さん
13/12/20 09:32:35.08
>>388
素晴らしい

391:１３２人目の素数さん
13/12/20 09:35:37.68
>>388
公認会計士、弁理士、医者は？

392:１３２人目の素数さん
13/12/20 13:33:11.96
アスぺ乙

393:１３２人目の素数さん
13/12/20 15:20:21.80
検定統計量っていろいろあるけど、どうやって算出するんだ？

394:１３２人目の素数さん
13/12/20 15:56:31.23
たいていはただの標準化だよ
教科書に導出とか載ってない？

395:１３２人目の素数さん
13/12/20 19:06:48.79
>>392
アスペクト比が問題なわけだな、分散の偏りだな、勉強になります

396:１３２人目の素数さん
13/12/20 19:55:16.86
>>391
3変数以上の検定には多重比較などを利用出来る。

397:１３２人目の素数さん
13/12/21 11:14:19.36
ピペット操作を複数回行い、得られた数値の平均値、標準偏差から変動係数は3%以内になった
変動係数が3%以内であれば測定値は正確な値だと言われている
なぜ3%以内なのか統計学の観点から考察せよ
という課題が出されたんですが、全くわからず、結局レポートを提出できませんでした
その後も答えをくれませんでしたし、参考書を見ても3%以内なら正確な値とは書かれてませんでした
どのような回答が正しかったのでしょうか

398:１３２人目の素数さん
13/12/21 11:58:29.21
>>397
「考察せよ」という課題に解答なんて存在するの？

399:１３２人目の素数さん
13/12/21 12:04:19.67
>>393
パラメトリックなときは、Neyman-Pearson fundamental lenma
ノンパラのときは、対立仮説と帰無仮説の差を表現できるものから検定統計量
作ります。

400:１３２人目の素数さん
13/12/21 13:13:44.85
「考察せよ」てのは問題自体も問題なんだよな

401:１３２人目の素数さん
13/12/21 13:34:30.09
正解がないなんて良問だろう。暗記問題じゃないということ。

402:１３２人目の素数さん
13/12/21 16:35:21.13
>>399
なるほど！

403:１３２人目の素数さん
13/12/21 17:25:22.60
>>397
読んでないけど、参考になるかも(wikipediaのreferenceより)
"Statistical quality control and routine data processing for radioimmunoassays and immunoradiometric assays."以下リンク
URLﾘﾝｸ(www.clinchem.org)

404:１３２人目の素数さん
13/12/21 22:56:36.44
考察せよ

考察しました

ご苦労さん

405:すみません数学得意な人この問題解いて下さいm(_ _)m
13/12/22 22:18:14.10
A.B.C.D.E.F.G.Hの8チームがトーナメント形式で戦う
一回戦の対戦相手はくじ引きで決めPからWまでのどこかに振り分けられる
Aが2回戦でBを倒し、3回戦でCを倒す確率は？
答えは336分の１なのですが納得出来ません
優勝
| |
ーー
| | | |
ーーーー
| | | | | | | |
P Q R S T U V W

406:１３２人目の素数さん
13/12/23 01:29:56.36
Aが2回戦でB、3回戦でCと当たるような配置になる確率:2/7*4/6
AとBが共に2回戦に進む確率:1/2*1/2
AがBに勝つ確率:1/2
Cが3回戦に進む確率:1/2*1/2
AがCに勝つ確率:1/2

これを全部掛け合わせる

407:１３２人目の素数さん
13/12/23 09:06:16.84
>>406
解決しましたありがとうございますm(_ _)m

408:１３２人目の素数さん
13/12/24 17:24:15.09
質問です
時系列データの標準偏差というのは定性的にいうとどういう意味があるのですか？
動きが激しいほど大きいとかですかね？？？

409:１３２人目の素数さん
13/12/24 21:42:08.14
逆だ。
「動きが激しい」という詩的表現が、
定性的には、時系列の分散が大きい
という意味を持つのだ。

410:１３２人目の素数さん
13/12/24 23:18:36.00
もちろん動きが激しいほどボラティリティは大きくなる。
例えば、株だとリスクの大きさを表す。

411:１３２人目の素数さん
13/12/26 13:48:23.42
最近勉強し始めて統計の入門の本いくつか読んでみたけど、
実践を説明しつつもその理論的背景に触れてる本ってほとんど無いんだね。

例えば、t分布の話では、t分布は母分散が未知で小さな標本に対して使うもので、
どうやって信頼区間を計算していくのかが説明されていくけど、
なぜそれがt分布に従うのかの説明が薄いことが多い気がする。

多分それは、実際的な仕事として統計学を必要としている人が数学に対するリテラシーを
あまり持ちあわせていないことが多いからなんだろうけど、
やっぱりちょっと理論の支柱を端折られるとなんとなく気持ち悪い。

こういうところを端折らないでしっかり説明してくれてる良い参考書ってある？

412:１３２人目の素数さん
13/12/26 16:23:07.25
おれもそう思う。
数学出身の人だと、確率論やったもんでなくとも、
大数の法則、中心極限定理など通過しているうちは納得出来るが、
いざ応用の段になって、これこれの標本には、ほにゃらら分布がよく合います、
というところでは、「ふ～ん」というしかない。
実際の現場では、そうなってんだからつべこべ言わずにやれ！
ということなんだろうか？
統計学は最強の武器である、というならわかるが
最強の「学問」だそうだから。

413:１３２人目の素数さん
13/12/26 16:43:38.14
数式を使用しないことを売りにしてる統計学入門書を手に取って
数式がない、証明がないというのは筋違いではなかろうか。

数理統計学ときちんと題名がついてるなら証明まで書いてる可能性が高いんじゃないかな。

414:１３２人目の素数さん
13/12/26 17:02:22.18
>>412
統計学は数学と違って解釈が含まれるからな。
例えば、有意水準５％にする理由にしても経験的なものだし。

やっぱその辺が数学者からしたら、しっくりこないんだと思う。

415:１３２人目の素数さん
13/12/26 17:05:54.65
自閉症の人でしょ、それ
数学者一般に話を拡げないでよ

416:１３２人目の素数さん
13/12/26 17:13:10.90
問題から入る統計学があってもいいかもね
ありそうだけど

417:１３２人目の素数さん
13/12/26 17:41:06.94
>>413
いや、数式満載、すべての定理に証明付き、という数理統計学の
で入門して１冊目はスムーズだったんですよ。
だから甲斐事情分布辺りまではスイスイだったんだが、
次の統計本になって、以上のような始末。
特に、馬に蹴られて死んだ兵士の数とかワラってしまう。
いや死者を侮辱してるのではないよ、ナポレオン時代の話しでしょ。
数学はなれるとこういう話は好きなんだが

418:１３２人目の素数さん
13/12/26 17:54:24.94
>>413
俺はあえて数式が少ない入門書を選ぶつもりはなかったんだ。
「統計学」自体が数学の一種に分類される学問を表す言葉だと思うし、
「統計学」が文系でも踏み込めるライトなジャンルで、
「数理統計学」がしっかりと数学しているヘビーなジャンルだなんていう住み分けは
初学者にはわからんよ。おかげでいきなり躓いてしまった。

それはともかく、数理統計学の本を探せばいいんだな。
教えてくれてありがとう。

419:１３２人目の素数さん
13/12/27 12:55:01.47
>>414
普通、統計学使った論文だと有意水準は複数出してる
５％、１％、０．１％など
あんまり入門書だけで語るな

420:１３２人目の素数さん
13/12/27 12:59:09.49
>>411
使い方よりも分布の構成の仕方とかを数学的に説明するというタイプの
本ならそこそこある。有名どころなら
Hogg, McKean and Craigの本とか。

421:１３２人目の素数さん
13/12/27 13:03:27.18
統計の入門書しか読んでない研究者が有意水準を複数論文に入れるんだろ？

普通なら検出力を書いとけば良いと思うが。

422:１３２人目の素数さん
13/12/27 18:46:18.37
検出力でなく、p値でしょ。

423:１３２人目の素数さん
13/12/27 23:32:46.74
>>411
> なぜそれがt分布に従うのか
t分布が編み出された『実験的背景』としては、
少数の標本抽出×気が遠くなるような試行回数の結果、構築することのできた分布なんでしょ？

今日までBSで神の数式完全版が放送されてたけど、出演者たち理論物理学者は
キチンと数式的に証明してくれなくっちゃ、こんな説明では全く納得できないんだろうけど。

424:１３２人目の素数さん
13/12/28 00:23:03.44
>>411
ガンマ関数やゼータ関数を用いて説明しなくちゃならないってことになったら、
大半の読み手のことを考えたら、理論的背景を敬遠するんじゃないかな。

425:１３２人目の素数さん
13/12/28 01:46:30.47
>>422
いや、p値じゃなく検出力

確かに、有意水準を複数記載されるより、p値を書いてもらったほうがありがたい。
けど、検定で最も大事なのは第一種の過誤と第二種の過誤がどのくらいの確率で起こるかを知ることだから、検出力の記載は必要かと。

426:１３２人目の素数さん
13/12/28 02:29:41.82
>>424さま
411ではありませんが，ガンマやゼータ使って議論出来るんですね
それは面白い，いずれ暇ができたら勉強します．
やっぱり本だけではなく，論文読んだり，その筋の人達と
しゃべらないと分かんないですよね．

427:１３２人目の素数さん
13/12/28 10:03:35.38
>>423
t分布が完全に経験則ってこと？そんなわけないだろ
そう勘違いする人が居るってこと自体、巷に出回ってる統計の参考書は不十分ってことだよ

428:１３２人目の素数さん
13/12/28 15:04:30.55
統計数理研究所の広大出身の河村敏彦助教ってのは、
書いている本が全く意味不明だし、
馬鹿のくせに自分の業績自慢ばかりしてる。

気に入らないとずっと怒鳴ってるし、
まったくキチガイとしかいいようがない。
なぜ河村敏彦のようなキチガイが
助教になれたんだ？

コネしか考えられないんだが、将来的には
河村敏彦のキチガイ野郎がコネで大学教授とかに
なるのか？
信じられん！

429:１３２人目の素数さん
13/12/28 15:09:02.09
なんとかして誰かを傷つけてやりたい、ってアンチの書き込みは、それが強すぎて
逆効果になってることってあるよね。

430:１３２人目の素数さん
13/12/28 15:35:29.34
なんとかって助教が馬鹿かはわからんが、>>428は間違いなく馬鹿

431:１３２人目の素数さん
13/12/28 19:25:48.80
人を攻撃するくせに自分は『スレ上では』完全匿名というのも卑怯だよね

432:１３２人目の素数さん
13/12/29 00:03:38.23
あまり強い言葉を遣うなよ弱く見えるぞ

433:１３２人目の素数さん
13/12/29 04:33:00.12
>>428
河村君の能力では助教以上のアカポスに就くのは不可能だろう
だから放っとけばいい

434:１３２人目の素数さん
13/12/29 04:41:57.52
ID非表示の板なら、日付変わらなくても工作活動が自由自在ね

435:１３２人目の素数さん
13/12/29 12:05:32.05
ここのサークルの統計本ってどうなの？
URLﾘﾝｸ(www.pixiv.net)

436:１３２人目の素数さん
13/12/29 13:34:54.83
河村君が２ｃｈばかりやっているといううわさが
本当だということは確かめられた
そんなヒマがあったらほんの少しでも勉強したほうがいい
それでなくても駅弁で頭も悪く、性格はすごく悪いと評判なのだから

437:１３２人目の素数さん
13/12/29 14:06:24.15
キチガイにストーキングされると大変だね

438:１３２人目の素数さん
13/12/29 15:31:27.03
河村敏彦助教がストーキングしてるのかね？
あいつならやりそうだ（笑

439:１３２人目の素数さん
13/12/30 11:35:01.74
あ、本当に河村が書かれてる

440:１３２人目の素数さん
14/01/02 05:54:57.73
　

441:１３２人目の素数さん
14/01/02 06:04:34.68
質問させてもらいます。

試行回数をｎ、的中率をｐ、回収率をｋ％とすると、
真の回収率＝ｋ × (p ± ２×平方根((１－ｐ)×ｐ／ｎ) )／ｐ

※１と２の真の回収率はいくつになるのでしょうか？お願いいたします。

※１　試行回数４８５　　　的中率５．８％　　　　　回収率１８１．３％

※２　　　　　４８５　　　　　　１１．５％　　　　　　　１２３．９％

442:１３２人目の素数さん
14/01/02 11:41:26.75
起こりにくい事象を毎日計測して曜日毎に平均回数を出してλ_sun, λ_mon, ･･･, λ_sat を作り、全て足し合わせたものをパラメータにポアソン分布を作ります

これは曜日なんて考えないで単純に毎日計測して平均回数を7倍したパラメータで作ったポアソン分布に一致しますか？

443:１３２人目の素数さん
14/01/03 07:52:01.90
質問があります。私は経済学部１年です。

1. 普通、回帰曲線は残差平方和を最小にする曲線だと思いますが、経済かその他の現象で、残差平方の加重平均か指数移動平均を最小にする曲線に意味があることはありますか？

2. よく個人投資家の株やfxで、現在価格とは違う、真の価値として単純移動平均や指数移動平均が出てきますが、これは有効ですか？
真の価値より低いときに買い、高いときに売るそうです。二項格子モデルでは無意味で、ブラック=ショールズモデルでは逆効果だと思うのですが。

時系列分析とか勉強してません。これからするつもりです。

444:１３２人目の素数さん
14/01/04 15:14:19.70
1.最小二乗法のことだと思うけど、その曲線に意味はない。
2.有効ではない。

とだけ、言っておこう。

証券の真の価値とかそんなもんデタラメだから、信じない方が良いと思います。

445:１３２人目の素数さん
14/01/04 17:37:59.71
>>444
はい

446:１３２人目の素数さん
14/01/04 17:42:29.51
fxのブログ見たら頭悪そうなのばっかり

447:１３２人目の素数さん
14/01/04 23:24:06.89
「改訂増補版紅魔館の統計学なティータイム」買った。
まあいい本だと思うが、もうこうなると別に東方のキャラ使う意味なくね？

448:１３２人目の素数さん
14/01/04 23:27:40.40
有名キャラを使えば、話のタネにしたい人やコレクターが買うんだろう

449:１３２人目の素数さん
14/01/04 23:49:20.66
興味ない人間からすると、逆にそういうの絡ませちゃうといい本でも手を出しづらくなるけどな

450:１３２人目の素数さん
14/01/05 17:54:45.18
クズがクソ本の宣伝

451:１３２人目の素数さん
14/01/05 21:40:00.32
クズ代表の俺から言わせてもらうと、他人をあからさまに
クズ形容する人に本物はいない。ソツのない秀才タイプが多い。
ソツがないということは、自分の手を汚そうとしない。けれど
真実を掴み取ろうと思ったら、自分で泥をかぶりその中にしか
ダイヤの原石のような本物は無い事に気付くことだ。クズの俺は
そんなことすらまだ出来ないw

452:１３２人目の素数さん
14/01/05 21:41:12.53
n数が1では正しさを評価しようがないな

453:１３２人目の素数さん
14/01/05 23:06:42.01
クズを無作為抽出→あなたは本物ですか？と質問→母比率の検定

454:１３２人目の素数さん
14/01/05 23:30:53.27
母集団は２ｃｈ

455:１３２人目の素数さん
14/01/06 01:26:03.23
キチガイがクズ本の宣伝しても
２ｃｈらしくていいんじゃないか？

456:１３２人目の素数さん
14/01/06 03:07:11.84
母集団の母数は何ですか(初心者)

集団のサイズwwwwwww

457:１３２人目の素数さん
14/01/07 19:53:54.79
『朝まで生テレビ』アンケートで7割が靖国参拝支持　社会学者「統計的に意味のない数字」
URLﾘﾝｸ(blog.livedoor.jp)

コレって意味ないの？

458:１３２人目の素数さん
14/01/07 21:18:34.63
無作為抽出とは程遠いから意味無いね

459:１３２人目の素数さん
14/01/07 21:23:22.46
ただ解ってるならアンケートやる前に言えよって話

460:１３２人目の素数さん
14/01/07 21:32:09.70
小学校3年生から英語を習わせるように、統計ってヤツも算数の段階からリテラシーを育成する意味でも教育に重きを置くべきなんじゃねーの？

461:１３２人目の素数さん
14/01/07 21:37:00.90
小学校で「割合」の概念を扱うのが、確か５年か６年の頃ですわ

462:１３２人目の素数さん
14/01/07 23:57:19.00
世論を推定するには価値のないアンケートだが、
朝生見てる奴はこういう奴らという統計量としては意味がある。

463:１３２人目の素数さん
14/01/08 00:04:50.78
むしろこの偏ったデータを修正するためにどの程度の規模でどのような調査を実施すべきなのか

464:１３２人目の素数さん
14/01/08 00:11:52.84
普通の新聞の世論調査で十分だよ。

465:１３２人目の素数さん
14/01/08 02:12:40.94
>>464
無作為で発生させた数字列を電話番号に見立てて、それで電話をかけて実際に出た人に対して、世論調査に協力。
いきなりの電話でイタズラ電話だと思う人も多いから、回答率は60%程度ではあるけれど、そんな無作為標本から得られた調査結果ならば、世論調査として安心できるわな。

政治問題に無関心な層に関しても、1-0.6≒0.4という数字デからも判断できるから、回答率100%のいびつな電話FAXアンケートよりも信頼に値する調査結果だし。

466:１３２人目の素数さん
14/01/08 14:21:36.72
「イタズラ電話にわざわざ回答する」というフィルターが恣意的ではないとは思えない

467:１３２人目の素数さん
14/01/08 17:15:41.53
URLﾘﾝｸ(www.nhk.or.jp)
NHKではこんな風に抽出してるらしい

468:１３２人目の素数さん
14/01/08 23:42:50.70
>>466
実際こういう世論調査における回答拒否ってどう扱えばいいんだろう？
テレビなんかだと回答内容の内訳のグラフとか出したりするけど、あれに回答拒否を加えたら意味あるのかね

469:１３２人目の素数さん
14/01/08 23:52:25.23
そもそも日中に家の電話に出られるヒマ人って段階で到底無作為とはいえないんじゃないか？

470:１３２人目の素数さん
14/01/08 23:54:20.63
まともな世論調査では有効回答とか回答率とか数値も出してる。

マスゴミの信用度と取るか世論の民度と取るか調査した会社の態度の悪さと取るかは
また別のアンケートが必要だな。

471:１３２人目の素数さん
14/01/12 18:13:49.95
例挙げて質問します

車のアクセルペダルの踏み込み量によって車の走り方がどう変わるかという実験をしたとします
踏み込み量を因子として、20%40%60%80%100%の５条件とします
測定データを加速度、最高速度、燃費、回転数とします
踏み込み量と車の走り方の関係性を検討するにはどういった検定を行えばよいでしょうか？

472:１３２人目の素数さん
14/01/16 23:07:55.05
仮説検定の対立仮説（H_1）と帰無仮説（H_0）について質問です
H_1:μ>m　と　H_0:μ=mについての検定ってよく書かれているんですが、
帰無仮説って必ずしもμ=mでなければならないんでしょうか？
μ＜mとかでもよいのでしょうか

473:１３２人目の素数さん
14/01/17 04:45:41.68
>>472
帰無仮説は否定されてこそナンボ
イコールであるコトを否定する方が検定作業は簡単。

474:１３２人目の素数さん
14/01/18 00:09:42.96
キム仮説ってなんか韓国人の仮説みたいだ

475:１３２人目の素数さん
14/01/18 08:53:02.44
ある事象が韓国発祥であるという仮説

確かに否定されてナンボだ

476:１３２人目の素数さん
14/01/18 12:55:31.99
もともと金さんが発見したから金仮説だろ
統計学の発祥は韓国

477:１３２人目の素数さん
14/01/18 17:47:40.88
大学で統計学やってるんだが質問いい？

問、(有意水準5%として)「有意水準」とは確率である。確率であるということはある試行を無限回繰り返した時に何が起こる確率が5%なのか？

また上でなされた判断(ある試験の母平均が50点であるかどうかの仮説検定)は、現実に観測された結果をどのように考えた結果なされたものかについて述べよ

説明が上手くできないから教えてくだされ
m(_ _)m

478:１３２人目の素数さん
14/01/20 12:44:19.29
>>477
有意水準＝危険率って教えてる先生も多い。
やさしい解説書にもそういう記述が多いんじゃないかな？

否定されてナンボのキム仮説が「実はまさかの真実であった！という確率→"有意水準0.05"

ato,
天気予報の降水確率と関連付けると、何となくわかり易いって教わった。

479:１３２人目の素数さん
14/01/20 20:16:20.57
URLﾘﾝｸ(imgur.com)
このZは何をさしてるのか教えて下さい(´・ω・｀)
独立2群の差の検定で求めたものです

480:１３２人目の素数さん
14/01/21 18:35:55.91
ももクロっぽさ

481:１３２人目の素数さん
14/01/23 00:25:18.24
独立でない正規分布の和、例えばX+Yみたいなのって正規分布に従う？
各平均、分散に加えて共分散さえわかれば、平均も分散は出せるけど分布も正規分布なのか？
適当に調べたんだが独立な場合に畳み込みやら再生性って話はあるけど、従属な時がわかりゃせん

482:１３２人目の素数さん
14/01/23 00:29:33.47
従属の仕方による

483:１３２人目の素数さん
14/01/23 00:45:50.69
>>482
なんかヒントください
共分散0.5みたいな感じだと正規分布になります？

484:１３２人目の素数さん
14/01/23 08:03:12.82
日本の学歴の相対評価

５（07%）　院卒・一流大卒
４（24%）　四大卒
３（38%）　短大卒・専門卒
２（24%）　高卒
１（07%）　中卒

これって大体あってますか？

485:１３２人目の素数さん
14/01/23 09:07:31.80
それで大体合うように大学を格付けすればいいんじゃないですかね

486:１３２人目の素数さん
14/01/23 09:10:02.78
大学院こそ学歴と実力との相関が大きい気がする

487:１３２人目の素数さん
14/01/23 10:43:20.60
>>481

従属なときは正規分布しないでしょ。

多次元正規分布は変数同士は独立が仮定にある。
独立じゃないと確率密度関数はめちゃ複雑な形になり、正規分布ではなくなる。

488:１３２人目の素数さん
14/01/23 11:17:21.98
X が正規分布するとき、
X と X は？

489:１３２人目の素数さん
14/01/23 11:30:53.09
ネトウヨがよく言う「韓国語は英語より平均点がめちゃくちゃ高いので
在日特権！（キリリッ」を検証するためには
１．大学入試センターが得点分布を公表し
２．その得点分布が正規分布に従うと言えるか検定
３．韓国語と英語の得点差に有意性があるかさらに検定
する必要があるんdが

あ　の　隠　蔽　体　質　を　考　え　る　と　ム　リ　ポ

490:１３２人目の素数さん
14/01/23 13:08:29.14
あえて英語じゃなくて第二外国語を選ぶっていうことは、
その言語に対してリテラシーがあるってことだから、平均点が高くなるのは当たり前
だから難易度に格差があるかどうかは第二外国語間の比較で論ずるのが妥当だと思う

491:１３２人目の素数さん
14/01/23 13:15:15.24
>>488
2Xの正規分布

492:１３２人目の素数さん
14/01/23 14:19:11.40
>>491
Xを確率変数としたとき
X＋Xと２Xは違うんだぜ

493:１３２人目の素数さん
14/01/23 14:53:02.62
マジで！？

494:売国新聞排除
14/01/23 15:01:24.55
新聞購読を止めて、月3000～4000円、年間36000～48000円の節約

特に日本と日本人を貶める売国新聞を購読することは売国行為に加担するに等しい

新聞を購読することは止めて自分の頭で考えるようになろう

495:１３２人目の素数さん
14/01/23 15:22:44.12
あ、iidじゃないのか。なら2X。

496:１３２人目の素数さん
14/01/23 21:35:35.27
分散=E(x^2)-E(x)^2
になるのどうしてですか？

分散は期待値u周りの二次元のモーメントなので、
分散=∫(x-u)^2･f(x)dx
=∫x^2･f(x)dx-2u∫x･f(x)dx+u^2∫f(x)dx
=∫x^2･f(x)dx-2u･u+u^2
=∫x^2･f(x)dx-u^2

ここで∫x^2･f(x)dxをどうすればE(x^2)に変形できるのですか？

497:１３２人目の素数さん
14/01/23 21:39:56.88
Eという記号の定義より

498:１３２人目の素数さん
14/01/23 21:46:03.28
E(x^2)って∫x^2・f(x^2)dx
じゃないの？

499:１３２人目の素数さん
14/01/23 21:48:04.55
f(x)はf(x)

例えばサイコロの出る目の二乗の期待値E(x^2)は
∑x^2・p(x^2)じゃなくて∑x^2・p(x)だろ？

500:１３２人目の素数さん
14/01/23 21:56:05.89
あm分かりました。ありがとうございます

501:１３２人目の素数さん
14/01/23 22:27:33.27
xの期待値は連続分布のとき∫x･f(x)dxで与えられるが、
このときxについての任意の関数g(x)の期待値は∫g(x)･f(x)dxになる

502:１３２人目の素数さん
14/01/24 00:02:07.06
これは良い正規分布
URLﾘﾝｸ(twicsy.com)

503:１３２人目の素数さん
14/01/24 17:02:58.68
綺麗な正規分布を描く試験はダメな試験

良い試験は出来る層と出来ない層で山が２つ出来る。

今年のセンター国語はアホが作ったんだな。

504:１３２人目の素数さん
14/01/24 17:50:50.25
2つ山ができたら良いテストなの？何故？

505:１３２人目の素数さん
14/01/24 18:00:14.28
出来る層（十分な国語の学力を持つ層）と出来ない層（十分な国語の学力を持たない層）の基準が大学によって異なる
ということに考えが至らないようでは…

506:１３２人目の素数さん
14/01/24 18:16:50.65
センターの場合、受験者が多いのと、学力にバラツキがあるから、
良いセンター試験は台形型の分布になるだろうな。

507:１３２人目の素数さん
14/01/24 18:28:06.87
>>504
テストの目的って、賢いやつと賢くないやつを分類することだろ？

今年のセンター国語は賢いやつと賢くないやつを分けれてないな。
こんな正規分布だと国語出来ない奴も出来る奴も中央値に向かいやすくなる。

つまり、国語出来ない奴にはお得な試験で、出来る奴には辛い試験だったという
ことが分布から分かるんだな～

508:１３２人目の素数さん
14/01/24 18:29:42.93
「十分に賢い」の基準が大学によって異なる

509:１３２人目の素数さん
14/01/24 18:33:03.99
教育界は横並び志向だから、
そっちのほうが「よい試験」。
偏差値を偏重するのも、
正規分布が念頭にあるから。

510:１３２人目の素数さん
14/01/24 18:33:08.99
＞テストの目的って、賢いやつと賢くないやつを分類することだろ？
この時点で疑問符がつく
上のような意図の試験も一つの形ではあるだろうが、細かくランク分けすることが好ましい場合もある
ましてやそれが、レベルが様々な全国の大学の共通試験ともなれば、一層疑問の色が濃くなる

511:１３２人目の素数さん
14/01/24 19:17:22.37
>>510
その場合、分散がでかくなるから、裾の広い分布になるだろ。
尖度の大きい分布にはならないはず。

512:１３２人目の素数さん
14/01/24 19:21:48.05
正規分布になるのが良い試験だとは言ってないよ
山が２つ出来るのが良い試験なのか？と疑義を投げかけている

513:１３２人目の素数さん
14/01/24 19:26:38.04
ちなみに、センターは基礎学力を見る試験だから、細かい能力の差を見る試験ではない。
より精密な順位をつけるために２次試験があるんだろ。

514:１３２人目の素数さん
14/01/24 19:30:09.08
合格、不合格の２値で判定される試験では、山２つが良い試験。

515:１３２人目の素数さん
14/01/24 20:41:14.14
>>507
テストの目的は能力を測ることだと思う

516:515
14/01/24 20:47:04.47
その上で能力を推定することを考えると
問題単位で考えると能力に対して正答率が50%くらいの問題を与えるのが情報量が多くて一番良いと聞いたことはあるんだけど、その問題の集合をテストとしたときに得点分布はどんなふうになるんだろう

517:515
14/01/24 21:56:24.41
>>516
これ得点分布考えても意味なさそうですね
考えるなら能力の分布ですかね

518:１３２人目の素数さん
14/01/24 23:47:48.78
え、二つ山より、正規分布になる方がいい試験だと思ってたけど違うの？

519:１３２人目の素数さん
14/01/25 07:48:16.70
>>516
テスト理論は統計学を使った方法がある。TOEICやTOEFLみたいな試験で採用されている。

この方法では、まず正答率が高い人を抽出する。
正答率が高い人だけが正解する問題は、出来る人を検出する問題ということで良い問題。
こいういう問題は配点が高くなる設定になる。
逆に正答率が高い人でも解けない問題というのは、誰も解けないじゃん。ということで悪問扱いで配点は低い。
あと、みんなが解ける問題というのも能力を測れていないので、配点は低い。

520:１３２人目の素数さん
14/01/25 07:51:19.54
>>515
能力を測る場合でも、分散がでかくなるような分布が理想。

521:１３２人目の素数さん
14/01/25 07:59:49.69
>>518
TOEICやセンターなど点数に意味のある試験では分散のでかい分布が良い試験。
間違っても、今年のセンター国語のような正規分布良い試験ではない。
２択まで絞って、そこからは運って試験が平均100点の正規分布となるが、センター国語はまさにそんな試験。

２次試験では合格、不合格に分類したいわけだから、山２つを目指して、試験を作る。

522:１３２人目の素数さん
14/01/25 09:44:15.55
それ合格者と不合格者が明確に異なる平均・分散からなる母集団に区分けされるってこと？
あり得ないだろそんなのｗ
ましてやセンター試験みたいな母集団が大きくて受ける大学もバラバラな試験じゃあね

523:１３２人目の素数さん
14/01/25 10:13:30.64
合否の分かれ目の点数に大量の受験者がいたら
運が合否の分かれ目の試験になってしまうな。よくない試験と言える。

524:１３２人目の素数さん
14/01/25 10:53:18.76
まず
良い試験
悪い試験
の定義から始めなよ

525:１３２人目の素数さん
14/01/25 11:37:34.71
>>522
統計学が分かってるやつらが作った試験（数学、物理）とそうでない奴らが作った試験（国語、歴史など）の分布を
見比べてみなよ。

国語や歴史は正規分布型に近いはず。
これは、科目の性質を表しているんじゃなくて、出題者の意図の違いだよ。
数学や物理は難しい問題を出そうと思ったらいくらでも出せるけど、
それでは出来る奴を判別する試験にはならないから、あえてそうしないだけ。

526:１３２人目の素数さん
14/01/25 12:24:45.43
適当に画像検索してみたが２つ山になんてなってねーじゃねーかｗ
デタラメばっか言うなよ

527:１３２人目の素数さん
14/01/25 13:14:44.81
物理や数学のセンター試験は山が２つあるとでも思ったのか？

だから、山２つ出来るのは２次試験だって何度も言ってるだろ。

528:１３２人目の素数さん
14/01/25 13:17:33.88
URLﾘﾝｸ(monoist.atmarkit.co.jp)

529:１３２人目の素数さん
14/01/25 13:28:45.63
センター試験に端を発してるのにその論理はもうグチャグチャだろ
だったら初めから口はさむなと言いたい

530:１３２人目の素数さん
14/01/25 13:55:21.72
統計の話じゃねーだろ

531:１３２人目の素数さん
14/01/25 14:25:24.82
>>529
センター試験の話がしたいなら受験サロンでもお逝きなさい

532:１３２人目の素数さん
14/01/25 15:10:00.86
得点が正規分布しない方が受験用としては良い試験というのは勉強になった。

533:１３２人目の素数さん
14/01/25 15:26:38.40
お口直しに
URLﾘﾝｸ(www.msi.co.jp)

534:１３２人目の素数さん
14/01/25 20:04:09.97
統計リテラシーが身につくといろんな知識が蓄えられるな

535:１３２人目の素数さん
14/01/26 03:34:41.01
数学がちょっと好きな文系１年です。（統計２級うかったけど１級落ちました(T_T)）
質問があります。

標本比率から母比率を検定する方法についてです。
n: 標本サイズ p: 母比率 r: 標本比率
大標本のとき、比率の分布がN(np, np(1-p))に近似できると本や学校で習いました。
そこまではいいんですが、検定するときにpをrで代用してp～N(nr, nr(1-r))に近似するという方法をやりました。
p≒rの話だと思うのですが、母比率の分布は厳密には少し0.5の方に歪んでますよね？（最尤値はrかな？）なんていう分布か教えてください。

それとレヴィ分布についても教えて下さい。
立ち読みした本に、正規分布を酔っ払いがホテルで自分の部屋から行き着く部屋とすると、
レヴィ分布は酔っぱらいが横に長い壁に向かって銃を撃ったときに銃弾があたる場所の分布だと書いてありました。
これってθ～Nのときの1/tanθの分布って意味ですか？

536:１３２人目の素数さん
14/01/26 05:52:34.57
勉強した人は高い平均の分布、してない人は低い平均の分布で、結果は２つ山。
これを２人でなく１０００人で考えると、多峰性の分布や一様分布になるが、さすがに０点や
１００点は少ないので両端とれて台形の分布になるのでは。上のレスであるように。

537:５３５
14/01/26 06:01:44.34
N(np, np(1-p))は数の分布だった
N(p, p(1-p)/n)です

538:１３２人目の素数さん
14/01/26 06:13:18.36
なんかわかりにくいので式にすると単に
X|μ ~ normal(mean =μ,sd =5)ぐらいで
μ~uniform(10,80)
の分布を考えると台形になるんじゃ。μ～normal(mean=50,sd=10)はどうなんかな。
Xがセンター試験の得点分布で、μが受験者の実力分布としたばあいね

539:１３２人目の素数さん
14/01/26 17:36:42.97
>>535
歪んでんの？へぇー

なぜ1/tanθだと思うの？

540:１３２人目の素数さん
14/01/26 20:18:38.68
r=0のとき明らかにpの平均値・中央値は0より大。r=1のときも1より小。
ただしpの最頻値がrであると思ったから。
それ以外は想像。

まずレヴィ分布について知らないから、よっぱらいの銃が壁にあたったところってあるから
URLﾘﾝｸ(i.imgur.com)
だとおもった。
θがランダムで、y=tanθとy=1の交点の分布を考えた。

541:１３２人目の素数さん
14/01/27 19:05:08.02
F分布のことかな？

それ、正規分布になると思うよ？
レヴィ分布は右に裾を引く分布だね。金融工学とかで使ってるよ。

542:535
14/01/27 21:21:13.51
F分布ですか。母比率についてF分布にしたがう統計量あってびっくりです。
正規分布の比の分布はコーシー分布、正規分布の二乗和の分布はカイ二乗分布みたいな、狭義レヴィ分布の説明ってありますか？

543:１３２人目の素数さん
14/01/27 21:42:55.63
パラメタ不明のn個の正規分布{N(μ_i, σ_i^2) | i ∈ [1,n]}から
それぞれm個ずつ独立に値をサンプリングして、
そのmn個の値をもとに平均の和(Σμ_i)の信頼区間を作りたいのですが、良い方法はありますか？

n個の分布に従う変数の和の分布を考えれば、標本数=mのt検定ができることは分かるのですが、
そこまで情報を捨てないで済むものを探しています

n=2の場合は片方を符号反転してWelchのt検定でよさそうなんですが、
一般の場合にも似たような手法が使えるのでしょうか

また、分散が一部共通の2n個の正規分布{N(μ_i_j, σ_i^2) | i ∈ [1,n], j ∈ [1,2]}の標本から
(Σ(μ_i_1 - μ_i_2))の信頼区間を作りたい場合に良い方法はありますか

544:１３２人目の素数さん
14/01/28 05:01:20.79
標本数？

545:１３２人目の素数さん
14/01/28 05:48:14.24
すいませんsample sizeのつもりでした

546:１３２人目の素数さん
14/01/28 09:09:10.97
sample size mのt検定はないでしょ。

547:１３２人目の素数さん
14/01/28 11:13:27.30
>>543
正規分布の再生性　じゃダメ？
それに平均の和(Σμ_i)の表記はΣX_iとかにすべきじゃ。もし
パラメータの信頼区間を求めたいなら別だけど。

548:１３２人目の素数さん
14/01/28 12:39:05.56
>>542
レヴィ分布は確率過程や確率解析の本を見たら乗ってると思う。
統計より確率論の話。

549:１３２人目の素数さん
14/01/28 15:41:50.93
こんなとこで聞かないで図書館行って調べろよ
何でもかんでも人に聞く癖を直せ
大学生なら最終的には教授に聞け

550:１３２人目の素数さん
14/01/28 21:27:49.76
>>547
再生性を使うより良い方法があるかと思って質問したのですが、無理そうでしたか
ありがとうございます

>それに平均の和(Σμ_i)の表記はΣX_iとかにすべきじゃ。もし
>パラメータの信頼区間を求めたいなら別だけど。
パラメータの推定が目的なので、パラメータの信頼区間を求めたいです

551:535
14/01/28 23:20:40.64
>>548 PRMLとかですか？
どうりで入門書でも数理統計の本で見なかったと思いました。

552:１３２人目の素数さん
14/01/28 23:22:14.09
prmlは確率過程じゃなかった

553:１３２人目の素数さん
14/01/29 04:16:50.94
統計学をやろうとおもうのですが、高校数学の平面図形の知識は必要ですか。

重点的にやっおいたほうがいいという分野がアレばお願いします

554:１３２人目の素数さん
14/01/29 06:28:53.08
統計学をやればいいと思います

555:１３２人目の素数さん
14/01/29 07:51:02.21
必要になる度に復習せえ
とんでもない量になって結局、高校数学全て見直す娘とになるがな

556:１３２人目の素数さん
14/01/29 08:17:42.21
確率は見直しとくとスムーズ

557:１３２人目の素数さん
14/01/29 09:57:22.23
機械学習と統計学の違いは何？
どっちが難しい？
どっちが実用的？
統計学が最強の～では機械学習はあまり触れられていませんでしたが。

558:１３２人目の素数さん
14/01/29 10:04:44.07
＞５５３
一変数の微積と高校程度の確率の話が分かってれば大体なんとかなる

559:１３２人目の素数さん
14/01/29 10:12:04.76
>>557
かぶる部分も多いけど、統計の方が難しい。
統計家は機械学習できるけど、情報屋は数理統計学で詰む。

実用的なのは機械学習。
ビッグデータでも使えるし。
従来の頻度論統計学はデータ量が多いと使えない。

560:１３２人目の素数さん
14/01/29 11:43:49.36
>>559
どうもです。機械学習のほうが難しいのだと思っていました。
統計学よりも数学的知識を前提にしているようですし。
データ量が多いと統計学が使えないのは初めて知りました。
統計学はデータ量が多いほど分析が簡単になるのでは？

561:１３２人目の素数さん
14/01/29 13:56:10.22
統計学の本来の目的って、標本から母集団を推定したり・検定することにある。
標本が1000とか1万とかのデータ数だと、それはもう母集団といえる規模。
推定は一致し、検定は有意な差しか出なくなる。

ビッグデータに古典的な推定や検定を使ってたら、分析者を殴っていい。

562:１３２人目の素数さん
14/01/29 17:51:50.00
>>561
どこまでを統計学というの？
また、ビッグ・データとは何？

563:１３２人目の素数さん
14/01/29 18:06:18.39
>>543
解決しました
検定統計量を
√(Σ(s_i^2/m))
(ただしs_iは標本標準偏差)とし、実効自由度を
(Σ(s_i^2/m))^2/(Σ((s_i^2/m)^2/(m-1)))
としたt検定でいけるようです

564:１３２人目の素数さん
14/01/29 20:31:10.73
>>562
明確な定義はない。

565:１３２人目の素数さん
14/01/30 14:57:27.25
>>561
有意な差がでるのは良くないことなんですね。つまり
有意な差がでやすい大きな標本を統計学では使うべきではない、
ということですね。わかりました。

566:１３２人目の素数さん
14/01/30 21:55:20.32
釣られてあげようか？

567:１３２人目の素数さん
14/01/30 22:10:41.80
>>565
そうだよ。
推測統計ではデータが少なすぎるのも問題だけど、多すぎるものに使うのも問題。

568:１３２人目の素数さん
14/01/30 22:12:01.89
多すぎると何が問題なんですか？

569:１３２人目の素数さん
14/01/30 22:17:32.41
ベイズ統計スレを新たに建てたら？

570:１３２人目の素数さん
14/01/30 22:32:32.04
>>567
例えば、データ数が1000の相関係数が0.06だった場合、普通は相関無しと思うが、
相関係数の検定をすると有意差が生まれる。

これは、検定がもともとデータ数が少ない場合に使うことを前提にして作られたから起きる問題。

URLﾘﾝｸ(www.urano-ken.com)

571:１３２人目の素数さん
14/01/31 03:31:41.68
そのｐｄｆ，「きわめて小さな差でも“（統計的には）有意である”という結果になる可能性が
高まります。」と書いてるけど、それで何が問題なのかわからないです。。

むしろ極めて小さな差でもデータ数が多ければ、その差が偶然出ないことがハッキリして
よかったね、というふう好意的に解釈してしまいました。

572:１３２人目の素数さん
14/01/31 06:47:42.46
適切な標本数って母集団の大きさと目標とする誤差で変わってくるんでは
政府統計だと標本数10万人規模だったりするし

573:１３２人目の素数さん
14/01/31 08:30:10.36
標本数

574:１３２人目の素数さん
14/01/31 08:45:25.91
標本の大きさというべきでありました・・・

575:１３２人目の素数さん
14/01/31 12:11:15.00
で
結局データ数が多い場合には極めて小さな差でも有意にできるのは問題なん？
問題ないん？どっち？

576:１３２人目の素数さん
14/01/31 12:55:36.73
問題無い

577:１３２人目の素数さん
14/01/31 18:45:32.96
>>570
問題の意味が分らない。誰か説明して。

578:１３２人目の素数さん
14/01/31 19:09:28.32
>>575
問題ありだろ。

例えば、イケメン度合い(y)を2chに書き込んだ回数(x)で回帰分析する場合を考える。
普通この２変数に相関はないだろう。
しかし、「2chに書き込めばイケメンになれるんだということを世間に知らしめたいとする」
その場合、標本数を1000以上とってくる。
そして、回帰モデルの検定を行う。
すると、p値に有意差が生まれて、このモデルは統計的に意味のあるモデルと言うことが出来る。

ただ、正の相関か負の相関かは標本次第w

579:１３２人目の素数さん
14/01/31 19:13:06.08
基本的に思考停止な検定を始める奴は統計学に向いていない

580:１３２人目の素数さん
14/01/31 20:41:22.58
質問です。
ここにいる皆さんは仕事をするときに統計学をがっつり使っていますか？
現在就活中で大学で統計学を専攻しているのでそれを活かせる職業を探しています。
因みに私立文系でプログラミングは出来ません。
よろしくお願いします。

581:１３２人目の素数さん
14/01/31 20:43:07.34
>>580
大学はどこ?

582:１３２人目の素数さん
14/01/31 20:50:17.70
>>581
早慶です

583:１３２人目の素数さん
14/01/31 21:10:32.93
基本的にプログラミングの知識を使わないで統計の知識だけ使うってことはほとんど無いよ
新卒なら入社してから覚えさせられることになるし、
現時点でバリバリプログラミングが出来る必要はないけど、
そういう仕事やりたいんならちょっとかじるくらいではプログラミングに触れておいたほうがいいかも

584:１３２人目の素数さん
14/01/31 21:11:29.97
↑自己アピールができる、という意味でね

ただ入社以降もプログラミングには触れたくない！って言うのならおすすめはしない

585:１３２人目の素数さん
14/01/31 21:25:45.95
>>582
早稲田は文系でも統計の研究室いくつかあるけど、そこ出身かな？！

マーケティングの統計職ならあまりプログラミングはないと思うけど。

次ページ