統計学Part17at MATH
統計学Part17 - 暇つぶし2ch1009:132人目の素数さん
20/10/17 10:38:49.93 /dkWfRN/.net
>>981
> ぐぐって次のところを見つけました。
>
> URLリンク(oshiete.goo.ne.jp)
>
>
> > f(x; a,b) = (x^a)e^(-x/b)
> > なんて書いて、「fはx,a,bによって値が決まる関数だけど、a,bは係数として
> > の性格が強くて、a,bを固定してxの関数と見なすことが多い」てなニュアンス
> > で、カンマとセミコロンを使い分けちゃったりすることがあります。
>
> と書いてありました。
> なるほど、統計学ってのは
> 汚い学問だとよく聞きますが、
> なるほど汚いw(笑)
>
> 意味不明の記述をして
> 難しいことをしているらしく
> 見せかけているということですね。
>
> 了解できましたw
カンマとセミコロンの使い分けは単に英文法でしょ。

1010:132人目の素数さん
20/10/17 11:19:20.64 wbkx6lR+.net
>>981
a, bの条件付きでの確率変数xの関数
みたいに解釈している

1011:132人目の素数さん
20/10/22 16:33:51.46 Fw5i0Sy8.net
数理に基づいた学問でも工学や物理学を始めとして分野によってどこまで明確に精確に数学を用いるかは違うしな

1012:132人目の素数さん
20/10/27 14:09:43.11 nDFw66Bi.net
統一しろや

1013:132人目の素数さん
20/10/31 08:10:39.76 SRqhoG/2.net
>>981
別に数学でも、セミコロン使うだろ
君何年生?

1014:132人目の素数さん
20/12/15 12:28:09.26 +saPgY7R.net
初心者がここで質問してよろしいでしょうか?
ある業務の、1つの案件に対する作業時間をプロットしてヒストグラムを作成して、X軸を対数変換したら、綺麗な正規分布になりました。
これは対数正規分布だと思うのですが、それであれば作業時間合計(残業時間)の予想(信頼区間を出す)ことが可能だと考えました。
仮に、20件の案件がある場合には、① 標本平均とt値、標準偏差から、信頼区間を出します。
② 次に、信頼区間上限・下限をe乗してあげると、対数変換を戻した時の標本平均の信頼区間が出ます。
③ 最後に、信頼区間を20倍してあげると、作業時間合計の信頼区間が出ます。
以上の手順ですが、自分でやっていて正しい計算とは思えません。
試しに、実際のデータから20件の標本平均を、100回抽出して、ヒストグラムを作成することを何度かやってみましたが、信頼区間の上限を超えて、信頼区間の下限はほとんど超えないという結果になりました。
どなたか正しい計算をお教えいただくことはできないでしょうか。
よろしくお願いします。

1015:132人目の素数さん
20/12/17 04:00:55.26 IoIBMAoa.net
>>988
確率変数を20倍したものと
20個の確率変数を足したものの分布は違うと思う
確率変数の和の分布の平均と分散は計算出来る



1016:https://bellcurve.jp/statistics/course/18592.html 20の和の確率変数の平均と分散を使って信頼区間を求めたら良いと思う



1017:132人目の素数さん
20/12/17 04:03:38.53 IoIBMAoa.net
>>988
別の方法はブートストラップ法で分布を求める方法
20のデータを100回取り出して分布を作ったのを
もっと多く1万回とかにして分布を作って
その平均や分散を計算して推定値とする

1018:132人目の素数さん
20/12/18 19:59:14.36 Psb7CDOJ.net
>>990
ありがとうございます
信頼区間の導出の仕方をもう少し勉強してからやってみようと思います
ブートストラップ法はExcelで手作業でやるには難しそうでした
今日、コルモゴロフ=スミルノフ検定をしたところ(計算の仕方が合っているかは分かりませんが)正規分布ではありませんでした。
また、E(ln(X))と、ln(E(X))は、異なる値になることも知りました。
E(ln(X))は、ln(相乗平均(X))と対応しているようです。
また整理できたら質問させていただくかもしれません

1019:132人目の素数さん
20/12/19 01:56:48.73 Y5VNLcGt.net
いいってことよ

1020:132人目の素数さん
20/12/19 06:29:38.32 68CAEKuu.net
>>991
作業時間データを行方向に書く
その範囲の行番号を乱数で発生させて
index関数でデータを取り出す
列方向に20個ランダムサンプリングしたデータの和を列に追加する
行方向にコピーして1万行同様の計算をする
1万行21列の和を計算した列からヒストグラム、平均、分散を計算する

1021:132人目の素数さん
20/12/21 23:31:32.80 X15I1tLx.net
頭いい人しかおらんのか…全くわからん

1022:132人目の素数さん
21/01/11 20:58:38.09 oZQgW4jU.net
NHKの高校数学(ベーシック数学)を見ていたんだが、
事前確立と事後確率の説明が間違っているんだが、
三流役者のお笑いの部分ばかり多くて
大事な説明が間違っているとは、なさけないぞNHK!!!

1023:132人目の素数さん
21/01/12 21:31:29.28 CKZDqn7z.net
NHKのその番組は、他の回もしばしばひどい

1024:132人目の素数さん
21/01/18 15:10:24.59 vhuxYGIA.net
最近NHKの教育はそういうのは多い

1025:132人目の素数さん
21/02/02 23:14:25.03 0uhvIcHZ.net
残レスが僅かのときに恐縮ですが、検定について質問させてください
商品について金額基準の故障率を考えています
たとえば1千円の商品が5個、2千円の商品が5個あるとき、2千円のものが1個故障したときの故障率は、
個数で見たときは1/10=0.10ですが、金額で見たときは2/(1*5+2*5)=0.13になります
このとき、全ての商品の金額・個数・故障件数を基に計算した金額故障率と、
特定の層に販売した商品についての金額故障率とを比較して、
全体平均よりも故障率が大きいかどうか判断するために検定を行おうと考えています
率同士の比較という事で安直に、全体を母集団、特定層をサンプルとした母比率の検定を考えたのですが、
取る値が01でないためかうまくいきません
なにかよいアイデアはないでしょうか
よろしくお願いします

1026:132人目の素数さん
21/02/03 00:04:23.57 1LrlfGJ1.net
>>998
何年分かの1月毎とか1週毎の故障率を集めて分布、ヒストグラムを全体と特定層向けの両方作る
故障率を確率変数とした分布になると思うから
その2つの分布が同じ分布かどうかを適合度検定するとか

1027:132人目の素数さん
21/02/04 09:06:51.73 0AiLVZp3.net
次スレ
統計学Part18 [無断転載禁止]
URLリンク(rio2016.2ch.net)

1028:1001
Over 1000 Thread.net
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 1546日 6時間 32分 33秒

1029:過去ログ ★
[過去ログ]
■ このスレッドは過去ログ倉庫に格納されています


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch