20/01/20 15:41:43.88 RFS0mRu2.net
それぞれ、サイズの異なる
A B C D E が5分類有り、ONとOFFの2つの状態を持ちます。
ONには、各分類でトリガーとなるイベントが起きた際に一定確率でなります。
判明している数値は、A~Eのサイズ(量)と各分類でONになった回数です。
分類ごとのトリガーの発生回数とONになる確率を推定したいのですが、
各分類で起こった回数もトータルでの起こった回数も不明です。
826:132人目の素数さん
20/01/20 15:58:45.38 59LWl8Pz.net
スレ違だったらすまん
TwitterでAが好きな人はお気に入り、Bが好きな人はリツイートっての見たことある人いると思うんだけど、片方の投票だけ拡散される性能がある場合ってアンケートは平等と言えるのかな?
ふと疑問に思ってしまった
827:132人目の素数さん
20/01/21 14:45:56 Etw7VOGJ.net
>>801
教えてもらったらレスしなさい、いやなら二度と来ないで
828:132人目の素数さん
20/01/21 16:04:38.27 pYByjpiW.net
今勉強中だから!
829:132人目の素数さん
20/01/21 18:49:54 XQhOWIM5.net
>>802
遅くなってしまい申し訳ありません。
情報ありがとうございます、参考に致します。また些細なことで質問することもあると思いますが、その時はどうぞよろしくお願いします。
830:132人目の素数さん
20/01/22 00:38:06 4VBFhSJv.net
>>807
うっせーんだよバーカ
老害か?
831:132人目の素数さん
20/01/22 00:54:27 ZSq/0bZF.net
とんでもねえ
あたしゃガウスだよ
832:132人目の素数さん
20/01/22 18:12:41 eTeJDHK9.net
URLリンク(i.imgur.com)
この問題って、どーやって解くんですか?
833:132人目の素数さん
20/01/22 19:30:28 KUYY19ls.net
>>812
定義とおりに計算したら求められると思います
Xが-4を取る確率をその表から読み取って掛け算して
他の値も同様にして、全部足し合わせる→平均
平均との偏差の二乗を足し合わせて個数で割る
共分散も定義の式を確認してその通りに計算する
834:132人目の素数さん
20/01/25 00:28:42 IzxreXdi.net
質問:日本人を対象としたアンケート調査で十分なサンプル数を得られたものの、回答欄に不備があって回答の数パーセントが間違った集計をされた場合
Q1. この統計調査そのものを棄却すべきなのか
Q2. 信頼区間をいじればどうにか統計として成り立つのか
Q3. 出てきた結果に数パーセントの補正をなにかしらすれば使えるのか
よかったら教えてください。具体的な話をすると「20代男性は交際経験も性交経験もないのが○%!」みたいな記事を読んでたとき「これ3-10%いるLGBT人口を考慮しないと自分みたいなケツマンコ人数2桁でもおマンコゼロって回答するよね…」て思ったので。
835:132人目の素数さん
20/01/25 18:51:17
836:qRSN3fq+.net
837:132人目の素数さん
20/01/25 18:51:28 E3e004yf.net
黙れアホ死ね
838:132人目の素数さん
20/01/27 12:27:19 p+k1S3fn.net
仮説が正しい確率とかいう意味不明な概念を持ち出して絶賛炎上中だな
"瀕死の統計学を救え! ―有意性検定から「仮説が正しい確率」へ―"
839:132人目の素数さん
20/01/27 13:06:07 vv73qAWZ.net
>>805
求めたい値を変数として
今わかっている関係を数式で表す
それらを使って誤差などの評価値を最小にする値を探す
組合せ最適化問題に帰着するかもしれない
840:132人目の素数さん
20/01/27 13:11:52 vv73qAWZ.net
>>814
除外する基準が分からないなら
そのアンケートの結果としては意味があるだろうけど
対象外としたい集団の結果がどの程度影響しているかわからないんじゃ補正の仕方もわからないと思う
別の統計で対象外としたい集団の結果がわかればそれを使って補正すればいいのではないか
841:132人目の素数さん
20/01/27 13:12:35 vv73qAWZ.net
>>817
仮説が正しい確率が小さいから仮説を棄却するんじゃね?
842:132人目の素数さん
20/01/27 21:23:53 rbwRL9KL.net
「仮説」を統計モデルのようなものとすると「仮説が正しい確率」を計算するためには今対象とする事象の真のモデルを知っている必要がある
現実世界においてはそんなもの知り得ないし、万が一知っているならそもそもそれと別のモデルを立てて計算する必要などなくなる
843:132人目の素数さん
20/01/27 21:38:20 vv73qAWZ.net
>>821
仮説が正しいという前提で観測した事象が発生する確率を考えてみたら1%以下だった→仮説が間違いと考える
分布は正規分布とかχ二乗分布とかt分布とかF分布とかそれらしいものを使うんじゃね?
中心極限定理とかで安定分布とみなせるとかあるんじゃね?
844:132人目の素数さん
20/01/27 21:40:59 vv73qAWZ.net
>>821
別の手段は何か適切なものがあるの?
ないなら近似的なものでも答えがわかった方がいいんじゃね?
845:132人目の素数さん
20/01/27 22:33:49.08 AlwQV46l.net
>>823
勝手に想定した分布は真の分布ではないし中心極限定理で正規分布になるというのも
有限サンプルの世界ではあくまで近似でしかない
そもそも「仮説が正しい確率」などというものが求めようがないと言っているだけであって
近似的に使えるものがあれば好きに使えばいい
ただ単にそれを「仮説が正しい確率」と呼ぶのは事実と異なる
846:132人目の素数さん
20/01/28 00:05:49 L5uOvH9/.net
この問題を教えて頂けないでしょうか?
大学1年生について,何かを失敗してしまうことへの恐怖感を感じる程度(「以下,「失敗恐怖尺度得点」)と,個人の大学生活への不適応度(以下,「不適応得点」)を測定したところ,
それぞれの記述統計量について,「失敗恐怖尺度得点」に関して平均値=4.05,標準偏差=1.17,「不適応得点」に関して平均値=20.29,標準偏差=6.49という結果が得られた。また,2変数間の共分散は2.37であった。
「失敗恐怖尺度得点」を独立変数とし,「不適応得点」を従属変数として単回帰分析を行い,それぞれ値を入力欄に記入せよ。
(1) 切片を推定せよ
(2) 回帰係数を推定せよ
(3) 決定係数を示せ
(4) 単回帰分析の結果,得られる,従属変数の予測値と,従属変数との間の相関係数を求めよ
(5) 予測の標準誤差を示せ
847:132人目の素数さん
20/01/28 06:43:17.72 zbNO1u7R.net
やっぱベイズが分かりやすくていいな。
848:132人目の素数さん
20/01/28 09:17:05 +WlMKIb4.net
ベイズって簡単なの?理解に苦しんでる笑
もう一踏ん張りしたらそのステージに上がれるかな
849:132人目の素数さん
20/01/29 06:00:24 wY0tYf5k.net
平均値100 標準偏差15で定義される知能指数で
標準大学の新入生の知能指数の平均が100
裏口シ
850:リツ医大の新入生の知能指数の平均が85であったとする。 各大学から1/10を無作為抽出して知能指数をt検定したときのp値の期待値、中央値を求めよ。 また、p値が0.05以上になって裏口シリツ医大の新入生の知能指数は統計的に有意差はないと主張できる確率はいくらか?
851:132人目の素数さん
20/01/29 06:51:38 wY0tYf5k.net
>>825
統計ソフトを使っていいなら、擬似乱数発生させて近似値ならだせる。
Rだと
library(MASS)
mx=4.05
my=20.29
sx=1.17
sy=6.49
vxy=2.37
n=1e6
mu=c(mx,my)
si=matrix(c(sx^2,vxy,vxy,sy^2),ncol=2)
dat=mvrnorm(n,mu,si)
X=dat[,1]
Y=dat[,2]
lm(Y~X)
852:132人目の素数さん
20/01/29 06:56:54 wY0tYf5k.net
近似値なら
Call:
lm(formula = Y ~ X)
Coefficients:
(Intercept) X
13.279 1.731
853:132人目の素数さん
20/01/29 07:46:51.07 wY0tYf5k.net
>>828
追加
1学年はどちらも100人
854:132人目の素数さん
20/01/29 10:50:47 QT00WVSK.net
>>824
仮説なんだから真の分布はわかるはずがないだろ
仮説が成り立つとして検定するんだから
真の分布なんて厳密に判るケースの方が少ないんじゃないか?
今あるデータだけでなく未来のデータも含めないと真の分布は厳密にはわからないんだし
855:132人目の素数さん
20/01/29 12:11:52 tswqnp9S.net
>>832
だから散々言っているように、真の分布が分からないのに仮説が正しい確率など分からないよね?ということ
あくまで自分が勝手に作ったモデルが手元のデータに対してどれぐらい使い物になるかが分かるだけ
それが有用なら使えばいいが、それは決して仮説が正しい確率ではないというだけのこと
856:132人目の素数さん
20/01/29 13:44:04.84 QT00WVSK.net
>>833
自分が勝手に作ったモデルのことを仮説と呼ぶ
仮説が正しい確率=自分のモデルが正しい確率
857:132人目の素数さん
20/01/29 14:19:09.31 J3LUoz9R.net
>>834
そこで言う「正しい」って何だよってこと
正解があって初めて自分が作ったものが正しいか間違いかを論じることができるはずだが正解を誰も知らないので「正しい」などという言葉を使ってはならない
858:132人目の素数さん
20/01/29 14:21:53 QT00WVSK.net
>>835
正しい→観測した事象が発生する確率が高い
859:132人目の素数さん
20/01/29 14:25:41 QT00WVSK.net
>>834
これは正確ではなかったかも
仮説が正しい確率=自分のモデルで対象の事象が発生する確率
自分のモデルで対象事象が発生する確率が低い→
自分のモデルつまり仮説が正しくないから仮説を棄却する
860:132人目の素数さん
20/01/29 14:27:55 QT00WVSK.net
>>837
統計量と検定に使う分布を適切に選ぶ必要はある
どの程度の精度が必要かは個別に違うだろう
近似でも有用なケースもある
861:132人目の素数さん
20/01/29 14:36:14.08 QT00WVSK.net
>>835
統計だから正しいか正しくないかの二択ではないんだよ
正しい可能性が1%なのか95%なのかで違うだろ
862:132人目の素数さん
20/01/29 15:11:01 tswqnp9S.net
正しいか正しくないかは確率変数ではないので正しい確率などという概念がおかしい
確率変数ではないのだから正しいという言葉を使った瞬間に正しいか正しくないかの二択で論じることになる
>>837にあるようにあくまで計算するのは作成したモデルで観測した事象をどれだけ説明できるかであるが
それは一般に言う「正しい」の意味合いとは大きく異なる
だから「正しい」などと大袈裟なことを言わずに正直に自分が作ったモデルとはこの程度合っていると言えばいいだけのこと
863:132人目の素数さん
20/01/29 17:57:57.14 QT00WVSK.net
>>840
正しいという言葉の定義の問題でしかないな
意思疎通ができれば問題ない
正しいとはこう言う意味に解釈すると前置きすれば解決する
864:132人目の素数さん
20/01/29 18:12:15.61 yutX131C.net
だからベイズ使えベイズ。
仮定したモデルが正しい確率だから分りやすいぞ。
865:132人目の素数さん
20/01/29 18:49:21 QT00WVSK.net
ベイズって観測するまでは事前分布を均等だとみなして
観測に合わせて分布を更新すると理解しているけど
それだと滅多に起きない事を考慮できないんじゃないの?
866:132人目の素数さん
20/01/29 21:16:02 Bb/kUddm.net
統計学は統計学
数学ではない
867:132人目の素数さん
20/01/31 12:18:53 3R+evHVz.net
>>843
無情報事前分布を当てはめるのは普通は確率分布のパラメータに対してであって最終的に知りたい確率分布自体は別のものを用意すればいい
レアな現象を扱いたいならポアソン分布とかをベースにした統計モデルがよく使われる
868:132人目の素数さん
20/01/31 18:00:11 20AlCGSm.net
別の質問スレに書いたけどスレチだったようで回答頂けなかったので、こちらで質問させてください。
あるデータを連続分布関数でフィッティングしてパラメータを決めたいのですが、累積でやるのと階級に区切ったヒストグラムでやるのはどちらがいいのでしょうか?
869:132人目の素数さん
20/02/05 08:39:16 EMFhdap/.net
累積じゃないか。
最小二乗法でフィッティングできない?
870:132人目の素数さん
20/02/05 18:12:00 CqhwK2bl.net
両方試して、実運用の成績が良さそうな方を使う
871:132人目の素数さん
20/02/05 18:23:56 X0ZPE/3a.net
自力で勉強だとどこくらいまでいけるかな
872:132人目の素数さん
20/02/18 01:50:07.55 MRffbEd5.net
>>847
俺も累積だと思うんだけど。
階級に区切るほうだと、階級幅をこっちで決めなきゃいけないからいらんパラメーターが増えるのがデメリットだけど、メリットあるのか?
どっちも最小二乗法は使えるよね。
873:132人目の素数さん
20/02/18 07:47:57 u7S9BjHY.net
最小二乗法が使えるかどうかはデータの誤差分布がどうなっているか次第なので実際のデータを見ない限り最小二乗法が使い物になるかは誰にも分からない
874:132人目の素数さん
20/02/25 22:11:40 i9jNym3/.net
日本統計学会の春季大会は中止になりました。
875:132人目の素数さん
20/02/28 14:03:26 +BoqDQ44.net
アメリカの株のセンチメントの悪化が1万年に1度の発生確率って本当ですか?
URLリンク(imgur.com)
876:132人目の素数さん
20/02/28 17:26:29 3mNEM8z5.net
収益率に正規分布を使うと大変な間違いになります。
株価は非線形的な反応をします。
ポートフォリオは毎日リスクにさらされます。
877:132人目の素数さん
20/02/28 17:35:43 zqjyPXbo.net
>>854
正規分布って線形ではないよね
株価とかがランダムウォークしたら正規分布にならない?
878:132人目の素数さん
20/02/28 17:36:54 zqjyPXbo.net
ポートフォリオがリスクにさらされないと価格変動はなくなるからキャピタルゲインを得られない
879:132人目の素数さん
20/02/28 17:49:00 3mNEM8z5.net
>>855
平時はそうだけど
裾はもっと分厚い
非線形というのは例えばコロナだけの問題ではないということで
連鎖反応がある
880:132人目の素数さん
20/02/29 01:12:54 9VrNPLAR.net
> センチメント分析とは、文字通り消費者の「センチメント = 感情」を分析する
> ことを意味します。ウェブ上に投稿されたコメントなどを分析することによって、
> 消費者が持っている感情がネガティブなのかポジティブなのか、また、どの程度の
> 強さなのかを知ることができます。
そのセンチメント分析が何をどういう方法で分析したのか不明なのだから、
5σと言われても、さっぱりなんのことやらわからんよ。
単に否定的な単語の出現頻度が上昇したとか、そんなところだろ?
だって、テレビも新聞もウィルスの記事だらけ。
そんなの分析したら極端な結果になるんだろうね。
だけど5σと判断した基準がわからんのだから、
さっぱり意味不明だね。
その意味不明だということが理解できない人が、馬鹿ということ。
つーか、非線形と線形がどういう意味なのか
知ってる奴がいないということに驚
881:いてる。 少しは勉強したほうがいいね。
882:132人目の素数さん
20/02/29 07:47:57.93 HVbT+JBd.net
>>858
線形、非線形を知っているのがいないってどうやって確認したの?
確認できない→いない
と判断した?
883:132人目の素数さん
20/03/01 00:47:01.48 xtXMQc/Z.net
SPSSで2グループの判別分析をおこなうと、正準判別関数と分類関数が出力されます。
この二つの違いは何でしょうか。
実際に分類を行う場合には、分類関数を使用するのでしょうか。
884:132人目の素数さん
20/03/10 23:31:53 qimc2JEn.net
初めてこのスレに来た!
データ分析のために統計学を学ぼうとしていて、調べるとちょうど6月に検定試験があってちょうどいいなと思ってた今日この頃
皆さんは受験しますか?
885:132人目の素数さん
20/03/11 01:44:41.71 EAYVYeBW.net
>>851
たまに真顔でこういう人がいるから困る
検定と推定は別物な
>>840
841がおかしいけど
センセーショナルなほうがもてはやされるんだろうね
886:132人目の素数さん
20/03/11 09:35:31 BYdSeDgC.net
>>862
R2が小さくても使えると?
887:132人目の素数さん
20/03/11 11:43:01 SrjUptyu.net
使える=計算して何らかの結果が出せる、という意味なら使える
使える=計算して得た結果が役に立つ、という意味なら使えない
888:132人目の素数さん
20/03/11 11:50:18 BYdSeDgC.net
>>864
計算可能かどうかは学問的には興味があるだろうけど
最小二乗法を学問的に研究しても面白くないんじゃないか?
事業とかの役に立つという意味で使えるという用語を使用する人が多いだろうよ
889:132人目の素数さん
20/03/11 20:11:15 pvvBKa5t.net
誤差が正規分布はblueの条件じゃないことをいいたいんだろう
正規分布に従っていればモデルのフィッテングがいいわけじゃない
決定係数が高くても外れ値で見かけ上の直線性になっているだけかもしれない
相関係数の検定結果で悦にひたっていた人を思い出すわ
890:132人目の素数さん
20/03/11 21:08:54 KSMk05c1.net
だから結局は実際のデータをプロットしたりして見てみないとどんな方法が最適かなど誰にも分からない
あらゆるデータに対して有用な結果を出せるような都合のいい手法など存在しない
891:132人目の素数さん
20/03/12 00:19:32 oP6dIOya.net
データを重視するって大事だよねー
892:25
20/03/21 22:18:20 OJKhoHNQ.net
人がいないので、質問を破棄します。
どうぞよろしく。
893:132人目の素数さん
20/03/21 22:22:48 OJKhoHNQ.net
>>869は間違いなので無視してください
すみませんが、確率論統計学オタクの方々、日本のコロナウイルス感染者数を
計算できませんか
このコロナ騒ぎ以来日本政府はなんか態度が怪しげで外国のように検査数を
増やすつもりもないようです。
そこで、実際の感染者数をなんとか計算でだせないかと。
3月20日現在の、感染者数
日本国内 1015人
重症者49人
死亡者35人
致死率は1%から2%
NHKが毎日更新してる新型コロナの日本のデータ
URLリンク(www3.nhk.or.jp)
ジョンズホプキンス大学が毎日更新してる新型コロナ世界の感染者数
URLリンク(gisanddata.maps.arcgis.com)
よろしくお願いしますm(_ _)m
894:132人目の素数さん
20/03/22 00:39:49 lg1RjcFm.net
医療体制も国民の意識も栄誉状態も国内外の移動の頻繁さも全く違う国のデータを並べて一体何が推定できるようになると思っているのか
895:132人目の素数さん
20/03/22 01:21:28 fIGjbcow.net
よろしくお願いしますm(_ _)m
896:132人目の素数さん
20/03/22 01:27:33 a1rnwvta.net
海外と比較して優位な差があるとかは分かるかもしれない
その理由はなぜかは海外との違う点が候補になるくらいじゃないかな
897:132人目の素数さん
20/03/22 09:49:16 u67prFqL.net
>>870
ガイガーとか地面においてたタイプの人?
898:132人目の素数さん
20/03/24 21:56:25 JJA4CvUW.net
統計学を1から勉強してるけど難しいな
アウトプットが足りない
899:132人目の素数さん
20/03/26 08:48:13.00 KpkCprwW.net
例えば、現在の都内の感染者数は正しいと仮定して、
都内の1ヶ月後の感染者数を
予測してみよう。
n:現在の感染者数を120人
d:接触率(1日に1人が何人と濃厚接触するか人数)=5人
c:感染率(人と濃厚接触して感染させる確率)=20%
M:都内の昼間人口
難しいのは感染者同士なら感染しない
一度感染した人は感染しないこと
また接触率を一定とする.
これから仕事なので
続きはまた後で・・・
900:132人目の素数さん
20/03/26 09:22:24 iPGeyjQw.net
マルコフ連鎖?
901:132人目の素数さん
20/03/26 15:38:09.17 Enner7kW.net
感染者数を教えてください。
森岡正博
@Sukuitohananika
みんな冷静に計算してほしいけど、東京都の新コロナ感染者数は現在171人。
東京から無作為に200人をピックアップしたときに、その中に超有名人の志村けん氏が入ってる確率ってどのくらいだと思う?
現在の感染拡大ペースは我々の想像をはるかに超えてるよ。
桁違いの感染者数になってるよ。
URLリンク(twitter.com)
(deleted an unsolicited ad)
902:132人目の素数さん
20/03/26 18:41:46.26 iPGeyjQw.net
>>878
超有名人かどうかは個人を特定した時にその値をどう解釈するかというだけじゃないの?
有名人かどうかに関わらず感染する確率は変わらない
有名人だから感染する確率が高くなるとか低くなるとは思えない
個人の行動範囲とか多数の人と会う機会が多いとかは影響するかも知れないし
有名人だから街で握手したりする機会が多いなら高くなるだろうけど
行動で感染するかどうかの結果は変わるだろう
903:132人目の素数さん
20/03/26 23:02:19 pyG83tbh.net
>>878
「統計でウソをつく方法」というのを思い出したw
904:132人目の素数さん
20/03/27 00:59:55 BtjmJaHD.net
>>879
ある国の人口は100,000,000人で、
そのうちの1,000人が「有名人」です。
いま、ある感染症に、1人の有名人が罹患しました。
なお、この感染症は国民にランダムに罹患するものとします。
?この条件だけで、全国民の感染症患者数は、ほぼ100,000人と推計できるでしょうか?
?「他の999人は罹患していないことが分かっている」という条件を付け加えたとき、
上記の推計結果は変わるでしょうか?
?罹患した有名人が2人のとき、単純に200,000人と推計できるのでしょうか?
罹患している人の確率よりも、罹患していない人の確率を計算して1から引く?
よくわからない。
905:132人目の素数さん
20/03/27 08:03:46.59 4yRXOLUB.net
志村けんが感染する確率なら結構低いかもしれないが、今気にしてるのはあくまで一定以上の知名度の有名人が感染する確率だから特に都内に限定すれば大して珍しいことではない
906:132人目の素数さん
20/03/27 10:39:09.59 RlLzJRqB.net
主観ではテレビ業界はインフル蔓延しがち
907:132人目の素数さん
20/03/27 13:20:56.10 Hl3wuGgz.net
>>881
1については母比率の推定から類推できそうだけど
芸能人に限定するとランダムサンプリングではないから
少し調整が必要だろうな
908: どんな調整が適切かは判らないけど 例えば、ダイヤモンドプリンセスをサンプルに感染率の推定をしても値が妥当でないのと同じだと思う
909:132人目の素数さん
20/03/27 16:01:36 0CEq6ZGF.net
>>881
人口がN=1億で、感染者の数がA、非感染者の数がN-Aとし、有名人の数がU=1千とすると、
有名人の感染者の数がnである確率は、C[U,n]C[N-U,A-n]/C[N,A]
A=2530のとき、n≧1の確率は2.5%、A=555900のとき、n≦1の確率は2.5%だから、
これだけの情報では範囲が荒すぎて?「ほぼ100,000人」なんて言えず、?も当然言えない
A=24230のとき、n≧2の確率は2.5%、A=720600のとき、n≦2の確率は2.5%だから、
これだけの情報では範囲が荒すぎて?「ほぼ200,000人」なんて言えない
そもそも、感染者を見つけてからそのサンプルの珍しさを後出しで主張するのは反則だよね
人は大きい集合に属していたり同時に小さい集合にも属していたりするので、
小さい集合から出たサンプルであると、後出しならいくらでも都合よく主張できてしまう
910:132人目の素数さん
20/03/27 16:36:21.98 XqeWjxGb.net
>>882
毎夜の六本木での志村のご乱行を
知っているので
感染しても当然としか思わない。
阪神の藤浪選手も同じような
ご乱行により感染したのだ。
これ業界では有名よ!
911:132人目の素数さん
20/03/28 00:19:05 UmPDo3qE.net
>>885
ありがとう
なんとなく雰囲気は分かりました。
学者なら、こういう議論くらいしてほしいよね。
912:132人目の素数さん
20/03/28 08:06:46 bVA1Z4ji.net
>>867
現時点をt=0とし、時点tにおける感染者の割合をp(t)とする
感染者は一人あたり、一日に5人と接触する
その5人のうち非感染者は、時点tにおいて、5*(1-p(t))人そのうち20%の人間に移す
なので感染者一人が作る一日の新規の感染者は、0.2*5*(1-p(t))=(1-p(t))人
感染者みんなで作る一日の新規の感染者は、それのp(t)倍に比例する量となる
よって、感染者の増加率は、p(t)(1-p(t))に比例し、dp(t)/dt=Kp(t)(1-p(t))と書ける
dp(t)/{p(t)(1-p(t))}=Kdt、∫dp(t){1/p(t)+1/(1-p(t))}=∫Kdt、ln(p(t))-ln(1-p(t))=Kt+C
ln(1/p(t)-1)=-Kt-C、1/p(t)-1=Aexp(-Kt)、p(t)=1/(1+Aexp(-Kt))、(ただし、A=1/p(0)-1)
また、p(t)に比例した量の死亡者が出ることで感染者の減少分があると考えるなら、
p(t)の増加率は、dp(t)/dt=Kp(t)(1-p(t))-KTp(t)=Kp(t)(1-T-p(t))=と考えて、
dp(t)/{Kp(t)(1-T-p(t))}=dt、dp(t){1/p(t)+1/(1-T-p(t))}/(1-T)=Kdt
ln(p(t))-ln(1-T-p(t))=∫K(1-T)dt=K(1-T)t+C、(1-T)/p(t)-1=Aexp(-K(1-T)t)
p(t)=(1-T)/(1+Aexp(-K(1-T)t)) ただし、A=(1-T)/p(0)-1
913:132人目の素数さん
20/03/28 09:59:49 3DwQ8k4x.net
>>887
>なんとなく雰囲気は分かりました
間違いのもとです
914:132人目の素数さん
20/03/28 10:03:17 NZGOL9Pc.net
雰囲気で学者をありがたる統計信者(笑)
915:132人目の素数さん
20/03/28 19:58:07 UmPDo3qE.net
議論するほど賢くないもので
A=2530のとき、n≧1の確率は2.5%、A=555900のとき、n≦1の確率は2.5%だから、
なぜここで2530と555900を選んだのかが分からない
916:132人目の素数さん
20/03/28 21:29:42 0Jknegzy.net
95%信頼度で両側に2.5%ずつになる値かと思う
917:132人目の素数さん
20/04/22 23:32:09 2xpQr0fg.net
やっとt検定まで理解できたつもりになった
ちゃんと理解せねば
918:132人目の素数さん
20/04/26 13:41:50.94 gXBBEOS0.net
統計学なんて独学でやってもさっぱりわからんね。
わかったと思っても使わないとすぐ忘れる。
919:132人目の素数さん
20/04/26 17:13:21 oxK12DPO.net
区間推定とか検定とかの考え方は忘れないだろ
具体的な計算方法は調べたりプログラムで実行したりすれば良い
920:132人目の素数さん
20/04/26 20:41:00.48 pzcxYlyC.net
URLリンク(twitter.com)
なぜこんなに事後確率が高くなるんだろう
ベイズの定理って未だに理解できない
(deleted an unsolicited ad)
921:132人目の素数さん
20/04/28 11:32:33 yBKE5vIS.net
>>894
確率が分かってれば応用だろ
922:132人目の素数さん
20/04/28 11:47:56 FGKtvkLj.net
統計勉強してる人はなんのプログラム言語を学習するべき?
923:132人目の素数さん
20/04/28 12:52:43 z4Y/dZK3.net
python
R
924:132人目の素数さん
20/04/28 16:02:51 lEM49v7s.net
1人じゃ進まねえ
学校ってありがたいもんだったな
925:132人目の素数さん
20/04/28 17:36:45.69 ztrrzbj+.net
>>898
プログラムは手段だから実現したいことが簡単になるものを選んだり学んだりしたらいい
とくにないならPythonは情報もモジュールも多いし悪くないと思う
926:132人目の素数さん
20/04/28 17:37:39.47 ztrrzbj+.net
あとPythonでWebサービス実装したりもできるし
一応汎用言語だから
927:132人目の素数さん
20/04/28 18:31:31 Ncn08YEb.net
>>900
俺には時間の無駄の極致だったな
928:132人目の素数さん
20/04/30 13:20:55.48 IPHijBTr.net
有益無益は本人次第
929:132人目の素数さん
20/05/01 12:00:58 nb1D09Me.net
>>900
>>903
俺の先生は、教えるのが下手であるし、
教えるのはめんどくさいという人で、
ホントに全く何も教わってないです。
しかし、他の先生方の勉強会に連れて行って
くれたりしたので、いろんな先生と出会って
結果としてそれが良かったです。
統計関連のいろんな先生に今まで何度も助けてもらったり、いろいろと教わることができました。
というのも、教えて欲しいことは、
壁にぶつかったときのひと言なんです。
自分で必死に考えて、必死に調べてもわからない。
そゆときに先生方に相談すると、
黄金のひと言をいただけるのです。
そうやってなんとか勉強を続けて、
現在に至ります。
自分で全く調べても考えてもいない人には教えても無駄なことが多いので、
考えてから質問する人に教えたいです。
930:132人目の素数さん
20/05/03 16:57:23 rOyG2x6v.net
>>851
>最小二乗法が使い物になるか・・・・・・・・・
収集値の残差分布が正規分布を呈していたら
最小二乗法が使えると判断してよいだろ?
931:132人目の素数さん
20/05/03 17:13:40.85 oOCf+D3d.net
収集値が母集団から満遍なくサンプリングされていることが保証できるならokだが実用上はそんなこと仮定できないことの方が多いだろう
実用化しようとしたら机上で考慮しなかったパターンのデータが侵入してまともに機能しないというのはあるある
932:132人目の素数さん
20/05/03 22:16:23 KIjxj67j.net
それ言っちゃなんもできんがな
933:132人目の素数さん
20/05/04 00:19:36 29QxuROc.net
何もできないなんて誰も言っていない
最小二乗法を使うための前提が成立しないのに最小二乗法は使えないぞと言っているだけ
別の方法を検討すればいい
934:132人目の素数さん
20/05/04 15:21:29.87 jDRWX2Ph.net
3月の宿題で(1)のみ正解の数弱@shukudai_sujaku
昨年度の大学への数学(大数)での勝率は、
学コンBコースが 1/1 = 100% ,
宿題が 3/10 = 30% でした!
宿題の勝率が低すぎると思うので、
これからは一層精進していきたいです!
URLリンク(twitter.com)
(deleted an unsolicited ad)
935:132人目の素数さん
20/05/08 18:49:49 u87MCJWT.net
仕事でつかえるかもと思い統計学を勉強中のものですが、
以下の問いがまったくわからないので教えてください。
YesかNoで答える質問で、以下のような回答データがある。
2010年 20% n=100
2011年 30% n=120
2012年 23% n=80
2013年 25% n=150
2014
936:年 10% n=100 この時、2014年の回答に対し、 「たまたまだ」「何か原因があるはずだ」 のどちらかの判断を下したいとき、どのように導けばよいか。 標本検定で母平均?母分散の比?を検定すればよいのか、 過去のデータから確率の理論値を出してカイ2乗検定をするのか、 そもそも統計学で結論を出すべき問題ではないのか・・・
937:132人目の素数さん
20/05/08 21:59:24 1eCSLYeq.net
>>911
母比率の信頼区間かな
95%信頼度でも99%でも有意差があると思う
938:132人目の素数さん
20/05/08 22:05:46 YIfAlxBg.net
テューキーの多重比較
939:132人目の素数さん
20/05/08 22:09:52 YIfAlxBg.net
>>912
各年を独立な観測とするならp値を修正する必要がある
940:132人目の素数さん
20/05/08 22:24:07 1eCSLYeq.net
2014年の信頼区間を求めて他の値がその区間に含まれるかどうかでよくないか?
941:132人目の素数さん
20/05/08 23:00:50.85 YIfAlxBg.net
k群の個々同士で有意水準αで検定したら
1-(1-α)^(kC2)=1-(1-0.01)^(5c2)=0.096の確率で帰無仮説を棄却することになる
この補正方法には何種類かあってどれを使うかは検出力次第
あとテューキーは等分散仮定しないとだめか
942:132人目の素数さん
20/05/08 23:13:29.64 1eCSLYeq.net
>>916
分散分析の方が良くないか?
2014年の結果が有意差あるかどうかを知りたいだけだから
2014年の母比率の信頼区間に他の年の結果が入るかどうかで良くない?
ダメな理由は?
943:132人目の素数さん
20/05/08 23:51:11 I8M8FBD6.net
ANOVAは全体として等平均性があるか検定してるけど1群だけ異なっているケースは棄却されにくい
そして特定の群だけに注目して他の群を見なかったことにするのは多重比較を前提にした実験で一番やってはいけないこと
944:132人目の素数さん
20/05/09 00:00:16 dCAy3uxZ.net
「2014年は他と差がありそう」っていうのはあくまで結果を見るまで分からないというのが統計のスタンス
それを調べるには全通り調べるしかない
945:132人目の素数さん
20/05/09 00:10:23 sHvoXVnK.net
>>919
で、具体的にどうやって検定したらいいの?
2014年と2013年の場合は?
2014年と2012年の場合は?
最終的にどう修正してどんな結果になる?
946:132人目の素数さん
20/05/09 00:27:57 dCAy3uxZ.net
多重比較とか比率の差の検定で調べればすぐに見つかる
947:132人目の素数さん
20/05/09 00:37:15 sHvoXVnK.net
>>921
結果は?
他の年と比べて誤差とは言えない有意な差がある?
948:911
20/05/09 01:36:05 gSOud7OB.net
みなさんありがとう。
私は過去4年の平均だして、有意水準95パーセントで区間推定して、その最小値を確率の理論値としてカイ2乗検定してみたんだけど、全然違うみたいだね。
教えていただいたキーワード調べてみます。
949:132人目の素数さん
20/05/10 15:16:21 gRX6XcIe.net
>>870
2月初めのダイプリ号報道以来新型コロナウイルス感染問題
一色になり当数学板にも新型コロナウイルス感染数理に特化
した以下スレが2/29に新設されていますね。
数学 統計に詳しい人が語るコロナウイルス
スレリンク(math板)
950:132人目の素数さん
20/05/16 03:41:44 awnDvamU.net
基準群Nと刺激群A,B,Cがあって,
基準群とA,B,Cそれぞれの組に違いがあるかをフィッシャーの正確確率検定で比較しようとしているのだけど,
この場合普通にN-A,N-B,N-Cを2つずつ比較してしまって構わないのかな?
それともこれらをやったあとに多重比較の補正を行う必要があるのかしらん?
951:132人目の素数さん
20/05/16 11:10:25 BzZNoWVh.net
>>925
フィッシャーの正確確率検定をどう適用する?
URLリンク(ja.m.wikipedia.org)フィッシャーの正確確率検定
2×2分割表みたいにすると思うけど
何を行に割り当てて
何を列に割り当てる?
952:132人目の素数さん
20/05/16 14:23:38 awnDvamU.net
>>926
心理的な評価内容で,行に群(N,A,B,C)を振って,列に選択した行動3種類(X,Y,Z)を振り,各セルに選択した人数を入れて適用しようとしてます
3×3の分割表ですね
953:132人目の素数さん
20/05/16 14:24:17 awnDvamU.net
3×3じゃないや,2×3か4×3の分割表かな
954:132人目の素数さん
20/05/16 19:22:20 BzZNoWVh.net
>>927
それで何が判るの?
最初に書いていたものと違うものが判るような気がするけど
955:132人目の素数さん
20/05/16 21:30:16 91NtAzyJ.net
>>929
妥当そうに見えるけど、間違ってるのか?
956:132人目の素数さん
20/05/16 22:01:49 BzZNoWVh.net
>>930
N,A,B,Cの結果に差がある事を確認したいのが元の目的
それを確認できるかな?
957:132人目の素数さん
20/05/16 23:38:25 awnDvamU.net
>>931
できないんですかね?もしかして私フィッシャーテストを勘違いしてる?
958:132人目の素数さん
20/05/22 06:22:09 CccJC99t.net
>>932
フィッシャーテスト?
実験計画法使ってますか?
スレリンク(sim板)
959:132人目の素数さん
20/07/07 13:10:46 CNs2wBlh.net
ガンマ分布関数の最頻値の確立変数を求めたいんだけど
最頻値の値は、式が見つかるんだけど
そのX座標みたいなものの式が見つからないんだよね
960:132人目の素数さん
20/07/07 13:25:28.81 CNs2wBlh.net
計算したら、
x=exp(log(a-1)/a-2))
になった。なるほど
961:132人目の素数さん
20/07/07 13:33:53 CNs2wBlh.net
違った
x=exp(log((a-1)Xb)/a-2))
だった。なるほど
962:132人目の素数さん
20/07/07 13:45:00.91 CNs2wBlh.net
間違っていた
b(a-1)
だった、聞くまでもなった
963:132人目の素数さん
20/07/10 20:28:26 ocJiF1i7.net
真面目かっ
964:132人目の素数さん
20/07/12 00:35:05 Q+EVygQj.net
普通に微分するだけやん
965:132人目の素数さん
20/07/19 23:40:40.77 EQ49CF6w.net
「異端の統計学ベイズ」が面白かった
こんな別世界があったなんて気づかなかった
966:132人目の素数さん
20/07/25 18:04:42.56 51B6JAyF.net
>>940
ベイズは異端でもなんでもないです
普通にデータ分析すればベイズになります
そういうタイトルを付ければ
釣られて本買うアホがいる
ということです
967:132人目の素数さん
20/07/26 01:19:01 zHu+NBBN.net
頻度論 VS ベイズみたいな構造で別物として考えようとする限りベイズを理解できているとは言えないだろうな
968:132人目の素数さん
20/07/26 04:15:28 2QCnkYEJ.net
>>941
歴史を知らない知ったかぶりのバカw
969:132人目の素数さん
20/07/26 11:50:07.18 7dVh5Mc5.net
ベイズを理解できなかった人の成れの果てのような記事
島根県の事例からも数字で明らかになる「検査をすると患者が増える」説のデタラメさ
URLリンク(hbol.jp)
>島根県、陽性者発生と大規模検査をベイズ推定で検証!
970:132人目の素数さん
20/07/26 12:03:13.28 bwMDUrJ9.net
>>943
お前がバカ過ぎるの
笑えるぐらいバカw
971:132人目の素数さん
20/07/26 12:06:32.17 bwMDUrJ9.net
このスレって初心者しかいないんだねえ(笑)
「ベイズってスゲーッ!」って
書けばいいの?(笑)
じゃベイズってなんだよ?
本読んで勉強したんだろ?(笑)
>>943はベイズを説明してみな。
できないだろうな
バカだからね(笑)
972:132人目の素数さん
20/07/26 16:43:23.50 2QCnkYEJ.net
>>945,946
悔しくて2連投。涙ふけよww
バカと言われた返しがこれ↓
>「ベイズってスゲーッ!」って
バカ丸出し。やはりただの知ったかぶりだったな
お前はこのスレで1番の知ったかぶりのバカと認定してやるよw
「お前が知ったかぶりかつバカである」という仮定の事前
973:確率は0.9だったが お前のレスで事後確率は、0.9999999になったw
974:132人目の素数さん
20/08/06 14:33:33 1/AtprVO.net
>>784
自分も気になってたから自分なりにまとめてみた
まず同じ確率分布を持つ変数x_iたちのどんな2次形式の平均値も元の確率分布の平均μと分散σ^2を使って書ける
実際、ベクトル表記x=(x_i)∈R^nと行列A∈M_n(R)を使って
一般に2次形式はx^tAxと書けるが、その平均E[x^tAx]は
σ^2tr(A)+μ^2(Σ_i,jA_ij)と計算できる
σ^2だけを得たい(σ^2の不偏推定量がほしい)のであれば
2項目つまりΣ_i,jA_ijがゼロであればよい
例えば、 Aが(1,1,…,1)に垂直な(n-1)次元超平面への射影行列であれば満たされる
この時、σ^2の係数であるtr(A)は(n-1)となる
(射影行列のトレースは像空間の次元に一致する)
こうしてE[x^tAx]=(n-1)σ^2を得る
同じように
一般にAが(1,1,…,1)に垂直な(n-k)次元超平面への射影行列であれば、E[x^tAx]=(n-k)σ^2を得る
多重線形回帰はこの射影する次元をパラメータを推定することで下げてると見ることができる
しかしσ^2の不偏推定量がほしいだけであればΣ_i,jA_ij=0であるどんな2次形式x^tAxを使ってもいい
そのときσ^2の係数はtr(A)だけズレる
975:132人目の素数さん
20/08/06 15:14:03.41 1/AtprVO.net
>>948
補足
標本の分散をn倍したものΣ(x_i-(Σx_k)/n)^2は
A=I-1/nP(Iは単位行列、Pは全ての成分が1の行列)を使って
x^tAxという2次形式になっている
この行列Aは対称かつ冪等なので射影行列であり
(1,1,…,1)に垂直な(n-1)次元超平面への射影になっていて
実際トレースは(n-1)である
976:132人目の素数さん
20/08/07 20:11:02 ptGcwOri.net
>>948
計画行列から射影行列を計算して二次形式の期待値を計算すれば(n-1)σ^2が求まるということですか?
977:132人目の素数さん
20/08/07 20:16:03 ptGcwOri.net
というか射影される次元はrank(A)に依存するか
978:132人目の素数さん
20/08/11 02:43:32 O8s6arxs.net
検定やら回帰分析は統計学でカバーしているが,
機械学習はクラスタリングや決定木とか、統計学の範囲を超えた部分もあるので,
そこらへんは機械学習使わんといかんと思います。
979:132人目の素数さん
20/08/11 12:57:02.48 vIooQgP1.net
誰かわかる?
TOEICみたいな英米の選択式試験て素点をスケーリングしてスコアにすることがほとんどだけど
英医学部適性試験UCATの資料みると
昨年の試験のある部分
素点平均21.27標準偏差5.78最高39
最高のZ値=(39-21.27)/5.78=3.06...
300から900にスケーリングするってんだが、結果
平均557.5標準偏差74.21最高890
最高のZ値=(890-557.5)/74.21=4.48...???
英米のこの手の換算かなり見たけど
おおざっぱではあってもほぼ線形
Z値ほぼ変わらない
しかし
この結果
いったいどういうスケーリングしたんだろ?
まったく想像できない
980:132人目の素数さん
20/08/11 18:24:30.58 FOYNfiZF.net
>>953
少なくとも、線形でスケーリングするなんて今時どこもやっていない。
たまたま数字が合っただけかと。
981:132人目の素数さん
20/08/11 19:26:42 vIooQgP1.net
偏差値は?
平均50
標準偏差10
線形スケーリング
982:132人目の素数さん
20/08/11 19:31:57 vIooQgP1.net
URLリンク(collegedunia.com)
上と下はあやしいが
ほぼ線形
英米ってなんでこうすんだろう
SATとかIQテストもこういうの多い
変換後5とか10きざみ
ある程度以上だと変換後スコア同じ
ある程度以下だと変換後スコア同じ
ってのがよくある
983:132人目の素数さん
20/08/12 17:14:06 981ZzhAP.net
選択式なのでたとえば4択40問ならわからなくても平均10
これより下はわかってないとして0にスケーリング
最高のZは高くなる
984:132人目の素数さん
20/08/12 17:14:07 981ZzhAP.net
選択式なのでたとえば4択40問ならわからなくても平均10
これより下はわかってないとして0にスケーリング
最高のZは高くなる
985:132人目の素数さん
20/08/22 00:20:07.51 PIye8TW8.net
そうなんだ
986:132人目の素数さん
20/08/24 05:50:54.16 KEAGmUNo.net
この問題分からないから誰か教えてくれ
不偏推定量と有効推定量についての問題
母平均μ(≠0)が分からない母集団分布から無作為抽出された標本X(1)、X(2)、X(3)、X(4)をとる。母分散は12である。
(1)母平均μの3つの推定量
T(1)=(X(1)+X(2)+X(3)X(4))/4
T(2)=(X(1)+2X(2)+2X(3)X(4))/6
T(3) =(X(1)+X(2)+X(3)X(4))/3
の中でどの推定量が不偏推定量であるか
(2)3つの推定量の中でどれが最も有効な推定量であるか
987:132人目の素数さん
20/08/24 06:27:12 ByIpMOCk.net
>>960
誤字ってないか
X(3)とX(4)の間に+がないとどれも不偏推定量にならん気が
988:132人目の素数さん
20/08/24 06:38:02 KEAGmUNo.net
>>961
誤字ってました。すいません
T(1)=(X(1)+X(2)+X(3)+X(4))/4
T(2)=(X(1)+2X(2)+2X(3)+X(4))/6
T(3) =(X(1)+X(2)+X(3)+X(4))/3
ですね
989:132人目の素数さん
20/08/24 07:34:13.35 ByIpMOCk.net
一括してT=aX(1)+bX(2)+cX(3)+dX(4)とおいて計算する
T(1)のとき、a=1/4,b=1/4,c=1/4,d=1/4
T(2)のとき、a=1/6,b=2/6,c=2/6,d=1/6
T(3)のとき、a=1/3,b=1/3,c=1/3,d=1/3
X(i)の期待値はE[X(i)]=μ
X(i)X(j)(i≠j)の期待値はE[X(i)X(j)]=E[X(i)]E[X(j)]=μ^2
X(i)^2の期待値はE[X(i)^2]=σ^2+μ^2=12+μ^2
である
(1)
Tがμの不偏推定量であるためにはTの期待値E[T]がμと一致しなければならない
E[T]=E[aX(1)+bX(2)+cX(3)+dX(4)]
=aE[X(1)]+bE[X(2)]+cE[X(3)]+dE[X(4)]
=aμ+bμ+cμ+dμ=(a+b+c+d)μ
よって(a+b+c+d)=1となっているT(1)とT(2)が不偏推定量である
(2)
Tが最も有効となるのはTが不偏かつその分散E[(T-E[T])^2]が最も小さくなるときである
E[(T-E[T])^2]=E[T^2]-E[T]^2
= E[(aX(1)+bX(2)+cX(3)+dX(4))^2]-((a+b+c+d)μ)^2
=a^2E[X(1)^2]+b^2E[X(2)^2]+c^2E[X(3)^2]+d^2E[X(4)^2]2abE[X(1)X(2)]+…+2cdE[X(3)X(4)]-((a+b+c+d)μ)^2
=(a^2+b^2+c^2+d^2)σ^2
=12(a^2+b^2+c^2+d^2)
となるので、結局a~dの平方和が最も小さいものが最も有効となる
この平方和はT(1)では1/4、T(2)では5/18となる
よって、T(1)がこの中で最も有効である
990:132人目の素数さん
20/08/24 07:47:11.91 KEAGmUNo.net
>>963
本当にありがとうございます。感謝しかないです。
991:132人目の素数さん
20/08/25 02:12:44.78 N98fFl99.net
カシオのWebアプリClassPad.net
URLリンク(youtu.be)
手書きの図をきれいに出力してくれたり
ユーザー定義関数を使えるのがいいね
992:132人目の素数さん
20/08/25 18:47:05.05 LqiSh/C2.net
よいですね
993:132人目の素数さん
20/08/26 10:35:32.62 8ae+cQFx.net
統計は教養ですね
994:132人目の素数さん
20/08/26 14:04:21.29 Ocbo+ot2.net
質問なのですが、最近GNIの統計を調べていたんですが、国連の統計で2018年の2年前までしか調べられません。
それを鑑みると、データブック2020は2019/12の発売で、GNIの統計データが2017年になっていて、なるほど2年前のデータです。
なぜ1年のラグは分かりますが、なぜ2年のラグが生じるのでしょうか?
教えてください。
995:132人目の素数さん
20/08/26 14:06:18.71 Ocbo+ot2.net
質問なのですが、最近GNIの統計を調べていたのですが、国連の統計で2年前の2018年までしか調べられません。
それを鑑みると、データブック2020は2019/12の発売で、載っているGNIの統計データが2017年になっていて、なるほど2年前のデータです。
1年のラグは分かりますが、なぜ2年のラグが生じるのでしょうか?
教えてください。
(日本語がおかしかったので修正しました)
996:132人目の素数さん
20/09/01 19:28:27 2qjbTlF5.net
2830
学コン・宿題ボイコット実行委員会@gakkon_boycott 9月1日
#拡散希望
#みんなで学コン・宿題をボイコットしよう
雑誌「大学への数学」の誌上で毎月開催されている学力コンテスト(学コン)と宿題は、添削が雑で採点ミスが多く、訂正をお願いしても応じてもらえない悪質なコンテストです。(私も7月号の宿題でその被害に遭いました。)このようなコンテストに参加するのは時間と努力の無駄であり、参加する価値はありません。そこで私は、これ以上の被害者を出さないようにするため、また、出版社に反省と改善を促すために、学コン・宿題のボイコットを呼び掛けることにしました。少しでも多くの方がこの活動にご賛同頂き、このツイートを拡散して頂ければ幸いです。
URLリンク(twitter.com)
(deleted an unsolicited ad)
997:132人目の素数さん
20/09/11 22:16:44.90 TPAXeVgK.net
2.0 4.9
12.7 28.4
0.7 2.3
5.4 11.9
0.9 8.9
3.9 13.9
6.2 26.5
31.3 47.2
26.5 37.0
9.2 26.4
10.1 27.3
5.7 19.8
21.9 ?
左の列の数字の時に右の列の数字が出るとして、
?が30以上になる確率を求める方法が知りたいです。
エクセルのFORECAST関数で36.67くらいになりそうだということまでは分かったのですが。
(左が予備校生のうち試験で成績が悪かった人の割合%、
右が試験受験者全体のうち試験で成績が悪かった人の割合%です。
予備校生のデータから未発表の全体の割合が30%を超える確率が知りたいです。)
998:132人目の素数さん
20/09/16 17:43:09.30 FMyxTy7q.net
ExcelのMINVERSEって
内部でやってるのはLU分解でしょうか?
999:132人目の素数さん
20/10/06 01:59:45.02 lsvBhfOa.net
逆行列を返すからLU分解してんのかもな
途中の処理を知ってどうするの?
1000:132人目の素数さん
20/10/12 17:31:41.82 8cn/otD4.net
こちらの論文をもとにサンプルサイズを計算したいのですが、式5(ミュー>0
のとき)を使って計算しても再現できないのです。この論文の式、間違っていると思われるのですが、正しい式わかりました(導出できる方いました)ら、お教え下さい。
URLリンク(www.degruyter.com)
1001:132人目の素数さん
20/10/16 10:31:52.88 qga+Q3cK.net
統計学の初心者です。
セミコロンの意味について教えてください。
最尤推定量の説明の中に、
L(Θ;x) = f(x;Θ)という説明がでてきたのですが、
数学において(少なくともピュアマスでは)
セミコロンがこのような場所で使われたことを見たことがありません。
なので統計学特有の使い方と思いますが、
説明がありません。
(統計学者にとっては常識???)
どういう意味かわかるかたいましたら教えてください。
1002:132人目の素数さん
20/10/16 12:51:32.85 kt7nYwS3.net
条件付き確率の事だと思うけど
|を使う書き方と同じじゃないかな?
違いがあるのかな?
1003:132人目の素数さん
20/10/16 16:02:36.64 ujcxTA5a.net
統計では普通に使う
単純にセミコロンの後はパラメータを書いているだけ
1004:132人目の素数さん
20/10/16 16:45:41.67 m+6utKvr.net
米国大統領戦で多くがバイデン勝利を予想していますが
こういった予想は可能なのでしょうか?
統計学者のネイトシルバーも前回の大統領選の予測は外していますが
有権者数に対してサンプル数が少なすぎる等の根本的な問題が有るような気がします。
1005:132人目の素数さん
20/10/16 19:07:09.77 kt7nYwS3.net
米国大統領選挙は州ごとに勝者全取りだから
大票田の州と少ない州もあるし
選挙制度によって予測方法も変わると思う
1006:132人目の素数さん
20/10/17 03:28:22.42 8rSS6k+v.net
>>976
> |を使う書き方と同じじゃないかな?
条件付き確率ということですか?
>>977
> 統計では普通に使う
> 単純にセミコロンの後はパラメータを書いているだけ
それが全く理解できないんですけど、
セミコロンの前も後ろもパラメータですよね?
統計学の人は、カンマのかわりにセミコロンを使うということですか?
1007:132人目の素数さん
20/10/17 03:33:27.25 8rSS6k+v.net
ぐぐって次のところを見つけました。
URLリンク(oshiete.goo.ne.jp)
> f(x; a,b) = (x^a)e^(-x/b)
> なんて書いて、「fはx,a,bによって値が決まる関数だけど、a,bは係数として
> の性格が強くて、a,bを固定してxの関数と見なすことが多い」てなニュアンス
> で、カンマとセミコロンを使い分けちゃったりすることがあります。
と書いてありました。
なるほど、統計学ってのは
汚い学問だとよく聞きますが、
なるほど汚いw(笑)
意味不明の記述をして
難しいことをしているらしく
見せかけているということですね。
了解できましたw
1008:132人目の素数さん
20/10/17 10:09:05.16 b9RsvhTl.net
数学的にはxもaもbも対等に見えるかも知れないがあくまで統計は現実世界を記述することが目的なので
どれが現実世界に直接現れるものでどれがハイパーパラメータかを区別するのは極めて重要
1009:132人目の素数さん
20/10/17 10:38:49.93 /dkWfRN/.net
>>981
> ぐぐって次のところを見つけました。
>
> URLリンク(oshiete.goo.ne.jp)
>
>
> > f(x; a,b) = (x^a)e^(-x/b)
> > なんて書いて、「fはx,a,bによって値が決まる関数だけど、a,bは係数として
> > の性格が強くて、a,bを固定してxの関数と見なすことが多い」てなニュアンス
> > で、カンマとセミコロンを使い分けちゃったりすることがあります。
>
> と書いてありました。
> なるほど、統計学ってのは
> 汚い学問だとよく聞きますが、
> なるほど汚いw(笑)
>
> 意味不明の記述をして
> 難しいことをしているらしく
> 見せかけているということですね。
>
> 了解できましたw
カンマとセミコロンの使い分けは単に英文法でしょ。
1010:132人目の素数さん
20/10/17 11:19:20.64 wbkx6lR+.net
>>981
a, bの条件付きでの確率変数xの関数
みたいに解釈している
1011:132人目の素数さん
20/10/22 16:33:51.46 Fw5i0Sy8.net
数理に基づいた学問でも工学や物理学を始めとして分野によってどこまで明確に精確に数学を用いるかは違うしな
1012:132人目の素数さん
20/10/27 14:09:43.11 nDFw66Bi.net
統一しろや
1013:132人目の素数さん
20/10/31 08:10:39.76 SRqhoG/2.net
>>981
別に数学でも、セミコロン使うだろ
君何年生?
1014:132人目の素数さん
20/12/15 12:28:09.26 +saPgY7R.net
初心者がここで質問してよろしいでしょうか?
ある業務の、1つの案件に対する作業時間をプロットしてヒストグラムを作成して、X軸を対数変換したら、綺麗な正規分布になりました。
これは対数正規分布だと思うのですが、それであれば作業時間合計(残業時間)の予想(信頼区間を出す)ことが可能だと考えました。
仮に、20件の案件がある場合には、① 標本平均とt値、標準偏差から、信頼区間を出します。
② 次に、信頼区間上限・下限をe乗してあげると、対数変換を戻した時の標本平均の信頼区間が出ます。
③ 最後に、信頼区間を20倍してあげると、作業時間合計の信頼区間が出ます。
以上の手順ですが、自分でやっていて正しい計算とは思えません。
試しに、実際のデータから20件の標本平均を、100回抽出して、ヒストグラムを作成することを何度かやってみましたが、信頼区間の上限を超えて、信頼区間の下限はほとんど超えないという結果になりました。
どなたか正しい計算をお教えいただくことはできないでしょうか。
よろしくお願いします。
1015:132人目の素数さん
20/12/17 04:00:55.26 IoIBMAoa.net
>>988
確率変数を20倍したものと
20個の確率変数を足したものの分布は違うと思う
確率変数の和の分布の平均と分散は計算出来る
1016:https://bellcurve.jp/statistics/course/18592.html 20の和の確率変数の平均と分散を使って信頼区間を求めたら良いと思う
1017:132人目の素数さん
20/12/17 04:03:38.53 IoIBMAoa.net
>>988
別の方法はブートストラップ法で分布を求める方法
20のデータを100回取り出して分布を作ったのを
もっと多く1万回とかにして分布を作って
その平均や分散を計算して推定値とする
1018:132人目の素数さん
20/12/18 19:59:14.36 Psb7CDOJ.net
>>990
ありがとうございます
信頼区間の導出の仕方をもう少し勉強してからやってみようと思います
ブートストラップ法はExcelで手作業でやるには難しそうでした
今日、コルモゴロフ=スミルノフ検定をしたところ(計算の仕方が合っているかは分かりませんが)正規分布ではありませんでした。
また、E(ln(X))と、ln(E(X))は、異なる値になることも知りました。
E(ln(X))は、ln(相乗平均(X))と対応しているようです。
また整理できたら質問させていただくかもしれません
1019:132人目の素数さん
20/12/19 01:56:48.73 Y5VNLcGt.net
いいってことよ
1020:132人目の素数さん
20/12/19 06:29:38.32 68CAEKuu.net
>>991
作業時間データを行方向に書く
その範囲の行番号を乱数で発生させて
index関数でデータを取り出す
列方向に20個ランダムサンプリングしたデータの和を列に追加する
行方向にコピーして1万行同様の計算をする
1万行21列の和を計算した列からヒストグラム、平均、分散を計算する
1021:132人目の素数さん
20/12/21 23:31:32.80 X15I1tLx.net
頭いい人しかおらんのか…全くわからん
1022:132人目の素数さん
21/01/11 20:58:38.09 oZQgW4jU.net
NHKの高校数学(ベーシック数学)を見ていたんだが、
事前確立と事後確率の説明が間違っているんだが、
三流役者のお笑いの部分ばかり多くて
大事な説明が間違っているとは、なさけないぞNHK!!!
1023:132人目の素数さん
21/01/12 21:31:29.28 CKZDqn7z.net
NHKのその番組は、他の回もしばしばひどい
1024:132人目の素数さん
21/01/18 15:10:24.59 vhuxYGIA.net
最近NHKの教育はそういうのは多い
1025:132人目の素数さん
21/02/02 23:14:25.03 0uhvIcHZ.net
残レスが僅かのときに恐縮ですが、検定について質問させてください
商品について金額基準の故障率を考えています
たとえば1千円の商品が5個、2千円の商品が5個あるとき、2千円のものが1個故障したときの故障率は、
個数で見たときは1/10=0.10ですが、金額で見たときは2/(1*5+2*5)=0.13になります
このとき、全ての商品の金額・個数・故障件数を基に計算した金額故障率と、
特定の層に販売した商品についての金額故障率とを比較して、
全体平均よりも故障率が大きいかどうか判断するために検定を行おうと考えています
率同士の比較という事で安直に、全体を母集団、特定層をサンプルとした母比率の検定を考えたのですが、
取る値が01でないためかうまくいきません
なにかよいアイデアはないでしょうか
よろしくお願いします
1026:132人目の素数さん
21/02/03 00:04:23.57 1LrlfGJ1.net
>>998
何年分かの1月毎とか1週毎の故障率を集めて分布、ヒストグラムを全体と特定層向けの両方作る
故障率を確率変数とした分布になると思うから
その2つの分布が同じ分布かどうかを適合度検定するとか
1027:132人目の素数さん
21/02/04 09:06:51.73 0AiLVZp3.net
次スレ
統計学Part18 [無断転載禁止]
URLリンク(rio2016.2ch.net)
1028:1001
Over 1000 Thread.net
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 1546日 6時間 32分 33秒
1029:過去ログ ★
[過去ログ]
■ このスレッドは過去ログ倉庫に格納されています