17/10/23 17:59:08.94 Dl6USvMt.net
¥
551:¥
17/10/23 17:59:31.50 Dl6USvMt.net
¥
552:¥
17/10/23 17:59:50.45 Dl6USvMt.net
¥
553:132人目の素数さん
17/11/14 14:50:33.34 joPUMHzn.net
スレチかもしれないが、適合しそうなスレがここだったんで書かせてもらいました。
構造方程式モデリングで、あるサービスの全体的な満足度とその構成サービスの品質の関係を7段階評価のアンケートで得た情報を元に求めようとしてます。
ただ、問題は回答者が構成サービスを全て使っている(又は経験がある)とは限らない点です。
個別の構成サービスの利用経験がない場合の回答はそもそも品質の評価が出来ないはずなのに、良い・悪いと回答するものが一定数あります。
その場合、そのまま扱うことは問題があると思います。
このデータは欠測値として処理すべきか、或はどちらとも言えないのような回答に纏めてしまうのが妥当か悩んでいます。
どちらも問題があるように感じてはいるんですが、自分ではどうすれば良いかわからないんです。知恵を貸してください。
554:132人目の素数さん
17/12/21 01:52:39.52 hyfnWguS.net
>>523
以下の後発スレの方が、適当では?
ベイズの統計学を学び始めたんだけど
スレリンク(math板)
555:132人目の素数さん
17/12/23 13:56:04.80 GaEzdGdo.net
学校の課題で問題が出されたのですが、全くわかりません。
問題は、
問1 平均値μ=2、および標準偏差σ=2の正規分布に従う確率変数を考える。このとき、この確率変数が次の区間に含ま
れる確率を小数第4位まで計算しなさい。
1 (4, ∞)
2 (-∞, 2.7)
3 (0.88, 5.6)
4 (1.46, 3.24)
問2 ある検問所で記録された車のスピードのデータによると、そこを通過する車は平均時速61.6km、標準偏差7.0kmで、だいたい正規分布に従っている。このとき、次の割合を100分率(パーセント)で小数第1位まで計算しなさい。
1 時速70kmをこえている車は全体の○%である
2 時速49kmよりも遅い車は全体の○%である
3 時速56kmから時速63kmまでの車は全体の ○%である
誰か助けてください、、答えだけでいいです、、、
556:132人目の素数さん
17/12/23 14:44:16.56 o3B98gr+.net
流石に授業も出てない、教科書も1章も読んでないのはスレチ
宿題外注スレへどうぞ
557:132人目の素数さん
17/12/23 14:58:59.29 JamHfM57.net
■モンティホール問題(空箱とダイヤ)
このゲームができるのは1回だけです
外からは中が見えない空箱100個の中のひとつに
ダイヤモンドを1個入れます
その中から1個の箱を選びます
98個の空箱を取り除きます
最後に残った2個の箱の中から1個の箱を選びます
ダイヤモンドが当たる確率は何%でしょうか?
558:132人目の素数さん
17/12/23 15:06:05.15 QY1eU5UE.net
ネットで何か知りたいときは下手に出るより出来るだけ挑発的に書いたほうがいいぞ
>>548みたいな奴が釣れて正解にたどり着けることが多い
559:132人目の素数さん
17/12/23 15:25:40.20 o3B98gr+.net
>>550
そろそろ釣れたかなw?
560:132人目の素数さん
17/12/23 15:29:40.77 QY1eU5UE.net
>>551
イミフ
561:132人目の素数さん
17/12/24 09:09:12.18 vhl+dUcQ.net
>>547
マジで簡単だから知恵袋にコピペしたら
562:132人目の素数さん
17/12/24 13:01:21.02 KJnyU+1/.net
>>553
自分でやったら
0.1587
0.6368
0.6763
0.3388
11.5
3.6
36.7 になった
563:132人目の素数さん
17/12/24 17:29:20.70 7IbDDB6m.net
>>545
もういないだろうが
データを除外するならデータ数がへるので検定力がさがる
つまり第二種の過誤がふえる
データ数が少ないならもんだいになる
どちらともいえないという回答にいれるってことは
線引きの問題がでてくる
線引きが外形的客観的にできないおそれがあるなら問題がでてくる
場合に応じてかんがえるべき
564:132人目の素数さん
17/12/24 17:33:16.87 ZCfw2SV/.net
あ
565:132人目の素数さん
17/12/24 19:45:42.56 SlrroN1n.net
教科書を勉強して正規分布やポアソン分布や中心極限定理
推定や検定(点推定区間推定~母平均母分散)
辺りまではやったのですが
次の段階としてどのテキストがお勧めでしょうか?
独学で学んでいるので、どれを学べばいいのかわからなくて困っています
566:132人目の素数さん
17/12/24 20:49:28.91 7IbDDB6m.net
>>557
東大教養課程編なんたらの
統計学入門なんたら
統計学入門人文学系なんたら
おなじく自然科学系なんたら
やっとけ
いいかどうか知らんが一応鉄板テキストだ
読み物なら駄目な統計学はよんどけ
時間に余裕があってより上をめざすなら
線形代数
速度論ルベーグ積分
集合論
はやっとけ
567:132人目の素数さん
17/12/25 18:06:49.35 Jjgc4VsK.net
>>558
ありがとうございます
3冊あるようなので内容を確認の上購入したいと思います
線形代数は学習済みなので測度論ルベーグ積分集合論について学習していきます
568:132人目の素数さん
17/12/26 13:11:11.22 8L4wMsz6.net
線形代数でも集合使ってんじゃないの?
569:132人目の素数さん
18/01/02 15:52:53.13 wG0bXeaR.net
東洋大の往路優勝はヴェイパーフライ4%の効果である。
これを統計学で証明できますか?
どのようにアプローチするのか勉強したいです。
570:132人目の素数さん
18/01/05 18:09:17.78 4Wd05fvH.net
重回帰分析で重決定係数が0.2などと低い場合は、偏回帰係数がいくつでもあまり意味がないのですか?
571:132人目の素数さん
18/01/07 00:22:03.05 bVIRAbtE.net
うんあんま意味ないよ。
回帰係数は傾きやからあてはまりとは関係ない。ほかの変数固定して固定しなかった変数を1かえるとどんだけ被説明変数が変動するかの目安でしかない。
572:132人目の素数さん
18/01/13 12:48:29.
573:00 ID:6Jex7paj.net
574:132人目の素数さん
18/01/14 19:37:56.17 g8ARdrLk.net
ある製品の重さ100枚を測定して
平均値が100g、最大101.5g、最小98.5gだったとします。
この製品は100枚をワンセットとして包装するため、
100枚あるかの確認のために秤を使用することにしました。
しかしながら、仮に最大あるいは最小の製品が100枚続くと仮定すると、
100枚時総重量は製品1枚分の100g以上に違いがでてしまいます。
100枚がそろっていることを確認するためには、
OKの範囲をいくつに設定すればいいのでしょうか?
575:132人目の素数さん
18/01/14 23:10:16.26 Qd/O3m2F.net
>>565
正規分布だと仮定すると ±3σ(99.73%)で 1kg ± 19.35g
一枚の重量を確率変数としてその分布を考え、それが100枚集まった新たな確率変数が従う分布を考えればいいんじゃないかな。
576:132人目の素数さん
18/01/16 23:42:26.22 xmxgcibx.net
>>566
>>一枚の重量を確率変数としてその分布を考え、それが100枚集まった新たな確率変数が従う分布を考えれば
まさにそういうことがやりたかったけど具体的にどう計算したらいいかわからなかったです
577:132人目の素数さん
18/01/20 01:49:30.12 Gqu+xipX.net
>>567
確率変数 和 積 平均 分散 あたりで調べてごらん。
578:132人目の素数さん
18/01/20 20:29:51.89 bEiI/N73.net
マルチ失礼します
(分からない問題スレで間違って自分が化学の問題ぶち込んだせいで、回答が得られそうにないので泣)
統計学の問題なのですが、問4(2)のやり方、答えがわかりません。教えてください。
URLリンク(i.imgur.com)
579:132人目の素数さん
18/01/21 02:18:13.47 nCiEPs2d.net
人生はリベンジマッチ
URLリンク(youtu.be)
580:132人目の素数さん
18/01/21 23:33:23.70 QoayuEoo.net
回帰係数の表裏の相乗平均が相関係数(符号無視)
581:132人目の素数さん
18/02/01 01:05:41.29 mDL9j4ny.net
最近は何が流行ってるのかね。高次元統計ももう随分長く研究されてきてopen problemがどれほどあるんだろうか?
582:132人目の素数さん
18/02/02 17:27:00.25 ZGDX6yca.net
とある大学のテストなんですが、どなたか解いてください。
マル付いてたりするけどあんまり気にしなくて大丈夫です
URLリンク(i.imgur.com)
URLリンク(i.imgur.com)
URLリンク(i.imgur.com)
URLリンク(i.imgur.com)
583:132人目の素数さん
18/02/03 08:23:02.65 Khu+UKxP.net
知恵袋に出しといたら誰かやってくれるよ
584:132人目の素数さん
18/02/04 12:50:38.43 e/Db4a5+.net
>>565
(最小×100)以上でいいじゃん
585:132人目の素数さん
18/02/06 14:18:09.65 x2G+n3vp.net
1と0の数列が乱数によって並べられたものなのか
意図的に並べられたものなのかを調べる方法を知りたいのです。
1010101010101010101010101010101010101010
上の数列の場合、1と0の出現率はともに20回ずつなので出現率だけを見ると乱数で偶然起こり得ると思いますが
1と0が等間隔にならんでおり偶然この様にならぶ確率は低いと思います。
1011001011001011001011001011001011001011
上の数列の場合、一見不規則に並んでる様で「101100」の繰り返しになってます。
この様な事を調べるにはどうしたら良いのでしょうか?何を勉強したらいいのですか?
乱数検定?恥ずかしながら中学校までの数学の知識しかないのですがだれか助けてください
586:132人目の素数さん
18/02/07 13:56:30.72 yVTOoFc7.net
統計学学んでないのに、自店と、近隣の同業店の
587:顧客に対する出口調査を行って アンケート結果を分析することになったんだけど、 重回帰分析のサイトとかを事前に読んで、以下のデータは用意できた ・それぞれの店の総合評価(1~5点) ・店内設備に対する満足度 ・総合評価 ・駐車場 ・カート ・空調 ・レジの数 ・etc... ・スタッフに対する満足度 ・品揃えに対する満足度 ・総合評価 ・肉類 ・魚介系 ・お菓子 ・生活雑貨 ・etc... ---------------------------------- 分析の結果としてほしいものは 「顧客は●●を重視している」的なことなんだけど、 総合評価を目的変数、それ以外を説明変数(すべて0or1のダミー変数)として 重回帰分析かけてみたらいいの? 作業はエクセルで行う予定
588:132人目の素数さん
18/02/07 18:27:44.82 K8x6sUH6.net
>>576
ウィルコクソンの順位和検定で検索してみ。
589:132人目の素数さん
18/02/07 22:22:37.00 OsFynxpx.net
>>578
ありがとうございます。
ググって見たけどその検定をどう使うのかわからなかったです。。。
二群を比較する際に使う検定のようですが1つの数列の判断する時はどう使うんですか?
590:132人目の素数さん
18/02/10 16:51:32.51 asDI+gHi.net
おれなら自己相関とかFFTとかで見るかな
591:132人目の素数さん
18/02/10 19:14:48.60 s7a0skcA.net
>>579
ヒントの出し方悪かったね。「乱数 検定」とか「ランダム 判断」の方が分かりやすい解説出てくるかも。
ざっくりいうと、理想的な場合(この場合は乱数)の特徴と今問題にしている数列の特徴を比較することで(二群の比較)判定するのが検定の考え方。
二値の場合、期待値と分散が理想乱数と同じになる場合があるので符号和みたいなテクニックが必要になるんだね。
>580
乱数→ホワイトノイズ→フーリエスペクトル一定で判定できそう、って連想するよね。なんかまだ研究中みたいだけど。詳しい人いるかな?
592:576
18/02/11 08:07:30.86 pJsVwN51.net
お二方ありがとう。
頂いたヒントを元に調べてみます。
593:132人目の素数さん
18/02/11 18:00:58.25 XYpvNV0x.net
>>564
RStudioの何を学びたいの?
594:132人目の素数さん
18/02/25 17:53:25.97 aD34K55o.net
統計学とウェブ解析を交えて実践的な勉強と練習を
したいのですが、おすすめな書籍やサイトはありますか。
実際に解析ツールや分析ツールを用いて
自分で分析解析してから
解答を見て適切な手順や方法、考察を
解説してくれるものが良いです。
統計学は統計検定2級の知識はありますが
ウェブ解析はテキスト読んだだけです。
595:132人目の素数さん
18/02/28 06:57:35.95 sX2fF8dz.net
偏差を標準偏差で割った値はなんといいますか?参考書等にも明確には定義されていないようです。
596:132人目の素数さん
18/02/28 09:10:13.21 r0LYQHsr.net
zスコアとか?
597:132人目の素数さん
18/02/28 17:37:59.68 8+JGalEQ.net
Z値
598:132人目の素数さん
18/03/02 11:01:57.06 +rrlSuSL.net
文科省の次期学習指導要領(まだ案の段階)では
高校生に統計を必修にするために空間座標やベクトルを
数Cに追い出したんだが
統計ってベクトルを追い出してまで
高校生のうちから勉強する必要があるのかな
599:588
18/03/02 11:32:38.93 +rrlSuSL.net
別にスレを建てた方がよいかな。
600:教育系の板でなく数学板で書いてるのは お受験のためではなく 将来の日本の科学技術の基礎力という観点から 議論したい為。
601:132人目の素数さん
18/03/02 13:39:53.06 MKxwD3ZU.net
少なくとも文系とる人のが多いんですからそういう人にとっては有益でしょうね
602:132人目の素数さん
18/03/02 14:21:56.28 tm9uaq96.net
高卒者と文学部(心理学以外)・法学部に進学する人は全く触れる機会がなかっただろうから
603:132人目の素数さん
18/03/02 15:56:16.74 +rrlSuSL.net
つまり文系に必要だから、理系の必須事項はどんどん高3に回してゆこう
ということか。
残念ながら理系の高3の多くは
・高1〜2で学んだ事を入試問題が解けるレベルまで引き上げること
・新たに数IIIの微積分を学習し、更に入試問題が解けるレベルまで引き上げること
で手一杯で、微積分以外で新たに学ぶ項目はとても定着が悪い。
例えば複素平面は今数IIIだが、数Bにあった頃に比べて、とても出来が悪い。
なので「理系だけがやればいい」とか言ってベクトルや空間座標を
3年に回してしまうと、理系の学生は大学に入ってからの線形代数に
ついて行けなくなる危険がある。
一方、大学の理系の統計では、線形代数の知識も要求される。
教える順序が間違っていると思うなあ。
604:132人目の素数さん
18/03/02 15:59:21.26 +rrlSuSL.net
あと、文系であっても経済学部だと線形代数は要求される。
2〜3次元の幾何ベクトルがシッカリ身に付いていないと
n次元の線形代数の理解はとても貧弱になると思うがどうだろうか。
それよりも高校生の段階で統計を学んでおく事の方が重要なんだろうか。
605:132人目の素数さん
18/03/02 16:01:56.89 +rrlSuSL.net
やっぱり別スレの方が良さそうだが
その前に統計スレで煽っておこうw
606:132人目の素数さん
18/03/02 16:23:35.82 tm9uaq96.net
統計学の端緒に触れるのに果たして幾何ベクトルの理解が必要なのかね
単なる数の並びで十分な気がする
しかも高校の学習内容に理論的な完全さは端から求められていないだろうし
607:132人目の素数さん
18/03/02 16:34:53.40 tm9uaq96.net
理系以外の教養の底上げが狙いだとすると、日本の科学技術の基礎力という観点だけでは是非を問えないね
統計学は科学技術の担い手だけのものではないので
608:132人目の素数さん
18/03/02 16:41:46.06 b6sKFCfz.net
数学の項目を削って統計を入れるという発想がおかしい
609:132人目の素数さん
18/03/02 16:43:52.82 +rrlSuSL.net
>>595
> 統計学の端緒に触れるのに果たして幾何ベクトルの理解が必要なのかね
そのような主張はしていませんが?
610:132人目の素数さん
18/03/02 16:47:59.08 tm9uaq96.net
科学技術の基礎力という観点だけでは是非を問えないと言ったろ
まず議論の出発点を見直さなきゃ
611:132人目の素数さん
18/03/02 17:01:04.15 KQHuBiVq.net
理系はどうせ数IIIやるんだから問題なくないですか?
612:132人目の素数さん
18/03/02 17:14:01.95 bcdASANG.net
このへんなんだろう(適当)
生徒が数学が社会に出ていないと感じていること
企業からの要望
応用重視へ
613:132人目の素数さん
18/03/02 17:14:23.05 +rrlSuSL.net
そうですね。統計は科学技術以外でも重要です。しかし
その普及のために科学技術者の養成を疎かにして良いこと
にはなりません。
文系の大学で統計を必須にしたって良いわけです。
ただでさえ理系と文系では大学で要求される時間数が
全然違うのだから、文系に統計が入ったくらいで
理系よりも時間数が多くなることはないでしょう。
あるいは高3の文系で統計を必須にするという選択肢もある。
あるいは高校で文理に分かれる時期を今よりも早めるとか、
学年に縛られず統計は2年で3年でも取れるようにするとか、
理系を犠牲にせずに文系に統計を教える方法はいくらでもあ�
614:驕B
615:132人目の素数さん
18/03/02 17:21:14.37 bcdASANG.net
文部官僚は指導要領をいじってみたいのよ
616:132人目の素数さん
18/03/02 17:33:31.85 +V7lzs/b.net
本当に問題だと思うならこんなとこに書き込んでないで行動を起こしたら
617:132人目の素数さん
18/03/02 22:47:00.74 +rrlSuSL.net
まあパブリックコメントは書くつもりだよ。
618:132人目の素数さん
18/03/02 23:13:12.04 0x9w8KIj.net
パブコメ募集してんの?
619:132人目の素数さん
18/03/03 13:34:57.51 y8a3pYCA.net
自分で勉強すりゃ良い事だ
620:132人目の素数さん
18/03/03 13:41:57.35 oavhYKS7.net
>>606
募集中、締め切りは確定申告と同じ3/15
パブリックコメント
URLリンク(search.e-gov.go.jp)
621:132人目の素数さん
18/03/05 14:12:34.81 to1UP0uR.net
高校数学での統計学必修化は間違っている
URLリンク(webronza.asahi.com)
622:132人目の素数さん
18/03/06 19:35:06.78 FZNGScTG.net
いきなり正規分布を三次元プロットする入門書が悪い
623:132人目の素数さん
18/03/24 14:59:47.12 /rhNv/dQ.net
統計学必修化するなら統計詐欺の代表的手法も紹介しとかないとマズイ
生兵法が一番危険だからね
ますます数学からかけ離れちゃうけど
624:132人目の素数さん
18/03/24 15:15:18.49 /rhNv/dQ.net
是非はともかくとして、大学ではなく高校で学習することには大いに意味があると思うよ
大学受験に必要となれば皆が真面目に勉強する
受験生の真面目さと大学生の不真面目さを対照すれば、これがどれほど重大な差かわかると思う
625:132人目の素数さん
18/03/29 14:05:06.36 oWMbFMe0.net
ベクトルは数学のあらゆる分野の土台となる。
統計学も進んだ理論にはベクトルの理解は不可欠。
逆に統計学は数学の各分野の土台となるだろうか。
だから
ベクトルを犠牲にしてでも統計をやらねば!!!!!!!
626:fig
18/04/04 19:29:27.67 8+Godamk.net
株価でも為替でもいいのですが、値動きのチャートが
ブラウン運動(ランダム)に沿っているのかどうかを
判定することは可能ですか?
627:132人目の素数さん
18/04/05 01:12:02.82 O24G/1OS.net
いいえ、ブラウン運動には従っていません
628:fig
18/04/05 02:28:09.08 TpTyaZ+P.net
それをT検定したいのですが。難しいですかね。
629:fig
18/04/05 02:37:00.97 TpTyaZ+P.net
>>576 ~>>581あたりがヒントになりそうだね。ありがとう。
630:¥
18/04/07 11:32:11.56 yx+HETs3.net
¥
631:¥
18/04/07 11:32:31.82 yx+HETs3.net
¥
632:¥
18/04/07 11:32:52.31 yx+HETs3.net
¥
633:¥
18/04/07 11:33:11.36 yx+HETs3.net
¥
634:¥
18/04/07 11:33:32.71 yx+HETs3.net
¥
635:¥
18/04/07 11:33:55.94 yx+HETs3.net
¥
636:¥
18/04/07 11:34:18.46 yx+HETs3.net
¥
637:¥
18/04/07 11:34:43.80 yx+HETs3.net
¥
638:¥
18/04/07 11:35:04.81 yx+HETs3.net
¥
639:¥
18/04/07 11:35:39.61 yx+HETs3.net
¥
640:132人目の素数さん
18/04/13 19:25:25.97 DJOFUmPK.net
ここの住人は標本数と標本の大きさの誤用についてどう思っているのか聞きたい。
641:132人目の素数さん
18/04/13 21:59:46.38 A3EEexMu.net
>>628
言葉遊びだと思うけど、
こだわる椰子がいるから俺はサンプルサイズと言ってる。
642:MC 火照る BACKESS INN SECRARETALY
18/04/24 18:28:27.51 AQvWaaW1.net
統計三世ぐらいかな?
643:132人目の素数さん
18/04/26 16:28:34.37 O7d38XWC.net
>>629
英語じゃないと駄目な言葉多いな
644:132人目の素数さん
18/04/26 18:20:10.78 8EF8msBO.net
英語で混同してるなら元々の用語に
645:問題があるんだよ。 単位系が定義変更してるのだから用語変更もすべき
646:¥
18/04/27 01:08:09.69 HEiX2WEB.net
¥
647:¥
18/04/27 01:08:28.01 HEiX2WEB.net
¥
648:¥
18/04/27 01:08:46.88 HEiX2WEB.net
¥
649:¥
18/04/27 01:09:07.26 HEiX2WEB.net
¥
650:¥
18/04/27 01:09:30.10 HEiX2WEB.net
¥
651:¥
18/04/27 01:09:48.02 HEiX2WEB.net
¥
652:¥
18/04/27 01:10:04.34 HEiX2WEB.net
¥
653:¥
18/04/27 01:10:25.34 HEiX2WEB.net
¥
654:¥
18/04/27 01:10:47.20 HEiX2WEB.net
¥
655:¥
18/04/27 01:11:07.88 HEiX2WEB.net
¥
656:132人目の素数さん
18/05/30 13:02:27.74 zhXCcFtY.net
Excelのマクロで統計関係の自作関数作って公開している人知っている?
わざわざRに取り込んだりするのめんどい
657:132人目の素数さん
18/05/30 15:46:15.18 pDBXC67r.net
EXCELは結果怪しいことが結構ある
658:132人目の素数さん
18/05/30 22:59:00.46 fLd3NENr.net
エクセルのソルバーは信用してないな。
659:643
18/05/30 23:16:31.14 RVrncVse.net
うん、分析ツールは良くないっていう話はよく聞くよね。
俺の妄想は、Excelシート上のA列にN数、B列に陽性数が入っているとして
C列に
=confint(A1,B1,0.95,"wald")
みたいにすると、簡単に信頼区間が得られるようなユーザ定義関数。
あ、RExcelがあるか
660:132人目の素数さん
18/05/31 00:11:02.18 aIE/YYKp.net
RExcelってまだあんの?
661:132人目の素数さん
18/05/31 10:56:29.42 pzVdBp0Y.net
>>646
Rの方が面倒くさくないよ。
パッケージbinomを使えば
A=c(1,2,3)
N=c(5,6,7)
for(i in 1:length(A))
print(binom::binom.confint(A[i],N[i],conf=0.95))
で一気に様々な信頼区間が表示される。
URLリンク(imagizer.imageshack.com)
662:643
18/05/31 19:48:49.58 ScaGZZYq.net
>>648
便利そうなパッケージ、教えてくれてありがとう。
俺の説明不足だったんだけど、
そのRのコンソールに出力されたテキストを結局また元のExcelへコピペして、
「区切り位置」とかでパースしたりいろいろして表の体裁に仕上げる、
という作業に、何となく徒労感があるんだ。
ちなみにExcelに戻すのは、色つけろ枠つけろみたいな要求に
R で対応するスキルが足りないから。
knit とか覚えればいいのかな。
>>647
URLリンク(sunsite.univie.ac.at)
開発は続いているよう。
663:132人目の素数さん
18/05/31 20:18:19.79 yx7icnTY.net
>>649
情報ありがとう。
以前、インストールでめちゃくちゃ苦労して、パソコン変わった際にはインストールする気が起きなかった記憶がある。それ以来、ご無沙汰してるわ
664:643
18/06/01 07:34:41.66 habNwJja.net
それな。
俺も昔苦労して最終的に入るには入ったんだけど、
Excelが全体的に重くなってしまうのがストレスで、あまりいい思い出がない。
今のPCはメモリたくさん積んでるから当時よりはましかもしれない。
統計学らしくない話を振ってしまってすまなかった。名無しに戻ります。
665:132人目の素数さん
18/06/01 09:36:03.25 SQks1NC+.net
URLリンク(ab-abo.com)
666:132人目の素数さん
18/06/20 19:27:08.42 I5gINDgV.net
既存の評価指標Aが0~10までしか計測できないところを
0~50まで図れる新規の評価指標Bを作りました。
信頼性と妥当性を検証したいんですけど、
信頼性は級内相関でいいとして、妥当性はどう検証すればいいでしょう?
BはAを内包している関係なので、相関係数が高くて収束的妥当性があってもよくないし
低くて弁別性があってもよくないと思うんです。
BがAを内包していますみたいなことを検証する統計ってあるんですか?
667:132人目の素数さん
18/06/21 13:56:27.00 Ze2kEGUX.net
>>628
今読んでる本(国立大の統計学の教授が翻訳)には
サンプルサイズのことを標本数と表現してあったので調べたが
読者等の混乱を避けるためにサンプルサイズ(標本の大きさ)と標本数は使い分けたほうがいいということらしい。
実際いま本読ん出る時に、どっちのことか混乱することがあるので
読者がいるようなものは使い分けたほうがいいとおもうわ。
668:132人目の素数さん
18/06/22 03:49:34.67 karFMQ6d.net
>>653
階層クラスター分析?
669:132人目の素数さん
18/08/26 14:42:57.20 6vST7ijX.net
>>646
>うん、分析ツールは良くないっていう話はよく聞く・・・・・・・・・・・・
良くないというのは、Excelのどのバージョンのどのサブメニューのことなのか?
良くないというのは、分析結果の精度が粗い?分析結果が間違っている?
それとも、うん、>>646と>>645を受けたレスということは、分析ツールとは別メニューの
Excelのソルバー>>645が、良くないという趣旨なのか?
ソルバーが良くないというのは、他の統計ツールと分析結果が相異するからなの?
670:132人目の素数さん
18/09/02 20:48:29.11 Ez5w7m9A.net
自由度の求め方について教えてください。
2グループについて、それぞれ平均値、標準偏差、n数がわかっています。
各グループでn数は違います
個々のデータは分かりません。分散が等しくないt検定(ウェルチのt検定)
をしようと思います。t値は求められるのですが、自由度も求め方がわから
ないので、有意水準5%で有意かどうかが判断できません。自由度の算出
方法を教えていただけないでしょうか。
671:132人目の素数さん
18/09/05 13:20:42.31 tS2KOPjG.net
定義読めば?
672:132人目の素数さん
18/09/08 13:11:44.95 WFiBaON4.net
>>657
# t検定(生データなし,等分散不問)
Welch.test=function(n1,n2,m1,m2,sd1,sd2){
T=(m1-m2)/sqrt(sd1^2/n1+sd2^2/n2)
df=(sd1^2/n1+sd2^2/n2)^2 / (sd1^4/n1^2/(n1-1)+sd2^4/n2^2/(n2-1))
p.value=2*pt(abs(T),df,lower.tail = FALSE)
return(p.value)
}
673:132人目の素数さん
18/09/08 13:21:23.26 WFiBaON4.net
標本数n 平均m 標準偏差sdの正規分布するシミュレーションデータを作ってWelchの検定をすることもできる。
Rが使えるなら
scale(rnorm(n))*sd + m
で可能。
これを各グループで作って検定する方法もある。
>659の結果と一致するはず。
674:132人目の素数さん
18/09/16 21:33:48.81 rMRDGQ30.net
統計学と並行して高校数学からやり直してるんだけど、微分積分さえある程度できれば解析学までやる必要はないってホント?
むしろその時間で線形代数やったほうが良いってのもホント?
675:132人目の素数さん
18/09/19 00:33:36.01 2tFRgvax.net
合成関数の微分とか全微分とかあたりまでは統計でも必須
676:132人目の素数さん
18/09/19 12:00:34.51 P3TgEiwp.net
ほ~そういうものか。ありがとう
677:学術
18/09/19 12:03:01.01 KX539Fwk.net
統計三世。ルパンナポレオンより最強の(血)統系。
678:132人目の素数さん
18/10/14 16:10:05.84 tYo68Cmn.net
3個中1個が当たりのものがある。これを被験者6人中5人が当たりを引いた。
このとき、被験者は有意水準1%で当たりがわかるとは言えないが、有意水準5%で当たりがわかると言え�
679:驕B ただし(1/3)^6=0.0014とする。 これ6C5*(1/3)^6+6C6*(1/3)^6=0.0096で1%を下回るんじゃないの? 納得できないんだけど教えて偉い人
680:学術
18/10/14 19:03:49.48 yXYU+8iI.net
確率を検証して当たる確率出すなんてナンセンスだよね。賭け事は進んでいて
意外性が在る乱数になるから、何か見えないものが働いていることが数学ではよくわからない。そしてタロットも然り。同じ確率なんだけど、
運命を感じるというのも変な話で。矛盾しているよね。気持ちと心が。
681:132人目の素数さん
18/10/22 11:52:44.19 1/aHuqXD.net
練習問題の解法を教えてください。基本統計学第4版(有斐閣)の6章の問題です。
41)1つのサイコロを1,000回投げたとき、1の目が180回以上出る確率と、1の目が140回以上200回以下出る確率を求めよ。
本の答えは、0.1379と0.9875です。以下のように計算してるのですが、答えがあいません。
前段の問題
n=1000,p=1/6の2項分布を正規分布で近似して求めた。μ=1000*1/6、σ^2=1000*1/6*5/6としてN(1000/6, 5000/36)を使う
(180-1000/6)/(sqrt(5000)/6)=80/sqrt(5000)=1.1313 ->正規分布の上側確率表より【0.12924】
後段の問題
Pr(140≦x≦200)で計算する
(140-1000/6)/(sqrt(5000)/6)=-160/sqrt(5000)=-2.2627 ->正規分布の上側確率表より0.011911
(200-1000/6)/(sqrt(5000)/6)=200/sqrt(5000)=2.828 ->正規分布の上側確率表より0.0023274
1-0.011911-0.0023274=【0.9857】
【】が自分で計算した答えです。計算式のどこかで間違えているのはずなのですが、自分では気付くことができません。
よろしくお願いします。
682:132人目の素数さん
18/10/22 15:38:07.09 TgBnmqGr.net
z=(179.5-1000/6)/sqrt(5000/36)=1.08894...→1.09
z=1.09に対する分布表の値は.3621なので、0.5からこれを引いて0.1379
z1=(200.5-1000/6)/sqrt(5000/36)=2.87085...→z=2.87
z=2.87 に対する分布表の値は 0.4979
z2=(139.5-1000/6)/sqrt(5000/36)=-2.30517...→z=2.31
z=2.31 に対する分布表の値は 0.4896
これらの和は0.9875
「180回以上出る確率」の相反事象は「179回以下出る確率」なので、
179.5を境界にするのが妥当だということと、教わった手順に従って、
「適当」な場面で四捨五入を行い、数表を用いると、
テキスト通りの値に行き着くようです。
683:132人目の素数さん
18/10/23 13:31:34.14 CdMSDP6/.net
ありがとうございました。離散数値での確率密度関数の使い方がわかりました。
684:132人目の素数さん
18/10/30 21:09:05.91 rPxKt/Y8.net
ちょいとすみません。わからないところがあってここにたどり着いたズブの素人なのですが、よければ教えてください。
標準偏差て平均が基準値なんですよね?
平均じゃなくて、ある値(カットオフ値)を基準にしてそこからバラつきがどんなものか調べたい時は、計算方法は標準偏差と同じで平均値をカットオフ値に置き換えたらいいのでしょうか?
ネットで調べても平均値で計算、ばかりでわからなかったです
685:132人目の素数さん
18/11/20 22:09:26.70 cFR1wwH3.net
Wolframに入力してみました。
URLリンク(www.wolframalpha.com)(1000,n)*1%2F6%5En*(5%2F6)%5E(1000-n),+n+%3D+180+to+1000%5D
sum[choose(1000,n)*1/6^n*(5/6)^(1000-n), n = 180 to 1000]
sum_(n=180)^1000 ((5/6)^(1000 - n) binomial(1000, n))/6^n
=0.138430864995663940543635063874277127250218037792364115557...
URLリンク(www.wolframalpha.com)(1000,n)*1%2F6%5En*(5%2F6)%5E(1000-n),+n+%3D+140+to+200%5D
sum[choose(1000,n)*1/6^n*(5/6)^(1000-n), n = 140 to 200]
sum_(n=140)^200 ((5/6)^(1000 - n) binomial(1000, n))/6^n =
=0.988113644388740861240108592472945211524447200450991732557...
686:132人目の素数さん
18/11/29 23:38:51.95 oAvg0d0l.net
九州大学大学院数理学府数理学専攻数理学コース 問題と解答
基礎科目4題(150分) 専門科目2題(120分) 口頭試問 ※英語は課さない
URLリンク(www.dropbox.com)
687:132人目の素数さん
18/12/04 22:30:12.09 44qbPqb5.net
>>576
亀レスだけど、ランの検定(連の検定)
URLリンク(i.imgur.com)
URLリンク(i.imgur.com)
URLリンク(i.imgur.com)
688:132人目の素数さん
18/12/16 11:35:51.85 FIaML+tk.net
重回帰分析で交互作用を検討?交互作用が予想される問題に
適用すべきは、実験計画法(分散分析)ではないのか?
重回帰分析で交互作用を検討する Posted on 2014年1月31日
URLリンク(norimune.net)
689:132人目の素数さん
18/12/25 20:38:41.41 pRXuZdkl.net
この名大のように先端医療開発部門に生物統計とバイオインフォマティクスを
抱える統計解析室という組織があるのは、他所のの医学部でも通常なのかな?
医学部で生物統計というと新薬の薬効の統計的検定ということか?
また統計解析室長を木下文恵某とかいう若手の助教が担うのも通常なのかな?
名古屋大学医学部附属病院 先端医療開発部 先端医療・臨床研究支援センターの体制
統計解析室--生物統計・バイオインフォマティクス
URLリンク(www.nu-camcr.org)
690:132人目の素数さん
18/12/27 00:12:12.23 MJGJAQMS.net
例えば、母集団から50枚の答案用紙を選んで、平均が
60点だとする。母集団は2500枚の答案用紙から成り立っているとして、平均は70点とする。このとき50枚の答案用紙をランダムに選んだかの検定はどの
ようにすればいいでしょうか。(つまり60点の平均点が低いので、ランダムに選んだかどうかを疑っているわけです。)
691:132人目の素数さん
18/12/30 08:45:37.63 OqurSyyP.net
>>646
EXCELの分析ツールは良くないというのは、統計専用ソフトと
出力値が合わないからですか?
お薦めの統計専用ソフトは、どれどれですか?
692:学術
18/12/30 12:25:34.69 RTlTqpwk.net
方程式に代入する速度はパソコンじゃ無理なんだろうか?そうでもないらしいね。
693:132人目の素数さん
18/12/30 15:39:18.16 VJBrhucL.net
こんなグラフの2つの系列に対する有意差検定ってどうすればいいでしょうか。
URLリンク(benesse.jp)
実際には2つの系列はそれぞれ複数の結果があります。
694:132人目の素数さん
18/12/31 12:28:26.71 BBwEFlcD.net
>>676
母集団のバラツキが大きいならランダムに選んだと言えるかもね。
母集団の分布をどう仮定するかによるんじゃね。
695:132人目の素数さん
18/12/31 23:33:19.06 oFI1Upvm.net
>>676
母集団は正規分布としてシミュレーションしてみた。
母分散が43点程度であれば標本平均が60点以下になる確率が5%を越える。
> f= function(sig){
+ x=scale(rnorm(2500))*sig + 70
+ mean(replicate(1e3,mean(sample(x,50)))<=60)
+ }
> f=Vectorize(f)
> f(1:100)
[1]
696: 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 [13] 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.001 [25] 0.002 0.002 0.003 0.003 0.005 0.006 0.010 0.018 0.017 0.017 0.013 0.021 [37] 0.029 0.026 0.029 0.041 0.035 0.037 0.057 0.054 0.058 0.076 0.059 0.060 [49] 0.063 0.068 0.080 0.074 0.077 0.086 0.098 0.092 0.114 0.096 0.110 0.098 [61] 0.115 0.115 0.133 0.122 0.141 0.118 0.139 0.157 0.170 0.153 0.182 0.165 [73] 0.171 0.154 0.167 0.175 0.163 0.174 0.178 0.174 0.196 0.205 0.204 0.211 [85] 0.206 0.205 0.217 0.212 0.235 0.218 0.189 0.230 0.232 0.215 0.221 0.246 [97] 0.217 0.228 0.216 0.248 >
697:132人目の素数さん
18/12/31 23:34:50.72 oFI1Upvm.net
>>679
同一濃度での反応速度データがあるならpaired t-test で検定できるのでは。
698:132人目の素数さん
18/12/31 23:58:42.47 oFI1Upvm.net
>>665
6C5*(1/3)^5*(2/3)+6C6*(1/3)^6= 0.01783265
699:132人目の素数さん
19/01/01 01:14:20.00 dni0tbHZ.net
>>682
x軸の値を実験の設定値にすれば同一ですが、測定値で補正してるので厳密には同一になりません。
散布図のプロットを繋いだような系列では難しいですね。
もしx軸を設定値としてpaired t-testする場合、レプリケートの扱いは各測点で平均化すればいいでしょうか。
それとも検定結果を平均化する方法が有るのでしょうか。
700:132人目の素数さん
19/01/01 07:21:45.66 nRsyFy0N.net
>>681
訂正
×母分散が43点程度
○ 母集団の標準偏差が43点程度
701:132人目の素数さん
19/01/01 07:42:07.71 nRsyFy0N.net
>>684
阻害剤の添加による反応速度の変化=0が帰無仮説の検定
なので両端のデータが多いと有意差なしになるだろうね。
この例での有意差検定の意味がわからなくなってきた。
702:132人目の素数さん
19/01/01 14:03:25.77 dni0tbHZ.net
>>686
専用の検定が無いとなると確かに両端に影響されますね。
有意差の数値化は諦めてグラフから説明するしかないかもしれませんね。
703:132人目の素数さん
19/01/03 05:08:06.81 9mVlT2wA.net
URLリンク(i.imgur.com)
帰無仮説、対立仮説に関する質問です。
・3つのグループの標本は同じ母集団から得られたものである。○か×か?
どちらなんでしょう。
初学者なため、自分でも何を言いたい質問なのか分かりませんが、お答えいただければ幸いです。
704:132人目の素数さん
19/01/03 12:53:01.61 QWWivxRF.net
>>688
×
705:132人目の素数さん
19/01/03 12:59:00.73 elcA+Zry.net
>>688
F分布を書くとこんなかんじ
URLリンク(i.imgur.com)
706:132人目の素数さん
19/01/03 13:43:39.06 ZOqQE5UH.net
>>688
宿題かい?
707:132人目の素数さん
19/01/03 16:24:30.86 9mVlT2wA.net
>>689-690
×なんですね。お返事ありがとうございます
それも画像付きで…感謝の極みです
>>691
Odyssey主催のビジネス統計スペシャリスト(上級)という資格試験の勉強中でして…
ベーシックに合格できたのでスペシャリストの方も取ろうと思ったら内容が一気に難しくなり、
恥ずかしながら独学でどうしても分からない所が出てきたので質問させていただきました
708:132人目の素数さん
19/01/03 17:27:28.50 xWkC5+gv.net
>>692
統計検定二級あたりの教科書で一通り手法は知っといた方がいいかもね。無料がいいなら統計WEBとかもあるし。
まあ、でも、問題に複数の会社名が出てきてる時点で同じロット(母集団)とは言えないんじゃ?と思ったけど。
709:132人目の素数さん
19/01/03 17:45:10.89 elcA+Zry.net
>>688
生データなしで計算すると
> ## m sd n
> A=c(159.0625,sqrt(3924.729167),16)
> B=c(240,sqrt(22027.5),17)
> C=c(366.35,sqrt(5329.292105),20)
>
> lh=rbind(A,B,C)
> colnames(lh)=c("m","sd","n") ; lh
m sd n
A 159.0625 62.64766 16
B 240.0000 148.41664 17
C 366.3500 73.00200 20
> mean.G=sum(lh[,"m"]*lh[,"n"])/sum(lh[,"n"])
> SS.bit=sum((lh[,"m"]-mean.G)^2*lh[,"n"])
> SS.wit=sum(lh[,"sd"]^2*(lh[,"n"]-1))
> df.bit=nrow(lh)-1
> df.wit=sum(lh[,"n"]-1)
> MS.bit=SS.bit/df.bit
> MS.wit=SS.wit/df.wit
> (F.ratio=MS.bit/MS.wit)
[1] 19.28831
> pf(F.ratio,df.bit,df.wit,lower.tail=FALSE)
[1] 6.18406e-07
> (η2=(SS.bit)/(SS.bit+SS.wit))
[1] 0.4355169
710:132人目の素数さん
19/01/03 18:05:15.25 elcA+Zry.net
どの2つが別の母集団かを検定すると
> pairwise.t.test(x,g,p.adjust='holm')
Pairwise comparisons using t tests with pooled SD
data: x and g
A B
B 0.02596 -
C 4.5e-07 0.00083
P value adjustment method: holm
711:132人目の素数さん
19/01/05 21:27:56.85 6yG70IA5.net
Zが標準正規分布に従う時、次の値を求めよ。
1:P{Z>u1}=0.05を満たすu1の値 → u1=1.645
2:P{Z<u2}=0.005を満たすu2の値 → u2=-2.576
3:P{-u3<Z<u3}=0.99を満たすu3の値 → u3=2.576
Xが正規分布N(10, 5^2)に従う時、次の確率を求めよ。
1:P{X>20} → 0.0228
2:P{X<5} → 0.1587
3:P{0<X<20} → 0.9544
途中式:URLリンク(i.imgur.com)
※P{X>20}は 0.0028 じゃなくて 0.0228 の間違い。
━━━━━━━━
Excelスレで質問したのですがスレチと言われたのでここで質問させて下さい。
上の6つの問題を標準正規分布の数値表を用いずに、
Excelの関数で求めたいのですが関数式を教えていただければ幸いです。
712:132人目の素数さん
19/01/05 22:04:26.80 yvpdTVqU.net
>>696
これを見た統計学スレの方々が答えてくれたのかはわかりませんが、
このレスの後すぐに関数式を教えていただけました。ありがとうございました!
713:132人目の素数さん
19/01/06 08:18:40.95 ef7QnJT7.net
>>697
NORMINV, NORMDIST
714:132人目の素数さん
19/01/06 09:53:57.32 a2Sn8ikL.net
>>696
Excelスレで質問?
数学板上のソフトスレは、以下しかない筈だが?
理工系分野手法操作も扱うExcelスレは、何処板に?
【R言語】統計解析フリーソフトR 第6章【GNU R】 [無断転載禁止]©2ch.net
スレリンク(math板)
統計ソフトSTATAの部屋 Ver.2
URLリンク(rio2016.2ch.net)
グラフから読み取る統計学の基本入門 [無断転載禁止]©2ch.net
スレリンク(math板)
715:132人目の素数さん
19/01/06 14:40:18.34 4nVseH61.net
Zが標準正規分布に従う時、次の値を求めよ。
1:P{Z>u1}=0.05を満たすu1の値 → u1=1.645
2:P{Z<u2}=0.005を満たすu2の値 → u2=-2.576
3:P{-u3<Z<u3}=0.99を満たすu3の値 → u3=2.576
qnorm(0.05,lower.tail = FALSE)
qnorm(0.005,lower.tail= TRUE)
qnorm((1-0.99)/2,lower.tail=FALSE)
Xが正規分布N(10, 5^2)に従う時、次の確率を求めよ。
1:P{X>20} → 0.0228
2:P{X<5} → 0.1587
3:P{0<X<20} → 0.9544
1-pnorm(20,10,5)
pnorm(5,10,5)
pnorm(20,10,5)-pnorm(0,10,5)
716:132人目の素数さん
19/01/08 14:30:28.74 6dIcngvn.net
散々ググってもわからなかったので、教えてください。
どこか間違ってるんだが、どこかわかりません。
検定の際にα=5% β=20%、右側検定(母集団の平均測定)として、
なぜ、確率の場合分けで足し合わせるように
H0となる確率=(1-α)/(1-α+β) H1となる確率=(1-β)/(1-β+α)
ではなく
いきなり、H0の第2種の過誤=β=20%、H1第1種の過誤=α=5%なのでしょう。
そもそもμ0とμが1:1の確率で起こる前提だと、確率の場合分けができますが、前提が違うのでしょうか。
H0ならば測定値xバーはZcrit 以下に95%分布している(はず)、よってH0をrejectできない。
でもそれが間違っている確率はβ=20%よ、というのがピンときません。。。
717:132人目の素数さん
19/01/10 20:50:46.14 Ylhxumi4.net
>間違っている確率はβ=20%よ
というのは正しくないよ。
棄却 棄却しない
H0 A B
H1 C D
α=A/(A+B)
β=D/(C+D)
β=D/(B+D)ではないよ。
ちなみに
A/(A+C)はFalse Positive Report ProvbabilityとかFalse Positive Rateとか呼ばれる
718:132人目の素数さん
19/01/10 22:24:03.86 7xf256Xd.net
平均値と中央値の差の絶対値が標準偏差以下であることを示して欲しいです。よろしくお願いします。
719:132人目の素数さん
19/01/10 22:55:32.84 TC7xh35K.net
>>688,692です。
URLリンク(i.imgur.com)
質問に答えてくださった方々のお力で資格試験に無事合格できました。
このスレにいる統計学の専門者の方々から見たら、
「おいおいそんな見たことも聞いたことも無いうんちな資格取ってどーすんだ?w」と思われるかもしれませんが、
単に、お礼を伝えに来ただけなのです。ありがとうございました(、、
720:132人目の素数さん
19/01/11 08:06:00.17 R3J99zpw.net
>>704
エクセル分析ベーシック?エクセル分析スペシャリスト?
無事合格おめでとうございます。
初めて聞く資格名です。
どの方面で有能な資格なのですか?
主催odysseyというのは、どういう組織なのですか?
URLリンク(stat.odyssey-com.co.jp)
721:132人目の素数さん
19/01/13 13:27:33.24 8DXBc9Sn.net
NHKのこの「日本人の意識」調査のサンプルサイズn=5400は、
過剰で統計理論に背いているだろ?
1安倍ちゃん ★2019/01/10(木) 18:43:00.82ID:e4+I4ZlK9
・・・「日本人の意識」調査を、昭和48年から5年ごとに行っています。最新の調査は
去年6月から7月にかけて、全国の16歳以上の5400人を対象に個人面接法で実施し、
50.9%にあたる2751人から回答を得ました。
この中で、結婚についての考え方を尋ねたところ「必ずしも結婚する必要はない」と
答えた人は68%、「人は結婚するのが当たり前だ」と答えた人は27%・・・・
【NHK世論調査の異常な現実】本当にちゃんと選んでるのか?現状の生活満足が92%
スレリンク(newsplus板)
722:132人目の素数さん
19/01/18 10:00:15.52 /asQ+GeG.net
>>706
どちらにしても、アンケートを受けた本人が考えたというより、
親の考え方がそうだということにしかならんのだよな。
そう考えると、大人は理不尽だ。
723:132人目の素数さん
19/01/19 20:28:25.83 HDORvJAa.net
統計先達方に質問。先般より騒動出来の厚労省「毎月勤労統計」不正問題だが、2004年
以前まで零細企業は抽出統計、大企業は全数統計と決められていた根拠は、何なのかな?
統計の考えに立脚すれば企業規模に関わらず標本抽出統計一本でよいのじゃないか?
【伝統】厚生労働省、勤労統計を正しく装うデータ改変ソフトまで作成していた事が判明 ★2
スレリンク(newsplus板)
724:132人目の素数さん
19/01/19 20:58:33.86 unI0qWhi.net
改変ソフトって、ほんとかね?割合を合わせてるだけじゃないの?
決まりはもちろん全数だけど、件数割合を全数に合わせているとしたら
計算結果はおおきく変わらないだろうね。
だとした場合
今までの報道では、件数も合わせずに、そのまま東京の分は1/3で計算
していたと報道していた。これの方が大間違いの報道ということに
なるのだが。
725:132人目の素数さん
19/01/19 21:31:58.40 MMSrQ9rB.net
だとした場合とか妄想で言われてもw
726:132人目の素数さん
19/01/19 21:41:50.33 rSgjVqQn.net
社会人でも通いやすい統計学の大学院てどこかありませんか
727:132人目の素数さん
19/01/19 23:55:29.01 iXhYyCfN.net
東京大学大学院経済学研究科
728:132人目の素数さん
19/01/20 09:09:44.52 vbB0l4YG.net
統計学を操って役に立てるようになりたい
729:132人目の素数さん
19/01/20 09:17:48.42 FFbdUxFQ.net
デイトレやるようになって勉強し始めた
とりあえず2級が目標
730:132人目の素数さん
19/01/21 07:07:44.77 s0Etp/8a.net
ある私立医大の合格者の偏差値の平均値はm、標準偏差は10の正規分布であるとする。
合格者のうち成績上位70%は入学を辞退し下位30%の合格者が入学する。入学者の偏差値の平均値をmaとする。
m - maを算出せよ。
答はmの値によらないでいい?
731:132人目の素数さん
19/01/21 07:08:29.04 s0Etp/8a.net
>>713
p hacking とか?
732:132人目の素数さん
19/01/21 13:43:35.90 jatJic6p.net
>>708
1 全件調査は法的に決まっていた
2 サンプル抽出なら、全体支払い料を算出する際に抽出率の逆数を乗じないといけない
3 上のミスをこっそり修正したので賃金の伸び率が不自然になった
733:132人目の素数さん
19/01/25 08:03:51.68 CDJmSyfR.net
>>717
勤労統計続報
厚労省「すいません、COBOL分かる人間が少なくて勤労統計調査のチェック甘かったです」
スレリンク(news板)
734:132人目の素数さん
19/01/25 11:27:01.46 jPcz8uua.net
おまけに2004年からのデータ破棄してるって
紙のアンケートだか何か知らないがひどい
735:132人目の素数さん
19/03/05 08:32:16.40 agNxkP9Y.net
>>718
じつは指摘されるのと類似した問題が一つの要因で
ただ、言われていることとちょっと異なるんだが
ソフト環境が進んで、さらに無償で利用できる関係で研究員によって
好みのツールを使うようになり、検証が不十分になってきているところが
今回の要因の一つにある。
便利さが生んだ問題と言ったらいいのか。
736:132人目の素数さん
19/03/05 09:01:16.13 agNxkP9Y.net
高度な統計解析が必要とされるわけではないので
言い換えれば、ツールオタクが生んでしまった問題の
一つと言えなくもない。
言語で結果が変わるわけじゃないんだから、
研究と業務という意識の切り分けができていなかった
といえるかも。
737:132人目の素数さん
19/03/08 12:44:40.00 wd6xlp6H.net
書くところがここしないので書かせていただきます
公的な統計の問題が毎日ニュースで流れていますけど、
賃金構造基本統計調査=> チンコウ
毎月勤労統計調査 => マイキン
と、統計の専門家が短縮してチンコウ、マイキンと
おっしゃっていますけど、俺が耳がすこし悪いので、
聞くたびに、チンコ、マンコと聞こえてしまいます。
お願いですから、他の短縮形を使っ
738:てください! よろしくお願いします!
739:132人目の素数さん
19/03/08 14:28:40.91 zPm0EWvO.net
ちんまいのう
740:132人目の素数さん
19/03/08 14:42:02.17 MkV0Z/ug.net
賃金構造基本統計調査=> 賃本
じゃあまずいかな?
どう発音してもいいけど
741:132人目の素数さん
19/03/08 17:35:23.00 63imntGD.net
むしろマイ金的な響きある
742:132人目の素数さん
19/03/29 21:03:23.99 g6RZxVSs.net
「統計」は「疑似科学」な
743:132人目の素数さん
19/03/31 13:16:25.70 XXvSi3Mk.net
疑似科学として使う方しか知らんのだな
744:132人目の素数さん
19/03/31 20:52:08.22 4szRP/7j.net
2mのキッチンとか死んじゃうよな
745:132人目の素数さん
19/04/02 21:51:43.84 awGEUT67.net
すいません、質問です。
URLリンク(www.data-arts.jp)
この問題の(3)の解答なのですが、なぜ自由度が9になるのでしょうか。11カテゴリで自由度10にならないのでしょうか。
746:132人目の素数さん
19/04/08 23:52:13.97 WYBAYyIg.net
性犯罪率と申告率
URLリンク(hakusyo1.moj.go.jp)
この二人が暗数(未申告)を含んだ実際の被害者数を計算してるんだが
どっちが正しい?
URLリンク(twitter.com)
URLリンク(twitter.com)
(deleted an unsolicited ad)
747:132人目の素数さん
19/04/09 03:51:51.39 mCRWATXA.net
>>730
あ、これもういいです。スルーでヨロ。
748:132人目の素数さん
19/06/10 20:24:58.97 DYnR/eWG.net
相関係数について教えてください。
変数a={1,1,1,1,1,1,1,1,1,1}
変数b={1,1,1,1,1,1,1,1,1,1}
つまり2つの変数の値が全て同じだった場合に、
相関係数を計算すると計算不能になりますけど、
これは相関係数は1だと言っていいんでしょうか?
それとも計算不能でいいんでしょうか?
749:132人目の素数さん
19/06/10 23:28:12.63 QNcedATQ.net
1でok
ていうか全く同じデータの相関係数求めてどうすんの
750:132人目の素数さん
19/06/11 02:56:55.47 4gLAsdF7.net
意味ないですよね?
よくよく考えてみると、
その意味ないことを
延々と証明してるキチガイ論文見つけたので
学会発表のときに
触れてやろうと思ってます
751:バーチャル5才児
19/06/12 12:12:32.56 HTSoCTZk.net
>>733 に異を唱えてくれるステキな大人のひと、いないの?
752:132人目の素数さん
19/06/12 12:39:38.21 r8hS2Av9.net
エンタングルメントみたいな非自明ながらも完全なる相関性とかもあるんだけどね。
753:132人目の素数さん
19/06/13 00:57:42.22 1/MlBZbG.net
>>735
そんな人は研究に忙しくて
5chみてるヒマないでしょ?
ここにくるのは初心者とカスとゴミですから
754:132人目の素数さん
19/06/13 13:49:57.02 ++fphncT.net
有意ですかぁ?
755:132人目の素数さん
19/06/18 08:09:12.14 boAmwD1T.net
>>729
よく読め
756:132人目の素数さん
19/06/18 10:20:44.21 r3SGd61F.net
>>732
相関係数の公式は知らんが、
0/0は、不定値である
そもそも、aもbも全部1とのことだが
より精密に測定すれば
0.982とか1.023の感じの測定値となる
有効数字1桁ではなく、せめて、
有効数字2~3桁となるよう再測定せよ
なお、相関K数は計算上不定だが
一般に相関K数は-1~+1に定まる
757:132人目の素数さん
19/06/27 09:26:40.59 CKXGCHz7.net
藤林丈司
758:132人目の素数さん
19/06/29 16:41:15.01 DHiuKlHq.net
統計学Part17
ふうL@Fu_L12345654321
学コン1傑いただきました!
とても嬉しいです!
URLリンク(pbs.twimg.com)
URLリンク(twitter.com)
(deleted an unsolicited ad)
759:132人目の素数さん
19/07/03 19:43:12.19 dqLWAG/2.net
4315
ふうL@Fu_L12345654321
学コン1傑いただきました!
とても嬉しいです!
URLリンク(pbs.twimg.com)
URLリンク(twitter.com)
(deleted an unsolicited ad)
760:132人目の素数さん
19/08/21 15:43:37.73 R9JKCgfG.net
統計学で大学院に行って学びたいと思うけど、修論がまったく思い描けない。
既にある問題解析なら、本を買ってやればよいと思う。
統計学の修士論文って、どんなレベルなんですか?
761:132人目の素数さん
19/08/21 16:06:20.31 l33Sc9o9.net
学部なんだろ、当たり前だろ、馬鹿か
>修論がまったく思い描けない
762:132人目の素数さん
19/08/24 17:56:49.65 Eorr1XN2.net
修論のテーマなんて教授から与えられるものじゃないの
763:132人目の素数さん
19/08/25 12:22:34.43 hN+91YQ9.net
統計学は理論的なことはもうやることないだろ。
764:132人目の素数さん
19/09/15 19:00:11.32 DioDLiiu.net
統計学も今後はAI台頭で不要になると思わない?
765:132人目の素数さん
19/09/16 00:42:27.54 +jVhODrH.net
昨今AIと呼ばれているものは統計学のごく一部を応用してるにすぎないし応用と呼べるレベルにすら達していないものも多い
つまり統計学なくして理論面でのAIの発展などあり得ない
766:132人目の素数さん
19/09/17 15:37:17.58 Mzc/TNCI.net
>>749
禿同
その基本的なことさえ
全く分かってない機械学を
Pythonでやってるママゴトでも
高い給料もらえるという
データサイエンティストバブル!
767:132人目の素数さん
19/09/17 16:24:41.95 J7tompAJ.net
統計の新しい理論が出来たわけではない、馬鹿乙
768:132人目の素数さん
19/09/17 20:42:38.79 TeA5l+qf.net
>>748
残念ながら今のところ
統計学≒AI
なのよ
よろしくね!
769:132人目の素数さん
19/09/17 20:53:38.59 hX7H6s46.net
希望と現実の区別がつかない素人
770:132人目の素数さん
19/09/18 08:45:49.87 4XM7uJtX.net
アンカーつけろ馬鹿たれ!
771:132人目の素数さん
19/09/18 08:47:04.34 4XM7uJtX.net
>>753
アンカーつけろ馬鹿たれ!
例な
772:132人目の素数さん
19/09/18 09:05:29.06 BuAUiqBt.net
>>755
例えば
死ねよアホ
773:132人目の素数さん
19/09/20 13:25:10.58 KyAOfC1j.net
2515
かずきち@dy_dt_dt_dx 8月28日
学コン8月号Sコース1等賞1位とれました!
マジで嬉しいです!
来月からも理系に負けず頑張りたいと思います!
URLリンク(twitter.com)
(deleted an unsolicited ad)
774:132人目の素数さん
19/09/20 21:26:50.38 srQjZ8Bg.net
>>756
馬鹿で性格も悪いって(笑)
775:132人目の素数さん
19/09/21 09:16:38.42 uWUdAHAp.net
>>758
自己紹介乙
776:132人目の素数さん
19/09/21 14:50:35.73 OeVFSCvD.net
河村敏彦(笑)
777:132人目の素数さん
19/09/28 17:33:46.84 3Xx7diYc.net
初歩的なことかもしれませんが、「有意水準」に関して悩ましいことがあったので質問させてください。
個人的な興味のために、「n面ダイスをm回振って、全ての目が出揃う確率」について議論したいんですが、
統計学的には、その確率が99%以上であれば、有意水準1%のもと、「n面ダイスをm回以上振�
778:黷ホ、流石に全ての目が出たものとして扱ってよい」と言える、 という認識で合ってますでしょうか。 合っているとして、ここからが本題なんですが。 例えばこれをn = 100で行った場合、 「百回中一回しか起こらない事象を自分は扱ってるくせに、統計学的には1%以下を無視するなんて、どの口が言ってねん」って感覚を覚えます。 つまり、nの値が大きければ大きいほど、有意水準を引き下げたくなってしまいます。 この感覚は理論的には正しいのでしょうか?
779:132人目の素数さん
19/09/29 04:09:38.53 ICvo204V.net
検定の概念がわかってないようなのでそこから見直しって感じですかね
780:132人目の素数さん
19/09/29 11:55:16.64 YdSphJX8.net
n面ダイスが正確に作られた(=各面の出る確率が等しい)ものであればm回振って全目が出る確率は厳密に計算できる
しかし、現実には完全に正確なダイスなどあり得ないのでこの確率からのブレが生じる
手元にある実物のダイスがどのくらい不正確かは実際に振ってみて値を記録しなければ分からない
で、実際に振った以上どの目がどの確率で出るのかは分かったのだから求めたい確率も計算できる
有意水準を使った統計学的検定でできるのはダイスが正確なものか否かの判定ぐらいでしかないので今の場合は不要
781:132人目の素数さん
19/09/29 16:14:00.89 2CC0mAW5.net
なるほど……有意水準という概念を適用できる範囲を誤解していたみたいですね。
有意水準の概念は「このダイスに偏りがないか」を調べるときには使えるが、
「ダイスが正確であるとして、m回振った結果すべての目が出揃っているか」は、例えば計算した結果99.4%だとしたらそれ以上でも以下でもなく、99%以上だからと言って全ての目が出ているとして扱えるものではない、と。
勉強し直します。ありがとうございました。
782:132人目の素数さん
19/09/29 16:40:09.39 2CC0mAW5.net
ちょっと調べてみたんですが、「どの程度、低い確率で起きる事象なら無視していいか」に関しては「ボレルの法則」というものがあるらしいですね。
「10のマイナス6乗以下の確率は、人間の時間スケールではまず起こらないものとして扱ってよい」という。
この場合適用すべきはこちらでしょうか。
783:132人目の素数さん
19/09/29 18:28:41.84 82vqIqjS.net
確率と有意水準をごっちゃまぜにしているように見えます。
有意水準という用語の背景には、必ず帰無仮説があります。
帰無仮説というのは、いわば否定されることを目的に立てるような仮説です。
帰無仮説が否定されたなら、それに従って、何らかの主張が行えます。
その時の常套句が、「有意水準これこれで、これこれを主張する」等となります。
なぜ、その帰無仮説が否定できたか?
否定した理由は、あまり起こりえないことが起こったからという論法です。
偶然、たまたま起こったと言うこともあり得ます。
しかし、そう考えるより、帰無仮説が間違っていたと考える方が、無難だと考え、
帰無仮説の内容の否定にあたる主張を、「有意水準云々で、此れ此れ...」と言うのです。
帰無仮説が間違っていると考えるか、偶然起こることもあるから、帰無仮説が間違っているとまでは
言い切れないと考えるか、その判定の境界として採用されているのが、5%とか、1%とかの値です。
従って、この5%とか1%は、「その主張が間違っている確率」ではありません。
「間違って帰無仮説を棄却してしまった確率」です。
帰無仮説は正しかったのに、誤って否定し、何らかの主張を行ってしまった確率です。
主張の内容の確率ではなく、帰無仮説を否定してある主張を持ってきたときの判断の誤りの確率です。
784:132人目の素数さん
19/09/29 20:56:45.27 rVYV+GdK.net
5645
かずきち@dy_dt_dt_dx 9月29日
京大オープン経済190/550しか取ってないやつにマウント取られて草
お前より90点高いんだよ
785:黙って勉強しろ https://twitter.com/dy_dt_dt_dx (deleted an unsolicited ad)
786:132人目の素数さん
19/09/29 23:29:22.50 4yGt3Rbe.net
検定とか有意とか
フィッシャー最大の失敗だと思いますんw
787:132人目の素数さん
19/09/30 21:32:41.09 pGz8xE4o.net
河村先生は女子学生にセクハラしてるのでは?
788:
19/10/20 16:28:57 /IBhYsib.net
統計学やると今流行のデータサイエンティストになれるのか?
789:132人目の素数さん
19/10/21 00:23:39.84 h0/eah2o.net
むしろデータサイエンティストブームが終わっても生き残るために必要なのが統計学
データサイエンティストになるだけが目的ならもっと小手先のテクニック身に着ける方が手っ取り早い
790:132人目の素数さん
19/10/22 01:47:38.25 OUWgx3Yq.net
データサイエンス=機械学習 になってしまって、統計学への関心が薄れてきた印象
データサイエンス関係の学科や学部が増えてきてるが、いずれもビジネスに寄りすぎていて、トレンド終わったら危うい印象
結局将来的にもデータ関連の人材はデータ処理を専門とせずに各々の研究の必要に迫られて独学した従来型が主流な気がする
791:132人目の素数さん
19/10/26 17:02:21.23 qnfsZRYc.net
機械学習にしても統計学にしても、今後はSPSS等の高額統計ソフトは廃れていくと思う。RやPython使える人が重宝されるだろう。
792:132人目の素数さん
19/10/26 17:14:56.32 80nGs05h.net
緑本が難しかったんだけど、どの本から始めたらいいですか?
793:132人目の素数さん
19/10/27 08:03:15.48 xp3AzHdF.net
機械学習のベースは統計学
ついでにいうと機械学習機械学習といっているのは日本くらいなもん
794:132人目の素数さん
19/10/27 10:08:41.82 725LjOOC.net
>>774
緑本って何?
795:132人目の素数さん
19/10/27 10:19:47.64 ZKA7UMw6.net
緑本と言えば東大出版の三部作の緑か、統計モデリング本かのどちらか
796:132人目の素数さん
19/10/27 10:53:15.64 QXm+1z/Q.net
赤本読んだか?
797:132人目の素数さん
19/10/27 12:59:36.48 fPVOzMOu.net
Rは数年前に既に衰退始まっててpythonに移行しつつある
798:132人目の素数さん
19/10/27 13:06:49.82 C7RbWweK.net
>>776
>>777
モデリングのほうです!
799:132人目の素数さん
19/10/27 13:22:30.81 t6dYTPS1.net
>>772
日本でいうDSだの機械学習はもう数年で終わり
今慌ててDS関係の講座作ってる大学は不良資産抱えることになる
新規採用した教員が今後20年足引っ張るよw
800:132人目の素数さん
19/10/28 00:18:55.59 xx3fOqhb.net
RはRstudioが使いやすいけど、Pythonは何使ってる?
801:132人目の素数さん
19/10/28 00:21:16.67 0lndKoC5.net
VScodeじゃん?
802:132人目の素数さん
19/12/04 23:38:03 JeLX6Nlr.net
不偏分散を算出する際にn-1で割る、というのは、実際に期待値を計算して、不偏推定量とするのに必要なのは理解できるのですが、
自由度と不偏推定量はどうして関係があるのでしょうか?
不偏分散だけじゃなくて、一元配置の分散分析や、最小2乗法でも、自由度で割る、
という自由度との関係があるように思いますが、どのような数学的背景があるのでしょうか。
803:132人目の素数さん
19/12/08 12:05:25.84 wenJp6AV.net
非線形の重回帰分析をしたいんだけど、ネットとか専門書見てもあんまり情報なくて、非線形重回帰分析ってあまり使われてないんですかね?
いい本あったら教えてください
804:132人目の素数さん
19/12/08 12:34:39.66 2phJLplo.net
非線形の重回帰って普通にニューラルネットなりランダムフォレストなりで回帰すること�
805:カゃないの? 又は2次関数なりで変数変換して線型回帰に落とし込むとか いずれにせよ大層な話じゃないと思う
806:132人目の素数さん
19/12/08 16:56:44 /8FwQ3R/.net
重回帰分析みたいに目的変数を推定するのを、説明変数と目的変数が非線形の関係なんで、非線形の重回帰分析をしたいんですよね
ニューラルネットとかでもいけるんですかね?ニューラルネットは軽く調べただけであんまわかってなくてすんません
807:132人目の素数さん
19/12/08 17:24:09.87 xexp9KOA.net
単純な非線形重回帰なら一般化線形モデルでよくないか?
808:132人目の素数さん
19/12/20 02:21:53.52 yiLw1Jz8.net
2200
しろ@huwa_cororon 11月27日
苦節6ヶ月、初満点&一等賞です!
URLリンク(twitter.com)
(deleted an unsolicited ad)
809:132人目の素数さん
19/12/30 23:03:06.88 3PRRBx7S.net
条件の違う2つの群に対して、5つ提示した物のうちどれが好みかってテストをして、条件によって選択のばらつきが変化するって話をしたいんだけど、これはどう検定したらいいんだろうか?
810:132人目の素数さん
19/12/31 20:29:52.64 uFwLZGG6.net
分散の比ならF検定かな
811:132人目の素数さん
19/12/31 20:31:56.88 uFwLZGG6.net
標準偏差の比が正しいのか
812:132人目の素数さん
19/12/31 22:11:44.84 4uBrQaIf.net
名義尺度になるから標準偏差は取れなくない?
カイ二乗検定かね?
813:132人目の素数さん
19/12/31 22:15:54.60 uFwLZGG6.net
独立性の検定は使えるかもね
814:132人目の素数さん
19/12/31 22:17:43.07 uFwLZGG6.net
好みを点数で評価してもらったら
形式上は間隔尺度になるかも
815:132人目の素数さん
20/01/17 01:21:44 uZ2HrGrW.net
要素Aについて、Aがある場合とAがない場合に、
100回中何回事象X、Y、Zが起きたか調べたデータがあるとき
X、Y、Zが起きるのは高得点である
たとえば
Xが起きる=〇点、起きない=0点
Yが起きる=△点、起きない=0点
のように何点であるかはわからないが、事象が起きると
起きないときに比べて高得点が得られるとすると、
要素Aは「高得点を得る」のに影響しているのか
というのを調べるのにはどうしたらいいでしょうか?
AとX、AとYのように個別にカイ二乗検定を行うと
p値は0.05より大きいというようなことはわかったのですが…
100回中
A ~A
X 15 10
Y 17 10
Z 12 8
816:132人目の素数さん
20/01/18 11:00:37.99 qWqQZnoU.net
>>796
Aと、Xが起きる起きないの関係でP値が5%超だと
AとXの発生は無関係って解釈になるのでは?
そのレスにあるクロス集計表だと
AとXYZのどれが発生するかの関係を調べることになると思う
817:132人目の素数さん
20/01/19 13:25:58.01 2vRPAcfj.net
>>797さん、ありがとうございます!
....A ~A
X...15 85
~X..10 90
....A ~A
Y...17 83
~Y..10 90
....A ~A
Z...12 88
~Z.. 8 92
についてそれぞれp値は5%超なので、
「高得点を得る」事象X、Y、Zについて、
帰無仮説:要素Aによって、事象X、Y、Zの発生のしやすさは変わらない
は棄却不能であるので、
Aによって、「高得点の得やすさ」は変わる、または変わらない、のどちらともいえない
Aがあるときはないときに比べて、Xは5回、Yは7回、Zは4回、多く発生しているが、
それは偶然であるのか必然であるのか、このデータから推論することはできない
ということでいいのでしょうか?
818:132人目の素数さん
20/01/19 14:38:42 SmisEix1.net
>>798
H0:二つの変数は独立である。
H1:二つの変数は独立ではない(何らかの関連がある。)
でH0を棄却できないので
AとXが独立である可能性がある、つまり
AとXに関連があるとは言い切れない
になると思います
有意水準の値にもよりますけど
819:132人目の素数さん
20/01/19 15:31:21 2vRPAcfj.net
ありがとうございます
優位水準5%としたとき、p>0.05なので
AとXが独立である可能性がある、つまり
AとXに関連があるとは言い切れない
同�
820:lにp>0.05なので AとY、AとZに関連があるとは言い切れない よって優位水準5%としたとき、Aと「高得点を得る」ことに関連があるとは言い切れない (あるともないとも言い切れない) ということで大丈夫でしょうか?
821:132人目の素数さん
20/01/19 15:47:51 6nrSQfDB.net
統計学の勉強をしたいのですがお勧めの教書はありますか?とりあえず統計検定2級を取ることを目標にして2級の参考書、過去問のみ持ってますが、範囲外のことも掻い摘んで勉強したいです
822:132人目の素数さん
20/01/19 15:58:46 SmisEix1.net
>>801
図書館とかでいろいろ見てみたらいいのでは?
同じ事でも自分に分かり易い書き方をしてあるかどうかは読む人によって違うので
823:132人目の素数さん
20/01/19 16:15:09 ZOYCVHu4.net
赤本、青本
824:132人目の素数さん
20/01/20 08:19:51 4LwsNzn7.net
まず宮川公男
からの赤本
825:132人目の素数さん
20/01/20 15:41:43.88 RFS0mRu2.net
それぞれ、サイズの異なる
A B C D E が5分類有り、ONとOFFの2つの状態を持ちます。
ONには、各分類でトリガーとなるイベントが起きた際に一定確率でなります。
判明している数値は、A~Eのサイズ(量)と各分類でONになった回数です。
分類ごとのトリガーの発生回数とONになる確率を推定したいのですが、
各分類で起こった回数もトータルでの起こった回数も不明です。
826:132人目の素数さん
20/01/20 15:58:45.38 59LWl8Pz.net
スレ違だったらすまん
TwitterでAが好きな人はお気に入り、Bが好きな人はリツイートっての見たことある人いると思うんだけど、片方の投票だけ拡散される性能がある場合ってアンケートは平等と言えるのかな?
ふと疑問に思ってしまった
827:132人目の素数さん
20/01/21 14:45:56 Etw7VOGJ.net
>>801
教えてもらったらレスしなさい、いやなら二度と来ないで
828:132人目の素数さん
20/01/21 16:04:38.27 pYByjpiW.net
今勉強中だから!
829:132人目の素数さん
20/01/21 18:49:54 XQhOWIM5.net
>>802
遅くなってしまい申し訳ありません。
情報ありがとうございます、参考に致します。また些細なことで質問することもあると思いますが、その時はどうぞよろしくお願いします。
830:132人目の素数さん
20/01/22 00:38:06 4VBFhSJv.net
>>807
うっせーんだよバーカ
老害か?
831:132人目の素数さん
20/01/22 00:54:27 ZSq/0bZF.net
とんでもねえ
あたしゃガウスだよ
832:132人目の素数さん
20/01/22 18:12:41 eTeJDHK9.net
URLリンク(i.imgur.com)
この問題って、どーやって解くんですか?
833:132人目の素数さん
20/01/22 19:30:28 KUYY19ls.net
>>812
定義とおりに計算したら求められると思います
Xが-4を取る確率をその表から読み取って掛け算して
他の値も同様にして、全部足し合わせる→平均
平均との偏差の二乗を足し合わせて個数で割る
共分散も定義の式を確認してその通りに計算する
834:132人目の素数さん
20/01/25 00:28:42 IzxreXdi.net
質問:日本人を対象としたアンケート調査で十分なサンプル数を得られたものの、回答欄に不備があって回答の数パーセントが間違った集計をされた場合
Q1. この統計調査そのものを棄却すべきなのか
Q2. 信頼区間をいじればどうにか統計として成り立つのか
Q3. 出てきた結果に数パーセントの補正をなにかしらすれば使えるのか
よかったら教えてください。具体的な話をすると「20代男性は交際経験も性交経験もないのが○%!」みたいな記事を読んでたとき「これ3-10%いるLGBT人口を考慮しないと自分みたいなケツマンコ人数2桁でもおマンコゼロって回答するよね…」て思ったので。
835:132人目の素数さん
20/01/25 18:51:17
836:qRSN3fq+.net
837:132人目の素数さん
20/01/25 18:51:28 E3e004yf.net
黙れアホ死ね
838:132人目の素数さん
20/01/27 12:27:19 p+k1S3fn.net
仮説が正しい確率とかいう意味不明な概念を持ち出して絶賛炎上中だな
"瀕死の統計学を救え! ―有意性検定から「仮説が正しい確率」へ―"
839:132人目の素数さん
20/01/27 13:06:07 vv73qAWZ.net
>>805
求めたい値を変数として
今わかっている関係を数式で表す
それらを使って誤差などの評価値を最小にする値を探す
組合せ最適化問題に帰着するかもしれない
840:132人目の素数さん
20/01/27 13:11:52 vv73qAWZ.net
>>814
除外する基準が分からないなら
そのアンケートの結果としては意味があるだろうけど
対象外としたい集団の結果がどの程度影響しているかわからないんじゃ補正の仕方もわからないと思う
別の統計で対象外としたい集団の結果がわかればそれを使って補正すればいいのではないか
841:132人目の素数さん
20/01/27 13:12:35 vv73qAWZ.net
>>817
仮説が正しい確率が小さいから仮説を棄却するんじゃね?
842:132人目の素数さん
20/01/27 21:23:53 rbwRL9KL.net
「仮説」を統計モデルのようなものとすると「仮説が正しい確率」を計算するためには今対象とする事象の真のモデルを知っている必要がある
現実世界においてはそんなもの知り得ないし、万が一知っているならそもそもそれと別のモデルを立てて計算する必要などなくなる
843:132人目の素数さん
20/01/27 21:38:20 vv73qAWZ.net
>>821
仮説が正しいという前提で観測した事象が発生する確率を考えてみたら1%以下だった→仮説が間違いと考える
分布は正規分布とかχ二乗分布とかt分布とかF分布とかそれらしいものを使うんじゃね?
中心極限定理とかで安定分布とみなせるとかあるんじゃね?
844:132人目の素数さん
20/01/27 21:40:59 vv73qAWZ.net
>>821
別の手段は何か適切なものがあるの?
ないなら近似的なものでも答えがわかった方がいいんじゃね?
845:132人目の素数さん
20/01/27 22:33:49.08 AlwQV46l.net
>>823
勝手に想定した分布は真の分布ではないし中心極限定理で正規分布になるというのも
有限サンプルの世界ではあくまで近似でしかない
そもそも「仮説が正しい確率」などというものが求めようがないと言っているだけであって
近似的に使えるものがあれば好きに使えばいい
ただ単にそれを「仮説が正しい確率」と呼ぶのは事実と異なる
846:132人目の素数さん
20/01/28 00:05:49 L5uOvH9/.net
この問題を教えて頂けないでしょうか?
大学1年生について,何かを失敗してしまうことへの恐怖感を感じる程度(「以下,「失敗恐怖尺度得点」)と,個人の大学生活への不適応度(以下,「不適応得点」)を測定したところ,
それぞれの記述統計量について,「失敗恐怖尺度得点」に関して平均値=4.05,標準偏差=1.17,「不適応得点」に関して平均値=20.29,標準偏差=6.49という結果が得られた。また,2変数間の共分散は2.37であった。
「失敗恐怖尺度得点」を独立変数とし,「不適応得点」を従属変数として単回帰分析を行い,それぞれ値を入力欄に記入せよ。
(1) 切片を推定せよ
(2) 回帰係数を推定せよ
(3) 決定係数を示せ
(4) 単回帰分析の結果,得られる,従属変数の予測値と,従属変数との間の相関係数を求めよ
(5) 予測の標準誤差を示せ
847:132人目の素数さん
20/01/28 06:43:17.72 zbNO1u7R.net
やっぱベイズが分かりやすくていいな。
848:132人目の素数さん
20/01/28 09:17:05 +WlMKIb4.net
ベイズって簡単なの?理解に苦しんでる笑
もう一踏ん張りしたらそのステージに上がれるかな
849:132人目の素数さん
20/01/29 06:00:24 wY0tYf5k.net
平均値100 標準偏差15で定義される知能指数で
標準大学の新入生の知能指数の平均が100
裏口シ
850:リツ医大の新入生の知能指数の平均が85であったとする。 各大学から1/10を無作為抽出して知能指数をt検定したときのp値の期待値、中央値を求めよ。 また、p値が0.05以上になって裏口シリツ医大の新入生の知能指数は統計的に有意差はないと主張できる確率はいくらか?
851:132人目の素数さん
20/01/29 06:51:38 wY0tYf5k.net
>>825
統計ソフトを使っていいなら、擬似乱数発生させて近似値ならだせる。
Rだと
library(MASS)
mx=4.05
my=20.29
sx=1.17
sy=6.49
vxy=2.37
n=1e6
mu=c(mx,my)
si=matrix(c(sx^2,vxy,vxy,sy^2),ncol=2)
dat=mvrnorm(n,mu,si)
X=dat[,1]
Y=dat[,2]
lm(Y~X)
852:132人目の素数さん
20/01/29 06:56:54 wY0tYf5k.net
近似値なら
Call:
lm(formula = Y ~ X)
Coefficients:
(Intercept) X
13.279 1.731
853:132人目の素数さん
20/01/29 07:46:51.07 wY0tYf5k.net
>>828
追加
1学年はどちらも100人
854:132人目の素数さん
20/01/29 10:50:47 QT00WVSK.net
>>824
仮説なんだから真の分布はわかるはずがないだろ
仮説が成り立つとして検定するんだから
真の分布なんて厳密に判るケースの方が少ないんじゃないか?
今あるデータだけでなく未来のデータも含めないと真の分布は厳密にはわからないんだし
855:132人目の素数さん
20/01/29 12:11:52 tswqnp9S.net
>>832
だから散々言っているように、真の分布が分からないのに仮説が正しい確率など分からないよね?ということ
あくまで自分が勝手に作ったモデルが手元のデータに対してどれぐらい使い物になるかが分かるだけ
それが有用なら使えばいいが、それは決して仮説が正しい確率ではないというだけのこと
856:132人目の素数さん
20/01/29 13:44:04.84 QT00WVSK.net
>>833
自分が勝手に作ったモデルのことを仮説と呼ぶ
仮説が正しい確率=自分のモデルが正しい確率
857:132人目の素数さん
20/01/29 14:19:09.31 J3LUoz9R.net
>>834
そこで言う「正しい」って何だよってこと
正解があって初めて自分が作ったものが正しいか間違いかを論じることができるはずだが正解を誰も知らないので「正しい」などという言葉を使ってはならない
858:132人目の素数さん
20/01/29 14:21:53 QT00WVSK.net
>>835
正しい→観測した事象が発生する確率が高い
859:132人目の素数さん
20/01/29 14:25:41 QT00WVSK.net
>>834
これは正確ではなかったかも
仮説が正しい確率=自分のモデルで対象の事象が発生する確率
自分のモデルで対象事象が発生する確率が低い→
自分のモデルつまり仮説が正しくないから仮説を棄却する
860:132人目の素数さん
20/01/29 14:27:55 QT00WVSK.net
>>837
統計量と検定に使う分布を適切に選ぶ必要はある
どの程度の精度が必要かは個別に違うだろう
近似でも有用なケースもある
861:132人目の素数さん
20/01/29 14:36:14.08 QT00WVSK.net
>>835
統計だから正しいか正しくないかの二択ではないんだよ
正しい可能性が1%なのか95%なのかで違うだろ
862:132人目の素数さん
20/01/29 15:11:01 tswqnp9S.net
正しいか正しくないかは確率変数ではないので正しい確率などという概念がおかしい
確率変数ではないのだから正しいという言葉を使った瞬間に正しいか正しくないかの二択で論じることになる
>>837にあるようにあくまで計算するのは作成したモデルで観測した事象をどれだけ説明できるかであるが
それは一般に言う「正しい」の意味合いとは大きく異なる
だから「正しい」などと大袈裟なことを言わずに正直に自分が作ったモデルとはこの程度合っていると言えばいいだけのこと
863:132人目の素数さん
20/01/29 17:57:57.14 QT00WVSK.net
>>840
正しいという言葉の定義の問題でしかないな
意思疎通ができれば問題ない
正しいとはこう言う意味に解釈すると前置きすれば解決する
864:132人目の素数さん
20/01/29 18:12:15.61 yutX131C.net
だからベイズ使えベイズ。
仮定したモデルが正しい確率だから分りやすいぞ。
865:132人目の素数さん
20/01/29 18:49:21 QT00WVSK.net
ベイズって観測するまでは事前分布を均等だとみなして
観測に合わせて分布を更新すると理解しているけど
それだと滅多に起きない事を考慮できないんじゃないの?
866:132人目の素数さん
20/01/29 21:16:02 Bb/kUddm.net
統計学は統計学
数学ではない
867:132人目の素数さん
20/01/31 12:18:53 3R+evHVz.net
>>843
無情報事前分布を当てはめるのは普通は確率分布のパラメータに対してであって最終的に知りたい確率分布自体は別のものを用意すればいい
レアな現象を扱いたいならポアソン分布とかをベースにした統計モデルがよく使われる
868:132人目の素数さん
20/01/31 18:00:11 20AlCGSm.net
別の質問スレに書いたけどスレチだったようで回答頂けなかったので、こちらで質問させてください。
あるデータを連続分布関数でフィッティングしてパラメータを決めたいのですが、累積でやるのと階級に区切ったヒストグラムでやるのはどちらがいいのでしょうか?
869:132人目の素数さん
20/02/05 08:39:16 EMFhdap/.net
累積じゃないか。
最小二乗法でフィッティングできない?
870:132人目の素数さん
20/02/05 18:12:00 CqhwK2bl.net
両方試して、実運用の成績が良さそうな方を使う
871:132人目の素数さん
20/02/05 18:23:56 X0ZPE/3a.net
自力で勉強だとどこくらいまでいけるかな
872:132人目の素数さん
20/02/18 01:50:07.55 MRffbEd5.net
>>847
俺も累積だと思うんだけど。
階級に区切るほうだと、階級幅をこっちで決めなきゃいけないからいらんパラメーターが増えるのがデメリットだけど、メリットあるのか?
どっちも最小二乗法は使えるよね。
873:132人目の素数さん
20/02/18 07:47:57 u7S9BjHY.net
最小二乗法が使えるかどうかはデータの誤差分布がどうなっているか次第なので実際のデータを見ない限り最小二乗法が使い物になるかは誰にも分からない
874:132人目の素数さん
20/02/25 22:11:40 i9jNym3/.net
日本統計学会の春季大会は中止になりました。
875:132人目の素数さん
20/02/28 14:03:26 +BoqDQ44.net
アメリカの株のセンチメントの悪化が1万年に1度の発生確率って本当ですか?
URLリンク(imgur.com)
876:132人目の素数さん
20/02/28 17:26:29 3mNEM8z5.net
収益率に正規分布を使うと大変な間違いになります。
株価は非線形的な反応をします。
ポートフォリオは毎日リスクにさらされます。
877:132人目の素数さん
20/02/28 17:35:43 zqjyPXbo.net
>>854
正規分布って線形ではないよね
株価とかがランダムウォークしたら正規分布にならない?
878:132人目の素数さん
20/02/28 17:36:54 zqjyPXbo.net
ポートフォリオがリスクにさらされないと価格変動はなくなるからキャピタルゲインを得られない
879:132人目の素数さん
20/02/28 17:49:00 3mNEM8z5.net
>>855
平時はそうだけど
裾はもっと分厚い
非線形というのは例えばコロナだけの問題ではないということで
連鎖反応がある
880:132人目の素数さん
20/02/29 01:12:54 9VrNPLAR.net
> センチメント分析とは、文字通り消費者の「センチメント = 感情」を分析する
> ことを意味します。ウェブ上に投稿されたコメントなどを分析することによって、
> 消費者が持っている感情がネガティブなのかポジティブなのか、また、どの程度の
> 強さなのかを知ることができます。
そのセンチメント分析が何をどういう方法で分析したのか不明なのだから、
5σと言われても、さっぱりなんのことやらわからんよ。
単に否定的な単語の出現頻度が上昇したとか、そんなところだろ?
だって、テレビも新聞もウィルスの記事だらけ。
そんなの分析したら極端な結果になるんだろうね。
だけど5σと判断した基準がわからんのだから、
さっぱり意味不明だね。
その意味不明だということが理解できない人が、馬鹿ということ。
つーか、非線形と線形がどういう意味なのか
知ってる奴がいないということに驚
881:いてる。 少しは勉強したほうがいいね。
882:132人目の素数さん
20/02/29 07:47:57.93 HVbT+JBd.net
>>858
線形、非線形を知っているのがいないってどうやって確認したの?
確認できない→いない
と判断した?
883:132人目の素数さん
20/03/01 00:47:01.48 xtXMQc/Z.net
SPSSで2グループの判別分析をおこなうと、正準判別関数と分類関数が出力されます。
この二つの違いは何でしょうか。
実際に分類を行う場合には、分類関数を使用するのでしょうか。
884:132人目の素数さん
20/03/10 23:31:53 qimc2JEn.net
初めてこのスレに来た!
データ分析のために統計学を学ぼうとしていて、調べるとちょうど6月に検定試験があってちょうどいいなと思ってた今日この頃
皆さんは受験しますか?
885:132人目の素数さん
20/03/11 01:44:41.71 EAYVYeBW.net
>>851
たまに真顔でこういう人がいるから困る
検定と推定は別物な
>>840
841がおかしいけど
センセーショナルなほうがもてはやされるんだろうね
886:132人目の素数さん
20/03/11 09:35:31 BYdSeDgC.net
>>862
R2が小さくても使えると?
887:132人目の素数さん
20/03/11 11:43:01 SrjUptyu.net
使える=計算して何らかの結果が出せる、という意味なら使える
使える=計算して得た結果が役に立つ、という意味なら使えない
888:132人目の素数さん
20/03/11 11:50:18 BYdSeDgC.net
>>864
計算可能かどうかは学問的には興味があるだろうけど
最小二乗法を学問的に研究しても面白くないんじゃないか?
事業とかの役に立つという意味で使えるという用語を使用する人が多いだろうよ
889:132人目の素数さん
20/03/11 20:11:15 pvvBKa5t.net
誤差が正規分布はblueの条件じゃないことをいいたいんだろう
正規分布に従っていればモデルのフィッテングがいいわけじゃない
決定係数が高くても外れ値で見かけ上の直線性になっているだけかもしれない
相関係数の検定結果で悦にひたっていた人を思い出すわ
890:132人目の素数さん
20/03/11 21:08:54 KSMk05c1.net
だから結局は実際のデータをプロットしたりして見てみないとどんな方法が最適かなど誰にも分からない
あらゆるデータに対して有用な結果を出せるような都合のいい手法など存在しない
891:132人目の素数さん
20/03/12 00:19:32 oP6dIOya.net
データを重視するって大事だよねー
892:25
20/03/21 22:18:20 OJKhoHNQ.net
人がいないので、質問を破棄します。
どうぞよろしく。
893:132人目の素数さん
20/03/21 22:22:48 OJKhoHNQ.net
>>869は間違いなので無視してください
すみませんが、確率論統計学オタクの方々、日本のコロナウイルス感染者数を
計算できませんか
このコロナ騒ぎ以来日本政府はなんか態度が怪しげで外国のように検査数を
増やすつもりもないようです。
そこで、実際の感染者数をなんとか計算でだせないかと。
3月20日現在の、感染者数
日本国内 1015人
重症者49人
死亡者35人
致死率は1%から2%
NHKが毎日更新してる新型コロナの日本のデータ
URLリンク(www3.nhk.or.jp)
ジョンズホプキンス大学が毎日更新してる新型コロナ世界の感染者数
URLリンク(gisanddata.maps.arcgis.com)
よろしくお願いしますm(_ _)m
894:132人目の素数さん
20/03/22 00:39:49 lg1RjcFm.net
医療体制も国民の意識も栄誉状態も国内外の移動の頻繁さも全く違う国のデータを並べて一体何が推定できるようになると思っているのか
895:132人目の素数さん
20/03/22 01:21:28 fIGjbcow.net
よろしくお願いしますm(_ _)m
896:132人目の素数さん
20/03/22 01:27:33 a1rnwvta.net
海外と比較して優位な差があるとかは分かるかもしれない
その理由はなぜかは海外との違う点が候補になるくらいじゃないかな
897:132人目の素数さん
20/03/22 09:49:16 u67prFqL.net
>>870
ガイガーとか地面においてたタイプの人?
898:132人目の素数さん
20/03/24 21:56:25 JJA4CvUW.net
統計学を1から勉強してるけど難しいな
アウトプットが足りない
899:132人目の素数さん
20/03/26 08:48:13.00 KpkCprwW.net
例えば、現在の都内の感染者数は正しいと仮定して、
都内の1ヶ月後の感染者数を
予測してみよう。
n:現在の感染者数を120人
d:接触率(1日に1人が何人と濃厚接触するか人数)=5人
c:感染率(人と濃厚接触して感染させる確率)=20%
M:都内の昼間人口
難しいのは感染者同士なら感染しない
一度感染した人は感染しないこと
また接触率を一定とする.
これから仕事なので
続きはまた後で・・・
900:132人目の素数さん
20/03/26 09:22:24 iPGeyjQw.net
マルコフ連鎖?
901:132人目の素数さん
20/03/26 15:38:09.17 Enner7kW.net
感染者数を教えてください。
森岡正博
@Sukuitohananika
みんな冷静に計算してほしいけど、東京都の新コロナ感染者数は現在171人。
東京から無作為に200人をピックアップしたときに、その中に超有名人の志村けん氏が入ってる確率ってどのくらいだと思う?
現在の感染拡大ペースは我々の想像をはるかに超えてるよ。
桁違いの感染者数になってるよ。
URLリンク(twitter.com)
(deleted an unsolicited ad)
902:132人目の素数さん
20/03/26 18:41:46.26 iPGeyjQw.net
>>878
超有名人かどうかは個人を特定した時にその値をどう解釈するかというだけじゃないの?
有名人かどうかに関わらず感染する確率は変わらない
有名人だから感染する確率が高くなるとか低くなるとは思えない
個人の行動範囲とか多数の人と会う機会が多いとかは影響するかも知れないし
有名人だから街で握手したりする機会が多いなら高くなるだろうけど
行動で感染するかどうかの結果は変わるだろう
903:132人目の素数さん
20/03/26 23:02:19 pyG83tbh.net
>>878
「統計でウソをつく方法」というのを思い出したw
904:132人目の素数さん
20/03/27 00:59:55 BtjmJaHD.net
>>879
ある国の人口は100,000,000人で、
そのうちの1,000人が「有名人」です。
いま、ある感染症に、1人の有名人が罹患しました。
なお、この感染症は国民にランダムに罹患するものとします。
?この条件だけで、全国民の感染症患者数は、ほぼ100,000人と推計できるでしょうか?
?「他の999人は罹患していないことが分かっている」という条件を付け加えたとき、
上記の推計結果は変わるでしょうか?
?罹患した有名人が2人のとき、単純に200,000人と推計できるのでしょうか?
罹患している人の確率よりも、罹患していない人の確率を計算して1から引く?
よくわからない。
905:132人目の素数さん
20/03/27 08:03:46.59 4yRXOLUB.net
志村けんが感染する確率なら結構低いかもしれないが、今気にしてるのはあくまで一定以上の知名度の有名人が感染する確率だから特に都内に限定すれば大して珍しいことではない
906:132人目の素数さん
20/03/27 10:39:09.59 RlLzJRqB.net
主観ではテレビ業界はインフル蔓延しがち
907:132人目の素数さん
20/03/27 13:20:56.10 Hl3wuGgz.net
>>881
1については母比率の推定から類推できそうだけど
芸能人に限定するとランダムサンプリングではないから
少し調整が必要だろうな
908: どんな調整が適切かは判らないけど 例えば、ダイヤモンドプリンセスをサンプルに感染率の推定をしても値が妥当でないのと同じだと思う
909:132人目の素数さん
20/03/27 16:01:36 0CEq6ZGF.net
>>881
人口がN=1億で、感染者の数がA、非感染者の数がN-Aとし、有名人の数がU=1千とすると、
有名人の感染者の数がnである確率は、C[U,n]C[N-U,A-n]/C[N,A]
A=2530のとき、n≧1の確率は2.5%、A=555900のとき、n≦1の確率は2.5%だから、
これだけの情報では範囲が荒すぎて?「ほぼ100,000人」なんて言えず、?も当然言えない
A=24230のとき、n≧2の確率は2.5%、A=720600のとき、n≦2の確率は2.5%だから、
これだけの情報では範囲が荒すぎて?「ほぼ200,000人」なんて言えない
そもそも、感染者を見つけてからそのサンプルの珍しさを後出しで主張するのは反則だよね
人は大きい集合に属していたり同時に小さい集合にも属していたりするので、
小さい集合から出たサンプルであると、後出しならいくらでも都合よく主張できてしまう