11/11/08 23:08:43.74 kqliEKPh
花王のデータ
URLリンク(www.kao.com)
これを見て思ったんだけど
44名中カテキン群と対照群でそれぞれ2名が外れ値として除外されてるよね
統計ってよく分からないんだけど
平均値±(3×標準偏差)の中に通常は100%含まれるから、
それを外れる数字は1%未満のレアケースとして「除外の候補にする」
という考え方でいいんだよね?
表を見ると-2500歩から10000万歩くらいまでが対象になってるようだけど
44名中4名は異常に沢山歩いたから除外して解析したってこと?
それはレアケースとしてあっさり無視していいものなのかな?
10人に一人、をレアケースって言っていいの?
その人達を表に入れたらグラフの傾きも
「歩数あたり体重変化」も大きく変わるわけだよね?
そもそも「1000歩あたりの体重変化」っていう表現は
(この表において運動量と体重変化を比例関係として捉えるのは)
適切なんでしょうか?