こんにちはゲストさん。会員登録(無料)して質問・回答してみよう!

解決済みの質問

有意差

小生,統計に関してはほぼ素人です
以下のグループの統計処理をエクセルで行いたいと考えています
グループA:90.30,50
グループB:5,4,3
このA,Bに関してf検定を行うと0.002となり非等分散になるかと思います
なのでt検定では尾部を1,検定の種類を3とするとp値として,0.048となります
グループAとBの値を考えるともっとp値の差がでてもよいような気がするのですがどうなのでしょうか?
やはり,n数とバラつきの影響でこのようなp値になるのでしょうか?
間違いや他に適した統計処理方法があれば,教えていただけると助かります
宜しくお願いします

投稿日時 - 2007-01-23 02:38:23

QNo.2688579

すぐに回答ほしいです

質問者が選んだベストアンサー

>私の分野(医療,バイオ)では,n数が3~5程度でも,t検定で有意差を検定している論文が多々あります.

・・・普通、そういう論文はまともな査読者ならリジェクトするでしょう。一応、無理やりsample size (n=3~5)で正規分布しているかどうかを「コルモゴルフ・スミノルフ検定」を行い、正規性を仮定できる。という検定結果がでたなら、確かに数学的にはt検定を行うことは可能です。自由度df=1ですが。
繰り返しますが、このように非常に少ないsample sizeは、検定を行うべきではありません。

>それらの論文にならって,今回も検定をしてみたのですが,不適当ということでしょうか?

・・・そうです。不適当だということです。
間違った論文をならう理由がありますか?習うべきはエビデンスに基づく科学的な思考です。過去の論文が正しいという保障など全くありません。できれば、国際的にアクセプトされるレベルのテキストを購入するかして、さらに統計解析には専門家のアドバイスをもらいながら厳密に分析を行うことです。
天才物理学アインシュタインでさえ、自分の研究論文の統計手法に関しては統計学者にコンサルタントしたそうです。

※余談ですが、t検定には片側検定と両側検定があります。
事前にどちらが多くなるか普通分かりようがないので、そういう場合は両側検定を使う。
2者のうち、一方が物理的に少なくなりようがない場合のみ片側検定を使用します。

(結論)nが3の場合はt検定自体はできることがある。しかし、検出力(1-β)が非常に低いのでt検定をするべきではない。
また、仮にt検定したところで、有意水準をいくらに設定するべきか想像もつきません。

投稿日時 - 2007-01-24 20:23:52

このQ&Aは役に立ちましたか?

2人が「このQ&Aが役に立った」と投票しています

回答(3)

ANo.2

看護師です。論文に載せるものなら厳密に統計処理・解析をする必要があります。
平均値の差の検定にはt検定を使用できますが、それは2群のデータが正規分布していることが前提条件です。
サンプルサイズが、3と3でたったの6個ではデータの分布の様子(状態)の把握が非常に困難です。
正規分布を仮定できるのかどうかの検定であるコルモゴルフ・スミノルフ検定を必ず行って正規性を調べる必要があるのですが、正規性を仮定できないならノンパラメトリック検定のマン・ホイットニーのU検定で、中央値(median)をもとに検定できるものがあります。
しかし、もしもサンプルサイズが6個だけであればそれすらできません。そういう非常に少ないサンプルサイズは【検定向きではない】のです。だから、少なくともt検定はダメです。
あと、サンプルサイズが小さいとp valueは大きくでます。(有意差がでにくい)なるべく検出力powerを高くするためにsample sizeを大きくしましょう。

投稿日時 - 2007-01-24 00:45:51

お礼

ありがとうございます.
私の分野(医療,バイオ)では,n数が3~5程度でも,t検定で有意差を検定している論文が多々あります.
それらの論文にならって,今回も検定をしてみたのですが,不適当ということでしょうか?
n数が3しかない場合,検定を行うことは不可能ということでしょうか?

投稿日時 - 2007-01-24 03:09:07

ANo.1

> このA,Bに関してf検定を行うと0.002となり非等分散になるかと思います

これは合っています。Rという無料の統計ソフトでやってもp-value = 0.002141となります。

> t検定では尾部を1,検定の種類を3とするとp値として,0.048となります

この表現の意味が分かりませんが,等分散性が仮定できない場合はウェルチの検定を適用するのですよ。このp=0.048というのは通常のt検定の結果です。正しくはp-value = 0.09608です。

> n数とバラつきの影響でこのようなp値になるのでしょうか?

ばらつきも何もサンプルサイズ(データ数)が3では,いわゆる「正しい結果」は望めないでしょう。そもそも少数例のデータを扱う場合はt検定のようなパラメトリック検定ではなく,メディアン検定やマンホイットニーのU検定と呼ばれるノンパラメトリック検定を適用すべきです。しかし,それでもいかんせんサンプルサイズが小さすぎます。。。

投稿日時 - 2007-01-23 10:53:20

あなたにオススメの質問