こんにちはゲストさん。会員登録(無料)して質問・回答してみよう!

解決済みの質問

同等性の検定について

現在、無作為の抽出した物の同等性の統計をどうしたらよいか困っています。

比較したいグループが5グループ有り、それぞれにかなり多くのデータを持っています。
そこで、そこの中から、1000個ずつ無作為に選択しました。

これらのグループはそれぞれが同じである事を証明したいと考えています。
差がある検定なら、色々あるのですが、差が無い(どのグループも同じ)と言うにはどうしたらよいでしょうか?

統計学の初心者ですので、分かりやすくお教えいただければ幸いです。

かなり漠然とした質問になっているかもしれません。
ご意見・ご指摘を頂戴しましたら、その都度お答えさせていただきますので、宜しくお願いいたします。

投稿日時 - 2009-01-28 05:12:18

QNo.4667400

困ってます

質問者が選んだベストアンサー

かなり長い回答になってしまいました。
(計算間違いをしてなければいいのですが…)
わからないところがあれば補足してください。

> 教えていただいたURLを拝見させていただいたのですが、この検定の内容は分かったのですが、計算式については素人なので、何が何だか良く分かりませんでした。

複雑な数式がいきなり出されても、わからなくとも当然のことと思います。


> しかし、一般的な統計ソフトに搭載されているとお聞きしたので、安心し飛ばしたのかもしれません。

もし統計ソフトを現在持っていないのなら、Rを使ってみてはいかがでしょうか?
GUIではないので少しとっつきにくいかもしれませんが、フリーソフトです。
統計ソフトRのサイト    http://www.r-project.org/
日本語の使い方のサイト  http://cse.naro.affrc.go.jp/takezawa/r-tips/r.html

Rでは、次のようにコルモゴロフ-スミルノフ検定ができます。
Rをダウンロードして、実際にやってみるといいでしょう。
頭に#がついているものは、コメントです。


### ここから下のコマンドを1行ずつ実行してみましょう。 ###

# 標準正規分布に従う乱数を10個発生させ、xに保存する。
x <- rnorm(10)
# 平均が1、標準偏差が2の正規分布に従う乱数を10個発生させ、yに保存する。
y <- rnorm(10, mean = 1, sd = 2)

# x, yの中を見てみる。
x
y

# 私の環境ではx, yはこういうデータになりました。
# > x
# [1] -0.8269207 0.7099844 -0.7690119 -0.6518651 -0.4547607 0.3805563 1.2568745 -0.5716070 -0.8341094 -0.1228892
# > y
# [1] 7.9536764 0.3226898 -2.3892380 3.0687527 1.5419668 -0.6778318 0.5084741 1.5935735 1.6216679 2.7330914

# コルモゴロフ-スミルノフ検定
ks.test(x, y)

# 上のデータでは以下の結果が出力されます。
# Two-sample Kolmogorov-Smirnov test
#
# data: x and y
# D = 0.6, p-value = 0.05245
# alternative hypothesis: two-sided
# 有意水準5%では棄却されませんでした。

### 実行はここまで ###



> この検出力、今まであまり聴いたことが無く、少し調べてみると、異常を判断する力とかかれており、いまいちピンときません。
> 申し訳ないのですが、検出力に関して噛み砕いてご説明いただけないでしょうか?

さて次に検出力についてですが、検定には第一種の過誤(Type I error)、第二種の過誤(Type II error)の2種類の誤りがあるのは理解されているでしょうか?
第一種の過誤は、帰無仮説が正しい場合に誤って棄却されてしまうことで、第二種の過誤は、対立仮説が正しい場合に正しく棄却されないことです。
検出力(power)は、1-(第二種の過誤)で定義されます。つまり、検出力とは対立仮説を正しく棄却する確率のことです。


> そして、検出力がわかった所で、何が分かるのでしょうか?

例えば、表の出る確率が0.55であるコインがあったとしましょう。
通常、この表の出る確率は未知ですので、このコインの表の出る確率が1/2かどうかを知りたいとします。
コインを投げる回数はとりあえず10回としておきましょう。

帰無仮説は「コインの表が出る確率は1/2である。」で、対立仮説は「コインの表が出る確率は1/2ではない。」となります。
コインの表の出た回数が1以下か9以上なら帰無仮説は棄却されます
しかし、表の出る確率は0.55なので、コインの表が1以下か9以上になる確率は0.02775935で、これが検出力になります。
つまり、0.55-0.5=0.05という差はコインを10回投げた程度では検出できないということです。

さて何度もいわれているように、統計は違いを見つけるには便利なのですが、通常の検定では同じであることがいえません。
それでは不便ですので、どうにかして同じであることを示したいことがあります。
コイン投げでもサイコロでも何でもいいのですが、表がでる確率が1/2のコインやそれぞれの目がでる確率がどれも等しく1/6であるサイコロは現実には存在しておりません。
しかし、それを理由にコイン投げをやめたり、サイコロを使わなかったりすることがあるでしょうか?
おそらく誰もがある程度の差は許容しているはずです。

同等性の検定は、検定を実施する前に許容できる差(それ以下なら同じとみなす差)とその差をどの程度の検出力で検出したいかを設定し検定を行い、その結果、棄却されなかったら同等であるとみなし、棄却されたら違うと結論付けます。

また、先ほどのコイン投げの例で説明します。
そして、このコインの表のでる確率が1/2であるかを有意水準5%、0.5から±0.01以上の差を検出力90%で検出できる検定することを考えます。

コインをn回投げたと仮定すると、帰無仮説ではnが正規分布近似ができる位大きいとすれば95%の確率で0.5-1.96/2/sqrt(n)から0.5+1.96/2/sqrt(n)の範囲で表が出ます。
表がでる確率が0.49の場合に0.5-1.96/2/sqrt(n)から0.5+1.96/2/sqrt(n)の範囲外になる確率が90%になるようなnを求めます。
表がでる確率が0.51の場合に0.5-1.96/2/sqrt(n)から0.5+1.96/2/sqrt(n)の範囲外になる確率が90%になるようなnも求める必要があるのですが、分布が0.5を中心に対称なので計算の0.49の場合だけを求めるだけでよい。
また、0.49の場合に求めたnなら0.5±0.01の範囲外のどの値でも、検出力90%を確保できていることに注意してください。
こうして求めたn回以上(上の例では26228回以上)、コインを投げれば、このコインの表がでる確率が0.5であるか否かをはっきりと結論付けることが可能となります。
(勿論有意水準5%、0.01以上の差を検出力90%でという条件がありますが)


> また、この検出力ですが、今回教えていただいたコルモブロフースミルノフ検定に用いるのでしょうか?
> それとも、No.1~3で教えていただいていたウェルチの検定に用いるのでしょうか?

上の説明からもわかるかと思いますが、どんな検定でも検出力を考えることができます。
コルモゴロフ-スミルノフ検定でもいいし、ウェルチの検定でも原理的には使うことはできます。
ただ、検出力の計算が結構難しいのです。
カイ二乗検定、F検定やt検定ならテキストを知っているのですが、コルモゴロフ-スミルノフ検定ですと私の手には負えそうにありません。

テキスト  永田 靖, サンプルサイズの決め方, 朝倉書店(2003)


> 例えば、両方に用いた場合(同じように用いれるのかどうか分かりませんが、)違いが生じるかもしれませんが、その違いはどのように考えたらよいのでしょうか?

これは比較しているものが異なるので、違いが出てもおかしくは無いでしょう。
(コルモゴロフ-スミルノフ検定は分布の位置と形の差を見るものですし、ウェルチの検定は平均の差を見ていますので)

投稿日時 - 2009-02-03 23:24:22

お礼

お返事大変遅くなり申し訳ありませんでした。
(普段はメールが回答を案内してくれるのですが、OKWAVEのメールが迷惑メールとして処理されていました。)

本当にわかりやすい説明ありがとうございました。
自分なりにも頂いた以前のご回答から調べてみたり、したのですが、どうしても釈然としませんでしたが、quaestioさんのご回答から雲間から一筋の日の光が差した気分です。

本当にありがとうございました。

投稿日時 - 2009-02-12 10:34:55

このQ&Aは役に立ちましたか?

3人が「このQ&Aが役に立った」と投票しています

回答(6)

ANo.5

>○○水準○%以下の検定値を得たので、AとBには差がない!」などとできない物かと単純に考えていました。
教科書の信者は、想いつかないので、私は好感を持てました。といっても、No1で書いたように、私もどっぷりつかりましたから、自己弁護もあるでしょうが。もがいてもがいて、その結果たどりついたのは、2つの集団で差がない、というのは現実にはありえない。統計学がそこから出発しているのなら、「差がない」の証明は不可能、ということです。
 有意差も、5%とか1%とかで判定します。1%であっても、100回に1回は、有意差あり、の結論は間違いかもしれない、が目をつむろう、と決め(誰がきめたのかは知りません)、それを他の人も認めた、それが統計学の世界です。
 差が無いも、平均値に5%あるいは1%の差なら、「差がない」と決めてしまえば、その検定は簡単です。ただし、私が提案しても、誰も賛同・納得してくれない、と思います。また、現実には、5%どころか1%の差でも、困る人も多いので、何%で差がないと判定するのか、の基準が困難でしょう。
 ついでに書いておけば、有意差は1%の危険性は許されます。が、私が「浮気をしていない」と100回返答をして、1回は、浮気をしていないか、したのかが不明では、家内は許さないと想います。

>実際、p値に0.88や、0.25などの数字が出た場合に、この数字には何かしらの意味があるのでしょうか?
最近のパソコンは、危険率を簡単に計算できるので、p<0.0001なんぞの記述を見ますが、全く意味がありません。
 5%と1%は、統計学の約束事。制限速度60kmのところで、80でも100でも200でも、違反は違反、です(スピード違反は罰金の額が違いますが)。「誰もはしっていないから、100kmにしろ」と言っても、誰も見向きもしないでしょう(公安委員会の偉いさんになれば可能かも)。

>棄却できなかったからと言って、0.9も0.1も同じと扱ってよい物でしょうか?
 検定の場合、「有意差がみられない」は、統計学的には無価値です。統計学的には、五十歩百歩で同じです(五十歩と百歩では違う、という人もいますが)。

繰り返しになりますが、統計学(正式には推測統計学)による検定゛の目的は、「有意差あり」の証明であり、主張できるのは、「有意差あり」の結論だけ。「差がない」(第2の罠)、「差が大きい」(第3の罠?)は、統計学では証明・主張・記述できません。
 平均値が10.0と10.01なら、「差は、0.01だった」までは事実なのでデータの科学的です。「ほとんど差がない」という表現は、統計学では証明できません。しかし、本人の感想・考えを拒否はできないので、学問の世界での主張は自由です。ただ、他の人を説得できるかどうかは、全く別の次元の問題です。

 ただ、私の考えは、教科書とは少し違うかも。というよりも、教科書で書いていない部分です。
 正否の判断は、ご自身で。

投稿日時 - 2009-01-31 13:14:57

お礼

返事が遅くなり、大変申し訳ございません。
毎回、同じ事をお伺いし、その都度丁寧にご回答いただき、本当にありがとうございます。

今回一連の中で色々分かってきたことがあり、自分のノートにまとめさせていただきました。

このような場で質問させていただくと、一般の書籍や教科書に書かれていないような事を教えていただけるので、自分にとってしっくりいく所が多く、感謝をしております。

色々ご教授賜りありがとうございました。

投稿日時 - 2009-02-02 22:55:13

5つの標本の分布が全て同じであることを検定したいのですね。

それでしたら、コルモゴロフ-スミルノフ検定(Kolmogorov-Smirnov test)を用いたらどうでしょうか?
検定方法については参考URLをご覧ください。
(日本語版Wikipediaにも項目がありますがあまり参考になりません。)
一般的な統計ソフトなら、コルモゴロフ-スミルノフ検定ができると思います。

ただし、コルモゴロフ-スミルノフ検定は2標本までしか検定できませんので、5つも標本があると多重比較を行わないといけません。
そうなると、検定の多重性の問題が生じますので、有意水準を全体で目的の値以下になるように調整しないといけません。
これについても参考URLをご覧ください。

言うまでもないでしょうが、No.1~3でも書かれているように、コルモゴロフ-スミルノフ検定で帰無仮説が棄却されなかったとしても分布が同じといっているわけではありません。

あと、No.3での補足質問に関してですが、検出力について調べてみてください。

参考URL:http://en.wikipedia.org/wiki/Kolmogorov-Smirnov_test, http://ja.wikipedia.org/wiki/%E6%9C%89%E6%84%8F

投稿日時 - 2009-01-30 21:38:29

補足

返事が遅くなり、大変申し訳ございません。

新しい検定方法を教えていただきありがとうございます。
始めて聞く名前に少々戸惑ってしまいました。
教えていただいたURLを拝見させていただいたのですが、この検定の内容は分かったのですが、計算式については素人なので、何が何だか良く分かりませんでした。

しかし、一般的な統計ソフトに搭載されているとお聞きしたので、安心し飛ばしたのかもしれません。

さて、ここで質問が有ります。
ご回答いただいた中で、検出力というお話が出てきました。
この検出力、今まであまり聴いたことが無く、少し調べてみると、異常を判断する力とかかれており、いまいちピンときません。
申し訳ないのですが、検出力に関して噛み砕いてご説明いただけないでしょうか?
そして、検出力がわかった所で、何が分かるのでしょうか?

また、この検出力ですが、今回教えていただいたコルモブロフースミルノフ検定に用いるのでしょうか?

それとも、No.1~3で教えていただいていたウェルチの検定に用いるのでしょうか?

例えば、両方に用いた場合(同じように用いれるのかどうか分かりませんが、)違いが生じるかもしれませんが、その違いはどのように考えたらよいのでしょうか?

大変漠然とした質問になっているかもしれませんが、統計学の初心者ですので、平易にご回答賜れば幸いと考えております。
宜しくお願いいたします。

投稿日時 - 2009-02-02 22:58:54

ANo.3

>グループの同一性
検定の目的は、同じグループから抽出したサンプルにしては、差がありすぎる、偶然にこんな差があるとは考えられない、だから「有意差あり」を出すのが目的。言い換えると、差がない(=同じである)、の表現を使うのは、誤りです。
 この根拠は長らく見つけられず、どこでも書いてなかったのですが、ようやくNo1で書きこんだように、平均値に、1であろうが0.001であろうが、差は差。すなわち、全サンプルを検査し、その平均値が完全に一致しない限り、「差はある」という事実から、「差は無い」という結論は出せない、と悟りました。平均値A群は10g、B群も10g、だから差はない、と主張しても、もうひと桁測定したら、どうなる、と質問されると、反論できません。
 繰り返しになりますが、母集団のデータを全て使用すれば、必ず差があります。そこから抜き出したサンプルを使って検定をするのは、母集団のでデータが多すぎるとか、蛍光灯の寿命のように全部を使うと売る物が無くなるとかの理由で、母集団の代わりにするためです。母集団に差があるのなら、その代りにも、差があるのは当然で、同一の証明は無理です。

 ウェルチの検定は、平均値の差の検定ですが、分散が同じと違う場合で、検定の方法(判定の式?)異なるようです。そこで分散が同じ、と判定しているハズなのですが、この部分の利用ができるかもしれない、とアドバイスしました。

 回帰分析は、秤AとBの性能は同じか、の場合には適用できます。
品物1、2、3、・・・について、秤AとBで測定する。Aの値とBの値の交点に点を打つ。この天の集まりが、1本の直線(曲線でもOK)になりやすいほど、一致度が高い、という手法をとります。「同じある」ことに論究できるのは、回帰分析しか知りません。
 書き込みを読んだ限りでは、回帰分析に持って行けないような印象があります。お役にたちそうもありませんが。

>重さを量って、結局このお菓子の袋には行っている物はみんな同じぐらいと言う事を言いたいのだと思います
このお菓子は、この袋から出した物と考えてよいか、というのなら、普通の検定です。
1) 袋の中からサンプルを取り、平均と標準偏差(σ)を求める
2) 平均±2σ(有意水準5%の場合)の範囲なら、同じ袋と判断
 というのは、ありますが。

 Aの袋とBの袋のお菓子の重さは、同じと考えてよいか、というのは、統計学ではできません。全てのお菓子の重さを量れば、1.0にせよ、0.001にせよ、平均値に差があるからです。

投稿日時 - 2009-01-29 17:29:17

補足

毎回、丁寧にご回答頂き本当にありがとうございました。
結局は、この世の中は全く一緒という物は存在しないから、同じに見えても、大なり小なり差があるため、それを証明するには検定を行って、示すという事になるのですね。

毎回同じ事を書いて申し訳ないのですが、僕は統計の初心者のため、
例えば
「帰無仮説でAとBには差がないとして、計算をしたら、有意水準5%以下の検定値を得たので、だからAとBには差がある!」
と言う物を逆手にとって、
「帰無仮説でAとBには差があるとして、○○水準○%以下の検定値を得たので、AとBには差がない!」
などとできない物かと単純に考えていました。
今までのお話を読ませて頂くと、こういう事を考える事自体、統計学の話ではないと言う事だと思いました。

最後に単純に疑問に思っている事を書かせて下さい。
検定の世界ではp値という物を使って、仮設を棄却したり、できなかったりで、この数値1つですべてで、報告書や論文の書き方が違ってくるように思えます。
実際、p値に0.88や、0.25などの数字が出た場合に、この数字には何かしらの意味があるのでしょうか?
極端に言えばp=0.1とp=0.9では共に、帰無仮説を棄却できません。しかし、数字的には大きな差があります。
棄却できなかったからと言って、0.9も0.1も同じと扱ってよい物でしょうか?

正規分布で考えると、1に近づけば近づくほど、山の大きな部分に近くなると言うイメージはあるのですが、差の検定で1に近づくというのは度言うイメージを持ったらよいのでしょうか?

なんだか、曖昧な表現になってしまいましたが、あわせてご教授頂ければ幸いです。

投稿日時 - 2009-01-30 12:58:55

ANo.2

失礼な書き方をして、申し訳ありません。
 統計学の書き込みでは、学生が卒論などで、指導教授の許可もなく、アイデアが盗まれる危険性も考慮せず、もちろんアドバイスに対する「謝辞」の配慮もなく、・・・、というのが多いので。

No1です。事情は、理解しました。
 私が浮かんだのは、「宝くじの確率は、同じである」で、悪戦苦闘したことがあります。○の次に、×がくる確率をプログラムするのに、どことなく似ている気がするのですが。

 同等性の検定は、一つだけその判定をしている検定法があります。2群の平均の有意差判定に、ウェルチの方法があって、検定の前提に、分散の同一性の判定があります。私は、『分散が違っていれば、別のグループ』、それは、2群が違うのだから、検定以前にグループ間で差があるのは明白、有意差ありだろう、ということで、この方法を使ったことはありません。
 実際に、どのように同じと判定しているのか知りませんが、統計学の教科書で、グループの同一性の判定をしているのは、これ以外に読んだことがありません。初心者ですので、『似たようなものはないか』と、本はアレコレひっくり返していますが。

 回帰分析をご存知なら、標準液の濃度と測定値、あるいは一定時間後の値と測定値、のように、2次元のデータで表せるなら(データを散布図にできるなら)、回帰分析の相関係数(私は決定係数を使いますが)で、一致度なら判定できると考えます。
 学生時代に、「データは、検定法を考えてから収集」の授業を受けたとき、その意味がわからなかったのです。が、この場合も、散布図として表わせるようなデータに変換できるなら、回帰分析でしょう。

>以前の研究の時は先輩にも「そんな統計無いじゃない?」と言われた事があるので…
検定の目的は、「有意差あり」を見つけること。当然でしょう。
回帰分析も、相関係数からt検定をして、こんなに相関係数が高くなるのは偶然ではない、と判定して、一致すると結論するわけけですから。

 乱数表からのデータだと、傾向がないので、回帰分析は無理でしょう。
 乱数表でデータを得られれば、同一性は、検定するまでもない、というのが数学の常識では。そうでないと、乱数表を利用する意味がありません。
 ただ、乱数表は無限、が前提。少数例は、異なるのも同然。乱数表での少数例の差異(実際の確率)、なんぞで論文がかけるかも。ただし、少数例を増やせば無限に近くなるので・・・。
 釈迦に説法の点は、ご容赦を。

 以上、お役にたちませんが、同一性、差がない、というのは、私の能力以上に、統計学の限界だと考えいてます。

投稿日時 - 2009-01-28 14:17:41

補足

早速のお返事ありがとうございます。
そして、わかりやすい解説感謝しております。

さて、ウェルチの検定ですが、私の認識「分散も2倍以上異なり、データ数も2倍以上違う時に使う検定」と単純に考えていました。
今回、データ数は一定にそろえてあり、分散値も2倍以上異なっていないので、この検定はノーマークでした。
私も同意見で、分散値も違うデータなのだから、当然有意差がでるだろうと思いこんでしまいます。しかし、kgu-2さんがお持ちの教科書に唯一同一性の検定ができると書かれているのですから、多分何らかの方法があるのだと思います。
検定方法の名前だけでも教えていただけたので、ここから少し本などをひっくり返してみたいと思います。

次に回帰分析ですが、あまり突っ込んで知らないので、少々教えていただけたらと思います。
回帰分析ですが、この条件の中にはデータ間の対応が必要なのでしょうか?

私のデータで、散布図を書く事は可能ですが、この場合、データ同士の対応がないです。
乱数表の使用理由とあわせてご説明させていただくと、今回のデータは2つ以上の同等と見なされる(見なしたい)物体から、ランダム(乱数表使用)にデータを抽出してきて、それぞれのグループが同じかどうかを検定したいと思っています。(何回もすいません)
つまり、乱数表で選ばれたデータを1000個ほど選んでいるので、AグループとBグループの対応はとれていません。
しかし、単純にエクセルデータに並べて、表(散布図)は書く事できます。
当然、AグループやBグループからデータを引っ張ってくる事は何回でも可能ですので、毎回違うデータで並んだ散布図を書くための表は作成可能です。

たとえで書かせていただくと、同じ工場が作っているお菓子が袋に入っていて、子供達がそれを無作為に毎回取り出して、重さを量って、結局このお菓子の袋には行っている物はみんな同じぐらいと言う事を言いたいのだと思います。


では、このデータをもとに、それぞれ相関係数(決定係数)を用いてかなり高い数値が出たとしても、対応のないデータですから、たまたまよかったのではないかという事になりかねません。
同じように、何回も何回も試して、かなり高い相関が毎回得られても、では、この相関係数は信頼できるのかどうかが、今度はこれが検定の材料になってきてしまいます。
つまり、出した相関係数が信頼性が高いかどうか?

こうなってしまうと、何が何だかわからなくなってしまうような気がします。

とりとめのない補足になってしまいましたが、ご理解いただき、もしよろしければ、ご助言いただけたらお思います。

投稿日時 - 2009-01-29 12:10:47

ANo.1

>差が無い(どのグループも同じ)と言うにはどうしたらよいでしょうか?
ありません。
 たとえば、1000個のデータについて、Aグループは10.00002±0.5、Bグループは10.00003±0.5、の場合、差があるのか、無いのか、ということです。数学的には、0.00001の差が平均値にはあります。ほんの僅かでも、差は差、です。グループごとにこの程度の差はあると推定されるので、「差が無い」という結論は無理なのです。
 有意差のように、1%以内なら差はない、と学者が決め、世間が認めれば別ですが。しかし、現実の社会では、1%の差が許される場合と、0.001%でも許されない機器もあり、統一できるとは想えません。

 例外的に、一致するか否かを検定する方法があります。回帰分析ですが、データが分からないので利用できるか否かは、判断できません。
 データを提示される前に、
1) お立場を書いて下さい。学生のなのか、個人の趣味なのか
2) 卒論など、指導者がおられるのなら、インターネットでの助言をOKされているのかどうか。
3) 2)がイエスの場合、もう一つ質問がありますが、。

 それと、内容を書かれると、「研究を盗まれた」という可能性も否定できませんので、その覚悟はしていて下さい。学生がこのような書き込みをすると、「私の学生なら追放」と断言しています。

>統計学の初心者ですので
初心者が陥る第一は、データがあるので、なんとかしてくれ。第二は、「差がないことを示したい」で、私が「初心者の罠」と呼んでいるのに、首までつかっています。
 第一の罠は、検定法に合わせてデータを収集する、のが常道です。こんなデータなら、この検定法が使えるのに、というのは多いので。ただ、なんとかなる場合が多いのですが。
 第二の罠は、統計学の教科書から抜け出すときに、誰しも陥るようです。私が、差がないことは証明できない、と言えるようになるまで、たぶん2年くらいかかりました。どこにも書いていないので。

 偉そうに書きましだか、私も初心者です。多重比較はできません。賢くないので、初心者がどこで躓くのか、だけはタップリ経験し、どこが分かりにくいのかだけは理解しています。

投稿日時 - 2009-01-28 10:46:40

補足

ご回答とご助言ありがとうございます。

まず、私の立場ですが、留学しているので、今の立場は学生です。
そして、この今回の質問は以前から疑問に思った事と、日本に置いてきた研究の続きをやっています。
以前の実験で日本にいた頃も、同じような同等性の比較をしたかったのですが、結局、t検定をして差がないと言う事から、そのまま報告書をまとめた事があります。
また、指導者などはいなく、私主導の研究なので、もしかしたら研究と言うより個人の趣味に走っている可能性もあるかもしれません。

そして、研究を盗まれると言う可能性は全く出ないと思います。
研究の核心については出しておらず、方法論を教えて頂きたいだけなので、もし仮にデータを出してもそのデータが何を意味して何を考えているのかは多分おわかりにならないと思います。

(お返事を頂戴した時に、書いてある所がかなり私の考えているデータの集団に近い事、そして”機器”と書かれている所はかなりドキッとししました。もしかしたら私の前の質問を読まれたのかもしれません。今回の、実験は機械を使っているので、その機械の開発と思っていただければよいです。)


私は初心者の罠にはまっているのは確かだと思います。
データが出たから統計でなんとかなると統計をTOOLとして考えている所があったのだと思います。
統計(検定法)から逆に研究の骨組みを考えるのが筋だと思います。
しかし、今回の場合すでにデータを取る方法論が決まっていたので、そのデータと統計をどのように結びつけるのかが少々難しく、以前と同じような同等性の確認をすればよいと安易に考えていたのは反省すべきところだと思います。

さて、本題に戻りますが、やはりないですか…
以前の研究の時は先輩にも
「そんな統計無いじゃない?」
と言われた事があるので…

データは莫大な量あるので、すべてを提示する事ができません。
申し訳ありません。
と言うのも、計算プログラムでなんとでも数字が出てくるためです。
一応、1000個のデータでとどめているのですが、出せば無限に出てきます。
つまり、そのデータ群ともう一方のデータ群が同じようなのかどうかなのです、その出し方も乱数を用いてデータを出しているので、例えばAグループとBグループとCグループが対応をとれていません。
私も回帰分析のように、相関係数を求めそれが相関が高ければよしという方法を考えたのですが、例えばAグループの1番目とBグループの1番目が同じように計算された事はまず無いので…
だからグラフを書く事もできずに、ただそれぞれのグループの平均値とSEMや分散値をながめて、同じような気がする。
と言う判断に頼っています。

最初の質問の中でも描かせてもらったのですが、統計の初心者ですので、希望としては
お互いのグループの平均値や分散値を見て、何%の確率で同じと言えるような検定があればと思っていました。

色々書かせていただきましたが、ご助言いただければ幸いです。

投稿日時 - 2009-01-28 11:04:32

あなたにオススメの質問