こんにちはゲストさん。会員登録(無料)して質問・回答してみよう!

締切り済みの質問

散布図の回帰計算と信頼区間の設定

 2つの量に関する散布図があって、そこから回帰計算で直線近似するというのは最小2乗法のシンプルな適用事例です。さらにそこに”95%信頼区間”というものが設定されるようです(図を参照願います)。これはどういう風に計算するのでしょうか。
図はRが計算したもので、作図コマンドに”信頼区間を出せ”と指定するだけで出てきます。
 直線が最小2乗法の結果からずれると誤差が増えることは評価できると思います。誤差が大きくなると信頼性が落ちるということを評価するのでしょうか。誤差と信頼性(%)の関係が示されないと具体的な数値が出せないと思うのですが。あるいは別の考え方かもしれませんが、信頼区間をどのように決めるのでしょうか。

大変申し訳ございませんが、この投稿に添付された画像や動画などは、「BIGLOBEなんでも相談室」ではご覧いただくことができません。 OKWAVEよりご覧ください。

マルチメディア機能とは?

投稿日時 - 2019-12-05 18:24:36

QNo.9686640

困ってます

このQ&Aは役に立ちましたか?

0人が「このQ&Aが役に立った」と投票しています

回答(2)

ANo.2

> 直線が最小2乗法の結果からずれると誤差が増えることは評価できると思います。

ここで直線とか誤差とか言うのは何?
xとyと言う変数があってy=a+b*xという関係があるとして,それぞれの変数の観測点Nペアをx[i],y[i]すると,y[i]=a+b*x[i]+e[i],回帰直線Y=A+B*Xとなる。
ここでe[i]を通常は誤差と呼ぶのだけれど,この誤差を意味しているのかな?直線と言うのはy=a+b*xのこと?それともY=A+B*Xのこと?
なんだか言いたいことがよくわからない。

> 誤差が大きくなると信頼性が落ちるということを評価するのでしょうか。

何の誤差の話をしているんだろう?

#1さんが計算式は示しているので,それを適当な数値を使ってエクセルで図にしてみるとちゃんと計算できたのが確認できるでしょう。
母集団の真の特性であるy=a+b*xは有限個の観測点ではわかりませんが,この信頼区間と言うのは真の特性であるy=a+b*xがその範囲に入っていると95%の確率で推量できる区間を言います。

大変申し訳ございませんが、この投稿に添付された画像や動画などは、「BIGLOBEなんでも相談室」ではご覧いただくことができません。 OKWAVEよりご覧ください。

マルチメディア機能とは?

投稿日時 - 2019-12-05 21:43:21

お礼

回答ありがとうございます。用語の間違いがありました。最小二乗法の原理は推定値(直線上)と実際のデータの差分の2乗和が最小になるように決めたわけで、その2乗和を誤差と言ってしまいました。誤差というとどうしても真値との差分であり、真値がわからないので誤差を評価することもできないですね。この質問の根本的な主旨はなぜ、そう言えるのかということでした。推定区間をどうして定めることができるのか?ということです。そしてそれは何かが仮定されているからではないかと思えるのですが。

投稿日時 - 2019-12-09 14:48:45

ANo.1

統計についての計算式は複雑で簡単には計算できません。
その計算の意味を理解出来たら、後は、パソコンに任せるのが現実的だと思います。
参考:
https://www.monodukuri.com/gihou/article/946

投稿日時 - 2019-12-05 19:12:17

お礼

回答ありがとうございました。実際のところ計算機によってはじき出された数値に従ってそのあとの処理を進めていくことになると思います。しかしながら、どういう風な原理でそれが計算されたかという問いを遡及させていくことも可能だと思っています(下手な考え休むに似たりと言われても)。ただし、どこかで、ここはどうしても演繹的に理解できないから近似でやっています、というところが出てきてもいいとは思います。どのように位置づけるのかということなのですが。

投稿日時 - 2019-12-09 14:54:00

あなたにオススメの質問