ピアソンの積率相関係数 r とそれに対する t 検定

Pocket

 xy との間の相関の程度を表す指標としてピアソンの積率相関係数 r があり,下記の式で表現します.相関係数 r は -1 から 1 の範囲にあります.

\displaystyle r = \frac{\sum_{i=1}^n(x_i-\bar x)(y_i - \bar y)}{\sqrt{\sum_{i=1}^n(x_i - \bar x)^2}\sqrt{\sum_{i=1}^n(y_i - \bar y)^2}}

\bar x and \bar y are average of x and y, respectively. i is number of sample (incremental variable). n is number of sample.

 母集団から無作為に抽出したサンプルの2種類の変数の間の相関係数 r は t 分布に従いますので有意差検定を行うことができます.

 相関係数 r に対する t 統計値は下記の式で求まり,サンプル数 n とすると自由度 n-2 の t 分布に従います.母集団の相関係数を \rho として帰無仮説を『相関係数 \rho = 0 である』とします.サンプル数 n, 相関係数 r から計算した t 統計値が,有意水準 \alpha に対応する t 統計値を越えれば帰無仮説を棄却します.

\displaystyle t = r\sqrt{\frac{n - 2}{1 - r^2}}

 ピアソンの積率相関係数 r の有意差検定について以前質問をいただきましたが,参考文献を入手しましたので追記します.実は証明など期待していたのですが,期待はずれでした.\rho についての帰無仮説を簡単に検定できる正確な方法は存在しない,と書いてありました.そのような帰無仮説に対して Fisher が近似的な方法を提供していると書かれていましたが,それ以上の記述はありませんでした.以下拙訳です.

 帰無仮説 H (ρ = 0) は次の帰無仮説と同等である.H (β1 = 0) または H (β2 = 0).そこで仮に x, y が共同二変量正規分布を取る場合,仮に検定対象の帰無仮説が真であるとすると,帰無仮説 H (ρ = 0) のための検定が得られる.

\displaystyle F = \frac{(n-2)Z^2}{XY-Z^2} = \frac{(n-2)r^2}{1-r^2}\vspace{0.1in}\\ X = \sum(x - \bar{x})^2\vspace{0.1in}\\ Y = \sum(y - \bar{y})^2\vspace{0.1in}\\ Z = \sum(x - \bar{x})(y - \bar{y})\vspace{0.1in}\\ r^2 = \frac{Z^2}{XY}

 上記の F は自由度 n-2 の F 分布に従う.同等の有意差検定として,仮に帰無仮説が真だとすると以下の式は自由度 n-2 の Student’s-t 分布に従う.

\displaystyle t = \frac{r\sqrt{n - 2}}{\sqrt{1 - r^2}}

 ρ についてのいかなる帰無仮説でも相関係数 ρ と回帰係数 β1 および β2 との間に平行性は存在しない.事実 ρ についての帰無仮説を簡単に検定できる正確な方法は存在しない.そのような帰無仮説に対して Fisher が近似的な方法を提供しているが,ここでは取り扱わない.

Pocket

投稿者: admin

趣味:写真撮影とデータベース. カメラ:TOYO FIELD, Hasselblad 500C/M, Leica M6. SQL Server 2008 R2, MySQL, Microsoft Access.

「ピアソンの積率相関係数 r とそれに対する t 検定」への4件のフィードバック

  1. いつも拝見させていただいております。
    今回、はじめてコメントさせていただきます。

    わたくしも、データの分析をするのに際し、
    2変数間の相関係数 r を上式で求めた後、
    下式によるt分布によって、 r = 0 となる帰無仮説を棄却することで
    2変数間に相関性があるかどうかという
    オーソドックスな手法を以前から使用しております。

    ところで、以前から素朴な疑問として思っていたのですが、
    下式 t = r ( ( n – 2 ) / ( 1 – r^2) )^1/2
    を用いると、何故 r が自由度 n-2 の t 分布に従うのか、
    統計学の初学者向けの参考書には、その根拠や証明などが
    まったく掲載されていません。
    下式が、あたかも当然であるかのごとく掲出されているものをよく目にします。

    つきましては、下式を用いると何故 r が自由度 n-2 の t 分布に従うのか、
    証明もしくはわかりやすい解説が掲載されている文献をご存じでしたら
    ご教示いただきたく、お願いいたします。

    ハンドルネーム T. O.

  2. T. O. 様
    はじめまして,どうぞよろしくお願いします.

    実は最近勉強を始めたところでして,ご質問の件についてお答えできるほど精通しているわけではありませんが,下記が参考になればと存じます.
    Wikipedeia.orgの参考文献から検索した結果です.
    Pearson product-moment correlation coefficient
    A Course in Theoretical Statistics
    Advanced Theory of Statistics: Inference and Relationship v. 2
    P.S.
    3番目のリンク間違いを修正しました.

  3. admin さま

    良書をご紹介いただきまして、どうもありがとうございます。

    わたくしも、これからじっくりと勉強させていただきます。

    わたくしは、工学系の出身で、数学については工学的な応用などについて
    もっぱら解析ソフトやプログラミングを通して、
    もっぱら利用させていただく立場から接してまいりました。
    統計学などは、その最たる物といったところでしょうか。

    したがって、数学のごく上澄みの部分だけ理解することで、
    分かった気になることが多いのですが、一見当たり前のように使っている
    定義式や数式でも、その奥をつきつめて考えていくことは、
    頭の中のベールが剥がれていくようで、ワクワクしますね。

    なお余談ですが、わたしも TOYO VIEW を写真撮影で愛用しています。

    最近では、デジタルカメラも普及・進歩をつづけてきて、
    普段使いなどでは、元々銀塩主義だったわたしも
    デジカメで楽させていただく機会も増えてしまったのですが、
    ここぞ、という場合は大判フィルムに絶大の信頼感を寄せています。

    なにより、ピントグラスとルーペを通して撮影対象に向き合うときの
    何ともいえない緊張感と高揚感は、大判カメラでしか味わえない世界だと
    このご時世になっても、頼りにしています。

  4. 確かに基礎となる数学からとなると大変ですね.ベータ関数とかガンマ関数とかの話になると,もう私の頭では理解できません・・・

    TOYO VIEWをお使いなんですね.細かい設定まで出来そうですが,持ち運びが大変そうですね.私は大判を持ってるくせに体力がないもので,最近はもっぱら室内撮りばかりになっています.本当はもっとフィールドに出たいのですが,なかなか・・・

    今後とも当ブログをよろしくお願いいたします.

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です