巨人の肩の上に登る

先人の積み重ねた発見に基づいて、なにかを発見しようとすることを指す。

R を用いた相関係数と無相関検定

無相関検定

帰無仮説を「両変数間に相関がない」とする.
p値が p < 0.01, あるいは,p < 0.05 であれば,帰無仮説が棄却され,「両変数間に相関がないとはいえない」となる.

Rでの例

サンプルデータとして,下記の data.tsv を用いる.
下記のデータの一列目と二列目は,明らかに負の相関である.

10    1
9   2
8   3
7   4
6   5
5   6
4   7
3   8
2   9
1   10

次に,Rを用いて無相関検定を行う.

$ R
> data <- read.table('data.tsv', sep='\t')
> cor.test(data[,1], data[,2],  method="pearson")

    Pearson's product-moment correlation

data:  data[, 1] and data[, 2]
t = -134217728, df = 8, p-value < 2.2e-16
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -1 -1
sample estimates:
cor
 -1

p-value は最小値を取り,相関係数は -1 となる.

Rを用いた無相関検定の方法

methodオプションには次の三つがあります.

  1. "pearson" : ピアソンの積率相関係数
  2. "kendall" : ケンドールの順位相関係数
  3. "spearman" : スピアマンの順位相関係数