How to calculate Fisher’s exact test with logarithm?

Chi-square test is known to compare between ratios with two-by-two table. But you couldn’t use chi-square test if total number was smaller than 20 or expected value was smaller than 5.

Even if you couldn’t use chi-square test, you could use Fisher’s exact test and calculate accurate p-value. Although the test has reliability, it requires huge amount of calculation with factorial function and software may overflow. You would easily calculate it with conversion to the logarithm first. Next, you could add or subtract the logarithm. At last, you could convert the result to the power of e, the base of natural logarithm.

  TRUE FALSE Marginal total
POSITIVE a b a + b
NEGATIVE c d c + d
Marginal total a + c b + d N 
\displaystyle \begin{array} {rcl} P &=& \frac{(a+b)!(c+d)!(a+c)!(b+d)!}{N!a!b!c!d!}\vspace{0.2in}\\&=& \exp \left[ LN \left( \frac{(a+b)!(c+d)!(a+c)!(b+d)!}{N!a!b!c!d!} \right) \right]\vspace{0.2in}\\ &=& \exp [ LN((a+b)!) + LN((c+d)!) + LN((a+c)!) + LN((b+d)!)\vspace{0.2in}\\& & - LN(N!) - LN(a!) - LN(b!) - LN(c!) - LN(d!) ]\end{array}

対数を用いてFisherの直接確率検定を計算するには

 四分表を用いて2つの比率が等しいか異なるかを検定する方法としてはχ二乗検定が知られています.しかしχ二乗検定は総数が20未満の場合や期待値が5未満のマスがある場合には用いてはならないとされています.

 そのような場合でも,Fisherの直接確率検定を用いれば正確なp値が求まります.ただし階乗計算を要するために,オーバーフローを起こす可能性があります.実際 EXCEL のワークシート関数でも階乗の引数は 170 までです.これは EXCEL に限った問題ではなく,数値のデータ型の定義域の限界と考えられます.

 この問題法は対数を用いて乗除の計算を加減に変換することです.

  1. 階乗の乗除の対数をとる
  2. 対数により乗除が加減に変換されるため実際の計算をここで行う
  3. 得られた結果を指数に戻す
  TRUE FALSE Marginal total
POSITIVE a b a + b
NEGATIVE c d c + d
Marginal total a + c b + d N 
\displaystyle \begin{array} {rcl} P &=& \frac{(a+b)!(c+d)!(a+c)!(b+d)!}{N!a!b!c!d!}\vspace{0.2in}\\&=& \exp\left[LN \left( \frac{(a+b)!(c+d)!(a+c)!(b+d)!}{N!a!b!c!d!} \right) \right]\vspace{0.2in}\\ &=& \exp [LN((a+b)!) +LN((c+d)!) +LN((a+c)!) +LN((b+d)!)\vspace{0.2in}\\& & -LN(N!) -LN(a!) -LN(b!) -LN(c!) -LN(d!) ]\end{array}

How to calculate Odds ratio, relative risk and 95% confidence interval by two-by-two table?

You can determine statistically significance with Odds ratio, relative risk and 95% confidence interval by two-by-two table which treats such binomial values which called as outcome as true or false, for example, enabled or disabled and death or survival and such binomial values which called as predictor as positive or negative, for example, with intervention or without, with exposure risk factor or without and active drug or placebo. 

Odds ratio (OR) is used for case control study. When OR is 1, the predictor has no effect. When OR is greater than 1, the predictor has positive effect to outcome. If it is smaller than 1, the predictor has opposite effect to outcome.

Relative risk (RR) is used for prospective cohort study and randomized controlled trials. It means that when RR is greater than 1 the predictor has positive effect to outcome and when RR is smaller than 1 the predictor has negative effect to outcome.

If 1 is between lower bound and upper bound of 95% confidence interval of Odds ratio and relative risk, it is not statistically significant.

  TRUE FALSE Marginal total
POSITIVE a b a + b
NEGATIVE c d c + d
Marginal total a + c b + d N 

You could calculate Odds ratio and 95% confidence interval with formula below;

\displaystyle OR=\frac{\frac{a/(a+c)}{c/(a+c)}}{\frac{b/(b+d)}{d/(b+d)}}=\frac{ad}{bc}

 

\displaystyle 95\%C.I.=\exp\left(\ln OR \pm 1.96\sqrt{\frac{1}{a}+\frac{1}{b}+\frac{1}{c}+\frac{1}{d}}\right)

You could calculate relative risk and 95% confidence interval with formula below;

\displaystyle RR=\frac{a/(a+b)}{c/(c+d)}

 

\displaystyle 95\%C.I. = \exp\left(\ln{RR}\pm1.96\sqrt{\frac{1}{a}+\frac{1}{c}-\frac{1}{a+b}-\frac{1}{c+d}} \right)

四分表からオッズ比と相対危険度および95%信頼区間を計算する

 有効か無効か,生存か死亡かなどの値が TRUE か FALSE の二項分布する名義変数をアウトカムとし,危険因子の暴露ありかなしか,介入ありかなしか,実薬か偽薬かなどの値が POSITIVE か NEGATIVE の二項分布する名義変数を予知因子とする場合,四分表により予知因子がアウトカムに及ぼす影響が統計的有意か否かをオッズ比や相対危険度の95%信頼区間により判定できます.

 オッズ比は症例対照研究に用いられ,オッズ比が1だと予知因子は何の効果もないことになります.オッズ比が1より大きいと予知因子によるアウトカムの発生が増えることになります.逆に1より小さければアウトカムの発生を抑制することになります.

 相対危険度は前向きコホート試験やランダム化比較試験で用いられ,1より大きければ予知因子はアウトカムの発生を高め,1より小さければ予知因子はアウトカムの発生が低くなることになります.

 オッズ比,相対危険度共に95%信頼区間が1を跨いでいる場合には統計的有意とはいえません.

  TRUE FALSE Marginal total
POSITIVE a b a + b
NEGATIVE c d c + d
Marginal total a + c b + d N 

オッズ比ORは以下の式で求まります.

\displaystyle OR=\frac{\frac{a/(a+c)}{c/(a+c)}}{\frac{b/(b+d)}{d/(b+d)}}=\frac{ad}{bc}

オッズ比の95%信頼区間は以下の式で求まります.

\displaystyle 95\%C.I.=\exp\left(\ln OR \pm 1.96\sqrt{\frac{1}{a}+\frac{1}{b}+\frac{1}{c}+\frac{1}{d}}\right)

相対危険度RRは以下の式で求まります.

\displaystyle RR=\frac{a/(a+b)}{c/(c+d)}

相対危険度の95%信頼区間は以下の式で求まります.

\displaystyle 95\%C.I. = \exp\left(\ln{RR}\pm1.96\sqrt{\frac{1}{a}+\frac{1}{c}-\frac{1}{a+b}-\frac{1}{c+d}} \right)