How to calculate appropriate sample size in Cox proportional hazard analysis with cross tabulation?

In this article, I’d like to describe how to calculate appropriate sample size in Cox proportional analysis with cross tabulation, a error and b error. a error is called as statistical significance or type 1 error and b error is called as type 2 error, respectively. 1 – b is called as statistical power. a is usually configured at 0.05 (two-tailed) and b is configured at 0.2 (one-sided), respectively. As a result, Za/2 is 1.96 and Zb is 0.84, respectively.

I’d like to assume that S1 is survival rate of risk group or intervention group and S0 is survival rate of control group, without risk or intervention. q is ratio of logarithm of them.

\displaystyle LN(S_1) = Exp(B)LN(S_0)\vspace{0.1in}\\\theta = Exp(B) = \frac{LN(S_1)}{LN(S_0)}

I’d like to use cross tabulation here. You can replace endpoint with death or failure.

ENDPOINT CENSOR Marginal total
POSITIVE a b a + b
NEGATIVE c d c + d
Marginal total a + c b + d N
\displaystyle S_1 = \frac{b}{a+b}\vspace{0.1in}\\S_0 = \frac{d}{c+d}

You can calculate estimated number of death (e) in both group as following formula by Freedman’s approximate calculation.

\displaystyle e = \left(\frac{\theta+1}{\theta-1}\right)^2(Z_{\alpha/2}+Z_\beta)^2

You can calculate entry size (n) in each group, as following formula.

\displaystyle e = n(1-S_0)+n(1-S_1)\vspace{0.1in}\\n = \frac{e}{2 - S_0 - S_1}

You have to correct entry size with drop-out rate (w) as following formula. Throughout trial, two times of n is needed.

\displaystyle n = \frac{e}{(2 - S_0 - S_1)(1-w)}

COX比例ハザードモデルのlog-rank検定に必要なサンプルサイズを四分表から計算する

 COX 比例ハザード解析はリスクの有無や治療介入の有無に対して,生存率や故障率の違いの差を検定する方法です.最終的には四分表に集約可能ですが,解析手段として試験期間にエントリーした症例を,エンドポイント発生までの生存期間を昇順でソートして,エンドポイントが発生するたびに累積生存率を再計算します.

 今回は四分表から計算した生存率の差,aエラー,bエラーから必要なサンプルサイズを計算します.aエラーとは有意確率または第1種の過誤といい,bエラーとは第2種の過誤ともいいます.1 – b のことを検出力といいます.通常ですとa = 0.05(両側),1 – b = 0.8(片側)とすることが多く,その場合 Za/2 = 1.96, Zb = 0.84 とします.当然ながら,リスク群と対照群との生存率の差が小さいほど必要なサンプルサイズは増えます.

 S1 はリスク群や介入群の生存率,S0 はリスクなし,介入なしなどいわゆる対照群の生存率とします.q はそれらの対数の比で,追跡終了時点での生存率の比です.

\displaystyle LN(S_1) = Exp(B)LN(S_0)\vspace{0.1in}\\\theta = Exp(B) = \frac{LN(S_1)}{LN(S_0)}

 ここで再び四分表が登場します.エンドポイントと打ち切りはそれぞれ死亡と打ち切り,故障と打ち切りなどと読み替え可能です.

  ENDPOINT CENSOR Marginal total
POSITIVE a b a + b
NEGATIVE c d c + d
Marginal total a + c b + d N

\displaystyle S_1 = \frac{b}{a+b} \displaystyle S_0 = \frac{d}{c+d}

 とすると Freedman による近似計算として両群での期待死亡値 e は下記の式で表現出来ます.

\displaystyle e = \left(\frac{\theta+1}{\theta-1}\right)^2(Z_{\alpha/2}+Z_\beta)^2

 n を各群で必要なエントリーサイズとして e をリスク群と対照群の死亡率で割り付けると下記の式で表現出来ます.

\displaystyle e = n(1-S_0)+n(1-S_1)

 これを n について解くと下記の式となります.

\displaystyle n = \frac{e}{2 - S_0 - S_1}

 脱落率を w とすると補正式は下記のとおりです.試験全体では 2n のサンプルサイズが必要です.

\displaystyle n = \frac{e}{(2 - S_0 - S_1)(1-w)}