How to calculate required sample size in chi-square test, Fisher exact test, Student’s t-test and log-rank test?

Sample size calculation may be hard for research member, because it’s difficult to distinguish sample size is enough or not when it was not statistical significant. Required sample size calculation is very important.

χ2 test without correction

To compare survival rate between risk/intervention group and control group, it’s required to execute χ2 test. You can calculate sample size as following formula. With significance level (α) 0.05 (two-tailed) and statistical power (1 – β) 0.8 (one-sided), Zα/2 is 1.96 and Zβ is 0.84, respectively.

\displaystyle N_0 = \frac{\left(Z_{\alpha/2}\sqrt{(1+\phi)\bar{p}(1 - \bar{p})} + Z_\beta\sqrt{\phi p_0(1 - p_0) + p_1(1 - p_1)}\right)^2}{\phi\delta^2}

\displaystyle N_1 = \phi N_0

If effect size δ was expressed with odd ratio (OR), sample size could be calculated as formula below.

\displaystyle N_0 = \left(\frac{1 + \phi}{\phi}\right)\frac{(Z_{\alpha/2} + Z_\beta)^2}{(\log{OR})^2\bar{p}(1 - \bar{p})}

\displaystyle N_1 = \phi N_0

\displaystyle N_0 : required number of control group.

\displaystyle N_1 : required number of risk/intervention group.

\displaystyle n_0 : actual number of control group.

\displaystyle n_1 : actual number of risk/intervention group.

\displaystyle \phi = \frac{n_1}{n_0}: the ratio of number of risk/intervention group to number of control group.

\displaystyle p_0 : survival rate or efficacy in control group.

\displaystyle p_1 : survival rate or efficacy in risk/intervention group.

\displaystyle \delta = p_1 - p_0 : effect size, difference between two groups.

\displaystyle \bar{p} = \frac{p_0 + \phi p_1}{1 + \phi}

χ2 test with Yates correction and Fisher exact test

When you execute χ2 test with Yates correction or Fisher exact test, you have to correct N0 with multiplying by C, correction term as below.

\displaystyle C = \frac{1}{4}\left(1 + \sqrt{1 + \frac{2 (1 + \phi)}{\phi N_0 |\delta|}}\right)^2

Student’s t-test

In Student’s t-test, you have to calculate standardized effect size (Δ) first with a mean of control group and a mean of risk/intervention group. Then you can calculate sample size with Δ as below. It’s assumed that the variances are equal between control group and risk/intervention group.

\displaystyle \Delta = \frac{|\mu_0 - \mu_1|}{\sigma}

\displaystyle N_0 = \left(\frac{1 + \phi}{\phi}\right)\frac{(Z_{\alpha/2} + Z_{\beta})^2}{\Delta^2} + \frac{Z_{\alpha/2}^2}{2(1 + \phi)}

\displaystyle N_1 = \phi N_0

log-rank test

In log-rank test, you can calculate required number of event (e) and sample size (N) as following formula. p0 and p1 are cumulative survival rate of control group and risk/intervention group, respectively, derived from previous research or cumulative survival rate after 1 or 2 years from the research started. When φ was 1, it means equal sample size in both groups, it would bring same result as described in How to calculate appropriate sample size in Cox proportional hazard analysis with cross tabulation?.

\displaystyle \theta = \frac{\log(p_1)}{\log(p_0)}

\displaystyle e_0 = \frac{1}{(1 + \phi)\phi}\left(\frac{1 + \phi\theta}{1 - \theta}\right)^2(Z_{\alpha/2} + Z_\beta)^2

\displaystyle e_1 = \phi e_0 = \frac{1}{1 + \phi}\left(\frac{1 + \phi\theta}{1 - \theta}\right)^2(Z_{\alpha/2} + Z_\beta)^2

\displaystyle e = e_0 + e_1 = \frac{1}{\phi}\left(\frac{1 + \phi\theta}{1 - \theta}\right)^2(Z_{\alpha/2} + Z_\beta)^2

\displaystyle N_0 = \frac{e}{(1 - p_0) + \phi(1 - p_1)} = \frac{1}{\phi}\left(\frac{1 + \phi\theta}{1 - \theta}\right)^2\frac{(Z_{\alpha/2} + Z_\beta)^2}{(1 - p_0) + \phi(1 - p_1)}

\displaystyle N_1 = \phi N_0

\displaystyle N = N_0 + N_1 = \frac{1 + \phi}{\phi}\left(\frac{1 + \phi\theta}{1 - \theta}\right)^2\frac{(Z_{\alpha/2} + Z_\beta)^2}{(1 - p_0) + \phi(1 - p_1)}

\displaystyle N_0 : required number of control group.

\displaystyle N_1 : required number of risk/intervention group.

\displaystyle n_0 : actual number of control group.

\displaystyle n_1 : actual number of risk/intervention group.

\displaystyle \phi = \frac{n_1}{n_0} : the ratio of number of risk/intervention group to number of control group.

\displaystyle p_0 : survival rate or efficacy of control group.

\displaystyle p_1 : survival rate or efficacy of risk/intervention group.

References:
TABLES OF THE NUMBER OF PATIENTS REQUIRED IN CLINICAL TRIALS USING THE LOG RANK TEST

χ2乗検定,Fisher正確確率検定,Student t検定およびlog-rank検定においてサンプルサイズを計算するには

 サンプルサイズの計算は重要です.多くの研究者にとって統計的有意差が出なかった場合に,それがサンプルサイズ不足が原因によるものかどうかの判断ができないからです.全ての検定を網羅することはできませんでしたが,重要と思われる主な検定においてサンプルサイズを計算する方法を述べます.

χ2検定

 リスク群・介入群と対照群との2群間で有効率・生存率を比較するにはχ2乗検定を行いますが,その際のサンプルサイズの算出には下記の式を用います.α = 0.05 (両側), 1 – β = 0.8 (片側)とすると Zα/2 = 1.96, Zβ = 0.84 として計算します.

\displaystyle N_0 = \frac{\left(Z_{\alpha/2}\sqrt{(1+\phi)\bar{p}(1 - \bar{p})} + Z_\beta\sqrt{\phi p_0(1 - p_0) + p_1(1 - p_1)}\right)^2}{\phi\delta^2}

\displaystyle N_1 = \phi N_0

 効果量 δ がオッズ比で表現できる場合,サンプルサイズは下式で求まります.

\displaystyle N_0 = \left(\frac{1 + \phi}{\phi}\right)\frac{(Z_{\alpha/2} + Z_\beta)^2}{(\log{OR})^2\bar{p}(1 - \bar{p})}

\displaystyle N_1 = \phi N_0

\displaystyle N_0 : 対照群に必要なサンプルサイズ

\displaystyle N_1 : リスク群・介入群に必要なサンプルサイズ

\displaystyle n_0 : 対照群の実際の症例数

\displaystyle n_1 : リスク群・介入群の実際の症例数

\displaystyle \phi = \frac{n_1}{n_0}

\displaystyle p_0 : 対照群の有効率・生存率

\displaystyle p_1 : リスク群・介入群の有効率・生存率

\displaystyle \delta = p_1 - p_0 : リスク群・介入群と対照群との有効率・生存率の差

\displaystyle \bar{p} = \frac{p_0 + \phi p_1}{1 + \phi}

Yates補正による χ2 検定と Fisher 正確確率検定

 Yates 補正や Fisher 正確確率検定の際には N0 に補正項 C を乗じて補正する必要があります.リンクした書籍には平方根内の項に 1 を加算していますが,森實敏夫の教科書には加算していません.しかしウェブ上のサンプルサイズの計算の数式は合っています.

\displaystyle C = \frac{1}{4}\left(1 + \sqrt{1 + \frac{2 (1 + \phi)}{\phi N_0 |\delta|}}\right)^2

Student t 検定

 対照群の平均値 μ0 およびリスク群・介入群の平均値 μ1 から効果量 Δ を計算し,そこからサンプルサイズを求めます.この場合,対照群とリスク群・介入群とでは分散が等しいと仮定しています.

\displaystyle \Delta = \frac{|\mu_0 - \mu_1|}{\sigma}

\displaystyle N_0 = \left(\frac{1 + \phi}{\phi}\right)\frac{(Z_{\alpha/2} + Z_{\beta})^2}{\Delta^2} + \frac{Z_{\alpha/2}^2}{2(1 + \phi)}

\displaystyle N_1 = \phi N_0

log-rank 検定

 log-rank 検定において必要なイベント数 e およびサンプルサイズ N は Freedman の方法で下式にて求まります.p0 および p1 は先行研究や試験開始後 1-2 年での累積生存率です.φ = 1 の場合,COX比例ハザードモデルのlog-rank検定に必要なサンプルサイズを四分表から計算するで説明した数式と同じ結果になります.

 森實敏夫の教科書の記載には誤りがあります.イベント数 e を求める式の分母において,Freedman の原著では φ は括弧の外にありますが,森實敏夫の教科書の記載では括弧内にあります.ウェブ上のサンプルサイズの計算の数式は合っています.参考文献の Freedman の原著は有料です.

\displaystyle \theta = \frac{\log(p_1)}{\log(p_0)}

\displaystyle e_0 = \frac{1}{(1 + \phi)\phi}\left(\frac{1 + \phi\theta}{1 - \theta}\right)^2(Z_{\alpha/2} + Z_\beta)^2

\displaystyle e_1 = \phi e_0 = \frac{1}{1 + \phi}\left(\frac{1 + \phi\theta}{1 - \theta}\right)^2(Z_{\alpha/2} + Z_\beta)^2

\displaystyle e = e_0 + e_1 = \frac{1}{\phi}\left(\frac{1 + \phi\theta}{1 - \theta}\right)^2(Z_{\alpha/2} + Z_\beta)^2

\displaystyle N_0 = \frac{e}{(1 - p_0) + \phi(1 - p_1)} = \frac{1}{\phi}\left(\frac{1 + \phi\theta}{1 - \theta}\right)^2\frac{(Z_{\alpha/2} + Z_\beta)^2}{(1 - p_0) + \phi(1 - p_1)}

\displaystyle N_1 = \phi N_0

\displaystyle N = N_0 + N_1 = \frac{1 + \phi}{\phi}\left(\frac{1 + \phi\theta}{1 - \theta}\right)^2\frac{(Z_{\alpha/2} + Z_\beta)^2}{(1 - p_0) + \phi(1 - p_1)}

\displaystyle N_0 : 対照群に必要なサンプルサイズ

\displaystyle N_1 : リスク群・介入群に必要なサンプルサイズ

\displaystyle n_0 : 対照群の実際の症例数

\displaystyle n_1 : リスク群・介入群の実際の症例数

\displaystyle \phi = \frac{n_1}{n_0} : リスク群・介入群の症例数と対照群の症例数との比

\displaystyle p_0 : 対照群の有効率・生存率

\displaystyle p_1 : リスク群・介入群の有効率・生存率

参考文献:
TABLES OF THE NUMBER OF PATIENTS REQUIRED IN CLINICAL TRIALS USING THE LOG RANK TEST

Primary Prevention of Cardiovascular Disease with a Mediterranean Diet

Outcome of PREDIMED Study has been published in the New England Journal of Medicine that examined primary prevention of cardiovascular disease with Mediterranean diet. The result has been shown that Mediterranean diet with extra-virgin olive oil or mixed nuts has better prognosis than reduction of lipid. It is considered that alpha linolenic acid rich Mediterranean diet, a component of walnuts, influences oxidative stress, inflammation or endothelial dysfunction.

Primary Prevention of Cardiovascular Disease with a Mediterranean Diet

Ramón Estruch, M.D., Ph.D., Emilio Ros, M.D., Ph.D., Jordi Salas-Salvadó, M.D., Ph.D., Maria-Isabel Covas, D.Pharm., Ph.D., Dolores Corella, D.Pharm., Ph.D., Fernando Arós, M.D., Ph.D., Enrique Gómez-Gracia, M.D., Ph.D., Valentina Ruiz-Gutiérrez, Ph.D., Miquel Fiol, M.D., Ph.D., José Lapetra, M.D., Ph.D., Rosa Maria Lamuela-Raventos, D.Pharm., Ph.D., Lluís Serra-Majem, M.D., Ph.D., Xavier Pintó, M.D., Ph.D., Josep Basora, M.D., Ph.D., Miguel Angel Muñoz, M.D., Ph.D., José V. Sorlí, M.D., Ph.D., José Alfredo Martínez, D.Pharm, M.D., Ph.D., and Miguel Angel Martínez-González, M.D., Ph.D., for the PREDIMED Study Investigators

N Engl J Med 2013;368:1279-90

Background

Observational cohort studies and a secondary prevention trial have shown an inverse association between adherence to the Mediterranean diet and cardiovascular risk. We conducted a randomized trial of this diet pattern for the primary prevention of cardiovascular events.

Methods

In a multicenter trial in Spain, we randomly assigned participants who were at high cardiovascular risk, but with no cardiovascular disease at enrollment, to one of three diets: a Mediterranean diet supplemented with extra-virgin olive oil, a Mediterranean diet supplemented with mixed nuts, or a control diet (advice to reduce dietary fat). Participants received quarterly individual and group educational sessions and, depending on group assignment, free provision of extra-virgin olive oil, mixed nuts, or small nonfood gifts. The primary end point was the rate of major cardiovascular events (myocardial infarction, stroke, or death from cardiovascular causes). On the basis of the results of an interim analysis, the trial was stopped after a median follow-up of 4.8 years.

Results

A total of 7447 persons were enrolled (age range, 55 to 80 years); 57% were women. The two Mediterranean-diet groups had good adherence to the intervention, according to self-reported intake and biomarker analyses. A primary end-point event occurred in 288 participants. The multivariable-adjusted hazard ratios were 0.70 (95% confidence interval [CI], 0.54 to 0.92) and 0.72 (95% CI, 0.54 to 0.96) for the group assigned to a Mediterranean diet with extra-virgin olive oil (96 events) and the group assigned to a Mediterranean diet with nuts (83 events), respectively, versus the control group (109 events). No diet-related adverse effects were reported.

Conclusions

Among persons at high cardiovascular risk, a Mediterranean diet supplemented with extra-virgin olive oil or nuts reduced the incidence of major cardiovascular events.

References:
Effects of a Mediterranean-Style Diet on Cardiovascular Risk Factors
Effect of a Mediterranean-Style Diet on Endothelial Dysfunction and Markers of Vascular Inflammation in the Metabolic Syndrome
Mediterranean-style diet and risk of ischemic stroke, myocardial infarction, and vascular death: the Northern Manhattan Study

地中海食による心血管疾患の一次予防

 地中海食による心血管疾患の予防効果を検討した PREDIMED Study の成果が New England Journal に掲載されました.単に脂質を制限するよりもオリーブオイルやナッツを摂取したほうが心血管疾患の一次予防に有効であったとする結果です.地中海食には胡桃の成分であるαリノレン酸が豊富に含まれており,酸化ストレスや炎症,内皮機能障害などに影響するからではないかと考察しています.



地中海食による心血管疾患の一次予防

Ramón Estruch, M.D., Ph.D., Emilio Ros, M.D., Ph.D., Jordi Salas-Salvadó, M.D., Ph.D., Maria-Isabel Covas, D.Pharm., Ph.D., Dolores Corella, D.Pharm., Ph.D., Fernando Arós, M.D., Ph.D., Enrique Gómez-Gracia, M.D., Ph.D., Valentina Ruiz-Gutiérrez, Ph.D., Miquel Fiol, M.D., Ph.D., José Lapetra, M.D., Ph.D., Rosa Maria Lamuela-Raventos, D.Pharm., Ph.D., Lluís Serra-Majem, M.D., Ph.D., Xavier Pintó, M.D., Ph.D., Josep Basora, M.D., Ph.D., Miguel Angel Muñoz, M.D., Ph.D., José V. Sorlí, M.D., Ph.D., José Alfredo Martínez, D.Pharm, M.D., Ph.D., and Miguel Angel Martínez-González, M.D., Ph.D., for the PREDIMED Study Investigators

N Engl J Med 2013; 368:1279-1290

要旨

背景

 観察コホート研究と二次予防試験は,地中海食の順守と心血管リスクとの間の逆相関を示した.我々は心血管疾患の一次予防のためこの食事様式の無作為化試験を実施した.

方法

 スペインにおける多施設で我々は心血管疾患リスクが高いが心血管疾患に罹患していない参加者を3つの食事群の一つに無作為割り付けした.エクストラバージンオリーブオイルを提供される地中海食群,ミックスナッツを低供される地中海食群,対照群で食事脂質を減量するよう指導された群である.参加者は四半期ごとに個別またはグループで教育セッションを受け,割り付けに従って無料でエクストラバージンオリーブオイルか,ミックスナッツか,少量の食品でない贈呈品を受け取った.一次エンドポイントは主要な心血管イベント(心筋梗塞,脳卒中または心血管由来の死亡)の率とした.暫定的な解析に基づいて,試験は経過観察期間の中央値が4.8年となった後に中止した.

結果

 全体で 7447 名(55 歳から 80 歳まで)の参加者が登録され,うち 57 % が女性であった.自己申告による摂食調査と生化学検査によると,地中海食の2群では介入に対して良好な順守が得られた.288 名において一次エンドポイント事象が発生した.エクストラバージンオリーブオイルを提供された地中海食群(96件)およびミックスナッツを提供された地中海食群(83件)の対照群(109件)に対する多変量調整したハザード比はそれぞれ 0.70 (95%CI 0.54 – 0.92) および 0.72 (95%CI 0.54 – 0.96) であった.食事に関連する副作用は全く認めなかった.

結論

 心血管リスクの高い人にとって,エクストラバージンオリーブオイルまたはミックスナッツを提供された地中海食は心血管イベントの発生を減少させた.

参照:
心血管危険因子における地中海料理の効果
メタボリック症候群における内皮機能障害と血管炎症マーカーに対する地中海式料理の影響
地中海式料理と虚血性脳卒中,心筋梗塞,血管死との関連:the Northern Manhattan Study

How to calculate appropriate sample size in Cox proportional hazard analysis with cross tabulation?

In this article, I’d like to describe how to calculate appropriate sample size in Cox proportional analysis with cross tabulation, a error and b error. a error is called as statistical significance or type 1 error and b error is called as type 2 error, respectively. 1 – b is called as statistical power. a is usually configured at 0.05 (two-tailed) and b is configured at 0.2 (one-sided), respectively. As a result, Za/2 is 1.96 and Zb is 0.84, respectively.

I’d like to assume that S1 is survival rate of risk group or intervention group and S0 is survival rate of control group, without risk or intervention. q is ratio of logarithm of them.

\displaystyle LN(S_1) = Exp(B)LN(S_0)\vspace{0.1in}\\\theta = Exp(B) = \frac{LN(S_1)}{LN(S_0)}

I’d like to use cross tabulation here. You can replace endpoint with death or failure.

ENDPOINT CENSOR Marginal total
POSITIVE a b a + b
NEGATIVE c d c + d
Marginal total a + c b + d N
\displaystyle S_1 = \frac{b}{a+b}\vspace{0.1in}\\S_0 = \frac{d}{c+d}

You can calculate estimated number of death (e) in both group as following formula by Freedman’s approximate calculation.

\displaystyle e = \left(\frac{\theta+1}{\theta-1}\right)^2(Z_{\alpha/2}+Z_\beta)^2

You can calculate entry size (n) in each group, as following formula.

\displaystyle e = n(1-S_0)+n(1-S_1)\vspace{0.1in}\\n = \frac{e}{2 - S_0 - S_1}

You have to correct entry size with drop-out rate (w) as following formula. Throughout trial, two times of n is needed.

\displaystyle n = \frac{e}{(2 - S_0 - S_1)(1-w)}

COX比例ハザードモデルのlog-rank検定に必要なサンプルサイズを四分表から計算する

 COX 比例ハザード解析はリスクの有無や治療介入の有無に対して,生存率や故障率の違いの差を検定する方法です.最終的には四分表に集約可能ですが,解析手段として試験期間にエントリーした症例を,エンドポイント発生までの生存期間を昇順でソートして,エンドポイントが発生するたびに累積生存率を再計算します.

 今回は四分表から計算した生存率の差,aエラー,bエラーから必要なサンプルサイズを計算します.aエラーとは有意確率または第1種の過誤といい,bエラーとは第2種の過誤ともいいます.1 – b のことを検出力といいます.通常ですとa = 0.05(両側),1 – b = 0.8(片側)とすることが多く,その場合 Za/2 = 1.96, Zb = 0.84 とします.当然ながら,リスク群と対照群との生存率の差が小さいほど必要なサンプルサイズは増えます.

 S1 はリスク群や介入群の生存率,S0 はリスクなし,介入なしなどいわゆる対照群の生存率とします.q はそれらの対数の比で,追跡終了時点での生存率の比です.

\displaystyle LN(S_1) = Exp(B)LN(S_0)\vspace{0.1in}\\\theta = Exp(B) = \frac{LN(S_1)}{LN(S_0)}

 ここで再び四分表が登場します.エンドポイントと打ち切りはそれぞれ死亡と打ち切り,故障と打ち切りなどと読み替え可能です.

  ENDPOINT CENSOR Marginal total
POSITIVE a b a + b
NEGATIVE c d c + d
Marginal total a + c b + d N

\displaystyle S_1 = \frac{b}{a+b} \displaystyle S_0 = \frac{d}{c+d}

 とすると Freedman による近似計算として両群での期待死亡値 e は下記の式で表現出来ます.

\displaystyle e = \left(\frac{\theta+1}{\theta-1}\right)^2(Z_{\alpha/2}+Z_\beta)^2

 n を各群で必要なエントリーサイズとして e をリスク群と対照群の死亡率で割り付けると下記の式で表現出来ます.

\displaystyle e = n(1-S_0)+n(1-S_1)

 これを n について解くと下記の式となります.

\displaystyle n = \frac{e}{2 - S_0 - S_1}

 脱落率を w とすると補正式は下記のとおりです.試験全体では 2n のサンプルサイズが必要です.

\displaystyle n = \frac{e}{(2 - S_0 - S_1)(1-w)}