微阵列实验的样本量

一组微阵列实验的共同目标是找到两种样本间差异表达的基因。一个典型的应用是将一种特定癌症的样本与相应的正常组织样本进行比较。

您可以使用此页面计算此类实验所需的样本数。这种分析的基本思想是,你最终将通过执行不同的基因t检验来检测差异表达的基因。这些逐基因检测的正确显著性水平α取决于你在微阵列上看到的基因数和你愿意接受的假阳性数(对于α的固定值,假阳性的数量与你看到的基因数量成正比。越多未必越好。)

样本大小取决于您希望能够检测到的差异有多大(通常测量为两种样本之间的折叠差异)。这也取决于测试的能力,这里我们可以把它看作是实验可能检测到的差异表达基因的百分比。

样本量计算所需的最后一个参数是在基2对数标度上估计基因强度测量的标准偏差。你可以在下面调整这个参数,但是我们发现对于中高水平表达的基因来说,0.7的值是相当现实的。


计算微阵列样本大小

输入参数(全部为必填项)

基因数
可接受的误报数
期望的折叠差异
期望功率
标准差

基础模型

这些样本量的计算是基于每个基因的表达在对数尺度上正态分布的假设。我们进一步假设两个实验组的方差是相同的,因此两组之间唯一的差异就是平均值。可接受的假阳性数除以基因数,以计算每个基因的显著性水平α,该水平将产生该假阳性数(因此,要求0个假阳性将需要无限多的样本。)最后,我们假设基因表达测量是独立的,并执行通常的计算来确定具有潜在正态分布的t检验所需的样本量。