有关统计样本的问题

sbf2000 · 发表于 2003-6-9 12:01:22

有人作了一个两样本的对照研究，患者组样本为50例，正常组样本为2000例，请问这样的样本数量是否恰当？如何判断？

stat106688 · 发表于 2003-6-9 16:05:01

一般情况下，认为每组样本含量大于30或50，可认为是大样本。大样本时，即使原样本不是来自正态分布，根据中心极限定理，其样本均数仍然服从正态分布。因此一般情况下，你说指的“患者组样本为50例，正常组样本为2000例”，样本含量是足够的。但样本含量多，则检验精度（即标准误）越高，但并非越多越好，这是因为样本含量多一则浪费人力物力；二则样本含量大时，调查或试验研究的系统误差可能会较大。所以一般认为样本含量采用适当公式计算比较好。
样本含量的计算主要由：1.I型错误（即alpha）、2.II型错误（即beta）、3.资料的变异情况（即标准差等）、4.研究允许误差（不同研究有所不同，如血压波动1、2个mmHg无实际意义，而某些试剂相差多少毫克，也许就有实际意义。如对于与人接近的猴、狗做试验样本含量少的多，而小老鼠做试验做试验样本含量相对就应多些，原理就在于此点）等四个因素决定。对于样本含量的计算，很多书中都有介绍，不同设计有不同的样本含量计算方法。

sbf2000 · 发表于 2003-6-9 16:59:30

谢谢 stat106688 ！样本数量问题明白了，“大样本时，即使原样本不是来自正态分布，根据中心极限定理，其样本均数仍然服从正态分布”，这方面能详细讲解一下吗？

tyq · 发表于 2003-9-20 15:45:52

这种设计的效率不高，等效样本含量是两样本含量的加权平均数。在病例难找的情况下可用这种设计，这种情况多数发生在预防机构，在临床医疗机构多数用等样本含量分组。
在实际工作中，往往不分大小样本，也分不清，因为t分布的极限分布就是u分布，所以计量资料一律用t检验，当然要考虑适用的条件。

		自动登录	找回密码
密码			欢迎注册