找回密码
 欢迎注册
搜索
热搜: 活动 交友 discuz
查看: 2728|回复: 3

有关统计样本的问题

[复制链接]
发表于 2003-6-9 12:01:22 | 显示全部楼层 |阅读模式
有人作了一个两样本的对照研究,患者组样本为50例,正常组样本为2000例,请问这样的样本数量是否恰当?如何判断?
发表于 2003-6-9 16:05:01 | 显示全部楼层

有关统计样本的问题

一般情况下,认为每组样本含量大于30或50,可认为是大样本。大样本时,即使原样本不是来自正态分布,根据中心极限定理,其样本均数仍然服从正态分布。因此一般情况下,你说指的“患者组样本为50例,正常组样本为2000例”,样本含量是足够的。但样本含量多,则检验精度(即标准误)越高,但并非越多越好,这是因为样本含量多一则浪费人力物力;二则样本含量大时,调查或试验研究的系统误差可能会较大。所以一般认为样本含量采用适当公式计算比较好。
    样本含量的计算主要由:1.I型错误(即alpha)、2.II型错误(即beta)、3.资料的变异情况(即标准差等)、4.研究允许误差(不同研究有所不同,如血压波动1、2个mmHg无实际意义,而某些试剂相差多少毫克,也许就有实际意义。如对于与人接近的猴、狗做试验样本含量少的多,而小老鼠做试验做试验样本含量相对就应多些,原理就在于此点)等四个因素决定。对于样本含量的计算,很多书中都有介绍,不同设计有不同的样本含量计算方法。
   
 楼主| 发表于 2003-6-9 16:59:30 | 显示全部楼层

有关统计样本的问题

谢谢 stat106688 !样本数量问题明白了,“大样本时,即使原样本不是来自正态分布,根据中心极限定理,其样本均数仍然服从正态分布”,这方面能详细讲解一下吗?
发表于 2003-9-20 15:45:52 | 显示全部楼层

有关统计样本的问题

这种设计的效率不高,等效样本含量是两样本含量的加权平均数。在病例难找的情况下可用这种设计,这种情况多数发生在预防机构,在临床医疗机构多数用等样本含量分组。
在实际工作中,往往不分大小样本,也分不清,因为t分布的极限分布就是u分布,所以计量资料一律用t检验,当然要考虑适用的条件。
您需要登录后才可以回帖 登录 | 欢迎注册

本版积分规则

快速回复 返回顶部 返回列表