查看更多相关内容
取消关注三、统计方法
线性回归分析对于确定两种测量方法之间的一致性几乎没有什么用处,用相关系数( r)及其有关的显著性水平来表示两组读数之间的相关性也毫无意义。因为一个具有显著意义的 r值仅仅代表配对数据的点明显接近于一条直线,而对于该直线的斜率(slope)和截距(in-tercept)并未提供任何信息。因此自然无法获得关于两组读数之间实际关系的信息。例如,倘若斜率不是 1.0,那么这两种测量方法就不是在 1∶1的基础上相关。在极端情况下,倘若斜率为零,那么此统计结果实际上证明了两组数值完全不相关。同样,如果截距显著大于或小于 0,则这两种测量方法亦不理想。
我们真正需要知道的是两种方法之间的差异是否基本上为 0,或是否在同一方向上存在系统差异。正、负平均差可反映这种差异,应用配对 t检验即可最简便地分析上述差异与原始数据相比配对数据间的平均差别是否具有显著性意义。
然而很容易产生这样一种情况,虽然平均差别接近于 0,而在 0 的两侧(正的或负的差异)实际差别的分布范围却很广。比较理想的是我们需要知道这些变异的范围,可由平均数差的标准差计算得到。标准差乘以适当的 t值(从 t值表上在 P = 0.05,配对数据的自由度n-1处取 t值),则平均差 ± t值就得到这种差异的 95% 范围,即 t0.05× s± t0.05。换言之,对于 95% 的分析结果而言,这两种测量方法之间的差异,将落在 95% 的可信限范围。
显然,理想的平均差应是 0,但要确定可接受的 95% 可信限比较困难。在大多数生物学研究中,相对于测定值的 5% 变异范围是足够的,从而两组数据将各有 95% 的可能性在 10%的范围内。但对于精子浓度来说,变异范围甚大,故必须用相对于两组数据平均值的百分数来表达。很明显,一个 ±10×106/mL 差异对于 20×106/mL 标本要比对于 100× 106/mL 标本有更大的意义。
本方法的适用性已由 Bland 和 Altman 从理论上加以证实,并应用到 CellsoftCASA 系统的评估中。然而,当老方法与新方法之间的差别十分明显时,利用这两种方法的平均值来计算变异百分比会得出错误的结果,因此,在这种情况下,只能使用被认为可靠、可接受的老方法的值。
四、"真实"的概念
许多临床医生以及许多临床研究人员习惯于将实验室获得的结果当做绝对真实的数据,而忽视了与生物学测量有关 的 抽 样 误 差 及(或)方 法 误 差。例 如:将 精 子 浓 度 为19×106/mL的男子归类为精子数减少者,而将精子浓度为 21× 106/mL 的另一男子归类为精子数正常者显然是荒唐的,其实两者均落在正常精子浓度的 10% 的误差范围内。多年来人们已经承认,标准精液分析方法容易产生较大的方法学上的误差和潜在的观察者偏倚。人们普遍认为电脑化的 CASA 系统必然是准确和精密的,遗憾的是大量的评估表明,这种推测是错误的,有待进一步证实,使之更臻完善。
由于电脑在计数上有很高的精确性,所以报告结果时倾向于把数据精确到小数点后若干位,而与测量和分析方法本身的准确性无关。如果结果取自其他显示器,如刻度盘显示器,那么我们会乐于接受这样一个事实:即读数易产生错误,并对合理的位数表示满意。而以下的事实则是与这种虚假精确度的观念相违背的:所测量的精子运动特征应以带一位小数的值表示而由此获得的前向运动精子数的比率应以整数百分数表示。
(实习编辑:黄秀杰)