梅斯医学MedSci APP
医路相伴,成就大医

P值的统计学意义与临床意义的区别?

Tags: p值   统计学意义   临床意义      作者:佚名 更新:2017-12-06

在医学科研领域,P值是特别神奇的数值,无数人为之欢喜或悲伤,甚至有无数种方法追求有统计学显著意义P值(P< 0.05)。但是我们真的应该只关注是否P< 0.05吗?P值有统计学意义等于有临床意义吗?

实际上在P值存在的90多年里,它一直饱受争议。一般来说临床研究的意义大抵可以分为两个水平,临床意义水平和统计学意义水平。临床意义显著性主要关注的是效应大小,而统计学学显著性主要关注的是P值。真正有临床意义的研究,不仅需要证明统计学角度有意义,更应该明确临床角度的获益程度。只关注P值给医学研究者们带来了很多困扰。有统计学显著意义的文章更容易发表,而可能同样重要的非统计学显著结果则锁在抽屉里,别人永远无法看到,这就是抽屉效应(File-drawer effect)。2014年《Nature》曾发表一篇新闻题为“Scientific method:Statistical errors”,其中提到:P值虽然是统计有效性的黄金标准,并不像许多科学家认为的那么可靠。也就是说,很多科学家在写论文时其实错用或滥用了P值这个概念。

当我们面临一个统计学上不显著的P值和有临床意义的组间差异,该如何抉择?

从数理统计的角度来看,P值大小的最重要影响因素是样本含量和组间差异大小。再微小的差异,达到足够大的样本量和测量精度,都能得到有统计学意义的P值;再大的差异,在样本量过小和测量精度不那么高的时候,也可能只能得到P>0.05。所以在临床研究中不应该唯P值是论,单看P值大小并不代表临床差异大小。美国统计学会(American Statistical Association, ASA)2016年正式发布的使用和解释P值的“六原则”中也提到:“P值或统计显著性并不能衡量效应的大小和结果的重要性。”。

当我们在开展临床研究时,得到了P<0.05的结果,该从哪些角度考虑和审视这个结果呢?

首先,考虑是否由于样本含量过小,统计学检验效能不足导致的阴性结果,可以根据目前研究所得到的数据,重新估算研究实际的检验效能,如果检验效能过低,一般认为可以进一步扩大样本含量进行研究;其次,临床研究结果用于指导实践,需要综合考虑试验设计、数据质量、实际临床获益、外部证据等等因素,决不能仅仅依靠P值下结论;最后,审视P值的同时应重点关注同时报道的效应量和可信区间,千万不要忘了环绕在P值周围的小伙伴们,比如OR值、RR值、HR值、95%CI等等,与P值进行同时报道,这些小伙伴们提供的信息往往比P值本身来得更有意义。

来源:交医临床研究中心
版权声明:
本网站所有注明“来源:梅斯医学”或“来源:MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有,非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:梅斯医学”。本网所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。同时转载内容不代表本站立场。
在此留言
小提示:本篇资讯需要登录阅读,点击跳转登录

相关推荐

移动应用
medsci.cn © 2020