P值的统计学意义与临床意义的区别？

Tags: p值统计学意义临床意义作者：佚名更新：2017-12-06

在医学科研领域，P值是特别神奇的数值，无数人为之欢喜或悲伤，甚至有无数种方法追求有统计学显著意义P值（P< 0.05）。但是我们真的应该只关注是否P< 0.05吗？P值有统计学意义等于有临床意义吗？

实际上在P值存在的90多年里，它一直饱受争议。一般来说临床研究的意义大抵可以分为两个水平，临床意义水平和统计学意义水平。临床意义显著性主要关注的是效应大小，而统计学学显著性主要关注的是P值。真正有临床意义的研究，不仅需要证明统计学角度有意义，更应该明确临床角度的获益程度。只关注P值给医学研究者们带来了很多困扰。有统计学显著意义的文章更容易发表，而可能同样重要的非统计学显著结果则锁在抽屉里，别人永远无法看到，这就是抽屉效应（File-drawer effect）。2014年《Nature》曾发表一篇新闻题为“Scientific method:Statistical errors”，其中提到：P值虽然是统计有效性的黄金标准,并不像许多科学家认为的那么可靠。也就是说，很多科学家在写论文时其实错用或滥用了P值这个概念。

当我们面临一个统计学上不显著的P值和有临床意义的组间差异，该如何抉择？

从数理统计的角度来看，P值大小的最重要影响因素是样本含量和组间差异大小。再微小的差异，达到足够大的样本量和测量精度，都能得到有统计学意义的P值；再大的差异，在样本量过小和测量精度不那么高的时候，也可能只能得到P>0.05。所以在临床研究中不应该唯P值是论，单看P值大小并不代表临床差异大小。美国统计学会（American Statistical Association, ASA）2016年正式发布的使用和解释P值的“六原则”中也提到：“P值或统计显著性并不能衡量效应的大小和结果的重要性。”。

当我们在开展临床研究时，得到了P<0.05的结果，该从哪些角度考虑和审视这个结果呢？

首先，考虑是否由于样本含量过小，统计学检验效能不足导致的阴性结果，可以根据目前研究所得到的数据，重新估算研究实际的检验效能，如果检验效能过低，一般认为可以进一步扩大样本含量进行研究；其次，临床研究结果用于指导实践，需要综合考虑试验设计、数据质量、实际临床获益、外部证据等等因素，决不能仅仅依靠P值下结论；最后，审视P值的同时应重点关注同时报道的效应量和可信区间，千万不要忘了环绕在P值周围的小伙伴们，比如OR值、RR值、HR值、95%CI等等，与P值进行同时报道，这些小伙伴们提供的信息往往比P值本身来得更有意义。

来源：交医临床研究中心

版权声明：
本网站所有注明“来源：梅斯医学”或“来源：MedSci原创”的文字、图片和音视频资料，版权均属于梅斯医学所有，非经授权，任何媒体、网站或个人不得转载，授权转载时须注明“来源：梅斯医学”。本网所有转载文章系出于传递更多信息之目的，且明确注明来源和作者，不希望被转载的媒体或个人可与我们联系，我们将立即进行删除处理。同时转载内容不代表本站立场。
在此留言

小提示：本篇资讯需要登录阅读，点击跳转登录

P值的统计学意义与临床意义的区别？

相关推荐