聚热点 juredian

ROC曲线,那些必须要知道的事

想要了解ROC曲线吗?不急,先来看看下面的小情景。

【情景设置】

牛逼的我:师傅,您能对我上点心吗?!文章还没发,明年快毕业了啊。。。

豆逼导师:小牛啊,我是挺中意你的。。

牛逼的我:师傅,你想多了。我是指对我的【论文】上点心。。。

豆逼导师:(故作正经)昨天你师兄的实验结束了。咱们这里有2组人群。一组是病人,一组是健康人。我们检测了他们血清中X指标。你看看,怎么才能根据X的数值,来判断一个人是病人还是健康人?判断的效果好不好。我先走了。。。明天到我办公室来汇报。。。

牛逼的我:哦。。。。

【统计方法】

来听听统计学砖家和叫兽是怎么考虑“豆逼导师”给小牛的问题的。

这是一个典型的诊断试验数据分析。每个人的血清X指标都不太一样,有大有小。一般是病人高,健康人低。实际上,小牛需要找到一个X指标的阈值。如果X指标超过阈值,则判断某一对象为病例;低于阈值,则判断某一对象为健康人。

显然,这么判断,肯定会出现错判的情况。也就是常说的假阳性和假阴性。如图1所示:

假阳性就是误诊,假阴性就是漏诊。按照“豆逼导师”的要求,咱们应该找到一个比较好的阈值,尽可能使得误诊和漏诊的比例尽可能低。

现在假设我们选定了一个阈值,并且将判断的结果整理成图2所示:

金标准,就是一个人真实的情况,是患者还是非患者。

诊断试验的结果,就是根据你的阈值,判断某一对象是患者还是非患者。

据此,我们可以计算以下几个常见的统计学指标,来评价判断的效果好还是不好。见下图3、图4。

实际上,判断效果好,就是要求灵敏度和特异度要高。如下图5,所示。

那么问题来了:如何确定一个最佳的阈值,使得灵敏度和特异度相对达到最大?

我们可以这么做。尝试设置不同的阈值。不同的阈值,判断结果不同,灵敏度和特异度不同。可以绘制以下一张图形。

横轴是不同的阈值。考虑的简单一点,咱们这里假设X的范围是0~1。蓝色的线代表的不同阈值下,灵敏度的变化。红色的线,代表的特异度的变化。两条线相交的地方,对应的那个阈值就是最佳阈值。图中,最佳阈值就是0.48。

那如果我们选择0.48做为标准来判断的话,对应的灵敏度和特异度到底是多少呢?如图所示,50个病人中,47个判断正确,灵敏度达到94%,127健康人中,119个判断正确,特异度达到93.7%。所有177个人当中,47+119个人判断正确了,正确率达到93.79%。

那大家会觉得奇怪了。这和ROC曲线有半毛钱关系啊?

别急,别急。。。

如果大家明白了小编说的这些内容。就不难理解ROC曲线了。

ROC曲线,全称是receiver operating characteristic curve,简称ROC曲线。中文翻译是受试者工作特征曲线。如下图所示。

如果横轴是1-特异度,纵轴是灵敏度。那么就会形成1个弯曲的曲线。这个曲线和45度的直线会形成一个曲线下面积(area under ROC),简称AUC。AUC越大,说明判断的效果越好。

以下是是通过AUC对判断效果进行评价的标准:

0.5<><>

0.6<><>

0.7<><>

0.8<><>

0.9<><>

如图所示,AUC为0.9758,说明判断效果优秀了!

但是,实际工作中,一般AUC在0.7-0.9范围内的比较常见。超过0.9的属于凤毛麟角了。当然,如果你对自己的分析结果不满意的话,可以求助专业的统计师哦。他们有能力、有策略,做得比你更好。

【知识总结】

(1)ROC曲线其实是诊断试验中用于展示某个判断原则效果好差的一种图形,可以通过AUC来衡量大小。

(2)给定最佳阈值后,可以通过灵敏度、特异度、正确率来评价判断的具体效果。

(3)当然,实际应用过程中还有其他方法、其他可以计算的统计指标。

订阅号那么多,找不到默博士了?

搜索建议:
热评

 【话费红包】十一假期,100元话...

十一长假终于到啦在金秋十月一起祝福我们亲爱的祖国永远繁荣富强这个假期,你是怎么安排的?是背上行囊游览祖国名川大山还是宅在家看书、追剧……无论你用哪种方式欢度假期...(展开)