ROC曲线就预测这个分类阈值能不能合理可靠

如上图  红色虚线就是一个预测的分类值

灵敏度是患糖尿病者中诊断出为糖尿病的概率(左上方)

特异度是未患病人中确实未确诊的人数(右下方)

 

右上方的格子表示假阳性率fp(false positive),本身没病(j属于没病的一类),诊断为糖尿病的概率 误诊啦啦啦

假阳性率=fp/所有没病的人 =fp(false positive)/fp+tn(true negative)         绿色表示特异度

 

 

 

可以看到 如果这条红线从最低端开始往上走

灵敏度为1左上角方格(纵坐标)

特异度为0 假阳性率为1(横坐标)

即坐标为(1,1)

随着分类线逐渐上移

灵敏度(左上角)方格很长时间为1,而假阳性率(右上角方格)开始由大变小

接着灵敏度也下降,假阳性率也下降

 

 

 

 

最终会归结到(0,0)

因为TPR和FPR中分母都是固定值,

TPR的分母是真正阳性的病人  

FPR的分母是真正阴性的人

 

所以都是分子表示大小 TP 与FP  约登指数越大即:灵敏度+特异度-1=灵敏度+(1-假阳性率)-1=灵敏度-假阳性率    最大

我们是希望灵敏度尽可能大 ,FP(假阳性率)尽可能小,那么线条越靠近左上角,这个分类越好

线条不好说明,所以就用面积更加直观一点,AUC曲线

 

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。