引用本文: 吴斌, 马骏, 史宏灿. 亚实性肺结节良恶性数学预测模型的建立与验证. 中国胸心血管外科临床杂志, 2021, 28(3): 311-318. doi: 10.7507/1007-4848.202006048 复制
肺癌作为全球范围内发病率和死亡率最高的恶性肿瘤之一[1]。早期以肺结节形式存在,可分为实性结节和亚实性结节。不同于实性结节,亚实性结节更容易恶变,同时其恶性率(81%)也明显高于实性结节(7%)[2]。亚实性结节主要指肺实质内局灶性不透明的结节,结节内可见肺内血管、支气管结构,由于其潜在恶性和异质性的特点,给临床诊断带来了困难[3-4]。美国国家肺癌筛查试验(筛查 53 000 例)显示,低剂量计算机断层扫描(CT)筛查可使肺癌相关死亡率降低 20%[5]。然而,自 CT 筛查以来,假阳性已经成为肺癌筛查的重要问题,为此,学者们通过各项研究来评估肺结节,结节筛查的敏感性为 30%~97%[6]。此外,肺结节早期筛查及后期随访存在着加重患者的经济负担、精神负担以及辐射风险的可能,一定程度上造成医疗资源的浪费[7]。目前,亚实性肺结节的良恶性评估已经成为临床上一个重要难题,本研究将回顾性分析 443 例亚实性结节患者的病例资料,探讨亚实性肺结节良恶性病变的独立危险因素,建立恶性概率预测模型,为肺结节的早期筛查提供新的诊断依据。
1 资料与方法
1.1 临床资料和分组
回顾性分析江苏省苏北人民医院 2014~2018 年入院的 443 例亚实性肺结节患者的病例资料。将患者按 2∶1 比例随机分为两组,其中建模组 296 例,男 125 例、女 171 例,平均年龄(55.9±11.1)岁;验证组 147 例,男 68 例、女 79 例,平均年龄(56.9±11.6)岁。纳入标准:胸部 CT 随访高度怀疑结节恶性可能,并有明确病理结果的亚实性肺结节患者。排除标准:患者入院前接受放射治疗、化疗等抗肿瘤治疗;病例资料不全者。
1.2 数据收集
收集患者的临床资料、影像学特征及肿瘤标志物。其中,临床资料包括年龄、性别、吸烟史、既往肿瘤史、肺基础疾病史。影像学特征包括结节直径、实性成分最大径、肿瘤实性成分直径比值(consolidation/tumor ratio,CTR)、结节位置、形态、边界、毛刺、分叶、钙化、空洞征、空泡征、血管集束征、细支气管征、胸膜凹陷征。肿瘤标志物包括癌胚抗原(carcinoembryonic antigen,CEA)、甲胎蛋白(alpha fetoprotein,AFP)、糖类抗原 125(carbohydrate antigen 125,CA125)、糖类抗原 199(carbohydrate antigen 129,CA199)和神经元特异性烯醇化酶(neuron-specific enolase,NSE)。
1.3 统计学分析
采用 SPSS 25.0 进行统计学分析,连续变量以均数±标准差(±s)表示,组间比较采用 t 检验,分类变量以例数和百分比表示,组间比较采用 χ2 检验。将年龄、性别、吸烟史、既往肿瘤史、肺基础疾病史、位置、结节直径、实性成分最大径、CTR、形态、边界、毛刺征、分叶征、钙化征、空洞征、空泡征、血管集束征、细支气管征、胸膜凹陷征、CEA、AFP、CA125、CA199 及 NSE 共 24 项因素进行单因素分析,以 P<0.05 为差异有统计学意义。将单因素分析结果中差异有统计学意义的数据纳入多因素分析,分析亚实性肺结节良恶性病变的独立危险因素,建立恶性概率预测模型,绘制受试者工作特征(receiver operating characteristic,ROC)曲线,计算曲线下面积(area under the curve,AUC),确定模型的诊断截点值,分析模型的灵敏度、特异性、阳性预测值(positive predictive value,PPV)和阴性预测值(negative predictive value,NPV)。最后,将验证组数据代入本研究模型、Mayo 模型、VA 模型、Brock 模型及北京大学人民医院(Peking University People’s Hospital,PKUPH)模型中,绘制 ROC 曲线,比较模型间的预测性能。
1.4 伦理审查
本研究已通过扬州大学医学院伦理委员会审批,批准号:YXYLL-2020-104。
2 结果
2.1 单因素及多因素分析结果
单因素分析结果显示,全组患者中肺结节良性和恶性患者在性别、结节直径、实性成分最大径、CTR、形态、边界、毛刺征、分叶征、钙化征、胸膜凹陷征及 CEA 方面差异有统计学意义(P<0.05)。建模组中肺结节良性和恶性患者在年龄、性别、结节直径、CTR、形态、边界、毛刺征、分叶征、钙化征及 CEA 方面差异有统计学意义(P<0.05);见表 1。综上所述,将年龄、性别、结节直径、实性成分最大径、CTR、形态、边界、毛刺征、分叶征、钙化征、胸膜凹陷征及 CEA 共 12 项数据纳入多因素分析,结果显示,性别、CTR、边界、毛刺征、分叶征及 CEA 是判断亚实性肺结节良恶性病变的独立危险因素;见表 2。



2.2 建立预测模型及绘制 ROC 曲线图
由此,建立亚实性肺结节良恶性预测模型:恶性概率 P=ex/(1+ex)。X=0.018+(1.436×性别)+(2.068×CTR)+(−1.976×边界)+(2.082×毛刺征)+(1.277×分叶征)+(2.296×CEA)。其中 e 为自然对数,X 因各项研究结果的不同而有所差别,定量结果有则记为 1,无则记为 0。性别女=1,男=0;C/T≥0.5=1,C/T<0.5=0;边界清晰=1,不清=0;有毛刺征=1,无毛刺征=0;有分叶征=1,无分叶征=0;CEA 阳性=1,阴性=0。基于建模组数据,绘制 ROC 曲线,AUC 值为 0.856(95%CI 0.804~0.908);见图 1。当截断点 T=0.778 时,约登指数最大,此时模型灵敏度为 81.6%,特异性为 75.6%,PPV 为 95.4%,NPV 为 39.8%。

2.3 恶性概率预测模型间的验证和比较
Mayo 模型[8]中 X=−6.8272+(0.0391×年龄)+(0.7917×吸烟史)+(1.3388×恶性肿瘤病史)+(0.1274×结节直径)+(1.0407×毛刺征)+(0.7838×上叶位置)。既往有吸烟史=1,无吸烟史=0;既往5年之外胸外肿瘤病史=l,无胸外肿瘤病史=0;结节直径以毫米为单位;有毛刺征=l,无毛刺征=0;结节位置在左肺或右肺上叶=1,位于其它位置=0。
VA 模型[9]中 X=−8.404+(2.061×吸烟史)+[0.779×年龄(10 岁)]+(0.112×直径)−[0.567×戒烟时间(10 年)]。既往有吸烟史=1,无吸烟史=0;年龄(10 岁)表示发现结节的年龄,并除以 10;结节直径表示结节所衡量到的最大直径;戒烟时间(10 年)表示戒烟的年数,并除以 10(0 表示未戒烟)。
Brock 模型[10]中 X=−6.6144+(0.6467×性别)+(−5.5537×直径)+(0.9309×毛刺征)+(0.6009×上叶)。其中女=1,男=0;结节直径表示结节所衡量到的最大直径(mm);有毛刺征=1,无毛刺征=0;结节位于上叶=1,位于其它位置=0。
PKUPH 模型[11]中 X=−4.496+(0.07×年龄)+(0.676×直径)+(0.736×毛刺征)+(1.267×肿瘤家族史)−(1.615×钙化征)−(1.408×边界)。其中有毛刺征=1,无毛刺征=0;有肿瘤家族史=l,无肿瘤家族史=0;有钙化征=l,无钙化征=0;结节边界清晰=1,边界模糊=0;结节直径表示结节所衡量到的最大直径(mm)。
将验证组数据代入本研究建立的模型和 Mayo、VA、Brock 及 PKUPH 模型中,绘制 ROC 曲线;见图 2。本研究建立模型的 AUC 值为 0.857,显著高于 Mayo、VA、Brock 和 PKUPH 模型;见表 3。5种模型的预测性能比较见表 4。



3 讨论
早期国外学者就曾设计相关模型对肺结节进行良恶性评估,如 Mayo 模型[8]、VA 模型[9]和 Brock 模型[10]。然而,随着肺癌流行病学趋势的改变,许多国家相继对肺结节诊治指南进行了更新,传统肺结节模型的实用性也受到了一定的影响。其中 Mayo 模型数据来源于 20 多年前,时效性较差。VA 模型中 98% 受试者是男性且年龄较大(平均年龄 66 岁),94% 受试者以前或现在吸烟[9],该模型基于高龄吸烟男性人群,限制了模型的通用性,同时未纳入影像特征进行分析,存在一定的误差。此外,鉴于国内外地域和种族差异,国外模型并不一定适用于国内患者。CHEST 指南曾指出:对亚洲肺结节患者的评估需要考虑到室内外高浓度空气污染所造成的肺癌高发率,以及亚洲非吸烟女性腺癌和肉芽肿性疾病的高患病率[12]。Fleischner 指南[13]认为肺结节最初评估应该集中在外观上,即实性结节和亚实性结节。不同于实性结节,亚实性结节数量明显较多,恶性率也较高,给肺结节早期筛查带来了困难。因此,可在传统模型的基础上建立适用于我国人群的亚实性肺结节良恶性预测模型,提高恶性结节的临床筛查率。
本研究将性别、CTR、边界、毛刺征、分叶征及 CEA 纳入预测模型公式中,相较于 Mayo、VA、Brock 及 PKUPH 等传统模型,本研究模型新增了 CTR、分叶征及 CEA。Ng 等[14]发现肺结节的恶性率与结节大小有一定的相关性,结节直径<5 mm,恶性率为 0%~1%;结节直径为 5~10 mm,恶性率为 6%~28%;结节直径>20 mm,恶性率为 64%~82%。本研究单因素分析中结节直径和 CTR 均有统计学意义,多因素分析后却只有 CTR 纳入到模型公式中。这可能由于本研究模型针对的是亚实性结节,其恶性率不仅与结节大小有关,还与其中实性成分有关。亚实性结节中实性成分具有一定的侵袭性,实性成分的增加往往提示着结节恶性浸润进展的加深。Elia 等[15]在肺结节随访中发现亚实性结节中固体成分的增加是恶性肿瘤的预兆。Hattori 等[16]基于肿瘤实变率,将肺结节分为纯磨玻璃结节(CTR=0,n=168),混合性磨玻璃结节(0<CTR<1.0,n=448)以及实性结节(CTR=1.0,n=565),结果显示肿瘤大小的影响应该只适用于实体结节,而不包括磨玻璃结节。肺结节的边缘特征有利于其良恶性诊断,其中恶性结节边缘多模糊,出现毛刺征、分叶征等特征。分叶征常见于周围性肺癌,由于每个方向上的生长速度不同或周围组织的阻碍,边缘多处呈弧形凸起。鲍彤等[17]对 117 例肺结节患者的病例资料进行分析,结果显示分叶征是判断孤立性肺结节良恶性的危险因素。Hu 等[18]通过对 112 例磨玻璃结节患者的研究,发现良恶性结节在分叶征方面有显著性差异,分叶征多见于恶性结节。目前,亚实性结节的分子评估也可以有效地用于肺癌的诊断,尤其是那些具有基因突变的亚实性结节[19]。肿瘤分子层面改变一般早于形态学改变,有研究[20]表明,早在部分腺癌患者出现明显病灶前,便可通过血液活检技术检测肿瘤标志物从而获取相关肿瘤信息。其中,CEA 的临床应用最为广泛,可作为肺癌最有价值的诊断指标。李笑莹等[21]在基于 250 例肺结节患者资料建立的预测模型中,也纳入了 CEA 进行模型分析,为肺结节良恶性评估提供了临床参考。
随着肺癌流行趋势的变化以及各研究设计的不同,最终纳入到模型公式中的因素也有所不同。肺结节患者年龄一般与恶性风险成正相关,Fleischner 指南[13]中提到,当年龄<35 岁,结节恶性可能较小,年龄>50 岁,结节恶性可能较大。相较于 Mayo 模型,本研究模型公式中未纳入年龄,其原因可能是本研究为单中心研究,样本量有限;也可能是由于随着年龄增加,恶性率也会增加,但年龄每增加1岁,恶性率变化的幅度并不明显。此外,虽然吸烟史是诱发肺癌的重要影响因素,但是近年来随着我国戒烟意识的逐渐加强,肺癌患者中非吸烟者比例逐年上升。Zhang 等[22]在 2012~2018 年期间对来自中国不同地区的 6 家医院 8 392 名员工进行了 CT 检查,研究发现肺癌患者中,非吸烟者(2.2%)多于吸烟者(1.4%)。同时,亚太肺结节评估指南也曾指出:亚洲非吸烟女性肺腺癌的患病率较高[12]。由此可见,在亚洲人群中,吸烟史对肺结节恶性率的影响正逐渐减弱。相较于国外 Brock 模型,上叶位置并未纳入到本研究的模型公式中,这可能由于在亚洲地区上叶尖后段位置也是肺结核的好发部位,美国胸科医师协会指南中“位于上叶的肺结节肿瘤概率大”并不完全适合我国和大部分亚太地区的国家[23]。钙化常见于良性结节中,如肉芽肿性疾病、错构瘤、肺结核、矽肺及淋巴结钙化等[24]。至于 PKUPH 模型公式中的钙化,在本研究中却未进入到模型公式中,这可能由于本次筛选入组的患者病例均是高度怀疑结节恶性可能且接受手术治疗的病例,存在选择偏倚。
模型的准确性受研究设计影响,包括患者特征和用于生成模型的人群中恶性结节的患病率[25]。考虑到国内外人群的差异,本研究数据均来自于我国近 5 年亚实性肺结节患者,引入了 CTR 和 CEA 两种新型预测值,纳入的临床、影像和肿瘤标志物方面指标多达 24 项,更为全面、详细。在模型的对比验证中,本研究模型的 AUC 值、灵敏度、特异性、PPV、NPV及准确性远高于 Mayo、VA、Brock 及 PKUPH 模型,表明本研究模型的漏诊率、误诊率、假阳性值及假阴性值均低于传统模型,诊断效力更为理想,具有较大的临床应用价值。
当然,本研究也尚有一些局限性。一方面,本研究人群均来自于高度怀疑结节恶性可能且接受手术治疗的患者,存在选择偏倚。另一方面,本研究为单中心研究,样本量有限,其具体临床效果还有待进一步的考察。此外,本研究模型的 NPV 相对较低,这说明了相对于恶性率大的结节,恶性率小的结节同样需要后期随访,依据结节动态变化从而选择下一步诊疗方法。
总而言之,本研究基于我国人群建立了亚实性肺结节良恶性预测模型,模型纳入了性别、CTR、边界、毛刺征、分叶征及 CEA 共 6 个独立危险因素。经过模型间对比验证,本研究模型 AUC 值、灵敏度、特异性、PPV、NPV及准确性均较高,其预测价值远超于传统模型,具有重要的临床应用价值,可作为亚实性结节的早期筛查方法。
利益冲突:无。
作者贡献:吴斌负责论文设计、数据收集与分析和论文初稿撰写;马骏负责数据收集、整理与分析;史宏灿负责论文审阅与修改。
肺癌作为全球范围内发病率和死亡率最高的恶性肿瘤之一[1]。早期以肺结节形式存在,可分为实性结节和亚实性结节。不同于实性结节,亚实性结节更容易恶变,同时其恶性率(81%)也明显高于实性结节(7%)[2]。亚实性结节主要指肺实质内局灶性不透明的结节,结节内可见肺内血管、支气管结构,由于其潜在恶性和异质性的特点,给临床诊断带来了困难[3-4]。美国国家肺癌筛查试验(筛查 53 000 例)显示,低剂量计算机断层扫描(CT)筛查可使肺癌相关死亡率降低 20%[5]。然而,自 CT 筛查以来,假阳性已经成为肺癌筛查的重要问题,为此,学者们通过各项研究来评估肺结节,结节筛查的敏感性为 30%~97%[6]。此外,肺结节早期筛查及后期随访存在着加重患者的经济负担、精神负担以及辐射风险的可能,一定程度上造成医疗资源的浪费[7]。目前,亚实性肺结节的良恶性评估已经成为临床上一个重要难题,本研究将回顾性分析 443 例亚实性结节患者的病例资料,探讨亚实性肺结节良恶性病变的独立危险因素,建立恶性概率预测模型,为肺结节的早期筛查提供新的诊断依据。
1 资料与方法
1.1 临床资料和分组
回顾性分析江苏省苏北人民医院 2014~2018 年入院的 443 例亚实性肺结节患者的病例资料。将患者按 2∶1 比例随机分为两组,其中建模组 296 例,男 125 例、女 171 例,平均年龄(55.9±11.1)岁;验证组 147 例,男 68 例、女 79 例,平均年龄(56.9±11.6)岁。纳入标准:胸部 CT 随访高度怀疑结节恶性可能,并有明确病理结果的亚实性肺结节患者。排除标准:患者入院前接受放射治疗、化疗等抗肿瘤治疗;病例资料不全者。
1.2 数据收集
收集患者的临床资料、影像学特征及肿瘤标志物。其中,临床资料包括年龄、性别、吸烟史、既往肿瘤史、肺基础疾病史。影像学特征包括结节直径、实性成分最大径、肿瘤实性成分直径比值(consolidation/tumor ratio,CTR)、结节位置、形态、边界、毛刺、分叶、钙化、空洞征、空泡征、血管集束征、细支气管征、胸膜凹陷征。肿瘤标志物包括癌胚抗原(carcinoembryonic antigen,CEA)、甲胎蛋白(alpha fetoprotein,AFP)、糖类抗原 125(carbohydrate antigen 125,CA125)、糖类抗原 199(carbohydrate antigen 129,CA199)和神经元特异性烯醇化酶(neuron-specific enolase,NSE)。
1.3 统计学分析
采用 SPSS 25.0 进行统计学分析,连续变量以均数±标准差(±s)表示,组间比较采用 t 检验,分类变量以例数和百分比表示,组间比较采用 χ2 检验。将年龄、性别、吸烟史、既往肿瘤史、肺基础疾病史、位置、结节直径、实性成分最大径、CTR、形态、边界、毛刺征、分叶征、钙化征、空洞征、空泡征、血管集束征、细支气管征、胸膜凹陷征、CEA、AFP、CA125、CA199 及 NSE 共 24 项因素进行单因素分析,以 P<0.05 为差异有统计学意义。将单因素分析结果中差异有统计学意义的数据纳入多因素分析,分析亚实性肺结节良恶性病变的独立危险因素,建立恶性概率预测模型,绘制受试者工作特征(receiver operating characteristic,ROC)曲线,计算曲线下面积(area under the curve,AUC),确定模型的诊断截点值,分析模型的灵敏度、特异性、阳性预测值(positive predictive value,PPV)和阴性预测值(negative predictive value,NPV)。最后,将验证组数据代入本研究模型、Mayo 模型、VA 模型、Brock 模型及北京大学人民医院(Peking University People’s Hospital,PKUPH)模型中,绘制 ROC 曲线,比较模型间的预测性能。
1.4 伦理审查
本研究已通过扬州大学医学院伦理委员会审批,批准号:YXYLL-2020-104。
2 结果
2.1 单因素及多因素分析结果
单因素分析结果显示,全组患者中肺结节良性和恶性患者在性别、结节直径、实性成分最大径、CTR、形态、边界、毛刺征、分叶征、钙化征、胸膜凹陷征及 CEA 方面差异有统计学意义(P<0.05)。建模组中肺结节良性和恶性患者在年龄、性别、结节直径、CTR、形态、边界、毛刺征、分叶征、钙化征及 CEA 方面差异有统计学意义(P<0.05);见表 1。综上所述,将年龄、性别、结节直径、实性成分最大径、CTR、形态、边界、毛刺征、分叶征、钙化征、胸膜凹陷征及 CEA 共 12 项数据纳入多因素分析,结果显示,性别、CTR、边界、毛刺征、分叶征及 CEA 是判断亚实性肺结节良恶性病变的独立危险因素;见表 2。



2.2 建立预测模型及绘制 ROC 曲线图
由此,建立亚实性肺结节良恶性预测模型:恶性概率 P=ex/(1+ex)。X=0.018+(1.436×性别)+(2.068×CTR)+(−1.976×边界)+(2.082×毛刺征)+(1.277×分叶征)+(2.296×CEA)。其中 e 为自然对数,X 因各项研究结果的不同而有所差别,定量结果有则记为 1,无则记为 0。性别女=1,男=0;C/T≥0.5=1,C/T<0.5=0;边界清晰=1,不清=0;有毛刺征=1,无毛刺征=0;有分叶征=1,无分叶征=0;CEA 阳性=1,阴性=0。基于建模组数据,绘制 ROC 曲线,AUC 值为 0.856(95%CI 0.804~0.908);见图 1。当截断点 T=0.778 时,约登指数最大,此时模型灵敏度为 81.6%,特异性为 75.6%,PPV 为 95.4%,NPV 为 39.8%。

2.3 恶性概率预测模型间的验证和比较
Mayo 模型[8]中 X=−6.8272+(0.0391×年龄)+(0.7917×吸烟史)+(1.3388×恶性肿瘤病史)+(0.1274×结节直径)+(1.0407×毛刺征)+(0.7838×上叶位置)。既往有吸烟史=1,无吸烟史=0;既往5年之外胸外肿瘤病史=l,无胸外肿瘤病史=0;结节直径以毫米为单位;有毛刺征=l,无毛刺征=0;结节位置在左肺或右肺上叶=1,位于其它位置=0。
VA 模型[9]中 X=−8.404+(2.061×吸烟史)+[0.779×年龄(10 岁)]+(0.112×直径)−[0.567×戒烟时间(10 年)]。既往有吸烟史=1,无吸烟史=0;年龄(10 岁)表示发现结节的年龄,并除以 10;结节直径表示结节所衡量到的最大直径;戒烟时间(10 年)表示戒烟的年数,并除以 10(0 表示未戒烟)。
Brock 模型[10]中 X=−6.6144+(0.6467×性别)+(−5.5537×直径)+(0.9309×毛刺征)+(0.6009×上叶)。其中女=1,男=0;结节直径表示结节所衡量到的最大直径(mm);有毛刺征=1,无毛刺征=0;结节位于上叶=1,位于其它位置=0。
PKUPH 模型[11]中 X=−4.496+(0.07×年龄)+(0.676×直径)+(0.736×毛刺征)+(1.267×肿瘤家族史)−(1.615×钙化征)−(1.408×边界)。其中有毛刺征=1,无毛刺征=0;有肿瘤家族史=l,无肿瘤家族史=0;有钙化征=l,无钙化征=0;结节边界清晰=1,边界模糊=0;结节直径表示结节所衡量到的最大直径(mm)。
将验证组数据代入本研究建立的模型和 Mayo、VA、Brock 及 PKUPH 模型中,绘制 ROC 曲线;见图 2。本研究建立模型的 AUC 值为 0.857,显著高于 Mayo、VA、Brock 和 PKUPH 模型;见表 3。5种模型的预测性能比较见表 4。



3 讨论
早期国外学者就曾设计相关模型对肺结节进行良恶性评估,如 Mayo 模型[8]、VA 模型[9]和 Brock 模型[10]。然而,随着肺癌流行病学趋势的改变,许多国家相继对肺结节诊治指南进行了更新,传统肺结节模型的实用性也受到了一定的影响。其中 Mayo 模型数据来源于 20 多年前,时效性较差。VA 模型中 98% 受试者是男性且年龄较大(平均年龄 66 岁),94% 受试者以前或现在吸烟[9],该模型基于高龄吸烟男性人群,限制了模型的通用性,同时未纳入影像特征进行分析,存在一定的误差。此外,鉴于国内外地域和种族差异,国外模型并不一定适用于国内患者。CHEST 指南曾指出:对亚洲肺结节患者的评估需要考虑到室内外高浓度空气污染所造成的肺癌高发率,以及亚洲非吸烟女性腺癌和肉芽肿性疾病的高患病率[12]。Fleischner 指南[13]认为肺结节最初评估应该集中在外观上,即实性结节和亚实性结节。不同于实性结节,亚实性结节数量明显较多,恶性率也较高,给肺结节早期筛查带来了困难。因此,可在传统模型的基础上建立适用于我国人群的亚实性肺结节良恶性预测模型,提高恶性结节的临床筛查率。
本研究将性别、CTR、边界、毛刺征、分叶征及 CEA 纳入预测模型公式中,相较于 Mayo、VA、Brock 及 PKUPH 等传统模型,本研究模型新增了 CTR、分叶征及 CEA。Ng 等[14]发现肺结节的恶性率与结节大小有一定的相关性,结节直径<5 mm,恶性率为 0%~1%;结节直径为 5~10 mm,恶性率为 6%~28%;结节直径>20 mm,恶性率为 64%~82%。本研究单因素分析中结节直径和 CTR 均有统计学意义,多因素分析后却只有 CTR 纳入到模型公式中。这可能由于本研究模型针对的是亚实性结节,其恶性率不仅与结节大小有关,还与其中实性成分有关。亚实性结节中实性成分具有一定的侵袭性,实性成分的增加往往提示着结节恶性浸润进展的加深。Elia 等[15]在肺结节随访中发现亚实性结节中固体成分的增加是恶性肿瘤的预兆。Hattori 等[16]基于肿瘤实变率,将肺结节分为纯磨玻璃结节(CTR=0,n=168),混合性磨玻璃结节(0<CTR<1.0,n=448)以及实性结节(CTR=1.0,n=565),结果显示肿瘤大小的影响应该只适用于实体结节,而不包括磨玻璃结节。肺结节的边缘特征有利于其良恶性诊断,其中恶性结节边缘多模糊,出现毛刺征、分叶征等特征。分叶征常见于周围性肺癌,由于每个方向上的生长速度不同或周围组织的阻碍,边缘多处呈弧形凸起。鲍彤等[17]对 117 例肺结节患者的病例资料进行分析,结果显示分叶征是判断孤立性肺结节良恶性的危险因素。Hu 等[18]通过对 112 例磨玻璃结节患者的研究,发现良恶性结节在分叶征方面有显著性差异,分叶征多见于恶性结节。目前,亚实性结节的分子评估也可以有效地用于肺癌的诊断,尤其是那些具有基因突变的亚实性结节[19]。肿瘤分子层面改变一般早于形态学改变,有研究[20]表明,早在部分腺癌患者出现明显病灶前,便可通过血液活检技术检测肿瘤标志物从而获取相关肿瘤信息。其中,CEA 的临床应用最为广泛,可作为肺癌最有价值的诊断指标。李笑莹等[21]在基于 250 例肺结节患者资料建立的预测模型中,也纳入了 CEA 进行模型分析,为肺结节良恶性评估提供了临床参考。
随着肺癌流行趋势的变化以及各研究设计的不同,最终纳入到模型公式中的因素也有所不同。肺结节患者年龄一般与恶性风险成正相关,Fleischner 指南[13]中提到,当年龄<35 岁,结节恶性可能较小,年龄>50 岁,结节恶性可能较大。相较于 Mayo 模型,本研究模型公式中未纳入年龄,其原因可能是本研究为单中心研究,样本量有限;也可能是由于随着年龄增加,恶性率也会增加,但年龄每增加1岁,恶性率变化的幅度并不明显。此外,虽然吸烟史是诱发肺癌的重要影响因素,但是近年来随着我国戒烟意识的逐渐加强,肺癌患者中非吸烟者比例逐年上升。Zhang 等[22]在 2012~2018 年期间对来自中国不同地区的 6 家医院 8 392 名员工进行了 CT 检查,研究发现肺癌患者中,非吸烟者(2.2%)多于吸烟者(1.4%)。同时,亚太肺结节评估指南也曾指出:亚洲非吸烟女性肺腺癌的患病率较高[12]。由此可见,在亚洲人群中,吸烟史对肺结节恶性率的影响正逐渐减弱。相较于国外 Brock 模型,上叶位置并未纳入到本研究的模型公式中,这可能由于在亚洲地区上叶尖后段位置也是肺结核的好发部位,美国胸科医师协会指南中“位于上叶的肺结节肿瘤概率大”并不完全适合我国和大部分亚太地区的国家[23]。钙化常见于良性结节中,如肉芽肿性疾病、错构瘤、肺结核、矽肺及淋巴结钙化等[24]。至于 PKUPH 模型公式中的钙化,在本研究中却未进入到模型公式中,这可能由于本次筛选入组的患者病例均是高度怀疑结节恶性可能且接受手术治疗的病例,存在选择偏倚。
模型的准确性受研究设计影响,包括患者特征和用于生成模型的人群中恶性结节的患病率[25]。考虑到国内外人群的差异,本研究数据均来自于我国近 5 年亚实性肺结节患者,引入了 CTR 和 CEA 两种新型预测值,纳入的临床、影像和肿瘤标志物方面指标多达 24 项,更为全面、详细。在模型的对比验证中,本研究模型的 AUC 值、灵敏度、特异性、PPV、NPV及准确性远高于 Mayo、VA、Brock 及 PKUPH 模型,表明本研究模型的漏诊率、误诊率、假阳性值及假阴性值均低于传统模型,诊断效力更为理想,具有较大的临床应用价值。
当然,本研究也尚有一些局限性。一方面,本研究人群均来自于高度怀疑结节恶性可能且接受手术治疗的患者,存在选择偏倚。另一方面,本研究为单中心研究,样本量有限,其具体临床效果还有待进一步的考察。此外,本研究模型的 NPV 相对较低,这说明了相对于恶性率大的结节,恶性率小的结节同样需要后期随访,依据结节动态变化从而选择下一步诊疗方法。
总而言之,本研究基于我国人群建立了亚实性肺结节良恶性预测模型,模型纳入了性别、CTR、边界、毛刺征、分叶征及 CEA 共 6 个独立危险因素。经过模型间对比验证,本研究模型 AUC 值、灵敏度、特异性、PPV、NPV及准确性均较高,其预测价值远超于传统模型,具有重要的临床应用价值,可作为亚实性结节的早期筛查方法。
利益冲突:无。
作者贡献:吴斌负责论文设计、数据收集与分析和论文初稿撰写;马骏负责数据收集、整理与分析;史宏灿负责论文审阅与修改。