广东省人民医院钟文昭教授团队:基于影像组学的支持向量机区分驱动肺腺癌进展的分子事件)
01文献信息本次分享的文献是由广东省人民医院肺癌研究所钟文昭教授团队联合华南理工大学医学院、广东省人民医院病理科、核医学科等多学科团队在2024年9月19日在《Journal of Thoracic Oncology》中科院1区IF20.8上发表的研究“Radiomics-Based Support Vector Machine Distinguishes Molecular Events Driving the Progression of Lung Adenocarcinoma”即基于影像组学的支持向量机区分驱动肺腺癌进展的分子事件该研究利用放射组学特征对1212例0–IB期肺腺癌LUAD患者进行无监督聚类构建支持向量机SVM分类器揭示不同放射组学集群与分子特征基因组、转录组、免疫微环境之间的关联并验证其预后价值。图 1研究流程图展示了研究全流程包含4个核心队列广东省人民医院GDPH回顾性队列12011-2020年最终纳入818例、回顾性队列22020-2022年无经典EGFR突变最终纳入394例、前瞻性队列32022-2023年含配对CT与RNA-seq最终纳入187例及TCIA数据库NSCLCRadiogenomics外部队列含配对数据最终纳入55例。流程依次为影像组学特征提取→基于回顾性队列进行共识聚类→构建SVM分类器→结合GDPH-3队列RNA-seq解析分子特征→通过外部队列验证。02研究背景及目标研究背景肺腺癌LUAD是最常见的非小细胞肺癌NSCLC高分辨率CTHRCT的普及使大量早期肺腺癌以肺结节形式被检出但其影像学特征与分子进展机制的关联尚未明确。影像学上的实性成分比例CTR可提示肿瘤恶性程度但其主观性较强。肿瘤进展伴随癌基因变异、肿瘤抑制基因失活及TME重塑但影像组学特征与这些分子事件的关联仍存在研究缺口。研究目标基于无监督聚类方法探究影像组学相似性与早期肺腺癌生物学行为侵袭性、病理分级、预后等的关联。构建稳定的SVM分类器实现基于影像组学的肺腺癌分子亚型划分。桥接影像组学特征与基因组、转录组特征揭示驱动肺腺癌进展的关键分子事件如增殖、免疫微环境变化。验证与预后相关的RNA特征为早期肺腺癌风险分层提供工具。03数据和方法研究数据患者队列共纳入4个队列均为0-IB期肺腺癌患者广东省人民医院GDPH回顾性队列1GDPH-12011-2020年手术患者最终纳入818例GDPH回顾性队列2GDPH-22020-2022年无经典EGFR突变19号外显子缺失或L858R患者最终纳入394例GDPH前瞻性队列3GDPH-32022-2023年有肿瘤组织及术前1个月内HRCT的患者最终纳入187例含配对CT与RNA-seq数据外部公共队列TCIA数据库NSCLCRadiogenomics数据集纳入55例含配对CT与RNA-seq数据用于外部验证。影像数据扫描设备GE、Siemens、Philips等64-256层CT扫描参数120kVp100-670mAs层厚0.60-1.25mm影像处理ITKSNAP手动分割感兴趣区域ROI排除支气管、血管等非肿瘤结构采用Pyradiomics提取2D影像组学特征。分子数据NGS数据检测520基因OncoScreenPlus或196基因GeneseeqPrime面板分析164个共基因的突变、融合及拷贝数变异CNVRNA-seq数据采用DNBSEQ-T7平台测序150bp双端reads比对至人类基因组GRCh38通过RPKM定量基因表达。研究方法影像组学分析特征提取基于2DCT影像提取纹理、形状等影像组学特征计算2D-CTR最大实变直径/最大肿瘤直径共识聚类采用R包“ConsensusClusterPlus”对2D影像组学特征进行无监督聚类根据累积分布函数曲线变化确定最佳聚类数k4。分类器构建采用Python包“Sklearn”构建SVM分类器以聚类结果为标签、影像组学特征为输入按3:7划分训练集与验证集评估分类准确率。分子与生物信息分析差异基因分析R包“DESeq2”筛选差异表达基因|log2FC|1p0.05功能富集分析R包“clusterProfiler”进行GO基因本体、KEGG京都基因与基因组百科全书富集分析R包“GSEA”进行基因集富集分析TME分析单样本GSEAssGSEA评估免疫细胞浸润及免疫功能基因模块与特征构建加权基因共表达网络分析WGCNA筛选预后相关基因模块Cytoscape识别枢纽基因R包“Singscore”构建RNA预后特征。统计分析采用R4.3.3软件分类变量用卡方检验或Fisher精确检验连续变量用t检验生存分析Kaplan-Meier法计算无病生存期DFS、总生存期OSlogrank检验比较差异Cox回归评估风险因素。04研究结果图图 2集群生存曲线与基因组图谱A1212例患者的共识矩阵图显示k4时聚类稳定。B-EKaplan-Meier生存曲线C1的DFS显著优于C2HR0.14p0.0026和C3HR0.30p0.0036与C4无差异p0.6051。F无经典EGFR突变患者的基因组全景图展示癌基因突变、融合等分布。G各集群癌基因频率对比C2/C3KRAS突变率更高C1ERBB2、BRAF突变率更高C1ALK融合率最低。H不同病理阶段AIS/MIA、分级等的基因频率如KRAS在黏液腺癌中达73.1%。I癌基因与TP53共突变频率C2/C3共突变率显著高于C1/C4。J不同KRAS亚型与TP53/STK11共突变频率体现KRAS异质性。图 3集群转录组与肿瘤微环境差异AGDPH-3队列RNA-seq的PCA图显示C1与C4、C2与C3分别聚类相近。B-CGO富集分析C2较C4上调增殖相关通路C3较C2下调免疫相关通路。D-GGSEA分析C2/C3富集“E2F靶标”等增殖通路C4较C1上调发育信号通路。H-IGDPH-3的ssGSEA评分C2免疫细胞CD4T、B细胞浸润及免疫功能更高C1/C4增殖活性低。J-K外部队列验证C3免疫细胞浸润如激活CD8T细胞及免疫功能如抗原呈递显著低于C2呈免疫抑制状态。图 4预后相关RNA特征构建与验证AWGCNA分析的基因模块-集群关联图黄色模块与增殖相关绿色模块与信号通路相关。B-D绿色、黄色、红色模块的GO富集结果分别关联信号通路、增殖、免疫功能。E-F绿色、黄色模块的枢纽基因网络。GGDPH-3中RNA特征评分C2/C3高风险评分显著高于C1/C4低风险。H-N4个外部数据集TCGA-LUAD、GSE31210等的生存曲线高风险组OS/DFS均显著缩短HR0.19~0.59p0.05。05讨论创新点将影像组学与多组学数据NGS、RNA-seq结合探索CT影像背后的分子学机制。建立SVM分类器精确度接近98%实现了影像到分子水平的跨学科桥接。揭示了相似影像结节在免疫微环境上的差异免疫活跃 vs. 免疫抑制。局限性训练队列为回顾性数据存在偏倚。RNA-seq样本量较小特别是Cluster 3病例数不足需要外部验证。外推至其他人群的泛化性仍待验证。临床价值有助于对早期LUAD结节进行风险分层惰性 vs. 进展性。为精准治疗提供参考如是否需要更积极手术、靶向或免疫治疗。可能推动AI影像学与分子诊断的深度融合。