
小编导读这项发表于《Cell》的重磅研究对16,369个肿瘤全基因组进行了系统的微生物信号分析开发并验证了名为PathSeq-T2T的宿主过滤与去污染流程。研究发现大多数癌症类型的微生物信号在去污染后与背景无法区分唯有口消化道癌如结直肠、口咽、食管和胃癌携带可检测的、多界的微生物群落。该研究不仅提供了高分辨率的癌症微生物组图谱还揭示了微生物负荷与肿瘤突变负荷之间的显著相关性为理解肿瘤微环境与宿主互作提供了新的视角。摘要微生物是肿瘤微环境的重要组成部分但关于不同癌症类型中微生物的普遍存在程度既往研究报告不一亟需更稳健的方法来表征肿瘤相关微生物组。本研究构建并基准测试了一套宿主序列扣除与分类流程用于在全基因组测序数据中识别微生物并将其应用于英国十万人基因组计划中的16,369个高深度肿瘤全基因组。去污染后大多数癌症类型的微生物信号与背景无法区分。但在口消化道肿瘤中研究检测到了多界的微生物群落包括细菌、真菌、病毒、古菌以及部分病例中的原生动物寄生虫——毛滴虫。这些群落的组成因肿瘤部位和亚型而异并且在微卫星不稳定和聚合酶ε/δ基因突变的肿瘤中微生物定植程度更高。此外在口消化道癌中观察到微生物载量与肿瘤突变负荷之间存在相关性。该分析有助于厘清泛癌微生物结构并将肿瘤微生物组与宿主表型及肿瘤基因组背景联系起来。研究方法数据来源与处理研究使用了英国十万人基因组计划中的16,369个肿瘤样本和15,249个匹配的胚系样本包括外周血和唾液。肿瘤样本的测序覆盖度约为100×胚系样本约为30×。所有数据均以GRCh38比对后的BAM文件形式交付。核心分析流程PathSeq-T2T研究团队开发了PathSeq-T2T流程该流程在前期PathSeq工具基础上进行了关键改进。具体步骤包括初步过滤利用samtools去除正确比对到GRCh38的读段保留未比对或非正确配对的读段。质量与复杂度过滤使用GATK PathSeqFilterSpark去除低质量、低复杂度、重复序列以及匹配到人参考基因组、MHC区域、载体序列和已知转录本的读段。二次宿主比对将过滤后的读段与完整的人类参考基因组T2T-CHM13进行比对进一步扣除人类来源序列。微生物分类通过Kraken2、MetaPhlAn4和Sylph三个工具并行进行分类并相互验证。Kraken2侧重灵敏度MetaPhlAn4侧重特异性Sylph则基于基因组覆盖度估算丰度。丰度标准化使用原始测序深度对微生物读段计数进行标准化计算每百万输入读段中的微生物读段数用于估算微生物与宿主DNA的比例。去污染策略泛癌等 prevalence 分数鉴于污染物会在不同类型样本中均匀分布研究设计了泛癌等 prevalence 分数。该分数基于物种在不同癌种中的检出 prevalence 计算取值范围0到1。分数越高表明该物种在各癌种中分布越均匀越可能是污染物。研究将PCE 0.7作为污染物去除阈值。已知的肿瘤相关物种如胃部的幽门螺杆菌、口咽癌的HPV-16具有较低的PCE分数而常见环境污染物如痤疮皮肤杆菌则具有高PCE分数。验证实验为验证流程性能研究设计了多个层次的基准测试。在计算机模拟混合实验中将已知组成的微生物群落与人类参考基因组读段按不同比例混合。在体外混合实验中将结直肠癌细胞系HCT116的DNA与已知微生物标准品按比例混合并进行测序。此外还分析了结直肠癌细胞系的全基因组数据以及100kGP中已知高微生物量的唾液样本和低微生物量的血液、胶质母细胞瘤样本。主要结果大多数癌症类型缺乏可检测的微生物组经过严格的去污染处理后只有在口消化道癌包括结直肠癌、口咽癌、食管癌和胃癌中微生物信号才持续高于背景阈值。在结直肠癌中微生物读段密度中位数为145 RPM口咽癌为3–189 RPM食管癌和胃癌则相对较低。而在其他如脑、乳腺、肝、肺、胰腺、前列腺等癌症类型中微生物信号在去污染后与血液或脑瘤等无菌/低微生物样本的背景水平无法区分。口消化道癌具有位点特异性的多界微生物群落在口消化道癌中微生物群落呈现明显的位点特异性分布。结直肠癌中以拟杆菌属、梭杆菌属和埃希氏菌属为主口咽部和食管胃癌中以普雷沃氏菌属、韦荣球菌属和链球菌属为主。值得注意的是许多通常在口腔中常见的物种如具核梭杆菌、微小微单胞菌也出现在结直肠癌中提示肿瘤微环境可能打破了正常的组织位点特异性。研究不仅检测到细菌和病毒还发现了真菌如白念珠菌、光滑念珠菌、酿酒酵母、古菌如史氏甲烷短杆菌以及原生动物的信号。其中原生动物毛滴虫属的信号在食管癌和胃癌中偶有检出但在口咽部和结直肠癌中未发现。病毒方面人乳头瘤病毒16型特异性地富集于口咽癌而EB病毒和巨细胞病毒则相对广泛分布。微生物负荷与肿瘤突变负荷显著相关在结直肠癌中微卫星不稳定和聚合酶突变型肿瘤的微生物载量显著高于微卫星稳定型肿瘤。进一步分析发现肿瘤突变负荷是微生物载量的独立预测因子。即使在微卫星稳定型肿瘤内部突变负荷越高微生物读段密度也越高。每增加10倍的肿瘤突变负荷微卫星稳定型肿瘤的微生物丰度平均增加4.7倍微卫星不稳定型增加3.6倍。这种相关性在口咽癌和胃食管癌中也得到验证。在控制肿瘤突变负荷的影响后微卫星不稳定和聚合酶突变状态本身不再对微生物载量有显著贡献提示突变负荷是更核心的驱动因素。微生物组成与肿瘤部位、突变负荷及发病年龄相关在结直肠癌中高突变负荷的肿瘤富集了口腔来源的物种如具核梭杆菌和具核梭杆菌动物亚种。而低突变负荷的肿瘤则富集了具有抗炎特性的肠道共生菌如普通拟杆菌、普拉梭菌。同时部分物种的丰度主要与肿瘤解剖部位相关而非突变负荷。例如产气荚膜梭菌和罗斯氏菌与近端结肠肿瘤相关而嗜黏蛋白阿克曼菌则与远端结肠肿瘤相关。特别值得注意的是在微卫星稳定型且位于远端结肠的早发性结直肠癌患者中嗜黏蛋白阿克曼菌的丰度显著降低。这一结果在两个独立数据集中得到了一致观察提示该菌的缺失可能与年轻患者的肠道屏障功能或黏膜稳态异常有关。结论本研究通过开发并验证一套严谨的生物信息学流程PathSeq-T2T和去污染策略PCE分数系统解析了泛癌微生物组的真实结构。核心结论是在充分去除背景污染后大多数实体瘤并不携带可通过全基因组测序检出的微生物组真正的肿瘤相关微生物群落主要局限于与外界相通的黏膜和上皮屏障部位尤其是口消化道癌。这些肿瘤中的微生物群落具有多界组成和位点特异性分布其负荷与肿瘤突变负荷密切相关揭示了肿瘤基因组背景与微环境之间的潜在关联。研究还发现嗜黏蛋白阿克曼菌在早发性结直肠癌中显著减少为相关机制的探索提供了新线索。参考文献Dohlman, A.B., Mjelle, R., Wood, H.M., et al. Biodiversity and biogeography of the multi-kingdom cancer microbiome. Cell, 2026, 189(1): 1-21. https://doi.org/10.1016/j.cell.2026.04.015