
编者述要图谱尺度的细胞微环境解析仍存在技术挑战。本文作者提出可扩展的对比学习框架通过细胞中心子图实现跨平台细胞生态位映射将该框架应用于超1,000万个细胞成功揭示了肿瘤与大脑组织的空间分布规律。摘要在图谱尺度解析细胞微环境仍面临核心挑战原因是分子特征、空间语境与平台异质性者高度耦合。本文提出可扩展的对比学习框架CellNiche该框架以细胞为中心构建空间近邻子图从空间组学数据中识别并表征细胞微环境。CellNiche融合空间共定位与分子共表达信号学习微环境感知的嵌入表征。在来自多种平台、总计超1,000万个细胞的空间组学数据集中扩展性实验证实模型表征能力随训练数据量增加而提升同时在聚类效果、嵌入质量与计算效率上均具备显著优势。在多样本人非小细胞肺癌NSCLC队列中CellNiche可识别保守型与样本特异性的肿瘤及免疫微环境并捕捉局部空间过渡特征。在4个独立小鼠脑图谱中CellNiche将293张组织切片整合为统一虚拟脑图谱实现跨图谱标注迁移与空间精细解析。liangzhongming21mails.ucas.ac.cnywangamss.ac.cnliushipinggenomics.cn#空间组学 #细胞微环境 #对比学习 #图谱级数据 #图神经网络 #空间整合 #肿瘤微环境 #小鼠脑图谱结果CellNiche通过计算重构细胞生态位基于分子特征与邻域细胞完成细胞表征图1CellNiche框架总览a. CellNiche整体架构包含输入模块、编码器模块、损失函数模块3大核心组件。输入模块以细胞为中心构建空间子图模拟细胞生态位支持小批量处理且对数据尺度不敏感编码器模块基于图神经网络GNN处理细胞微环境子图为每个细胞生成低维嵌入在单个微环境内依据空间共定位或分子共表达将邻域细胞划分为正/负样本损失函数模块采用微环境上下文对比学习指导模型训练可选用难样本感知对比损失强化表征。b. 本研究基准数据集汇总按数据尺度、组学模态/技术平台、应用场景分类。c. 左不同方法在基准数据集细胞数5千20万上生成微环境表征的计算耗时右CellNiche在整合图谱数据集细胞数20万1000万上的计算耗时虚线为CPU耗时、实线为GPU耗时。CellNiche在空间蛋白质组数据上表现精准且稳健图2CellNiche在空间转录组与空间蛋白质组数据的基准测试a、b. 小鼠躯体感觉皮层osmFISH数据细胞分别按生态位标签a、细胞类型标签b着色。c. CellNiche在小鼠躯体感觉皮层数据集识别的细胞生态位。d. 其他方法在该数据集识别的细胞生态位。e. 基于ARI、AMI、Macro-F1、轮廓系数的性能对比每种方法独立运行3次误差线为均值±标准差。f、g. 3例野生型小鼠脾脏CODEX数据细胞分别按细胞类型标签f、生态位标签g着色。h. CellNiche在小鼠脾脏CODEX数据集识别的细胞生态位。i. 其他方法在该数据集识别的细胞生态位。j. 基于AMI、ARI、Macro-F1、轮廓系数的性能对比3例样本评估误差线为均值±标准差。CellNiche可高效解析人类肿瘤病理微环境图3 CellNiche在复杂组织结构与肿瘤病理微环境的性能a、b. 小鼠大脑STARmap PLUS冠状切片well11细胞分别按生态位标签a、细胞类型标签b着色。c. CellNiche在well11切片识别的组织亚区域。d. 其他方法在该切片识别的组织亚区域。e. 基于4项指标的性能对比8例样本评估误差线为均值±标准差。f、g. 人结直肠癌CODEX切片reg007_A细胞分别按细胞类型标签f、生态位标签g着色。h. CellNiche在该切片识别的空间区域。i. 其他方法在该切片识别的空间区域。j. 基于4项指标的性能对比每种方法独立运行3次误差线为均值±标准差。CellNiche整合肿瘤队列数据并解析肿瘤内异质性图4 CellNiche解析非小细胞肺癌的细胞微环境a. 17种CellNiche微环境的细胞类型富集点大小为log2倍变化值颜色为显著性置换检验p值p0.01为显著富集。b. 各样本中CellNiche空间生态位的占比。c. 淋巴系富集生态位C0的空间图谱左及LUAD-5 R1、LUAD-12中对应淋巴系细胞类型右。d. CellChat推断的LUAD-5 R1中C0生态位内MHC-I信号通信概率。e. C0生态位内细胞类型空间近邻互作强度星号为显著配对*p0.05。f、g、h. LUAD-9 R1与LUAD-12中成纤维细胞/中性粒细胞富集生态位分布f、细胞空间分布g、细胞-细胞互作强度h。图5 CellNiche识别并表征从淋巴结构到肿瘤核心的带状分布模式a. LUAD-5 R1切片全局与局部视图。b. 各生态位C0/C9/C7/C14/C5/C15的细胞类型占比。c. 局部区域各生态位的差异表达基因。d. 核心基因HLA-DRA、CD74、BGN等的空间表达水平。e. 不同微环境的主要细胞类型占比。f. 癌症核心通路血管生成、凋亡、EMT 等的GSVA评分。g. 代谢通路糖酵解、脂肪生成等的GSVA评分。CellNiche整合跨平台空间图谱并构建统一虚拟组织图谱图6 CellNiche实现跨平台异质空间图谱整合a. 4张代表性切片的基因panel交集大小。b. CellNiche、FuseMap、Harmony生成的细胞嵌入UMAP投影按切片ID着色。c. 批次校正评估指标对比。d. KNN方法的标注迁移准确率。e. MLP方法的标注迁移准确率。f. CellNiche嵌入的UMAP投影按主要脑区标注着色。g. 图谱1主要组织区域标注的迁移占比。图7 CellNiche实现跨图谱组织区域的归一化整合a. 图谱1 well05切片的区域精修原标注LSX_HY_MB_HB的细胞被重标注为纤维束区FbTrt经多图谱验证、标记基因表达、Leiden聚类一致性证实。b. 图谱1 well03切片CNU_13区域的亚结构划分经标记基因Foxp2/Sox4、Tshz1/Sox11与Leiden聚类验证该区域可分为2个亚区。数据小鼠躯体感觉皮层osmFISHhttps://github.com/drieslab/spatial-datasets小鼠脾脏CODEXhttps://data.mendeley.com/datasets/zjnpwh8m5b/1小鼠大脑STARmaphttps://singlecell.broadinstitute.org/single_cell/study/SCP1830人结直肠癌CODEXhttps://data.mendeley.com/datasets/mpjzbtfgfr/1非小细胞肺癌CosMxhttps://nanostring.com/products/cosmx-spatial-molecularimager/nsclc-ffpe-dataset/小鼠大脑空间转录组图谱❶https://singlecell.broadinstitute.org/single_cell/study/SCP1830❷https://doi.brainimagelibrary.org/doi/10.35077/g.610❸https://doi.brainimagelibrary.org/doi/10.35077/act-bag❹https://info.vizgen.com/mouse-brain-map小鼠E16.5全胚胎Stereo-seqhttps://db.cngb.org/stomics/mosta/download/代码GitHubhttps://github.com/Super-LzzZ/CellNicheZenodohttps://doi.org/10.5281/zenodo.19143524详细总结思维导图核心数据集规模参考Nat Commun. 2026 Apr 22. doi: 10.1038/s41467-026-71759-4.CellNiche represents cellular microenvironments in atlas-scale spatial omics data with contrastive learning260422CellNiche.pdf注AI辅助创作如有错误欢迎指出。内容仅供参考不构成任何建议。