
点击“AladdinEdu你的AI学习实践工作坊”注册即送-H卡级别算力沉浸式云原生集成开发环境80G大显存多卡并行按量弹性计费教育用户更享超低价。摘要空间转录组学Spatial Transcriptomics通过将基因表达信息映射回组织原位空间坐标填补了单细胞测序丢失空间信息的空白为解析组织微环境、细胞互作和疾病机制提供了全新维度。本文系统阐述空间转录组学的主流技术平台10x Visium、Slide-seq、MERFISH、Stereo-seq的原理、分辨率、通量及适用场景深入解析空间转录组数据分析的核心计算方法包括数据预处理、空间差异表达分析、细胞类型解卷积、空间共定位分析以及空间轨迹推断探讨空间转录组与单细胞数据整合的策略与应用。通过案例分析展示空间转录组在肿瘤微环境、发育生物学和神经科学中的突破性发现并展望多模态空间组学、活体动态成像等未来方向。关键词空间转录组空间组学10x Visium细胞解卷积组织微环境空间差异表达1. 引言组织是由数十亿细胞按照精妙的空间构型组成的复杂系统。细胞的空间位置决定了其接收的信号、相互作用的对象和执行的生物学功能。传统的bulk RNA-seq丢失了细胞间的空间信息而单细胞RNA-seqscRNA-seq虽然解析了细胞异质性却在组织解离过程中破坏了细胞的空间邻域关系。这就好比将一座城市的所有居民打散后统计人口结构却失去了对社区、街区、功能区的理解。空间转录组学Spatial Transcriptomics应运而生。它通过在组织切片上原位捕获mRNA将基因表达信息直接映射回组织空间坐标实现了“在哪里表达”与“表达什么”的统一。自2016年第一项空间转录组技术发表以来该领域呈爆发式发展涌现出多种技术平台涵盖从基于成像的原位杂交到基于测序的空间条形码等多种策略。同时海量的空间转录组数据对生物信息学方法提出了全新挑战推动了一系列计算方法的创新。本文将从技术原理、计算方法和应用案例三个层面系统介绍空间转录组学的核心内容帮助研究者理解这一前沿领域并开展自己的研究。2. 空间转录组技术平台空间转录组技术可分为两大类基于成像的方法和基于测序的方法。2.1 基于成像的方法2.1.1 原位杂交技术ISH/FISH荧光原位杂交FISH是最早的空间转录组方法通过荧光标记的探针与目标mRNA杂交在显微镜下直接观察基因表达的空间分布。smFISH单分子FISH使用多个短探针每个基因约48个杂交单个mRNA分子形成可检测的荧光点可实现单分子计数。但通量低一次只能检测几个基因。2.1.2 多重原位杂交技术MERFISHMultiplexed Error-Robust FISH通过组合编码和顺序杂交可在单细胞中同时检测数百至数千个基因。每个基因用独特的二进制码表示通过多轮杂交读取编码再通过错误校正解码。目前通量可达1000-10000个基因。seqFISH类似MERFISH通过多轮杂交和成像实现高通量检测。最新版本seqFISH可检测超过10000个基因。Xenium10x Genomics商业化平台基于MERFISH原理提供预设计的基因panel可在组织切片上检测数百个基因分辨率达单细胞水平。CosMx SMINanoString结合FISH和免疫荧光可同时检测上千个RNA和数十个蛋白质分辨率达单细胞级。优点单细胞/亚细胞分辨率可精确划定细胞边界。检测效率高可捕获低表达基因。可结合免疫荧光同时检测蛋白质。局限通量受限于预设panel通常不超过1000个基因。实验成本高成像时间较长。组织穿透深度有限。2.2 基于测序的方法2.2.1 10x Genomics Visium10x Visium是目前最广泛使用的商业化空间转录组平台基于空间条形码微阵列技术。原理玻璃芯片上预先印有数千个空间条形码点spot每个spot直径55 μm间距100 μm每个spot包含数百万条具有相同空间条形码的寡核苷酸含UMI和poly(dT)。将新鲜冰冻组织切片10 μm厚贴在芯片上进行固定、透化使mRNA释放并捕获到对应的spot上。反转录、建库、测序每个spot相当于一个“空间转录组”表达量与组织位置对应。经过组织染色成像后可将基因表达映射回组织学图像。版本演进Visium原版spot直径55 μm约覆盖3-10个细胞分辨率有限。Visium HD最新版本spot直径2 μm接近单细胞分辨率实现高分辨率空间转录组。优点全转录组无预设panel可检测所有基因。成熟商业化平台试剂盒和分析软件配套完善。可兼容FFPE样本。局限分辨率有限原版约3-10个细胞/spot需通过计算解卷积推断单细胞水平。无法精确定义细胞边界。2.2.2 Slide-seq / Slide-seqV2由哈佛大学开发的基于测序的高分辨率空间转录组技术。原理在盖玻片上排列数万个10 μmV2版磁珠每个磁珠携带独特的空间条形码和UMI、poly(dT)。将组织切片置于磁珠阵列上释放mRNA并捕获到磁珠。通过测序获取每个磁珠的表达谱同时通过成像定位磁珠空间坐标。优点高分辨率10 μm接近单细胞水平。全转录组。局限技术门槛高目前主要在少数实验室开展。商业化程度低。2.2.3 Stereo-seq华大智造华大智造开发的纳米级分辨率空间转录组技术。原理在芯片上制作DNA纳米球DNB阵列间距约500 nm每个DNB携带独特的空间条形码。组织切片置于芯片上捕获mRNA进行原位反转录、建库、测序。可实现亚细胞分辨率500 nm的全转录组检测。优点极高分辨率500 nm可达亚细胞水平。大视野可覆盖整张切片。全转录组。局限通量高数据量极大数百GB至TB级。商业化较新生态尚在建设中。2.3 技术对比技术分辨率基因数通量商业化适用场景MERFISH单细胞100-1000中-高是Xenium靶向基因panel细胞类型鉴定CosMx单细胞1000 RNA蛋白中是多模态分析Visium3-10细胞/spot全转录组高是常规空间转录组组织图谱Visium HD单细胞全转录组高是高分辨率空间转录组Slide-seqV210 μm全转录组高否高分辨率探索研究Stereo-seq500 nm全转录组极高是亚细胞分辨率大视野3. 空间转录组数据分析流程空间转录组数据分析需要处理空间坐标与基因表达双重信息核心流程包括数据预处理、空间差异表达、细胞类型解卷积、空间共定位与邻域分析、空间轨迹推断等。3.1 数据预处理3.1.1 原始数据处理Visium数据使用Space Ranger10x官方进行初步处理将测序读段比对到参考基因组。根据空间条形码分配读段到对应的spot。生成表达矩阵spot × gene和空间坐标信息。输出文件filtered_feature_bc_matrix.h5表达矩阵spatial/组织图像、spot坐标、高分辨率图像对齐信息3.1.2 读入分析环境SeuratRlibrary(Seurat)# 读入Visium数据visium_data-Load10X_Spatial(path/to/data/,filenamefiltered_feature_bc_matrix.h5)ScanpyPythonimportscanpyasscimportspatialdataassd adatasc.read_visium(path/to/data/)3.1.3 质量控制UMI计数过低表示技术失败过高可能为双spot或多细胞聚集。基因数类似单细胞过滤低质量spot。线粒体比例过高提示细胞应激或组织坏死区域。组织覆盖确保表达数据与组织学图像对齐排除组织外区域。# Seurat质控visium_data[[percent.mt]]-PercentageFeatureSet(visium_data,pattern^MT-)VlnPlot(visium_data,featuresc(nCount_Spatial,nFeature_Spatial,percent.mt),ncol3)visium_data-subset(visium_data,subsetnCount_Spatial500nFeature_Spatial200percent.mt20)3.2 空间差异表达分析空间差异表达分析旨在识别在特定空间区域如肿瘤边界、坏死区、结构域中高表达的基因。与传统差异表达不同空间DE需考虑空间自相关性。3.2.1 基于聚类的空间DE首先对spot进行空间聚类如使用HMRF或BayesSpace识别空间域再比较不同域之间的差异表达。Seuratvisium_data-SCTransform(visium_data,assaySpatial,verboseFALSE)visium_data-RunPCA(visium_data,assaySCT,verboseFALSE)visium_data-FindNeighbors(visium_data,reductionpca,dims1:30)visium_data-FindClusters(visium_data,resolution0.5)3.2.2 空间自相关分析Spatial AutocorrelationMoran’s I全局空间自相关统计量衡量基因表达在整个组织中的空间聚集程度。I0表示空间聚集高值相邻。Geary’s C类似Moran’s I对局部差异更敏感。SpatialDE基于高斯过程模型将空间变异分解为空间结构和随机噪声识别空间模式显著的基因。SpatialDEPythonimportspatialde spatialde_resultsspatialde.run(adata,coordinatesadata.obsm[spatial])3.2.3 区域特异表达分析针对特定组织结构如肿瘤边界、三级淋巴结构通过定义空间掩膜提取区域内spot比较区域内外表达差异。3.3 细胞类型解卷积由于空间转录组如Visium原版的分辨率不足每个spot可能包含多个细胞需要计算解卷积deconvolution来推断spot内的细胞类型组成。3.3.1 基于参考单细胞数据的解卷积利用同一组织或相似组织的scRNA-seq数据作为参考推断每个spot中各种细胞类型的比例。常用方法RCTDRobust Cell Type Decomposition基于泊松或负二项模型考虑spot内细胞类型组成。Cell2location贝叶斯分层模型可同时推断细胞类型丰度和基因表达空间模式。SPOTlight基于种子非负矩阵分解NMF速度快。Stereoscope深度学习框架利用scRNA-seq数据训练模型。RCTD使用示例Rlibrary(spacexr)# 准备scRNA-seq参考数据SingleCellExperiment对象reference-scRNA_ref# 准备空间数据spatial_counts-GetAssayData(visium_data,assaySpatial,slotcounts)coords-GetTissueCoordinates(visium_data)spatial_obj-SpatialRNA(coords,spatial_counts)# 运行RCTDrctd-create.RCTD(spatial_obj,reference,max_cores4)rctd-run.RCTD(rctd)# 提取细胞类型比例celltype_proportions-rctdresults$weights3.3.2 无参考解卷积当缺乏scRNA-seq参考数据时可通过矩阵分解或空间模式推断细胞类型。NMF非负矩阵分解将表达矩阵分解为细胞类型特征矩阵和丰度矩阵。BayesSpace结合空间信息进行聚类增强生物学可解释性。3.4 空间共定位与细胞-细胞相互作用分析空间转录组学的一大优势是能够直接分析不同细胞类型或基因表达模式的空间邻域关系推断细胞间相互作用。3.4.1 共定位分析计算两种细胞类型或基因的空间分布重叠程度皮尔逊相关系数基于spot水平的丰度相关性。最近邻分析计算不同细胞类型之间的空间距离分布。共定位得分使用coloc等方法量化两通道图像的重叠。3.4.2 配体-受体相互作用推断利用已知的配体-受体L-R数据库如CellChatDB基于spot内或邻域spot的细胞类型组成推断潜在相互作用。常用工具CellChat基于单细胞数据推断细胞间通信已扩展至空间数据。SpatialDM专门用于空间转录组的配体-受体相互作用分析。stLearn整合空间位置和表达信息推断细胞互作。3.5 空间轨迹推断在发育或疾病进展过程中细胞状态沿组织空间轴呈现连续性变化需要空间轨迹推断spatial trajectory inference来重建这些过程。3.5.1 基于组织路径的轨迹通过手动或自动定义组织路径如肿瘤侵袭前沿、发育轴沿路径分析基因表达的变化趋势。3.5.2 基于图的轨迹推断PAGAPartition-based Graph Abstraction将spot聚类抽象为节点节点间连接强度表示细胞状态连续性可在空间图上进行轨迹推断。stLearn结合空间位置和表达相似性构建空间图计算空间拟时序。3.6 空间转录组与单细胞数据整合整合空间转录组和单细胞数据是当前研究热点可实现“单细胞分辨率”的空间表达图谱。3.6.1 标签转移Label Transfer利用scRNA-seq中定义的细胞类型标签通过共享的基因表达空间将标签映射到空间spot。常用方法Seurat TransferData基于CCA的标签转移。Symphony高效的参考映射方法。# 假设已有scRNA-seq参考sc_ref和空间数据spatial_obj# 寻找共同基因common_genes-intersect(rownames(sc_ref),rownames(spatial_obj))# 运行标签转移spatial_obj-TransferData(referencesc_ref,queryspatial_obj,dims1:30,featurescommon_genes)3.6.2 整合映射Integration将空间数据和单细胞数据整合到统一的嵌入空间同时保留空间坐标和转录组信息。工具Seurat CCA/IntegrateData适用于多模态数据整合。Harmony批次校正方法可整合空间和单细胞数据。SPARK专为空间数据设计的整合方法。4. 应用案例4.1 肿瘤微环境研究案例乳腺癌空间转录组揭示三级淋巴结构TLS与免疫治疗响应使用Visium对乳腺癌组织切片进行空间转录组分析。通过细胞类型解卷积识别肿瘤细胞、免疫细胞、基质细胞的空间分布。发现B细胞富集的三级淋巴结构与抗PD-1治疗响应密切相关。结合空间邻域分析揭示TLS区域内T细胞-B细胞-树突状细胞的相互作用网络。4.2 发育生物学案例小鼠胚胎心脏发育的空间图谱使用Slide-seqV2对小鼠胚胎心脏连续切片进行高分辨率空间转录组。结合scRNA-seq数据构建心脏细胞类型空间分布图。通过空间轨迹推断揭示心肌细胞、心内膜细胞沿发育轴的分化轨迹。鉴定关键转录因子如Tbx5、Gata4的空间表达模式指导心脏发育研究。4.3 神经科学案例阿尔茨海默病AD患者脑组织空间转录组对AD患者和健康对照的脑组织进行MERFISH或Visium分析。发现Aβ斑块周围胶质细胞反应性增强特定神经元亚群丢失。通过空间共定位分析鉴定与斑块空间相关的炎症基因表达特征。构建AD相关的空间基因调控网络。5. 挑战与未来方向5.1 当前挑战分辨率与通量的权衡高分辨率如Stereo-seq产生海量数据分析计算压力大高通量Visium分辨率有限依赖计算解卷积。多模态整合空间转录组与空间蛋白质组、空间代谢组、组织病理图像的整合方法尚不成熟。标准化与可重复性不同平台、不同样本间的批次效应校正缺乏统一标准。动态过程捕捉静态切片只能提供时间快照无法直接观测动态过程。临床转化空间转录组成本高、通量低限制其在临床诊断中的应用。5.2 未来趋势多模态空间组学同时检测转录组、蛋白质组、代谢组、表观组的多模态空间技术将更加普及。活体空间成像结合双光子显微镜等技术实现在活体组织中的动态空间转录组监测。深度学习应用使用Transformer、图神经网络等模型从空间数据中自动提取模式和生物学机制。空间-临床整合将空间转录组数据与临床病理图像、预后信息关联开发新的生物标志物和诊断方法。大规模空间图谱类似人类细胞图谱Human Cell Atlas构建人类全器官空间转录组图谱。6. 结语空间转录组学使基因表达分析回归到组织原位重新连接了分子信息与组织结构。从基于成像的MERFISH到基于测序的Visium、Stereo-seq多种技术平台各具优势满足不同研究需求。与此同时空间数据分析方法也在快速发展从空间差异表达、细胞解卷积到细胞互作推断和空间轨迹重建构成了完整的分析体系。空间转录组学已广泛应用于肿瘤免疫、发育生物学、神经科学等领域揭示了传统方法无法发现的空间模式。未来随着技术的不断进步和计算方法的创新空间转录组学将成为理解组织功能、疾病机制和药物响应的核心工具推动精准医学迈向空间维度。参考文献Ståhl, P. L., et al. (2016). Visualization and analysis of gene expression in tissue sections by spatial transcriptomics.Science, 353(6294), 78-82.Chen, K. H., et al. (2015). Spatially resolved, highly multiplexed RNA profiling in single cells.Science, 348(6233), aaa6090.Rodriques, S. G., et al. (2019). Slide-seq: A scalable technology for measuring genome-wide expression at high spatial resolution.Science, 363(6434), 1463-1467.Chen, A., et al. (2022). Spatiotemporal transcriptomic atlas of mouse organogenesis using DNA nanoball-patterned arrays.Cell, 185(10), 1777-1792.Cable, D. M., et al. (2022). Robust decomposition of cell type mixtures in spatial transcriptomics.Nature Biotechnology, 40(4), 517-526.Kleshchevnikov, V., et al. (2022). Cell2location maps fine-grained cell types in spatial transcriptomics.Nature Biotechnology, 40(5), 661-671.点击“AladdinEdu你的AI学习实践工作坊”注册即送-H卡级别算力沉浸式云原生集成开发环境80G大显存多卡并行按量弹性计费教育用户更享超低价。