
小罗碎碎念文献来源本文基于2026-04-29发表在Nature Medicine上的论文《An agentic framework for autonomous scientific discovery in cancer pathology》核心作者为Florian Trost、Bide Zhang和Yuri Tolkach来自德国科隆大学等机构。论文所有代码、参数和结果均已公开可在GitHub和Zenodo上获取。传统病理AI要么依赖人工设计的特征要么需要针对每个任务单独训练模型不仅解释性差而且工作流程碎片化。它们只能完成被明确教导过的任务无法自己提出新的生物学假设更不能自主发现隐藏在切片中的肿瘤规律。来自德国科隆大学等机构的研究团队在Nature Medicine杂志上发表了一项突破性研究——开发了一个名为SPARKSystem of Pathology Agents for Research and Knowledge的智能体框架打造了一个会做研究的数字病理大脑。SPARK能够自主思考、提出假设、设计实验并验证结果从常规的病理切片中挖掘出人类医生和传统AI都无法发现的肿瘤生物学规律。医学AI交流群大家好我是罗小罗团队的联合创始人00后也是本篇推送的作者。目前我们团队的全平台关注量120,000交流群总成员4000大部分来自国内外顶尖院校/医院期待您的加入添加好友的时候记得备注【姓名-单位/学校-科室/专业】哦SPARK自主科研工作流这是SPARK最核心的部分展示了它作为数字病理大脑的四个串联工作阶段每个阶段由专门的AI智能体负责。第一阶段想法生成Idea generation——“首席科学家提出假设”输入用自然语言写的任务描述比如生成能分析7种细胞类型来预测患者生存的方法核心智能体想法生成智能体Idea generation agent论文中使用OpenAI o1当时最强的推理模型支持设置创造力级别基础→高级→创意→远见和每个想法涉及的细胞类型数量系统地探索所有可能的生物学假设质量控制智能体想法审核智能体Idea review agent检查生成的想法是否符合任务指南想法去重智能体Idea duplicate detector agent用相似度评分0-10判断重复相似度≥8的想法会被丢弃输出原始想法数据库Raw idea database每个想法包含标题、涉及细胞类型、生物学假设、实现方法、复杂度评估等完整信息第二阶段想法精炼Idea refinement——“资深助理细化实验方案”核心智能体想法精炼智能体Idea refinement agent工作内容把模糊的生物学想法转化为精确、可执行的技术方案例如把淋巴细胞浸润影响预后细化为计算肿瘤边界100μm范围内的淋巴细胞密度统计每个1mm²区域的平均值和最大值同时补充每个参数的计算逻辑、输入输出格式和生物学意义输出精炼想法数据库Refined idea database所有想法都标准化为可直接编码的格式第三阶段想法/参数编码Idea/parameter coding——“程序员实现分析工具”核心智能体想法编码智能体Idea coding agent论文中使用Anthropic Claude Sonnet 3.5当时最强的代码模型把精炼的想法转化为可运行的Python代码1个想法通常对应1-5个可计算的数值参数代码审核智能体Code review agent自动检查代码错误最多重试3次实现测试用10张标准测试切片验证代码的正确性和运行效率第四阶段参数验证Parameter verification——“质检员筛选可靠工具”大规模队列分析把编码好的参数批量应用到多肿瘤类型的患者队列计算每张切片的所有参数值参数验证智能体Parameter verification agent过滤掉不合格的参数排除计算效率过低的参数单张切片分析超过60秒排除结果不稳定、缺失值过多或有明显偏差的参数排除高度相关的冗余参数相关系数0.9输出经过验证的高质量参数库用于后续的临床相关性分析和预后建模人类交互模块——“让医生也能快速做科研”这是SPARK的可选扩展模块专门为没有编程能力的病理医生和临床研究者设计实现人类想法→AI自动验证的闭环输入病理学家/研究者用非结构化自由文本写的想法列表示例“1. 肿瘤细胞附近的淋巴细胞数量。2. 肿瘤基质中巨噬细胞的密度”核心智能体想法格式化智能体Idea formulation agent把人类的自然语言想法自动转化为SPARK标准格式的结构化想法输出标准化的原始想法数据库直接接入图a中的想法精炼及后续流程SPARK的输入数据结构——“从病理切片到可分析的数字对象”展示了常规HE染色病理切片如何转化为SPARK能理解和分析的标准化数据格式这是所有后续分析的基础原始输入患者的数字化全切片图像WSIWhole Slide Image通常是千兆像素级的超大图像预处理步骤1多类组织分割使用器官特异性的语义分割模型UNetEfficientNet架构独立验证Dice系数0.89把切片自动分割为肿瘤组织、肿瘤基质、坏死组织、淋巴细胞聚集区等不同类型预处理步骤2过滤肿瘤区域只保留肿瘤肿瘤基质的核心区域排除正常组织、脂肪、空白等无关区域减少计算干扰预处理步骤3单细胞检测和分类使用HoverNext算法检测每个细胞的细胞核精确边界多边形自动分类为7种癌症病理中最关键的细胞类型最终输出WSI对象包含组织分割掩码肿瘤、基质等和完整的单细胞数据每个细胞的坐标、边界、类型、形态特征这是SPARK所有分析的统一输入格式所有参数都基于这个标准化对象计算一、打造会做研究的数字病理大脑SPARK的核心创新在于它不是一个单一的AI模型而是一个由多个专门智能体组成的协作系统就像一个分工明确的科学研究团队。每个智能体负责一个特定的环节它们通过自然语言进行交流共同完成从想法生成到结果验证的整个研究流程。与传统病理AI需要针对每个任务重新训练模型不同SPARK通过推理和工具构建来适应新任务完全不需要额外的模型训练。第一步想法生成——首席科学家提出假设SPARK的第一个模块是想法生成智能体它就像团队里的首席科学家。研究人员只需要用自然语言告诉它研究目标和可用的数据它就能自主提出各种生物学假设。在论文中研究人员给这个智能体的任务是“生成能够分析这七种细胞类型肿瘤细胞、淋巴细胞、中性粒细胞、嗜酸性粒细胞、巨噬细胞、成纤维细胞、浆细胞来预测患者生存或肿瘤进展的方法和假设。”为了系统地探索所有可能性研究人员还设置了不同的创造力级别从基础到有远见以激发既有传统又有创新的想法。这个过程就像是给首席科学家一个研究方向然后让他自由地思考各种可能的研究课题。最终SPARK在两个用例中分别生成了500个和118个独特的生物学想法涵盖了从单细胞形态特征到多细胞空间相互作用的各个方面。第二步想法精炼——研究助理细化方案有了初步的想法接下来需要把它们转化为具体、可执行的实验方案。这就是想法精炼智能体的工作它就像团队里的资深研究助理。这个智能体知道SPARK的数据结构和分析流程它会把淋巴细胞浸润与预后有关这样的模糊想法细化为计算肿瘤边界100微米范围内的淋巴细胞密度并统计其平均值和标准差这样的精确参数。它还会为每个想法添加生物学假设说明和实现复杂度评估确保后续步骤能够顺利进行。第三步想法编码——程序员实现工具接下来编码智能体登场它就像团队里的专业程序员把精炼后的实验方案转化为可执行的Python代码。论文中使用了Anthropic的Claude Sonnet 3.5作为编码智能体结果令人惊讶99.2%的想法都成功编译成了可运行的代码。这意味着SPARK可以在几小时内生成数百个不同的分析工具而这在过去需要人类程序员花费几个月甚至几年的时间。更重要的是这些代码都是完全透明和可解释的研究人员可以清楚地看到每个参数是如何计算的。第四步参数验证——质检员确保质量最后参数验证智能体会对生成的代码进行严格的质量检查就像团队里的质检员。它会排除那些计算太慢单张切片分析超过60秒、结果不稳定、或者有大量缺失值的参数。经过这一系列严格的筛选研究人员最终得到了1115个非冗余、高质量的分析参数。这些参数构成了一个庞大的肿瘤生物学特征库可以用于各种后续研究。除了自主研究模式SPARK还提供了一个非常实用的人类交互模块。病理医生和研究人员可以把自己的想法用自然语言输入进去比如1. 肿瘤细胞附近的淋巴细胞数量。2. 肿瘤基质中巨噬细胞的密度SPARK会自动把这些想法转化为可执行的分析工具。这就像是给每个医生配备了一个专属的AI研究助手让他们能够快速验证自己的临床观察和科学假设。二、从预测到发现SPARK在五大癌症中的表现为了验证SPARK的能力研究人员使用了18个独立的患者队列涵盖了5种最常见的癌症类型肺腺癌、肺鳞癌、结直肠癌、乳腺癌和口咽鳞癌总共超过5400名患者。所有患者都有完整的病理切片和临床随访数据。预测临床生物标志物研究人员首先测试了SPARK参数预测临床重要生物标志物的能力。这些生物标志物对于癌症治疗方案的选择至关重要但通常需要额外的免疫组化或基因检测不仅费用高昂而且耗时较长。在预测结直肠癌的微卫星不稳定性MSI时SPARK达到了0.933的AUROC曲线下面积越接近1表示准确率越高这与目前最好的商业检测工具相当。在预测乳腺癌的雌激素受体ER状态时AUROC达到了0.863在预测口咽鳞癌的HPV/p16状态时AUROC达到了0.828都达到了临床应用的水平。在预测肺腺癌的PD-L1表达时SPARK在多个临床相关的截断值上都表现出了有意义的准确率这意味着它可以帮助医生快速筛选出最有可能从免疫治疗中受益的患者。值得注意的是所有这些预测都只需要常规的HE染色切片不需要任何额外的检测。这对于医疗资源有限的地区来说具有特别重要的意义。预后风险分层接下来研究人员测试了SPARK参数预测患者预后的能力。他们使用多变量Cox回归模型在探索队列中发现了大量与预后相关的参数并在独立的测试队列中进行了验证。结果显示SPARK生成的参数能够显著区分不同风险的患者。例如在肺腺癌中研究人员将排名前30的预后参数组合成一个简单的评分系统能够将患者分为4个不同的风险组各组之间的生存率差异非常显著P0.0001。更重要的是这些参数具有明确的生物学意义。例如排名靠前的参数包括肿瘤-基质界面处肿瘤细胞核的长宽比、淋巴细胞核的偏心率和成纤维细胞在肿瘤3区的核周长异质性等。这些参数揭示了肿瘤微环境中各种细胞类型的形态和空间分布特征与患者预后的关系为我们理解肿瘤生物学提供了新的视角。空间生物学探索为了测试SPARK处理更复杂数据的能力研究人员将其应用于空间生物学领域。他们使用了著名的METABRIC乳腺癌队列该队列包含了625名患者的成像质谱流式数据能够同时检测14种不同细胞类型的空间分布。SPARK在这个复杂的数据集上表现同样出色。它生成了2452个可靠的分析参数发现了许多与预后相关的新的细胞相互作用模式。例如SPARK发现成纤维细胞亚型、巨噬细胞和肿瘤细胞之间的特定空间关系与患者的预后密切相关。这些发现揭示了肿瘤微环境中不同细胞类型之间的复杂对话为开发新的免疫治疗靶点提供了重要线索。肿瘤进化追踪最令人惊叹的突破是SPARK能够从静态的病理切片中推断出肿瘤的动态进化过程。这就像是给肿瘤拍了一张时间快照让我们能够看到它过去的发展轨迹预测它未来的行为。研究人员的思路是肿瘤进化是一个克隆选择的过程早期出现的特征会占据肿瘤的大部分区域而晚期出现的特征则只存在于较小的区域。通过分析不同形态特征在肿瘤中的空间分布SPARK能够重建肿瘤从早期到晚期的进化时间线。结果显示在所有癌症类型中超过70%的侵袭性特征都是晚期出现的。研究人员还识别出了不同癌症类型中特征性的进化序列。例如在肺腺癌中早期事件主要涉及肿瘤细胞本身的特征而成纤维细胞和巨噬细胞的变化出现在中期中性粒细胞的变化则出现在晚期。这一发现具有深远的意义。它不仅帮助我们理解肿瘤进化的机制还为开发针对不同进化阶段的治疗策略提供了依据。三、SPARK如何影响癌症研究与诊疗SPARK的出现标志着病理AI进入了一个全新的智能体时代。它不再是被动的诊断工具而是主动的研究伙伴。首先SPARK能够解锁全球医院里存储的数十亿张病理切片中的海量信息。这些数据过去因为缺乏有效的分析方法而被闲置成为了沉睡的数据金矿。SPARK可以在几小时内完成过去需要人类研究人员几年才能完成的工作大大加速了生物标志物的发现和验证过程。其次SPARK生成的生物标志物都是完全可解释的这解决了传统AI黑箱问题。每个参数都对应着明确的生物学特征医生可以清楚地理解为什么一个患者被归为高危组这增加了临床应用的可信度和接受度。第三SPARK的人类交互模块将彻底改变病理研究的方式。病理医生不再需要依赖生物信息学家来分析数据他们可以自己提出假设然后让SPARK快速验证。这将极大地释放临床医生的创造力让他们能够将自己的临床经验转化为科学发现。未来SPARK还有很大的发展空间。研究人员计划在更多的癌症类型和更大的队列中验证它的性能特别是在活检样本中的应用。他们还希望将SPARK与基因组学、转录组学等多组学数据整合构建更全面的肿瘤生物学模型。最终SPARK有望成为癌症研究和精准医疗的核心工具为每一位癌症患者带来更个性化、更有效的治疗。从只能背答案的学霸到会思考、会做研究的科学家AI在病理领域的进化正在深刻改变我们认识和治疗癌症的方式。SPARK就像一束光照亮了病理切片中隐藏的肿瘤秘密也为全球数百万癌症患者带来了新的希望。