山东大学等团队构建头颈癌显微高光谱病理基准数据集,突破医学组织切片智能分类难题

发布时间:2026/6/9 1:55:55

山东大学等团队构建头颈癌显微高光谱病理基准数据集,突破医学组织切片智能分类难题 近日由山东大学、齐鲁医院、德国慕尼黑工业大学、西安电子科技大学等单位联合完成的学术论文《HSPath-Bench: A microscopic hyperspectral dataset and local-global learning network for histopathological classification》正式公开发布。该研究首次构建了面向头颈癌免疫组化IHC与原位杂交ISH切片的显微高光谱公开基准数据集 HSPath-Bench并提出了创新的最大质量波段选择M²BS算法与自适应局部‑全局特征融合ALGFF网络在极少量标注样本下实现了病理组织的高精度分类。01研究背景高光谱成像能够捕获组织切片在数百个连续波段上的光谱信息为生物细胞分析和医学病理诊断提供了超越传统RGB图像的”光谱指纹“级分辨能力。然而该技术在医学显微领域落地仍面临三大瓶颈1. 数据极度稀缺至今没有一个公开的、带有像素级精细标注的显微高光谱病理数据集严重制约了算法开发与公平对比。2. 光谱冗余与噪声高光谱数据波段多、相关性强且采集过程中存在暗电流、光源不均等噪声直接使用会导致“休斯现象”维度灾难降低分类精度。3. 标注成本高昂病理专家手工逐像素标注耗时极长深度学习方法在少量训练样本下容易过拟合泛化能力差。为了打通从“先进传感”到“智能诊断”的最后一公里研究团队与高谱成像紧密合作从数据采集、算法设计到实验验证完成了一次系统性的创新突破。02核心贡献2.1 发布 HSPath-Bench 数据集团队采集了43例头颈鳞癌患者的组织切片涵盖EGFR、P16、P53、P63、EBER五种关键分子标记物经过严格病理专家双重标注与仲裁构建了包含60万像素级精标注样本的高光谱数据集。每个样本均提供400-1000nm 范围内300个连续光谱波段像素级的三类染色强度标注强阳性、弱阳性、阴性以及上皮/间质区域划分校准后的光谱透射率数据附暗电流与空白参考校正HSPath-Bench 是目前国际领先的、多类别、像素级标注的显微高光谱病理数据集为后续算法研究与行业基准测试提供了宝贵的“标尺”。2.2 提出 M²BS 波段选择算法针对高光谱波段冗余问题研究团队创新性地提出最大质量波段选择M²BS算法。不同于传统仅考虑方差或互信息的方法M²BS 通过最大化平行多面体体积来评估波段组合的代表性在有效去冗余的同时最大程度保留判别信息显著降低了后续网络的计算负担。2.3 设计 ALGFF 自适应局部‑全局融合网络为了兼顾显微组织的局部细节纹理与全局空间上下文论文设计了ALGFFAdaptive Local‑Global Feature Fusion模块核心创新包括空间‑光谱注意力SS在编码器‑解码器结构中强化对关键光谱特征的响应。Swin Transformer 与 CNN 自适应融合通过通道级动态权重平衡窗口自注意力建模长程依赖与卷积操作捕获局部精细结构。无补丁patch‑free全图处理避免了传统滑窗造成的感受野受限与计算冗余。03实验结果3.1 极稀疏标注下显著优于当前主流算法在每类仅使用5个像素作为训练样本的极端条件下所提方法在10张测试图像上的总体分类精度OA达到61% – 90%平均准确率AA与 Kappa 系数均显著超越十种主流方法包括 SVM、随机森林、1D/2D CNN、Transformer、FPGA、SSDGL 等。部分典型结果EGFR-17OA 86.6%第二名80.7%P16-03OA 83.6%第二名78.3%EBER-01OA 78.8%第二名68.8%P53-01AA 86.6%第二名82.7%3.2 训练样本增加时性能持续提升当训练样本增加到每类50像素时精度相比5像素条件平均提升6–16个百分点增加至100像素时仍有小幅稳定增长表明模型具有良好的数据扩展性不会因样本增多而饱和。3.3 消融实验验证各模块贡献移除 SS 模块替换为普通卷积分类精度下降2–10个百分点尤其在复杂核染色的 P53 数据集上下降近10%。移除 ALGFF 模块仅保留单分支平均精度下降1–2个百分点。结合 M²BS SS ALGFF 的完整模型在所有测试集上均取得最优或次优结果。3.4 可视化分类图对比论文提供了每种方法在各类切片上的分类伪彩图。可以看到仅用光谱信息像素级方法会产生大量椒盐噪声边界模糊。基于固定尺寸补丁的方法2DCNN、2DFormer在阳性细胞散在分布的区域容易漏检或误判。本方法生成的分类图最接近专家标注的真值尤其在 EGFR 胞膜连续阳性与 EBER 核阳性混合区域表现突出。04显微高光谱HY-5010-S 具备400–1000 nm光谱范围、优于2.8 nm的光谱分辨率、推扫式成像与暗电流/空白双重校正为研究团队提供了高信噪比、高一致性的光谱数据是 HSPath-Bench 数据集高标注质量的硬件保障。论文链接https://doi.org/10.1016/j.optlastec.2025.114413光谱数据集地址https://github.com/zhangchenglong1116/HSPath-Bench

相关新闻