GNSS干扰监测:机器学习模型评估、伪标签与域适应实战

发布时间:2026/5/25 14:43:55

GNSS干扰监测:机器学习模型评估、伪标签与域适应实战 1. 项目概述当GNSS遇上机器学习我们如何让干扰无处遁形如果你从事自动驾驶、无人机导航或任何依赖卫星定位的领域那么“GNSS干扰”这个词对你来说可能意味着定位漂移、服务中断甚至是严重的安全隐患。想象一下一辆正在高速公路上进行L3级自动驾驶的汽车其GNSS接收机突然受到一个廉价车载干扰器的攻击定位信息瞬间出现上百米的误差——这绝不是危言耸听而是真实世界正在面临的挑战。传统的干扰监测方法比如基于信号功率或载噪比C/N0的阈值检测在面对日益复杂和隐蔽的干扰手段时常常力不从心。它们就像只靠听声音大小来判断是否有人闯入的保安对于蹑手蹑脚的小偷或者伪装成正常访客的入侵者很容易漏判或误判。这正是我们这项工作的起点将机器学习的“火眼金睛”引入GNSS干扰监测领域。我们的核心目标是构建一个能够从海量、复杂的GNSS信号数据中自动、精准地识别和分类各种干扰模式的智能系统。这不仅仅是把现成的图像分类模型比如ResNet生搬硬套到信号数据上那么简单。GNSS信号有其独特的时空特性干扰模式在不同环境如开阔高速公路 vs. 多径效应严重的室内下差异巨大并且获取大量精确标注的干扰数据成本极高。因此我们的项目深入到了几个关键的技术深水区如何评估不同机器学习模型在真实与受控数据上的泛化能力如何利用伪标签技术在标注数据稀缺的情况下“榨干”无标签数据的价值以及当模型从一个环境迁移到另一个环境时如何通过域适应技术来弥合数据分布的鸿沟简单来说我们试图回答三个核心问题第一在理想情况下训练和测试数据来自同一分布哪些模型能最好地识别干扰第二当数据来源不同存在“域偏移”时模型表现会恶化到什么程度我们又该如何应对第三有没有一些“取巧”但有效的方法能用更少的人工标注训练出更鲁棒的模型围绕这些问题我们进行了一系列从数据采集、模型选型、策略验证到效果分析的完整实验。本文将为你拆解其中的每一个环节分享我们踩过的坑和收获的经验希望能为同样致力于提升GNSS鲁棒性的工程师和研究者提供一份详实的“避坑指南”和实战参考。2. 核心挑战与实验设计思路拆解在深入代码和图表之前我们必须先理解这个项目面临的独特挑战这决定了我们整个实验设计的走向。GNSS干扰监测不是一个标准的、数据干净、分布一致的分类问题它充满了现实世界的“噪音”。2.1 数据异质性从“温室”到“荒野”的鸿沟我们收集了多组数据集它们之间的差异构成了第一个核心挑战真实世界高速公路数据集在德国高速公路上采集目标是检测车辆中的干扰设备。数据特点是环境动态车辆高速移动、卫星几何变化快但干扰源相对单一主要是车载干扰器。这类数据“真实性”最高但干扰事件稀疏非干扰样本占绝大多数存在严重的类别不平衡。受控室内大规模数据集在屏蔽室或可控环境中使用专业设备低/高频天线注入已知的各类干扰。数据“纯净”干扰类型丰富、可控信噪比高但完全缺乏真实环境的多径、遮挡等复杂效应。这好比在实验室里培养的“温室花朵”。Seetal Alps数据集在奥地利阿尔卑斯山区采集包含了强烈的真实多径效应信号经山体、建筑反射。这里的挑战不是故意注入的干扰而是复杂地理环境对信号本身造成的、类似干扰的畸变。关键洞察直接将在受控室内数据上训练到99.9%准确率的模型应用到高速公路数据上性能可能会暴跌。这是因为数据分布发生了根本性变化机器学习领域称之为“域偏移”Domain Shift。我们的实验必须量化这种偏移的影响并找到克服它的方法。2.2 评估策略交叉验证与域适应基准为了系统性地评估模型应对上述挑战的能力我们设计了三层评估体系第一层传统交叉验证。在同一个数据集内划分训练集和测试集评估模型“记住”和“泛化”到同类数据的能力。这给出了模型性能的上限在理想情况下它能做多好。第二层跨数据集验证。这是本次项目的重中之重。我们用数据集A训练在数据集B上测试。例如用“受控室内数据”训练在“真实高速公路数据”上测试。这个结果直观地揭示了域偏移的严重程度也是评估任何域适应、数据增强技术效果的黄金标准。第三层混合数据集训练与测试。将所有数据集混合在一起训练一个模型然后分别在每个独立数据集上测试。这考验的是模型能否从混杂的、分布各异的数据中学习到超越具体环境的、关于“干扰”的本质特征。我们的实验主体正是围绕这三层评估展开分别对应了原文中的“快照数据交叉验证”、“机器学习方法评估”和“域适应方法评估”几个核心部分。2.3 技术路线选择为什么是ResNet18、伪标签和域适应面对这些挑战我们选择了三条主要的技术路线进行攻坚以ResNet18为代表的深度监督模型尽管最初为图像设计但其残差结构能有效捕捉信号中的层次化特征。我们将其作为基线模型和特征提取器用于评估不同数据集上的基础性能并为后续的伪标签方法提供可靠的“教师模型”。伪标签技术标注GNSS干扰数据是专业且耗时的工作。伪标签的核心思想是“用模型标注数据再用新标注的数据训练模型”形成一个自增强的循环。我们探索了在仅有10%-50%标注数据的情况下通过多模型共识生成高置信度伪标签来扩充训练集从而降低对人工标注的依赖。域适应方法当源域如室内数据和目标域如高速公路数据分布不同时域适应试图在训练过程中对齐两个域的特征分布使得在源域上学到的知识能直接用于目标域。我们系统评估了包括DANN、Deep CORAL、MMD等在内的多种域适应方法看它们能否帮助模型跨越从“温室”到“荒野”的鸿沟。这个设计思路形成了一个完整的闭环先用基础模型摸清数据底细和问题边界再用半监督技术解决标注难题最后用迁移学习技术解决环境差异问题。接下来我们就深入到每一部分的实操细节中去。3. 数据准备与特征工程构建模型的“粮草”在训练任何模型之前数据是地基。对于GNSS干扰监测原始数据是射频RF信号或中频IF采样数据我们通常将其处理为两种形式供模型使用“快照”数据和“低开销”时序数据。3.1 数据模态快照 vs. 时序快照数据可以理解为信号的“频谱图”或一系列并行的时序片段。我们将一段时间内的多通道GNSS信号如I/Q两路或更多天线通道处理成一个二维矩阵时间点 × 通道数或者进一步通过短时傅里叶变换STFT转换为时频图。这种格式非常适合像ResNet、InceptionTime这类卷积神经网络处理它们能像识别图像中的纹理一样识别干扰时频域上的特定模式如窄带干扰的竖线、扫频干扰的斜线。低开销时序数据为了适应低成本LC传感器或实时性要求更高的场景我们提取了一系列低维时序特征如每秒的载噪比C/N0序列、伪距残差序列、多普勒变化率等。这些数据是一维时间序列更适合GRU、LSTM、TCN等时序模型或Isolation Forest、LOF等传统异常检测算法。它的优势是数据量小计算快但信息密度也相对较低。实操心得数据格式的选择如果你的目标是高精度分类已知干扰类型且有足够的计算资源快照数据配合CNN模型是首选它能捕捉最丰富的模式。如果你的目标是轻量级实时异常报警或者数据带宽有限LC时序特征搭配轻量模型或传统算法更实用。在我们的实验中快照数据上的模型性能普遍优于LC数据但后者在计算效率和部署成本上优势明显。3.2 特征嵌入分析与数据差异可视化在投入训练前我们使用t-SNE或UMAP等降维技术将高维特征可以是原始数据也可以是模型中间层的输出投影到二维平面进行可视化。这一步至关重要它能直观地回答干扰样本和非干扰样本在特征空间里是否可分不同数据集高速公路、室内、山区的样本是否聚集在不同的区域我们的可视化结果明确显示干扰与非干扰类之间通常存在较明显的边界这给了模型学习的机会。但更重要的是不同数据集的特征分布存在显著差异。例如受控室内数据的样本点聚集得更紧密而真实高速公路数据的点则更分散且两者在特征空间中有部分重叠但中心分离。这从视觉上证实了域偏移的存在也解释了为什么直接跨数据集测试会失败。3.3 数据预处理与增强策略标准化对于快照数据我们进行通道级的均值和标准差归一化。对于LC时序数据进行序列级的归一化。这能加速模型收敛并避免某些数值较大的特征主导训练过程。数据增强为了提升模型对微小变化和未知场景的鲁棒性我们对训练数据进行了增强主要包括时序扭曲对时间轴进行轻微的随机拉伸或压缩模拟信号采样率或相对速度的微小变化。添加噪声注入高斯白噪声或与背景噪声谱相似的色噪声提升模型抗噪能力。随机掩码随机将信号的一小部分置零模拟信号短暂丢失或衰落的情况。关键发现数据增强在“同数据集交叉验证”时对最终准确率提升有限模型已经能很好拟合。但其最大价值体现在跨数据集验证中。如图25与图18的对比所示使用了数据增强的模型在面对来自不同分布的数据时表现出了更强的鲁棒性准确率有显著提升。这说明增强操作有效地拓宽了模型所“见过”的数据分布使其泛化能力更强。4. 监督模型基准测试谁才是GNSS干扰分类的“全能王”我们构建了一个包含20种主流时序/图像分类模型的“擂台”在所有的快照数据集上进行了全面基准测试。这些模型涵盖了从传统的多层感知机MLP、全卷积网络FCN到复杂的LSTM-FCN、ResNet、Transformer架构如TST、TSiT等。4.1 模型性能横评结果与洞见测试结果对应原文图19揭示了一些非常有趣且具有指导意义的规律环境是性能的决定性因素所有模型在“真实世界高速公路”数据集上都取得了极高的准确率很多超过95%这是因为该场景相对“干净”干扰模式突出。然而在“受控室内”数据集上所有模型的性能都出现了显著下降平均跌幅可达20-30个百分点。这并非模型不行而是室内数据包含了更多样的干扰和复杂的反射任务本身更难同时验证了数据分布差异的巨大影响。“大模型”优势明显参数量大的模型如ResNet、InceptionTime、XceptionTime在大多数数据集上表现稳定且领先。例如我们的ResNet18模型拥有约1100万参数它在混合数据集训练后展现了最好的跨场景泛化能力。这符合深度学习的一个经验在数据量足够或通过增强等效增加的情况下更大的模型容量有助于学习更通用、更鲁棒的特征。时序模型并非总是最佳选择GRU、LSTM、TCN等纯时序模型或混合模型如LSTM-FCN在本任务中出现了明显的过拟合现象。这是因为GNSS干扰的判别特征更多体现在频域和时频联合域上例如特定频率上的能量突增而非长时间的时间依赖关系。一个扫频干扰在0.1秒内就可能扫过一个频段关键信息在于其频谱的瞬时形态。轻量级模型的局限简单的MLP和基础FCN模型被更深的网络大幅超越。这表明GNSS干扰分类是一个需要深层非线性变换才能很好解决的特征学习问题。我们的核心建议是对于GNSS干扰分类任务优先考虑参数量较大的卷积神经网络架构如ResNet或其变种。如果追求极致的性能可以尝试最新的Transformer架构如TSiT但其训练成本和数据需求也更高。在选择模型时必须结合你的具体部署场景计算资源、实时性要求来权衡。4.2 ResNet18作为基线的深入解析我们以ResNet18为基础进行了大量实验这里详细拆解其应用细节输入处理我们将多通道信号快照例如4个天线通道每个通道4096个采样点重塑为类似图像的结构。一种有效的方式是将每个通道视为一个“高度”为1的“行”按时间序列排列形成一个通道数 × 时间点的“图像”然后通过初始卷积层将其映射到更高的特征维度。修改与调整原始的ResNet18是为ImageNet设计的输入是3通道224x224图像。我们将其第一层卷积核调整为适应我们的一维“图像”宽度即时间维度并将通道数改为我们的信号通道数。最后的全连接层输出维度改为我们的干扰类别数。训练技巧使用带重启的余弦退火学习率调度配合AdamW优化器能有效避免陷入局部最优。对于类别不平衡的数据集如高速公路数据非干扰样本占99%以上我们采用了加权交叉熵损失函数给少数类干扰类更高的权重防止模型将所有样本都预测为多数类。5. 伪标签技术实战用30%的标注数据达成90%的效果标注数据是瓶颈。我们能否让模型自己来创造训练数据伪标签技术正是为此而生。其核心流程是一个自训练循环使用少量如10%有标签数据训练一个初始模型教师模型。用这个教师模型对剩余90%的无标签数据进行预测选取预测置信度最高例如softmax概率 0.9的那部分样本将其预测标签作为“伪标签”。将这部分带有伪标签的数据加入到训练集中重新训练模型。重复步骤2和3直至模型收敛或达到预定迭代次数。5.1 我们的改进多模型共识与阈值选择简单的伪标签容易导致错误累特别是初始模型不准时。我们引入了两个关键改进1. 多模型共识机制我们同时训练4个结构相同但初始化不同的ResNet18模型。对于一个无标签样本只有当这4个模型的预测结果完全一致时我们才采纳其伪标签。这极大地提高了伪标签的可靠性。实验数据图20a显示当四个模型达成共识时其伪标签的正确率高达99.98%几乎与人工标注无异。2. 动态阈值策略我们对比了不同的置信度阈值0.5 0.8 0.9。更高的阈值0.9意味着更严格的筛选每次迭代加入的伪标签数据量更少但质量更高。实验表明在干扰分类任务上高阈值策略能带来更稳定、更快的性能提升。因为初期引入噪声标签对模型的伤害远大于数据量不足的影响。5.2 结果分析与部署建议效果在受控大规模数据集上仅使用30%的标注数据并经过7轮伪标签迭代后模型在干扰分类任务上的准确率就能接近使用100%标注数据训练的全监督基线约81%。这意味着我们节省了70%的标注成本局限性伪标签在“多径场景分类”任务上效果大打折扣图20b。这是因为多径效应模式复杂模型初期难以形成高置信度的正确预测导致可靠的伪标签样本过少自训练循环无法有效启动。实操指南启动条件伪标签需要一个“还不错”的初始教师模型。确保你的10%-20%的种子标注数据具有代表性覆盖所有主要类别。迭代控制监控每一轮迭代中新加入的伪标签数据的数量和其在验证集上的准确率。如果准确率开始下降或伪标签数量骤减应停止迭代防止性能退化。领域适用性该方法在类别相对分明、模型容易产生高置信度预测的任务上如干扰存在性检测效果卓越。在细粒度、模糊的分类任务上需谨慎使用。6. 异常检测方法在LC数据上的应用轻量级的守护者对于资源受限的边缘设备如低成本GNSS传感器运行庞大的ResNet模型可能不现实。此时基于低开销时序特征的异常检测算法提供了一个轻量级解决方案。它们的核心思想是学习正常信号的特征轮廓将显著偏离该轮廓的样本判为异常干扰。6.1 算法选型与性能对比我们评估了包括Isolation Forest、LOF、COPOD、ABOD、OCSVM以及深度自编码器AutoEncoder在内的近30种异常检测算法。结果图22显示在理想场景下在数据质量较高、干扰与正常信号区分度大的“真实高速公路数据集1”上许多算法如ABOD COPOD都能达到接近100%的准确率。Isolation Forest表现尤为稳定且突出。在复杂场景下在充满真实多径效应的“Seetal Alps”数据集上所有算法的性能都出现了显著下降准确率在50%-70%之间徘徊。这说明当“正常”信号本身就因环境而波动剧烈时区分正常波动与恶意干扰变得异常困难。跨域泛化一个有趣的发现是如果在训练时混合多个数据集包括室内和室外模型在未见过的真实高速公路数据上测试时部分算法如ECOD COPOD的泛化能力得到了提升。这暗示即使是无监督的异常检测暴露在多样化的“正常”模式中也有助于模型学习更通用的正常行为边界。6.2 关键参数调优实战以Isolation Forest和LOF为例无监督算法对超参数敏感调参是成败关键。Isolation Forest的n_estimators这个参数控制森林中树的数量。图23a-b展示了其影响在高速公路数据上树的数量超过100后准确率反而下降可能是因为过拟合了训练数据中的噪声。而在更复杂的Seetal Alps数据上准确率随着树的数量增加而持续提升因为更多的树有助于捕捉数据中更复杂的异常模式。建议从一个中等大小的数值如100开始在验证集或通过少量标注数据构建的评估集上观察性能曲线避免盲目增加。LOF的n_neighbors这个参数决定了计算局部密度时考虑的邻居数。图23c-d表明在数据点分布相对稀疏、异常点明显偏离主集群的场景高速公路较大的邻居数如20-30效果更好因为它基于更广域的密度进行判断更稳定。在数据点密集、异常点隐藏较深的场景受控室内较小的邻居数如5-10更敏感能发现局部密度差异。建议n_neighbors的选择与你的数据分布紧密相关。可以通过可视化如k-距离图或网格搜索来确定。避坑提示异常检测算法给出的通常是“异常分数”你需要根据业务需求选择一个阈值来划分正常/异常。这个阈值的选择极度重要。一个实用的方法是在有一小部分标注数据的情况下根据精确率-召回率曲线PR曲线或ROC曲线来选取最佳阈值。如果完全没有标注可以假设异常点占比很小例如1%将分数最高的前1%样本判为异常。7. 域适应技术让模型学会“举一反三”当我们在丰富的受控室内数据源域上训练好一个模型却想把它直接部署到情况迥异的真实高速公路目标域上时域适应技术是我们的“桥梁”。其核心目标是在训练过程中最小化源域和目标域特征分布之间的差异从而让模型学习到域不变的特征。7.1 方法概览与我们的评估我们系统评估了四大类共24种域适应方法基于差异的方法如MMD最大均值差异、CORAL相关性对齐直接计算并最小化两域特征分布的统计距离。对抗性方法如DANN域对抗神经网络引入一个域分类器并让特征提取器“欺骗”它从而生成域不变的特征。重构方法通过自编码器在目标域上重构输入迫使模型学习目标域的数据结构。混合方法结合多种策略如Sinkhorn距离MMD。实验结果图24表明在从受控室内数据迁移到高速公路数据的任务上DANN、Deep CORAL、HoMM高阶矩匹配和DAN取得了最佳效果准确率最高可达90%非常接近在目标域上直接训练的性能上限。高阶统计量匹配如HoMM整体表现优于仅匹配一阶、二阶矩的方法说明GNSS干扰数据的域差异可能体现在更复杂的分布特性上。“少样本目标风险”评估有效在无监督域适应中如何选择模型和超参数是个难题。我们采用Ragab等人提出的“少样本目标风险”策略即仅用目标域极少量的标注样本如每个类1-2个来验证模型其选择效果与使用大量目标域标注的“目标风险”接近这为实际应用提供了可行的评估方案。7.2 实战步骤以DANN为例下面简述如何实现一个经典的DANN模型用于GNSS干扰分类网络结构模型包含三部分特征提取器G如ResNet的前几层、标签分类器C用于干扰分类、域分类器D用于区分数据来自源域还是目标域。训练流程前向传播源域和目标域数据都通过G提取特征。标签损失源域数据通过C计算分类损失有标签。域损失所有数据的特征通过D计算域分类损失。这里需要一个“梯度反转层”GRL在反向传播到G时将域分类损失的梯度乘以一个负数从而实现“对抗”——G努力让D分不清特征来自哪个域。总损失总损失 标签损失 - λ * 域损失λ是权衡参数。关键技巧λ的调度初期λ应较小让模型先学会基本的分类任务后期逐渐增大加强域对齐。可以采用线性或余弦调度。域分类器的学习率通常设置得比特征提取器更高一些以确保它足够强大能给G提供有效的对抗信号。8. 从LC数据预测驾驶行为一个延伸应用除了检测干扰我们探索了LC数据的另一个有趣应用仅凭低成本的GNSS传感器数据预测车辆的行驶方向。这在某些监控或交通流分析场景中可能有用。我们使用Seetal Alps数据集包含两个传感器进行实验。将两个传感器的LC时序特征如C/N0变化、多普勒偏移拼接起来输入到一个时序分类模型中。实验表9发现仅使用10个时间步长约10秒的数据模型就能以超过98%的准确率判断是否存在干扰并以约72-80%的准确率预测行驶方向。当将输入长度增加到30个时间步长并结合两个传感器的数据时方向预测的准确率提升到了86.99%。重要发现干扰分类的准确率始终高于方向预测。这说明干扰对信号特征的影响是剧烈而显著的更容易被模型捕捉而行驶方向带来的信号变化相对细微需要更长的观察窗口和更多传感器的融合信息。这个实验证明了即使是从低成本传感器获取的、看似粗糙的GNSS数据也蕴含着丰富的可挖掘信息。通过精心设计的模型可以实现超出传统定位的感知功能。9. 常见问题、故障排查与经验总结在近一年的实验和调试中我们积累了大量的实战经验。以下是一些最常见的问题及其解决方案希望能帮你节省大量时间。9.1 模型训练与性能问题问题1模型在训练集上表现很好但在验证集或跨数据集测试上表现糟糕。可能原因1过拟合。这是最常见的问题尤其是在数据量有限的情况下。排查与解决检查训练集和验证集的准确率/损失曲线是否早早分离。增加数据增强这是对抗过拟合最有效的手段之一。确保你的增强策略是合理的例如对GNSS信号添加噪声、进行小幅时间扭曲。引入更强的正则化如Dropout、权重衰减L2正则、Label Smoothing。简化模型尝试减少网络层数或神经元数量。使用早停监控验证集损失当其不再下降时停止训练。可能原因2数据分布不一致。训练集和验证集/测试集来自不同环境存在域偏移。排查与解决进行特征可视化t-SNE看两个集合的样本在特征空间是否分离。如果确认是域偏移考虑采用域适应技术如DANN或在训练集中混合一部分目标域风格的数据如果可获得。采用更稳健的模型架构如我们实验中表现较好的ResNet。问题2类别极度不平衡如99%是非干扰样本模型倾向于把所有样本都预测为多数类。排查与解决计算每个类别的F1-score或F2-score而不仅仅是整体准确率。准确率在这种情况下是欺骗性的。使用加权损失函数在交叉熵损失中为少数类干扰类分配更高的权重。重采样对少数类进行过采样或对多数类进行欠采样。注意过采样可能导致过拟合可以结合SMOTE等生成式方法。采用异常检测思路将问题重构为“单类分类”或“异常检测”只学习正常信号的特征将干扰视为异常。9.2 伪标签实践中的陷阱问题3伪标签训练过程中模型性能不升反降。可能原因错误伪标签的累积。初期模型不准产生了大量错误标签污染了训练集。排查与解决提高置信度阈值如将softmax阈值从0.5提高到0.9只采纳模型非常确信的预测。采用多模型共识像我们一样使用多个独立训练的模型进行投票只有全票通过的样本才打上伪标签。设置迭代轮数上限通常3-7轮后收益递减应停止。保留一个干净的验证集密切监控模型在干净验证集上的表现一旦下降立即回滚。9.3 域适应实战难点问题4应用域适应后模型在目标域上的性能提升不明显甚至下降。可能原因1域差异过大。如果源域和目标域根本就是两种不同的任务例如源域是窄带干扰目标域是欺骗式干扰域适应可能无效。排查与解决重新审视任务确保源域和目标域的任务本质是相同的。可能原因2域分类器太强或太弱。在对抗式方法中域分类器需要与特征提取器保持“动态平衡”。排查与解决调整域对抗损失的权重λ。如果λ太大特征提取器可能为了对齐域而破坏了分类所需的判别特征如果λ太小则对齐效果不足。尝试不同的调度策略。可能原因3特征提取器能力不足。如果基础特征提取器如一个很浅的CNN无法提取出有意义的特征那么对齐这些特征也无济于事。排查与解决使用更强的基础网络或在源域任务上先进行充分的预训练。9.4 工程部署考量问题5模型推理速度慢无法满足实时性要求。排查与解决模型轻量化考虑使用MobileNet、ShuffleNet等轻量级CNN架构或对ResNet进行通道剪枝、知识蒸馏。输入降维评估是否可以使用更低采样率的信号或更短的信号快照长度。转向LC特征轻量模型如果实时性要求极高可以放弃快照数据采用我们实验中提到的LC时序特征搭配Isolation Forest或小型LSTM它们通常有更快的推理速度。硬件加速利用GPU、NPU或专用的AI加速芯片进行推理。最后一点个人体会在GNSS干扰监测这个领域没有“银弹”模型或算法。我们的实验表明ResNet18在大多数情况下是一个稳健的基线选择。但真正的成功取决于对数据的深刻理解、清晰的问题定义你到底要检测什么以及将多种技术数据增强、伪标签、域适应组合使用的工程智慧。从一个简单的基线模型和干净的数据集开始逐步引入复杂性并始终用严谨的跨数据集验证来评估模型的真实泛化能力这才是通往可靠系统的务实之路。未来我们计划探索基于不确定性的伪标签筛选和扩散模型用于数据增强以期在数据利用和模型鲁棒性上更进一步。

相关新闻