
1. 项目概述与核心挑战在电力系统的日常运维中电流互感器CT的角色有点像我们人体的“感觉神经末梢”。它实时感知着电网中奔涌的电流将一次侧的高压大电流按比例转换为二次侧的低压小电流供保护装置、计量仪表和监控系统使用。可以说CT的测量精度是电力交易结算公平性的基石也是继电保护装置能否正确动作、避免大面积停电事故的生命线。然而这个关键的“神经末梢”并非永远精准。长期运行中铁芯材料的老化、外部负载的剧烈波动、环境温湿度的变化甚至是电网中难以避免的谐波干扰都会像“噪声”一样逐渐侵蚀CT的测量精度产生我们所说的“测量误差”。更棘手的是这种误差往往是缓慢、渐进且不易察觉的等到保护误动或计量出现显著偏差时往往已经造成了实际损失。传统的应对方法是“离线检定”定期将CT从运行线路上拆下来送到实验室与更高精度的标准CT在模拟环境下进行比对。这种方法就像给设备做“全身体检”虽然结果准确但弊端显而易见——必须停电操作。对于现代追求高可靠性与不间断供电的电网而言频繁停电带来的经济损失和社会影响是难以承受的。因此业界一直在探索一种能够“在线把脉”的技术即在CT不停运、电网正常工作的状态下实时监测其健康状况提前发现误差超限的苗头。这个问题的难点在于我们面对的是一个典型的“无监督”或“少样本”异常检测场景。电网的稳定运行机制和强大的保护系统使得CT发生严重故障、产生巨大误差的样本极其稀少。我们无法像训练图像识别模型那样收集成千上万张“故障CT”的电流波形图。我们拥有的绝大部分是CT在“看似正常”状态下运行的海量数据。如何从这些看似平静的“正常”数据海洋中敏锐地捕捉到那一丝预示性能衰退的“异常涟漪”就是本次技术探索要解决的核心问题。我这次分享的正是我们团队基于“双分解与核密度估计”构建的一套在线检测方法它不依赖故障样本库仅凭正常运行数据就能为CT的健康状况进行“实时体检”。2. 方法整体设计思路从“信号清洗”到“特征审判”面对CT二次侧电流信号这个包含真实电流、噪声、谐波以及潜在误差信息的混合体直接进行分析无异于“雾里看花”。我们的核心思路是进行一场精细的“信号解剖”与“特征提纯”手术最终由一个“智能法官”阈值来做出“正常”或“异常”的判决。整个流程可以概括为四个环环相扣的步骤其逻辑框架如下图所示注此处为描述性示意非实际图表第一步初筛与去噪——变分模态分解VMD想象一下CT二次电流信号是一杯混有泥沙噪声和糖我们关心的误差特征的水。VMD的作用就像一台智能离心机它能根据信号成分自身振荡频率的不同自适应地将这杯“混合液”分离成多个不同频率的“模态分量”。其中高频分量通常对应着随机噪声和快速波动而低频或特定频带的分量则可能蕴含着与CT铁芯磁化特性变化相关的缓变信息。我们的目标就是提取出最能反映CT性能缓慢劣化的那个“残余分量”。这个过程的关键在于设定两个参数分解层数K和惩罚因子α。K决定了我们会把信号分成几份分得太少K小可能把糖和泥沙混在一起分得太多K大则可能把糖也打碎丢失有效信息。α则控制了每个分量的带宽α越大分量在频域上越“紧凑”抗噪声能力越强但过于严苛也可能损伤真实特征。第二步深挖与聚焦——小波分解WD经过VMD初筛得到的“残余分量”虽然去除了大部分高频噪声但它本身仍然是一个时间序列包含了从低频趋势到中频波动的多种信息。这时我们需要小波分解这把“显微镜”进行更精细的观察。小波分解能够将信号在时域和频域同时进行多分辨率分析。简单来说它把信号一层层地分解下去每一层都会产生一个“近似系数”代表信号的低频轮廓、大趋势和一系列“细节系数”代表信号的高频细节、局部波动。对于CT劣化这种缓慢过程其关键信息往往隐藏在信号的低频趋势里。因此我们聚焦于提取小波分解后得到的“近似系数”集合这个集合可以看作是从时间维度压缩后表征CT状态演变趋势的一组多维特征。第三步降维与可视化——t-SNE嵌入上一步得到的小波近似系数集合是一个高维数据例如多个尺度的系数构成一个向量。高维数据不便于直观理解和后续的阈值计算。t-SNE是一种非常出色的非线性降维技术它的目标是在把数据从高维映射到低维比如一维时尽可能保持数据点之间的“邻里关系”。也就是说在原始高维空间里相似的两个样本比如两个健康状态接近的CT数据点映射到一维后它们的距离也应该很近。通过t-SNE我们将多维的近似系数集合映射为一个一维的“劣化特征值”。这个值就像一个“健康指数”其数值的变化趋势直接反映了CT状态的演变。第四步判决与定位——核密度估计KDE阈值现在我们有了每个CT相的一维“健康指数”时间序列。如何判断当前指数是否异常我们不需要预先知道“生病”是什么样子只需要定义好“健康”的范围。我们收集该相CT在已知健康状态例如误差小于0.2%下的一段历史数据计算其“健康指数”。核密度估计KDE的作用就是根据这些有限的健康样本估计出“健康指数”这个随机变量的整体概率分布形状。基于这个估计出的分布我们可以设定一个置信边界比如99%。这意味着如果一个新计算出的“健康指数”落在这个边界确定的区间内我们有99%的信心认为它属于健康状态如果落在了区间外则判定为异常。通过为三相分别计算其动态阈值我们不仅能判断CT整体是否异常还能精准定位到具体是哪一相出现了问题。核心思路总结这套方法的精髓在于“层层过滤步步为营”。VMD负责粗过滤去掉明显噪声小波分解负责精提炼抓取趋势特征t-SNE负责做翻译将高维特征转化为可判读的指标最后KDE担任法官依据健康历史做出无监督判决。整个流程形成了一个从原始信号到异常告警的完整闭环。3. 核心环节实操要点与参数心法纸上谈兵终觉浅任何算法的成功都离不开对细节的精准把控。在这一部分我将结合我们的实验经验深入剖析VMD、小波分解、t-SNE和KDE这四个关键环节中那些在论文里可能一笔带过但却决定成败的实操要点和参数设置“心法”。3.1 VMD参数调优在过分解与欠分解间走钢丝VMD的效果极度依赖于分解层数K和惩罚因子α的选取。我们的目标是找到那个“甜点”既能有效分离出与劣化相关的残余分量又不会引入过多虚假模态或丢失信息。1. 分解层数 K 的选择K值太小属于“欠分解”噪声和有效信号混杂在一起后续处理难度大增K值太大属于“过分解”会把一个完整的物理过程信号拆得过于零碎甚至产生一些没有实际意义的虚假模态不仅增加计算量还可能引入干扰。我们的策略采用网格搜索结合中心频率观察法。首先给定一个α的初值比如2000让K从2逐步增加到6或7。对每个K值运行VMD观察分解出的各模态分量的中心频率。如果随着K增加出现了中心频率非常接近的模态或者出现了频率极低接近0Hz、能量很弱的模态这往往意味着过分解开始了。实验踩坑记录在我们针对A相数据的调优实验中当K4时虽然看似分解更“细致”但准确率Precision反而下降了23.3%。分析发现过分解产生了一个中心频率与真实残余分量非常接近的虚假模态在后续特征提取中造成了混淆导致了误报False Positive增加。最终对于工频50Hz的CT电流信号K3被证明是一个稳健的选择它能稳定地分离出工频主分量、主要谐波/间谐波分量以及我们需要的低频残余趋势分量。2. 惩罚因子 α 的权衡α控制着每个模态分量的带宽。α越大带宽越窄模态在频域上越“纯净”时间上的紧致性也越强抗噪声能力提升。但物极必反过大的α会使算法对初始化和噪声过于敏感鲁棒性下降可能无法有效捕捉信号中较宽的频带成分。我们的策略α的选择与数据采样频率和噪声水平强相关。对于电力系统采样率通常为几千Hz和中等噪声水平的数据α通常在几百到几千的范围内。我们通过控制变量实验发现α100在本案例中是一个临界点。关键发现当α 100时虽然召回率Recall较高即能检测出更多的潜在异常但准确率Precision会下降。这意味着系统变得“疑神疑鬼”容易把一些正常的波动也判为异常导致误报增多。当α 100时召回率开始下降系统变得“迟钝”可能会漏掉一些早期的、微弱的劣化迹象。因此α100在准确率和召回率之间取得了最佳平衡使得综合评价指标F1 Score达到最高。3.2 小波基函数选型不是所有“小波”都适用小波分解的核心在于选择合适的小波基函数。不同的“小波”具有不同的支撑长度、对称性和消失矩这直接影响其对信号特征的提取能力。1. 函数类型对比实验我们系统对比了连续小波变换CWT中的cmor函数以及离散小波变换DWT中经典的dbDaubechies、bior双正交和demy系列。实验结果非常明确db0Haar小波脱颖而出在所有评估指标准确率、召回率、F1值上均表现最佳。Haar小波虽然简单但其方波形状与CT电流信号在发生轻微畸变时的边缘特性有较好的匹配度计算效率也极高。bior系列表现不稳bior1.0和bior1.5小波在参数敏感性和特异性之间难以平衡导致误差识别的稳定性下降。demy小波过于平滑其过度平滑的特性削弱了对测量误差中高频分量的分辨率影响了特征捕获的完整性不适用于需要捕捉细微变化的场景。2. 小波分解层数的确定分解层数并非越多越好。层数越多得到的近似系数序列长度会以2的幂次衰减可能丢失过多的时间分辨率。我们的经验是对于以捕捉趋势为目的的应用分解到3-4层通常已经足够。可以通过观察各层近似系数的能量占比来决定当某一层近似系数的能量占总能量比例已经非常低例如5%时通常不需要再往下分解。3.3 t-SNE降维保留“灵魂”的映射将高维的小波近似系数集映射到一维关键在于保持数据的内在结构。t-SNE有几个关键参数困惑度Perplexity可以理解为算法考虑每个点邻居数量的多少。值太小会过度关注局部结构忽略全局值太大则可能模糊了不同类别间的边界。经过反复试验我们将其设置为30这能在CT不同健康状态构成的“数据云团”间保持清晰的分离度。早期放大因子Early Exaggeration在优化初期该参数会放大数据点之间的相似度差异有助于形成更清晰的簇状结构。我们设置为12以促进不同健康程度样本在低维空间中的分离。随机种子random_state这是一个至关重要的可重复性参数t-SNE的优化过程是随机的不同的初始状态会导致完全不同的映射结果。务必将其固定例如设为42否则每次实验得到的“健康指数”将无法比较阈值计算也就失去了意义。3.4 KDE阈值设定置信度的艺术核密度估计为非参数方法其核心是平滑参数h带宽的选择。带宽太大估计的概率密度函数过于平滑会掩盖细节带宽太小则会出现过多的毛刺对噪声敏感。我们采用了常用的“斯科特规则”进行自适应带宽计算这在大多数情况下是稳健的。更关键的是置信度的选择。我们设定阈值的依据是在CT健康状态误差0.2%的历史特征数据上用KDE估计其分布然后取99%的置信区间作为正常范围边界。为什么是99%这是一个工程上的权衡。电力系统正常工况下数据波动通常较小且稳定。99%的置信度意味着我们将仅有约1%的正常波动数据视为“极端值”并排除在正常范围外。这为异常检测提供了一个足够严格但不至于过于苛刻的门槛。如果设置为95%阈值区间会变窄可能导致大量正常的随机波动被误报为异常虚警率高如果设置为99.9%区间会变宽检测灵敏度下降可能漏掉早期异常漏报率高。99%是一个在工业过程监控中被广泛接受的折中值。4. 完整实验流程与结果分析理论和方法需要实验的验证。我们在中国电力科学研究院的实验平台上完整复现并验证了这套双分解检测流程。实验平台由CT模拟器、数据采集设备和远程服务器构成能够模拟CT在劣化过程中二次电流的变化趋势。4.1 实验设计与数据准备为了模拟真实场景中单相CT逐步劣化的情况我们设计了三种实验案例A相劣化保持B、C相正常让A相的比差从0%开始以0.01%为步长逐步增加到0.5%。共形成51种不同比差状态每种状态采集100个样本。B相劣化保持A、C相正常B相比差从0%递增至0.5%。C相劣化保持A、B相正常C相比差从0%递增至0.5%。采集到的二次侧电流数据如图2所示此处为描述实际论文中有图。可以明显观察到随着劣化相误差的增大该相电流呈现单调递增的趋势。但三相电流在多数采样点上波动显著这是由于负载变化、谐波干扰和采样噪声共同作用的结果。这也印证了直接对原始信号进行阈值判断是行不通的必须依靠我们提出的特征提取方法。4.2 分步实验结果与解读第一步VMD分解提取残余采用优化后的参数K3,α100对三相电流信号进行VMD分解。图4展示了分解后得到的残余信号。可以看到对于正常相如A相劣化实验中的B、C相其残余信号幅值很小且围绕零值随机波动而对于劣化相A相其残余信号呈现出一个明显的、与比差增长趋势一致的直流偏置或缓变成分。这正是我们要捕捉的、反映CT铁芯磁化特性变化的“蛛丝马迹”。VMD成功地将这一微弱趋势从强噪声背景中剥离了出来。第二步小波分解获取近似系数对上述残余信号进行3层离散小波分解使用db0小波提取第3层的近似系数。这部分系数代表了残余信号中最低频的趋势成分是劣化特征的进一步浓缩。表III列出了部分比差下各相的前3个近似系数值示例。可以看到随着比差增大劣化相的近似系数值呈现出系统性偏移而正常相的系数则保持相对稳定。第三步t-SNE降维得到劣化特征将每个样本的多尺度近似系数一个高维向量输入t-SNEperplexity30,early_exaggeration12,random_state42映射为一维特征值。结果如图5所示。这是一个非常直观的展示对于每一相其数据点在一维轴上形成了清晰的序列。正常状态比差0.2%的数据点聚集在左侧对于A相或右侧对于B、C相因初始相位差异导致形成一个“健康簇”。随着比差增大数据点有规律地向另一侧移动。这个一维特征值完美地表征了CT的劣化进程。第四步KDE设定阈值并检测基于“健康簇”比差0.2%的所有样本的特征数据应用KDE置信度99%计算每相的动态阈值。计算结果如表IV所示A相阈值1.6818467698208412B相阈值-0.7405597525400477C相阈值-2.0088016164450466请注意三相的阈值截然不同。这并非错误而是真实物理世界的反映。由于三相电流在幅值、相位和谐波含量上存在天然的不平衡导致CT各相的铁芯磁化程度、损耗积累速度和饱和特性本就存在差异。因此它们的“健康指数”基线即特征值的正常范围也必然不同。这正体现了我们方法“分相建模、分相阈值”的优势比用一个统一阈值去判断三相要精准得多。最终的检测结果如图6所示。图中散点代表每个样本的特征值水平虚线即为KDE计算出的阈值。可以清晰看到当比差小于0.2%时几乎所有点都落在阈值线以内正常区。当比差超过0.2%后该相的特征值点开始显著地、成批地越过阈值线进入异常区。在A相劣化实验中B、C相的点始终保持在各自的正常区域内。实验结果表明该方法能够以0.2%的比差为界准确地区分CT的正常与异常状态并精确定位到发生劣化的具体相别。4.3 对比实验验证方法优越性为了证明我们提出的“VMD小波”双分解方案的有效性我们设计了两组对比实验。1. 与VMD改进算法的效率对比我们选取了两种VMD的改进算法顺序变分模态分解SVMD和降阶变分模态分解RVMD在相同实验设置下进行对比。结果显示三种方法都能识别出误差超限的相别但在计算效率上差异巨大SVMD分解耗时0.1699秒RVMD分解耗时0.9139秒标准VMD分解耗时0.0717秒我们的方法标准VMD在保证识别精度的前提下计算速度比SVMD快约2.4倍比RVMD快约12.7倍。这对于需要实时或准实时处理的在线监测系统而言是一个至关重要的优势。2. 与数据驱动模型的性能对比我们选取了经典的卷积神经网络CNN和长短期记忆网络LSTM作为数据驱动方法的代表。用相同的数据集包含正常和0%-0.5%比差的样本对它们进行训练和测试。结果如表V所示无论是CNN还是LSTM其识别准确率均显著低于我们提出的无监督方法。根本原因数据驱动模型是“大样本依赖型”的。它们需要大量覆盖各种故障状态尤其是严重故障的样本进行训练才能学习到一个可靠的分类边界。而在实际中严重的CT误差样本极其稀缺模型只能用大量正常样本和极少量的轻微异常样本进行训练这必然导致其泛化能力差对未知程度异常的检测能力弱。我们的方法则完全规避了这个问题它只从“正常”数据中学习“正常”的边界不依赖于任何“异常”样本的先验知识更适合于本场景。5. 工程落地思考与常见问题排查将一套实验室验证成功的算法部署到真实的变电站环境是另一个维度的挑战。以下是我基于项目经验总结的一些工程化思考和在调试中可能遇到的典型问题。5.1 工程实施关键考量1. 数据质量与预处理采样率与同步确保对三相电流的采样是同步的采样率需满足奈奎斯特采样定理通常不低于1kHz以捕捉可能的谐波。同时数据采集单元DAQ的精度和抗干扰能力必须过硬。数据清洗在实际现场数据中可能包含因开关操作、雷击等引起的瞬时尖峰或数据丢失。在送入VMD前必须增加一个简单的数据清洗环节例如采用中值滤波去除瞬时脉冲或采用线性插值填补短时缺失数据缺失过长则应标记为无效数据段。2. 计算资源与实时性边缘计算部署考虑到变电站数据量大且对实时性有一定要求建议将本算法的核心部分部署在站内的边缘计算装置上。只需将计算好的“劣化特征值”和“越限告警”信号上送主站可极大减轻通信带宽压力。滑动窗口与定时触发算法无需对每个采样点都运行。可以采用“滑动时间窗口”的方式例如每5分钟取一个长度为1秒的窗口数据包含50个工频周期进行计算。这既能跟踪变化又控制了计算频率。3. 阈值自适应与更新初始阈值建立在新CT投运或大修后需要采集至少一周涵盖不同负载、不同时段的正常运行数据用来计算初始的KDE阈值。阈值缓慢漂移CT的性能会随着时间极其缓慢地自然老化这可能导致“健康指数”的基线发生缓慢漂移。因此阈值不应是永久固定的。可以设计一个“慢更新”机制例如每月或每季度将过去一段时间内未触发告警的数据视为仍处于健康状态重新纳入KDE计算对阈值进行微调。但更新周期不宜过短且必须有严格的逻辑防止将已异常的数据误用于更新。5.2 典型问题排查指南在实际调试中你可能会遇到以下现象这里提供一些排查思路现象可能原因排查步骤与解决思路所有相频繁误报警1. VMD参数K, α设置不当导致残余分量中仍包含大量噪声。2. KDE置信度设置过高如99.9%阈值区间过窄。3. 用于计算阈值的历史“健康数据”本身不纯净包含了未发现的早期异常。1. 检查VMD分解后的各模态中心频率确认残余分量是否主要为低频。可适当增大α或调整K值。2. 将置信度暂时下调至95%观察若误报消失则说明需要重新评估阈值或检查输入数据质量。3. 回溯用于建立阈值的历史数据绘制其“劣化特征值”时序图查看是否存在缓慢上升趋势若有则需剔除后期数据。某特定相持续报警但离线检定正常1. 该相CT二次回路负载与其他相存在显著差异如导线长度、接触电阻不同。2. 三相电流本身存在较大不平衡导致该相CT长期工作在轻度饱和区其特征基线本就不同。3. 数据采集通道存在微小零漂或增益误差。1. 检查二次回路接线和负载。2. 分析三相电流的长期录波数据确认不平衡度。这种情况下应接受该相具有不同的“健康基线”重点监控其特征值的变化趋势而非绝对值。3. 对采集通道进行校准。算法运行速度过慢无法满足准实时要求1. 滑动窗口重叠率过高或窗口长度太长。2. t-SNE计算耗时成为瓶颈尽管数据已是一维但样本数多时仍耗时。1. 调整窗口策略例如每10分钟计算一次每次用1秒数据。2. 对于在线监测可以考虑用PCA主成分分析替代t-SNE。虽然PCA是线性降维可能损失部分非线性结构但对于本场景中趋势明显的特征PCA速度极快且效果往往可以接受这是一个重要的工程折中方案。特征值无明显趋势杂乱无章1. 小波分解层数过深丢失了主要趋势信息。2. t-SNE的perplexity参数设置不当或未固定random_state导致每次映射结果随机。3. 原始信号质量太差信噪比过低。1. 尝试减少小波分解层数如从3层改为2层。2.务必检查并固定random_state参数。调整perplexity尝试20, 30, 40。3. 检查传感器和采集系统在VMD前可考虑增加一个带通滤波如45-55Hz以初步增强信噪比。5.3 方法局限性与未来展望没有任何方法是万能的。坦诚地说我们当前的方法也有其局限性对突发性故障不敏感该方法擅长检测由老化、绝缘受潮等引起的缓慢性劣化。对于CT二次绕组开路、短路等突发性硬故障其特征可能表现为瞬态冲击容易被VMD当作高频噪声滤除无法有效检测。这类故障仍需依靠传统的保护告警信号。依赖稳定的运行工况如果电网工况发生剧烈变化如大型电机启动、投切大容量电容器组会导致电流波形发生短时畸变可能引起特征值的短暂跃迁造成误报警。因此算法需要与SCADA系统联动在已知的特定操作期间暂时闭锁告警或放宽阈值。环境因素量化目前方法尚未显式考虑环境温度、湿度对CT特征的影响。理论上这些因素会影响到铁芯磁导率等参数。一个更完善的系统可以引入温度传感器数据探索建立特征值与温度之间的补偿关系。未来的工作一方面是将此方法在真实的配电网环境中进行长期部署验证收集更多样化的运行数据来打磨算法的鲁棒性。另一方面可以探索与轻量级深度学习模型如自编码器相结合用无监督学习的方式从历史数据中自动学习更强大的特征表达进一步提升检测的早期性和准确性。这条路走通了才能真正为电力设备的预测性维护打开一扇新的大门。