最近在时间序列预测的项目里折腾了个贝叶斯优化的BP神经网络模型,记录点实战经验。直接上代码干货,边写边聊踩过的坑

发布时间:2026/6/11 14:46:34

最近在时间序列预测的项目里折腾了个贝叶斯优化的BP神经网络模型,记录点实战经验。直接上代码干货,边写边聊踩过的坑 贝叶斯Bayes)-BP时序预测模型MATLAB程序报告 1环境初始化程序开始时清空所有变量关闭所有图窗和警告信息为数据处理提供一个干净的环境。 2数据导入从Excel文件 数据集x1sx中导入时间序列数据。 3数据集构造使用历史数据作为自变量通过设定的延时步长和预测跨度构造数据集为机器学习模型提供训练数据。 4数据集分析和划分将数据集分为训练集和测试集用于模型训练和验证。 5数据归一化对训练集和测试集数据进行归一化处理使模型训练更稳定。 6. 贝叶斯优化使用贝叶斯优化算法自动寻找神经网络的最优超参数如隐藏层节点数和学习率。 7网络训练和预测使用优化后的参数配置训练前馈神经网络并对训练集和测试集进行预测。 8评价指标计算计算模型在训练集和测试集上的均方根误差RMSE)、相关系数R^2)、平均绝对误差MAE)、平均偏差误差MBE和平均绝对百分比误差MAPE)。 9结果可视化绘制预测结果与真实值的对比图以及贝叶斯优化过程中适应度值的变化。环境初始化上来先给MATLAB来个大扫除防止变量污染clc; clear; close all; warning(off,all); % 堵住各种warning弹窗这波操作像不像每次做饭前先把灶台擦干净强迫症患者表示极度舒适。数据导入的玄学读取Excel时文件名打错是保留节目rawData xlsread(数据集.x1sx); % 注意这个诡异的x1sx后缀 % 此处应有灵魂拷问为什么总有人把xlsx打成x1sx建议直接暴力改名文件避免在代码里玩大家来找茬。时间序列变形记把一维时间序列掰成监督学习需要的二维结构delay 3; % 时间滑窗 forecastStep 1; % 预测步长 X []; Y []; for i 1:length(rawData)-delay-forecastStep X [X; rawData(i:idelay-1)]; Y [Y; rawData(idelayforecastStep)]; end这操作相当于把时间轴折叠成特征维度类似把视频帧拆成连续画面组。注意delay设置别太贪心否则维度爆炸警告。数据分割的哲学7:3分训练测试集是基本礼仪splitPoint floor(0.7*size(X,1)); trainX X(1:splitPoint,:); testX X(splitPoint1:end,:); % 此处应有沉思时间序列真的能随机分割吗对于强时序相关的数据建议用前70%预测后30%避免未来信息泄露。归一化的秘密战争标准化处理藏着魔鬼细节[XTrain, ps] mapminmax(trainX, 0, 1); XTest mapminmax(apply, testX, ps); % 重要知识点测试集必须用训练集的缩放参数见过太多人直接整体归一化结果测试时模型性能虚高——妥妥的数据泄露车祸现场。贝叶斯Bayes)-BP时序预测模型MATLAB程序报告 1环境初始化程序开始时清空所有变量关闭所有图窗和警告信息为数据处理提供一个干净的环境。 2数据导入从Excel文件 数据集x1sx中导入时间序列数据。 3数据集构造使用历史数据作为自变量通过设定的延时步长和预测跨度构造数据集为机器学习模型提供训练数据。 4数据集分析和划分将数据集分为训练集和测试集用于模型训练和验证。 5数据归一化对训练集和测试集数据进行归一化处理使模型训练更稳定。 6. 贝叶斯优化使用贝叶斯优化算法自动寻找神经网络的最优超参数如隐藏层节点数和学习率。 7网络训练和预测使用优化后的参数配置训练前馈神经网络并对训练集和测试集进行预测。 8评价指标计算计算模型在训练集和测试集上的均方根误差RMSE)、相关系数R^2)、平均绝对误差MAE)、平均偏差误差MBE和平均绝对百分比误差MAPE)。 9结果可视化绘制预测结果与真实值的对比图以及贝叶斯优化过程中适应度值的变化。贝叶斯优化黑盒调参神器让算法自己找最优网络结构optimVars [ optimizableVariable(hiddenLayerSize, [5, 50], Type,integer) optimizableVariable(lr, [1e-4, 1e-2], Transform,log) ]; objFcn (params)trainNet(params, XTrain, YTrain); % 自定义训练函数 results bayesopt(objFcn, optimVars, MaxTime, 300);贝叶斯优化像自动驾驶找路比网格搜索聪明太多。遇到过在30维参数空间里乱窜的网格搜索吗那场面堪比无头苍蝇。网络训练的反常识最优参数到手后反而要用简单配置bestParams results.XAtMinObjective; net feedforwardnet(bestParams.hiddenLayerSize); net.trainParam.lr bestParams.lr; net train(net, XTrain, YTrain);这里有个反直觉现象复杂网络在验证集表现好但实际预测可能过拟合。所以最后用全量数据训练时控制住你的调参之魂预测与反归一化的仪式感预测完记得把数据掰回原形YPred net(XTest); YPred mapminmax(reverse, YPred, ps); % 数据逆变换 % 忘记这步的话误差计算直接崩到外太空误差指标的群殴现场五大指标全面围剿模型误差rmse sqrt(mean((YTest - YPred).^2)); r2 1 - sum((YTest - YPred).^2)/sum((YTest - mean(YTest)).^2); mae mean(abs(YTest - YPred)); mbe mean(YTest - YPred); % 正负偏差抵消警告 mape mean(abs((YTest - YPred)./YTest))*100;这时候才懂为什么论文里都挑表现最好的指标写——其他几个可能惨不忍睹。可视化の美学暴力最后用图形魔法让结果看起来专业subplot(2,1,1) plot(YTest,LineWidth,1.5); hold on; plot(YPred,--); legend(真实值,预测值,Location,northwest) subplot(2,1,2) plot(results.ObjectiveTrace,r-o) title(贝叶斯优化进化史)画图技巧预测线要用虚线坐标轴标签字号调大不然投论文时编辑会说图片看不清。整套流程跑下来最大的感悟调参就像谈恋爱——你以为自己在控制参数其实是参数在PUA你。贝叶斯优化算是给这个虐恋关系加了层缓冲垫至少不用手动试错到天亮。下次试试把delay参数也加入优化变量或许能有意外惊喜

相关新闻