总梯度是各样本梯度的线性叠加-尧图网站设计

设总损失函数J(w)J(w)J(w)为数据集中NNN个独立样本的损失函数Li(w)L_i(w)Li(w)之和即J(w)∑i1NLi(w)J(w) \sum\limits_{i1}^{N} L_i(w)J(w)i1∑NLi(w)。若每个样本的损失函数Li(w)L_i(w)Li(w)关于模型参数www均可导则总损失函数J(w)J(w)J(w)关于参数www的导数或梯度等于各个样本损失函数Li(w)L_i(w)Li(w)关于参数www的导数或梯度之和。用数学公式表示即为∂J(w)∂w∂∂w(∑i1NLi(w))∑i1N∂Li(w)∂w\frac{\partial J(w)}{\partial w} \frac{\partial}{\partial w} \left( \sum\limits_{i1}^{N} L_i(w) \right) \sum\limits_{i1}^{N} \frac{\partial L_i(w)}{\partial w}∂w∂J(w)∂w∂(i1∑NLi(w))i1∑N∂w∂Li(w)证明这个结论的证明依赖于微积分中两个最基础的求导法则求和法则与链式法则。在机器学习中总损失函数JJJ通常是所有NNN个样本的损失LiL_iLi的平均值或总和即J(w)1N∑i1NLi(w)J(w) \frac{1}{N} \sum\limits_{i1}^{N} L_i(w)J(w)N1i1∑NLi(w)其中LiL_iLi是第iii个样本的损失它依赖于模型的预测值而预测值又依赖于参数www。对参数www求导对总损失JJJ关于参数www求偏导数∂J∂w∂∂w(1N∑i1NLi)\frac{\partial J}{\partial w} \frac{\partial}{\partial w} \left( \frac{1}{N} \sum\limits_{i1}^{N} L_i \right)∂w∂J∂w∂(N1i1∑NLi)运用求和法则根据微积分的求和法则和的导数等于导数的和以及常数因子可以提取到导数外面的性质可以把求导符号放进求和符号里面∂J(w)∂w1N∑i1N∂Li(w)∂w\frac{\partial J(w)}{\partial w} \frac{1}{N} \sum\limits_{i1}^{N} \frac{\partial L_i(w)}{\partial w}∂w∂J(w)N1i1∑N∂w∂Li(w)结论观察上面的等式右边∑i1N∂Li∂w\sum\limits_{i1}^{N} \dfrac{\partial L_i}{\partial w}i1∑N∂w∂Li正是各个样本损失对参数的导数之和。这个数学性质是批量梯度下降Batch Gradient Descent和小批量随机梯度下降Mini-batch SGD能够成立的基石。并行计算的基础因为它证明了总梯度可以拆分成独立的部分所以可以把数据分成一个个 Batch分别计算每个 Batch 的梯度最后把它们加起来或取平均就能得到全量数据的真实梯度。补充说明适用前提该性质成立的核心前提是各个样本的损失LiL_iLi之间是相互独立的并且都是关于参数www的可导函数。

总梯度是各样本梯度的线性叠加

相关新闻

3步轻松免费下载百度文库文档：纯净阅读与PDF保存终极指南

重新定义怀旧体验：揭秘Bilibili-Old项目的架构哲学与实战价值

数据库三大日志深度解析：Redo Log、Binlog、Undo Log 如何守护你的数据

3D打印到CAD设计：如何用stltostp轻松实现STL转STEP格式转换

网络诊断工具终极指南：iperf3 Windows版完整教程与性能测试

v1-5-pruned-emaonly.safetensors 搭配mm_sd_v15_v2.ckpt 生成视频，具体操作步骤

【Appium 系列】第14节-断言与验证 — Validator 的设计

Gemini 写作工作流：选题→大纲→润色→定稿的迭代法

Fere AI 新手快速上手指南

手把手教你用PlantUML和Gravizo：无需插件，在任意Markdown平台嵌入动态UML图

告别命令行恐惧：在Ubuntu 23.04上图形化玩转Mininet网络模拟（附MiniEdit配置全流程）

告别哑巴设备：用DY-SV17F语音模块给你的Arduino项目加上声音（附STM32串口控制代码）

2026年十大最佳地区搜索排名优化工具：权威榜单赋能企业高效增长

DDR3内存Row Hammer问题解析与防护方案

为ItsyBitsy ESP32设计3D打印外壳：从原型到产品的完整实践

别再手动点关了！用PowerShell永久关闭Windows Defender的保姆级教程（含Server 2016/2019）

别再只换芯片了！BP2832A替换CL1502，你的电感参数算对了吗？

全平台智能资源下载工具：res-downloader 完整使用教程