别再死记ResNet结构了！用PyTorch手把手拆解ResNet34的‘跳跃连接’（附完整代码）

发布时间：2026/6/9 7:14:48

别再死记ResNet结构了！用PyTorch手把手拆解ResNet34的‘跳跃连接’（附完整代码）

从PyTorch实现透视ResNet34跳跃连接如何破解深度网络训练难题当你在PyTorch中第一次看到out residual这样的代码时是否曾困惑这行简单的加法为何能解决深度神经网络训练的世界级难题本文将带你深入ResNet34的实现细节通过代码实例揭示跳跃连接Skip Connection背后的精妙设计。1. 残差块深度神经网络的革命性设计传统卷积神经网络随着深度增加会遭遇梯度消失问题导致深层网络反而不如浅层网络表现好。2015年ImageNet竞赛中ResNet通过引入残差学习概念解决了这一难题。残差块的核心思想可以用一个方程式表示输出 F(x) x其中x是输入F(x)是神经网络要学习的残差映射就是PyTorch中那个看似简单的加法操作在PyTorch中一个基础的残差块实现如下class BasicBlock(nn.Module): def __init__(self, in_channels, out_channels, stride1): super().__init__() self.conv1 nn.Conv2d(in_channels, out_channels, kernel_size3, stridestride, padding1, biasFalse) self.bn1 nn.BatchNorm2d(out_channels) self.relu nn.ReLU(inplaceTrue) self.conv2 nn.Conv2d(out_channels, out_channels, kernel_size3, stride1, padding1, biasFalse) self.bn2 nn.BatchNorm2d(out_channels) self.shortcut nn.Sequential() if stride ! 1 or in_channels ! out_channels: self.shortcut nn.Sequential( nn.Conv2d(in_channels, out_channels, kernel_size1, stridestride, biasFalse), nn.BatchNorm2d(out_channels) ) def forward(self, x): residual x out self.conv1(x) out self.bn1(out) out self.relu(out) out self.conv2(out) out self.bn2(out) out self.shortcut(residual) out self.relu(out) return out关键点当输入输出维度不匹配时stride≠1或通道数变化需要通过1x1卷积调整维度后才能相加。2. ResNet34架构全景解析ResNet34由多个残差块堆叠而成整体架构可分为以下几个部分网络部分输出尺寸组成模块初始卷积112x1127x7卷积stride2 BN ReLU最大池化56x563x3池化stride2layer156x563个残差块64通道layer228x284个残差块128通道stride2layer314x146个残差块256通道stride2layer47x73个残差块512通道stride2全局池化1x1平均池化全连接1000分类输出在PyTorch中构建完整ResNet34的代码如下class ResNet34(nn.Module): def __init__(self, num_classes1000): super().__init__() self.in_channels 64 self.conv1 nn.Conv2d(3, 64, kernel_size7, stride2, padding3, biasFalse) self.bn1 nn.BatchNorm2d(64) self.relu nn.ReLU(inplaceTrue) self.maxpool nn.MaxPool2d(kernel_size3, stride2, padding1) self.layer1 self._make_layer(64, 3, stride1) self.layer2 self._make_layer(128, 4, stride2) self.layer3 self._make_layer(256, 6, stride2) self.layer4 self._make_layer(512, 3, stride2) self.avgpool nn.AdaptiveAvgPool2d((1, 1)) self.fc nn.Linear(512, num_classes) def _make_layer(self, out_channels, blocks, stride1): layers [] layers.append(BasicBlock(self.in_channels, out_channels, stride)) self.in_channels out_channels for _ in range(1, blocks): layers.append(BasicBlock(out_channels, out_channels)) return nn.Sequential(*layers) def forward(self, x): x self.conv1(x) x self.bn1(x) x self.relu(x) x self.maxpool(x) x self.layer1(x) x self.layer2(x) x self.layer3(x) x self.layer4(x) x self.avgpool(x) x torch.flatten(x, 1) x self.fc(x) return x3. 跳跃连接如何解决梯度消失问题要理解跳跃连接的作用我们需要从反向传播的角度分析。考虑一个简化的情况假设有一个两层的残差块y F(x, W) x在反向传播时梯度计算为∂L/∂x ∂L/∂y * (∂F/∂x 1)关键点即使∂F/∂x很小梯度消失仍有1项保证梯度可以回传梯度可以直接跳过中间层传播到更浅的层这使得超深层网络如152层的ResNet也能有效训练实验对比表明网络类型层数Top-1错误率普通网络3428.5%ResNet3424.0%普通网络152训练失败ResNet15221.3%4. 实战可视化ResNet34中的数据流动为了更好地理解数据在ResNet中的流动我们可以添加调试代码来跟踪特征图的变化def forward(self, x): print(f输入尺寸: {x.size()}) residual x out self.conv1(x) print(f第一卷积后: {out.size()}) out self.bn1(out) out self.relu(out) out self.conv2(out) print(f第二卷积后: {out.size()}) out self.bn2(out) if self.shortcut: residual self.shortcut(x) print(fshortcut调整后: {residual.size()}) out residual print(f相加后: {out.size()}) out self.relu(out) return out典型输出可能如下输入尺寸: torch.Size([1, 64, 56, 56]) 第一卷积后: torch.Size([1, 64, 56, 56]) 第二卷积后: torch.Size([1, 64, 56, 56]) 相加后: torch.Size([1, 64, 56, 56])当有维度变化时输入尺寸: torch.Size([1, 64, 56, 56]) 第一卷积后: torch.Size([1, 128, 28, 28]) 第二卷积后: torch.Size([1, 128, 28, 28]) shortcut调整后: torch.Size([1, 128, 28, 28]) 相加后: torch.Size([1, 128, 28, 28])这种可视化方法能帮助你直观理解数据在残差块中的流动路径特别是在维度变化时的处理方式。

相关新闻

AI落地四步法：先拥抱再优化的节奏控制策略

AI落地四步法：先拥抱再优化的节奏控制策略

2026/6/9 7:14:48

别再让模型白训练了！Keras EarlyStopping 保姆级调参指南（附实战避坑）

别再让模型白训练了！Keras EarlyStopping 保姆级调参指南（附实战避坑）

2026/6/9 7:14:27

超越MOTA：深入解读AB3DMOT论文提出的3D MOT新评估指标（AMOTA/sAMOTA）

超越MOTA：深入解读AB3DMOT论文提出的3D MOT新评估指标（AMOTA/sAMOTA）

2026/6/9 7:13:47

现场五招验苗技巧，不用专业设备筛选优质鱼苗

现场五招验苗技巧，不用专业设备筛选优质鱼苗

2026/6/9 8:15:48

飞书消息排版救星：用‘富文本’模式轻松搞定通知换行与@同事（含在线调试工具推荐）

飞书消息排版救星：用‘富文本’模式轻松搞定通知换行与@同事（含在线调试工具推荐）

2026/6/9 8:13:25

算力中心环境感知体系中POE传感终端的关键技术探析

算力中心环境感知体系中POE传感终端的关键技术探析

2026/6/9 8:12:04

从Copilot到Agent--我的开发工作流正在被颠覆

从Copilot到Agent--我的开发工作流正在被颠覆

2026/6/9 8:12:04

日月不失其体，故蔽而复明；江汉不失其源，故穷而复通

日月不失其体，故蔽而复明；江汉不失其源，故穷而复通

2026/6/9 8:12:04

2026年金属粉末粘合剂实力厂家，选购注意事项汇总

2026年金属粉末粘合剂实力厂家，选购注意事项汇总

2026/6/9 8:12:04

洛雪音乐音源配置终极指南：打造专业级免费音乐库

洛雪音乐音源配置终极指南：打造专业级免费音乐库

2026/6/9 0:01:41

SpringBoot+Vue游戏赛事平台源码+论文

SpringBoot+Vue游戏赛事平台源码+论文

2026/6/9 0:02:24

小区物业智能卡管理的设计与实现毕设源码

小区物业智能卡管理的设计与实现毕设源码

2026/6/9 0:04:29

从放大器选型反推：为什么你的无线模块用OQPSK而不用QPSK？一个硬件工程师的避坑指南

从放大器选型反推：为什么你的无线模块用OQPSK而不用QPSK？一个硬件工程师的避坑指南

2026/6/8 10:15:40

实战指南：基于快马平台生成可集成的流程图组件，告别单纯安装教程

实战指南：基于快马平台生成可集成的流程图组件，告别单纯安装教程

2026/6/8 10:15:40

Qwerty Learner：程序员如何在VSCode中边写代码边记单词的终极指南

Qwerty Learner：程序员如何在VSCode中边写代码边记单词的终极指南

2026/6/8 10:15:40

Harness 中的响应合并：将多个片段组装为完整输出

Harness 中的响应合并：将多个片段组装为完整输出

2026/6/8 22:50:30

Windows Cleaner终极教程：5分钟彻底解决C盘爆红问题，让系统重获新生！

Windows Cleaner终极教程：5分钟彻底解决C盘爆红问题，让系统重获新生！

2026/6/7 20:17:08

别再只会用ifconfig了！在Ubuntu 22.04/20.04上，教你用ip命令并顺带配置好国内镜像源

别再只会用ifconfig了！在Ubuntu 22.04/20.04上，教你用ip命令并顺带配置好国内镜像源

2026/6/8 13:05:37