图神经网络（七）-4.4 过平滑问题-尧图网站设计

系列文章目录图神经网络目录文章目录目录系列文章目录文章目录前言一、过平滑问题1. 现象2. 原因3. 后续研究二、PairNorm一种缓解过平滑的方法1. 基本思想2. TPSD 的数学表达3. PairNorm 的两步操作1中心化2缩放4. 最终 TPSD 计算三、总结前言以下内容来自学习笔记主要按照《图神经网络 -基础、前沿与应用》这本书进行学习。一、过平滑问题1. 现象在深度图神经网络GNN中堆叠多层网络后模型性能通常会显著下降。这一现象在许多GNN架构如GCN、GAT等中普遍存在。2. 原因Li 等人2018b指出这一问题主要由过平滑引起。他们证明图卷积网络GCN本质上可以看作是一种拉普拉斯平滑操作其中是随机游走归一化邻接矩阵。GCN 对应且使用对称归一化形式。拉普拉斯平滑会促使同一聚类内的节点表示趋于相似这对节点分类等任务最初是有利的。但当网络层数加深时这种平滑作用过度导致所有节点的表示趋同从而无法区分不同类别的节点最终使下游任务性能严重下降。3. 后续研究后续多篇文献如 Zhao and Akoglu, 2019; Xu et al., 2018; Li et al., 2019; Rong et al., 2020也验证了这一现象并尝试提出解决方案。二、PairNorm一种缓解过平滑的方法1. 基本思想PairNorm 的核心是保持节点表示之间的总平方距离Total Pairwise Squared Distance, TPSD不变使其与原始输入特征的 TPSD 保持一致。这样可以在多层传播后仍然保留节点之间的差异性避免过度平滑。假设是图卷积层输出的节点表示矩阵PairNorm 的输出为目标2. TPSD 的数学表达TPSD 定义为所有节点对之间欧氏距离的平方和可以等价表示为其中8是节点表示的均值。3. PairNorm 的两步操作PairNorm 通过中心化和缩放两步实现1中心化将每个节点表示减去所有节点的均值使表示矩阵中心化2缩放将中心化后的表示缩放到固定的总平方距离其中 s 是一个超参数用于控制最终的 TPSD 值。4. 最终 TPSD 计算经过上述两步后最终的 TPSD 为因此通过调节 s可以控制节点表示之间的整体差异性从而缓解过平滑。三、总结问题描述过平滑多层GNN中节点表示趋于一致丧失区分性导致性能下降原因GCN 等模型本质是拉普拉斯平滑多层后过度平滑PairNorm 思想保持节点表示的 TPSD 与输入一致避免表示趋同实现两步中心化缩放保证表示间的总距离恒定作用缓解过平滑支持更深层的图神经网络训练

图神经网络（七）-4.4 过平滑问题

相关新闻

彻底禁止windows自动更新

从零到一：基于LLaMA-Factory的微调实战与核心参数精讲

League-Toolkit：革新英雄联盟体验的效率倍增工具集

年度最佳AI代码生成平台Top排行榜：2026年开发团队选型评测

macOS虚拟PDF打印机终极指南：3步实现一键文档转换

wechat-jssdk源码解析：深入理解微信JSSDK NodeJS实现原理

给我推荐一款儿童古诗APP？适趣古诗词适合孩子从兴趣开始学

G-Helper终极指南：轻量级华硕笔记本控制工具完整教程

GetQzonehistory：为你的QQ空间记忆打造专属时光胶囊

UE5 Niagara火焰特效性能优化实战：从GPU负载到移动端适配

卡梅德生物技术快报｜重组蛋白的表达和纯化：IMAC 金属螯合色谱全流程工艺手册｜基质 - 配基 - 金属离子匹配与蛋白质分离纯化参数优化

卡梅德生物技术快报｜蛋白质分离纯化：肠激酶可溶性原核表达 + 两步层析全参数｜标准化蛋白质分离纯化 SOP

STM32F411RE与MCP3551高精度ADC应用指南

【RT-DETR涨点改进】26 跨平台SDK封装：从Python原型到C++生产级部署

【RT-DETR涨点改进】27 RT-DETR推理加速：从TensorRT到ONNX Runtime的零开销切换

餐饮老板必看：扫码点餐小程序3步搞定，别再让顾客干等了！

国产DSP FT-M6678 DDR3配置避坑指南：从PLL时钟到PHY寄存器，手把手调通你的第一块板

Coze与Dify对比指南：低代码AI应用开发从入门到实战