
论文地址[2606.30669] Local Pheromone Network: Sparse Local Learning with Multi-Scale Synaptic Trails, Consolidation, and Replay2017 年人工智能还没有像今天这样火热。那时我还在学校里利用课余时间开发一款 OCR 软件我给它取名叫“极度 OCR”。为了提升它在特定场景下的识别效果我尝试过用 CNN、LSTM 等机器学习算法为它构建特异性的识别模型。这个模型最初的想法并不是突然产生的而是来自我多年学习机器学习、深度学习之后的一次归纳和反思。更早的时候我曾读过一本书《复杂诞生于秩序与混沌边缘的科学》Complexity: The Emerging Science at the Edge of Order and Chaos。书中提到蚂蚁本身是一种相对简单的生物但它们可以依靠信息素完成很多复杂的群体行为比如路径规划、食物标记、群体协作等。这给了我很深的启发如果一个计算模型也能像蚂蚁一样通过某种“信息素”机制来引导局部区域的激活、更新和记忆那么它是否可以形成一种自发的、自适应的学习能力一、最初的设想让模型像蚂蚁一样学习我当时一直在思考一个问题传统神经网络通常依赖全局反向传播大量参数会被一起更新。这样虽然强大但也容易带来一个问题当模型学习新任务时旧任务对应的参数可能被覆盖这就是所谓的“灾难性遗忘”。如果换一种方式呢比如我们不让所有计算单元都参与更新而是让模型根据损失变化自主决定哪些区域应该被激活、哪些连接应该被强化、哪些记忆应该被保留。我的直觉是当损失变大时说明当前参与计算的区域不足模型应该扩大“信息素范围”让更多计算单元参与学习当损失变小时说明当前路径有效模型可以逐步缩小更新范围用更少的计算资源完成任务经常被触发、反复产生作用的区域应该被强化为长期记忆偶然触发、低频使用的区域则可以作为短期记忆在后续学习中被重写或重新利用。这样一个模型就不再只是被动地接受梯度更新而是可以根据任务状态自适应地调整自己的计算区域和记忆结构。二、从想法到模型Local Pheromone Network后来我按照这个思想设计了一种局部信息素网络也就是论文中整理的Local Pheromone Network。它的核心并不是构造一个更大的全连接网络而是反过来让模型从一开始就是稀疏的、局部的、带有区域约束的。在这个网络中每个输出单元并不会连接所有输入单元而只会连接一小片局部区域。每条连接上不仅有传统的权重还保存了几类状态权重决定输入对输出的基本影响短期信息素表示近期被激活、近期有用的路径长期信息素表示反复被验证、较稳定的路径巩固状态表示这条连接是否已经成为较稳定的长期记忆。模型在训练时不会依赖传统的 loss.backward() 自动反向传播而是通过局部误差、局部共激活和信息素强度选择一部分连接进行更新。也就是说每次学习只更新一小部分最相关的局部连接。这和我最初的设想是一致的让模型通过“信息素”决定学习发生在哪里而不是让整个网络无差别地被更新。三、信息素如何参与学习在这个机制里信息素并不是简单替代权重而是起到一种“门控”和“路由”的作用。一条连接如果经常被激活并且对降低损失有帮助它的信息素就会增强。信息素增强以后这条路径在后续推理和学习中会更容易被再次使用。反过来如果一条连接很少被触发或者长期没有贡献它的信息素会逐渐衰减。这就形成了一种类似自然系统的反馈有效路径会被加强无效路径会被弱化短期有用的路径会被临时保留长期稳定的路径会被巩固新任务出现时模型会优先寻找局部可用区域而不是立即覆盖所有旧参数。这种机制对于多任务学习尤其重要。传统全连接网络在连续学习多个任务时往往会出现新任务覆盖旧任务的问题。而通过标签、区域划分、输出掩码和信息素巩固机制不同任务可以被分配到不同的局部区域中从而减少彼此干扰。四、短期记忆、长期记忆与灾难性遗忘我后来发现信息素最有价值的地方并不只是“指导计算”而是可以自然地表达记忆。如果一个区域被频繁触发它的信息素强度会不断增加并逐渐形成长期记忆。这样的区域在后续训练中会变得更稳定不容易被新任务改写。如果一个区域只是偶然触发它就更像短期记忆。短期记忆可以被利用也可以在新的任务中被覆盖这使模型保持一定的可塑性。论文中的实验也验证了这一点当两个任务被划分到不同的标签区域和输出区域时旧任务的记忆可以被较好地保留下来而当两个任务直接争夺同一批局部连接时遗忘仍然会发生。进一步加入巩固机制后模型对旧任务的遗忘明显降低但代价是学习直接冲突的新任务会变慢。这其实对应了智能系统中的一个经典问题稳定性与可塑性的平衡。模型既不能太容易改变否则旧知识会被覆盖也不能完全不改变否则无法适应新任务。信息素网络提供了一种可控的折中方式通过局部更新、长期信息素和巩固机制让模型在保持旧记忆的同时仍然具备继续学习的能力。五、自适应计算损失决定信息素范围这个模型中还有一个非常关键的机制更新预算会随着损失变化而调整。如果当前损失下降说明现有路径正在发挥作用模型会倾向于收缩更新范围只更新少量关键连接。这样可以减少不必要的计算也能避免无关区域被扰动。如果当前损失上升说明当前路径不足以解释任务模型会扩大更新预算并向最近活跃的邻域扩展让更多局部计算单元参与进来。这就类似蚂蚁寻找路径一条路径有效信息素会增强更多个体会沿着这条路径行动路径失效或环境变化时搜索范围会扩大系统会尝试新的局部区域。因此这个网络并不是固定计算路径而是根据任务反馈动态调整自己的学习区域。六、进一步扩展结构可塑性与回放在后续实验中我还加入了结构可塑性和回放机制。结构可塑性允许模型在固定容量内调整连接对象低信息素、低巩固度、长期无用的连接可以被剪掉新的连接可以在活跃区域附近生长出来。这样网络虽然不是无限扩张但可以在有限资源下重新组织自己的局部结构。回放机制则用于处理冲突。当模型发现新任务可能破坏旧记忆时可以重新调用一部分低损失旧样本用同样的局部更新规则进行回放从而缓解遗忘。这让 Local Pheromone Network 不只是一个局部学习模型也开始具备某种“记忆维护”能力。七、阶段性结果与意义在论文中的初步实验里这个模型已经表现出几个有意义的现象在合成局部回归任务中模型可以在不使用自动反向传播的情况下将误差明显降低在分区记忆任务中通过标签和输出掩码不同任务的记忆可以较好地共存在直接冲突任务中模型仍然会遗忘但加入巩固机制后遗忘程度明显下降短期信息素衰减更快长期信息素保留更久这符合短期记忆与长期记忆的设定在混合模型中信息素记忆分支可以作为长期局部记忆模块补充传统模型短感受野的不足。当然这个模型目前仍然是研究原型。它还不能说是 Transformer、CNN 或 RNN 的替代品也没有在大规模任务上证明通用性能。它更像是一个实验平台用来验证这样一种思想神经网络是否可以通过局部信息素、稀疏连接、区域标签、巩固和回放形成一种更加自适应的学习与记忆机制。八、最后说点东西吧我依然认为在人工智能时代灵活运用学习到的知识确实是一个很不错的能力拥有发散的思维和想法在未来就可以有无限的创新和创造让人工智能技术把我们从繁杂的工作中解放出来多看看大自然多晒晒太阳感受生活本身也是科技赋予我们的价值。