AI领域40多年，真正不变的是什么？-尧图网站设计

AI领域40多年真正不变的是什么零一万物CEO李开复与AI老兵Tom Mitchell的深度对谈从隐马尔可夫模型到Transformer从语音识别到大语言模型技术范式一直在变。但推动AI进步的本质从未改变。一、起点一个改变一生的选择1979年年轻的李开复进入哥伦比亚大学对人工智能产生了浓厚兴趣。“AI是人类认识并理解自己的最后一里路。”他认为探索大脑工作机制就是在回答一个更重大的问题我们能否创造出比肩人类的智能体带着这个梦想李开复来到卡内基梅隆大学CMU攻读博士。在这里他遇到了一个关键选择——做主流的专家系统还是走一条没人验证过的路二、突破勇敢走不同的路当时的背景1980年代语音识别领域的主流路线是专家系统让人类专家定义规则教机器如何识别语音。但李开复通过朋友接触到了另一条路线隐马尔可夫模型HMM——一种基于概率统计的机器学习方法。导师的一句话改变了一切李开复去找导师Raj Reddy说“我尊敬您但我想尝试一种不同的方法——用隐马尔可夫模型。”Raj回答了一句非常了不起的话“我不同意你但我会支持你。”这句话让李开复终身受益。他后来总结“AI的突破很少来自孤立的灵感。真正改变历史的是有人敢走不同的路。”成功的三要素李开复拿到了做研究需要的三样关键资源海量数据“没有任何数据能胜过更多的数据。”IBM研究员Fred Jelinek的名言李开复至今深信不疑强大算力20台SPARCstation在当时是惊人的算力自由探索导师的支持让他可以追求自己真正有热情的方向96%准确率的震撼经过一系列改进优化模型结构、采用更好的信号处理、引入语言模型在一个周六早晨李开复发现系统准确率达到了96%。“技术突破往往不是单点奇迹而是模型结构、数据表示、上下文建模、数据规模和计算资源等多个正确方向同时叠加后的结果。”三、演进AI技术的三次跃迁第一次跃迁从HMM到深度学习李开复的博士论文让HMM成为语音识别的行业标配。但几年后基于HMM的改进逐渐变慢。“靠这套方法无法真正到达终点。”下一次突破来自深度学习。当Geoffrey Hinton利用李飞飞的ImageNet数据库证明深度学习可以打破计算机视觉基准后语音识别也迎来飞跃。关键洞察神经网络的想法一直存在只是过去没有足够算力训练足够大的网络。当层数增加、数据规模扩大、算力增强后性能就大幅提升。第二次跃迁从深度学习到Transformer再往后就是今天我们熟悉的Transformer和大语言模型。核心进步过去二元语法、三元语法只能看前一两个词现在Transformer可以关注上百万个词的上下文并通过注意力机制进行选择性处理不变的底层逻辑回顾AI技术演进李开复认为关键始终在于四件事要素作用例子模型架构定义如何处理信息HMM → 深度学习 → Transformer海量数据让机器真正理解“没有数据能胜过更多的数据”强大算力训练更大规模的模型20台SPARCstation → GPU集群处理上下文的能力理解复杂关系看1-2个词 → 看100万个词四、惊喜过去5年最震撼的事李开复说最大的惊喜有三个1. Transformer架构竟然能带我们走得如此之远他是GPT-2的早期测试者当时就意识到Transformer会带来巨大提升但**“没有料到它能像今天这样扩展得如此庞大、深入”**。2. Scaling Law缩放定律竟然能持续奏效如此之久模型越大、数据越多、算力越强性能就越好——这个规律竟然一直成立。3. 强化学习终于发挥了关键作用经过多年蛰伏强化学习在大语言模型时代终于展现出巨大价值。一个有趣的观察经验可能是负担李开复坦承“我被过去那种长期缓慢发展的节奏给’毒害’了所以我花了一段时间才适应这个快节奏。”那些在生成式AI时代长大的20多岁的年轻人思想完全是未被约束的。他们就像李开复当年很幸运地在机器学习领域未被更早期的专家系统约束一样。“AI的历史不是一条直线而是一代人不断推翻上一代人的确定性。”五、未来接下来会发生什么近期突破3-4年内李开复预测AI做出突破性的科学发现——不会让人惊讶三四年内AI领域就会出现诺贝尔奖级别的突破真正被授予诺贝尔奖可能需要更长时间长远影响一旦AI能加速科学发现它带来的将不只是效率提升也可能推动健康寿命延长物质财富增加更多人类难题的解决六、给年轻研究者的建议如果有即将入学的计算机科学与AI专业博士生问李开复该怎么做他会给出这样的建议情况一想参与当前的主流突破寻找那些与拥有大量计算资源的企业有合作关系的教授。原因今天基于Transformer的生成式AI要继续发展必须建立在庞大算力基础设施之上而多数纯学术机构并不具备这样的条件。情况二寻找下一个范式打破常规寻找Transformer之外的下一个范式。“当所有人都在优化答案时总要有人重新定义问题。”如果没有充足计算资源很难在谷歌或OpenAI的主战场上击败他们。但你可以做他们还不知道怎么做的事——去构建或发明下一个Transformer或者下一代强化学习机制。关键洞察AI领域真正稀缺的从来不是共识而是能被验证的非共识。那些在谷歌崛起后仍固执己见做传统信息检索的人最终走进了死胡同。学术界的光明未来必须脚踏实地。七、结语不变的本质回到文章开头的问题AI领域40多年真正不变的是什么答案不是某个具体的技术、某个模型、某个算法而是不变的四大底层变量数据从没有任何数据能胜过更多的数据到今天的大语言模型训练语料算力从20台SPARCstation到今天的GPU集群和数据中心模型架构从HMM到深度学习到Transformer——形式在变但如何更好地处理信息这个问题不变真实问题技术最终要解决的问题——让机器真正理解人类不变的精神敢于走不同的路Raj的那句我不同意你但我会支持你用结果说话技术路线之争不是靠辩论赢的是要靠结果赢的一代人推翻一代人的确定性AI的历史不是直线而是不断颠覆的过程文章来源零一万物 01AI责编林洁希望这篇文章能帮助你理解AI技术演进的背后逻辑以及那些真正推动进步的不变量。技术的进步或许很快但有些东西始终未变。

AI领域40多年，真正不变的是什么？

相关新闻

肺癌术后随访离散选择实验（DCE）设计与SAS实现

112、飞控中的数学库优化：arm_math与CMSIS-DSP

NSK LH65GM至NH65GM无缝替换指南

欧奥电子车载移动UFS4.1验证：mSMP与B2B 高保真探测技术详解

Mac微信防撤回终极指南：3分钟解锁完整聊天记录保护

WarcraftHelper：解决魔兽争霸III玩家三大核心痛点的专业工具

python3.7-数据存储与运算-赋值运算符

我的 Agent 真的能提效 —— 深信服 FastGPT 平台赋能业务革新

微信聊天记录永久备份终极指南：用WeChatExporter完整保存你的数字记忆

OpenCore Legacy Patcher：老Mac焕新计划，突破苹果限制的完整指南

终极iOS越狱完整指南：如何安全解锁iPhone隐藏功能

掌握AMD Ryzen底层调试：SMUDebugTool专业调优完全指南

从放大器选型反推：为什么你的无线模块用OQPSK而不用QPSK？一个硬件工程师的避坑指南

实战指南：基于快马平台生成可集成的流程图组件，告别单纯安装教程

Qwerty Learner：程序员如何在VSCode中边写代码边记单词的终极指南

Harness 中的响应合并：将多个片段组装为完整输出

Windows Cleaner终极教程：5分钟彻底解决C盘爆红问题，让系统重获新生！

别再只会用ifconfig了！在Ubuntu 22.04/20.04上，教你用ip命令并顺带配置好国内镜像源