什么是大语言模型(LLM)?用最通俗的方式带你彻底搞懂它的超能力

发布时间:2026/5/19 7:17:22

什么是大语言模型(LLM)?用最通俗的方式带你彻底搞懂它的超能力 文章目录什么是大语言模型大模型的演化历程1. 预训练Pre-training2. 监督微调Supervised Fine-Tuning3. 人类反馈强化学习Reinforcement Learning from Human FeedbackLLM擅长什么不擅长什么你可能已经听说过“大模型”、“LLM”这些词感觉它们很厉害又感觉离自己很远。或者你已经用上ChatGPT了一边惊叹它啥都会一边心里犯嘀咕这玩意儿到底是怎么学会说话的它是真懂还是假懂会不会其实就是一个高级点的搜索引擎他的原理到底是什么不单单只有你这么想。我最早也是这么想的。但后来我发现理解它的钥匙比想象中简单一万倍。根本不需要你懂代码、懂数学只需要一个你我都无比熟悉的游戏——猜词接龙。今天我不从太过专业的角度给你讲解就拿最通俗易懂的比喻给你讲通就算是小白也包你能彻底搞懂(是不是又担心文章内容太过浅显不能满足你的求知欲放心每小节中都放有本节的详细知识链接包你能一次性看个爽)什么是大语言模型大语言模型Large Language Model, LLM是一种基于海量文本数据训练而成的、规模极其庞大的神经网络模型。它的核心工作机制非常简单根据已输入的文本预测下一个最可能出现的词。这句话可能有点抽象我们把它拆开来看。“大”在哪里?这里的“大”指的是模型的参数规模。参数可以理解为模型内部无数个可调节的旋钮它们决定了输入一段文字后模型会如何理解和回应。早期模型可能只有几百万个参数而现在的大语言模型参数规模动辄达到百亿甚至数千亿级别。正是这种量变引发了质变让模型拥有了许多出人意料的能力。“语言模型”做了什么?语言模型的任务从它被设计出来的第一天起就没有变过学习一种语言的规律然后能够判断或生成符合这种规律的文本。(说人话就是凭借经验和规律将可能性最大的结果生成出来反馈给你)具体到这个“预测下一个词”的机制我们可以看一个例子当你输入“法国的首都是”模型会计算在它读过的所有文本中接下来最可能出现的词是“巴黎”。于是它输出“巴黎”。然后它会把你输入的“法国的首都是巴黎”作为一个整体继续预测下一个词。如果它判断这句话已经结束就会给出一个句号。这个过程循环往复就能从你给出的一个简短开头生成一整篇连贯的文章。它和我们熟悉的搜索有什么不同?很多人第一次用会以为它在联网搜索答案。但两者的原理完全不同。搜索引擎是从已有的网页库里找到最匹配的条目然后把链接列给你。大语言模型没有去任何地方“查找”。它基于训练时记在参数里的语言模式一个字一个字地“生成”出回答。这就是为什么它有时会编造事实。它不是在回忆而是在续写。那么这样一个只会“预测下一个词”(技术人员管这个‘词’叫 Token词元它可能是一个字、一个词甚至是半个单词。) 的模型是怎么变得能写诗、写代码、听懂复杂指令的答案藏在它经历的三步关键训练里。让我们来一个一个看。点到为止这里就只简单的介绍一下如果觉得没看够或想更深入研究请看什么是语言模型大又指什么大模型的演化历程1. 预训练Pre-training预训练是大语言模型整个训练流程的第一步也是最耗时、最耗费算力的一步。这个阶段的目标很纯粹让模型在海量文本中学会人类语言的基本模式和规律。它到底在“学”什么?预训练的核心任务叫自监督学习。听起来复杂其实逻辑很简单把一段文字中某个词盖住让模型来猜。比如原文“今天天气真好适合出去__。”模型需要填出“走走”“玩”“晒太阳”之类。你可能会想这和小学语文的完形填空有什么区别区别只有两点量极大重复极多。模型的训练数据是互联网级别的文本——书籍、网页、论文、代码、百科总量以TB计算。它做的完形填空不是几千道而是几百亿、几千亿道。每做一道题它就根据对错微调自己内部的参数。参数调整的幅度极小但积累了几千亿次之后模型就会发生质变。模型学到了什么不是知识是模式经过这样的训练模型大脑里留下的是什么不是具体的知识点而是语言的结构性规律。它不知道“苹果”酸甜如何但它知道“苹果”后面常跟什么词什么语境下会提到它。它不知道什么是“因果”但它知道“因为”后面往往会出现“所以”。它不懂语法术语但它写出来的句子主谓宾搭配天然合理。它没见过“幽默”本身但它隐隐知道哪类词语组合会让人想笑。这就是预训练的本质它学的是语言中词汇、句子、段落之间的统计关联性而不是事实知识本身。你可以理解为它把一个语言的“骨架”和“肌肉记忆”全部内化了。这个阶段结束后模型什么样预训练结束后你会得到一个“原始的”大语言模型。它有一个突出能力和一个致命短板能力你给它一段文字它能按照语言规律流畅地续写下去。无论是新闻体、小说体、学术体它都能像模像样地接。短板它只会“续写”不会“对话”。你问它“帮我总结一下这篇文章”它不会照做而会顺着你的话继续往下编——“这篇文章写得很好我读了之后深受启发以下是我的心得体会……”因为它没学过“回答问题”这件事。举个例子让你彻底搞懂预训练就像让一个人读完了整座图书馆的书。他因此变得文采斐然、出口成章但你若问他一个问题他只会用漂亮的句子继续你的话头而不是针对你的意图给出回应。他有语言能力但没有“助手意识”。如果觉得没看够或想更深入研究请看预训练Pre-training—— “海量阅读”2. 监督微调Supervised Fine-Tuning预训练结束后我们得到了一个“饱读诗书”的模型但它有一个致命缺陷只会续写不会对话。指令微调就是为了解决这个问题而生的。它解决了什么问题预训练模型的行为逻辑很简单收到任何文字都当作一个“话头”往下接。这在文学创作中或许可行但在实际使用中会闹笑话。比如你输入“把下面这句话翻译成英文今天天气真好”预训练模型可能会接“把下面这句话翻译成英文今天天气真好适合出去走走阳光明媚万里无云……”它把“翻译成英文”也当成了需要续写的内容而不是一个需要执行的任务。这就是指令微调要解决的问题让模型学会区分“什么是指令”和“什么是需要处理的内容”并且按照指令的要求去行动而不是机械续写。它是怎么做到的方法非常直接给模型看大量的“指令-正确回答”范例。具体来说研究人员会构造几万甚至几十万个训练样本每个样本包含两部分输入一条明确的指令比如“请总结这段话的主要观点”“将以下内容翻译成法语”“解释量子力学的基本概念”。期望输出一个符合指令要求的、高质量的答案。然后让模型在这些样本上继续训练。当模型看到“请总结”时它慢慢学会这种情况下我应该提炼要点而不是继续写下去看到“翻译”时我应该逐句转换语言而不是发表感想。这个过程并不需要改变模型底层架构只是用新的数据对它进行第二轮训练。参数调整的幅度比预训练阶段小得多但效果立竿见影。它本质上教会了模型什么预训练阶段模型学会了“一个词后面通常是什么词”。指令微调阶段模型学会了另一件事“当人用某种方式开头时他希望我做哪种类型的回应。”这是一种意图映射能力。经过指令微调之后模型不再把一切输入当作平等的续写素材而是能识别出其中的指令成分并把自己的输出模式切换到对应的任务频道上。简单说预训练给了模型“语言能力”指令微调给了模型“工作态度”。举个例子让你彻底搞懂如果预训练是让一个人读了整个图书馆的书那么指令微调就像对这个人进行入职培训。这个人虽然学富五车但没有经过入职培训你问他问题他只会顺着你的话说下去。入职培训之后他明白了当人说“帮我查一下”时我需要调取信息当人说“帮我写一封”时我需要生成文本。他仍然用同一个大脑但学会了如何接人待事。如果觉得没看够或想更深入研究请看监督微调Supervised Fine-Tuning简称 SFT3. 人类反馈强化学习Reinforcement Learning from Human Feedback指令微调之后模型已经能听懂人话、执行任务了。但一个新问题随之而来听得懂不代表答得好。回答可能语气生硬、充满偏见甚至一本正经地胡说八道。人类反馈强化学习就是为了给模型上一道“质量把关”。它解决了什么问题?指令微调教会了模型“按指令办事”但它没有教会模型“办什么样的事才算好”。举个例子你问模型“怎么说服朋友借我钱”一个经过指令微调但没经过这一步的模型可能会真的给你列出几条操纵他人的话术。它执行了指令但完全没有判断这个指令是否合适。再比如你让它写一篇关于某个历史事件的文章它可能掺杂偏见、编造细节但语气却斩钉截铁让你难以分辨真假。这就是人类反馈强化学习要解决的核心问题让模型的回答不仅“符合指令”还要“符合人类的价值判断”——有帮助、诚实、无害。它是怎么做到的这一步的专业术语叫RLHFReinforcement Learning from Human Feedback基于人类反馈的强化学习听起来复杂拆开来看逻辑很清晰。它分成三个小步骤第一步让模型先回答人再来打分。研究人员给模型一批问题让它对每个问题生成好几个不同版本的回答。然后人类标注员对这些回答进行质量排序——哪个回答更有帮助、更诚实、更无害哪个就排前面。第二步训练一个“奖励模型”。用这些人类打分的数据训练出一个小型的奖励模型。这个奖励模型的作用很简单给定任意一段回答它能预测人类会给这段回答打多少分。你可以把它理解为模型内部的一个“品味鉴赏器”它学会了人类的偏好。第三步用奖励模型来训练大语言模型。把这个奖励模型接入大语言模型。大语言模型每生成一个回答奖励模型就给它打一个分。然后大语言模型朝着“拿更高分”的方向去调整自己的参数。经过大量反复的自我对弈和优化模型渐渐学会了什么样的回答会被人类认可什么样的回答会被人类厌恶。它本质上教会了模型什么?如果预训练给了模型“语言能力”指令微调给了模型“工作态度”那么人类反馈强化学习给的就是“职业素养”。它学会了拒绝“我不能帮你做这件事因为这可能伤害他人。”它学会了谦逊“我不确定这个答案是否准确建议你核实一下。”它学会了无害化表达同样的信息用一种更中性、更尊重的方式说出来。这就是为什么你现在用ChatGPT这类产品会觉得它彬彬有礼、四平八稳。这不是它天生的性格而是这一步训练强加给它的行为准则。为什么这一步如此关键没有RLHF之前大语言模型像一个才华横溢但口无遮拦的天才。它可以写出惊艳的诗但你也可能被它的偏见和谎言所伤。RLHF相当于给这个天才上了一整套职业规范课让它学会在展示才华的同时守住安全底线。当然这一步也不是完美的。过度对齐可能会让模型变得过于谨慎在一些本可以正常回答的问题上也打官腔。这是业界仍在持续优化的方向。如果觉得没看够或想更深入研究请看基于人类反馈的强化学习 ——RLHFLLM擅长什么不擅长什么了解了训练过程之后一个很自然的问题就是它到底能做什么不能做什么只有摸清它的能力边界我们才能真正用好它而不是被它的表面流畅所误导。它擅长什么?总体来看大语言模型在那些看重语言流畅度和模式匹配而不要求严格事实精确性的任务上表现出色。具体包括文本生成与创意写作写邮件、写文案、写故事、写诗甚至模仿特定作家的文风。这是它的看家本领因为它本质上就是一个高级文本生成器。内容总结与提炼将长篇大论浓缩成几个要点或者从非结构化文本中提取关键信息。翻译与改写在多语言之间转换或者将一段话用不同的语气、复杂度重新表达。代码辅助生成代码片段、解释代码逻辑、查找常见错误。它并非真的会编程但编程语言的语法比自然语言更结构化恰好吻合它擅长的模式匹配。头脑风暴与思路拓展当你需要创意灵感或不同角度的思考时它可以快速生成大量可能性供你挑选。这些任务的共同特点是不存在唯一标准答案评价标准是“好不好”而不是“对不对”。它不擅长什么以及为什么?大语言模型的能力缺陷根源于它的本质它不是在查找或计算而是在生成。这意味着以下几个典型问题几乎无法通过增大模型规模来根除。1. 幻觉会一本正经地编造事实这是LLM最著名的短板。你问它一个它不知道的事它不会说“我不知道”而是会用极其自信的口吻编造一个看起来合理的答案。为什么会这样它的核心任务是“预测下一个词”而不是“验证事实”。当它遇到知识空白时它仍然会根据语言模式拼凑出一个最像正确答案的文本。它不是在撒谎——它根本不知道“真”和“假”的区别。典型表现编造不存在的论文、虚构法律条文、给名人安上错误的出生日期且语气斩钉截铁。2. 复杂数学与逻辑推理可能出错让LLM直接心算多位乘法或者解决需要多步推理的逻辑题它可能给出错误答案。为什么会这样它不是计算器它的内部没有数学引擎。它做出的数学推理本质上仍然是在模仿它见过的推理过程文本。过程看起来对但结果可能完全不对。现状这个问题可以通过调用外部工具如代码解释器来缓解但模型本身不可靠。3. 知识截止不知道训练数据之后的事一个模型的知识截止于它的训练数据收集完毕的那一天。那之后发生的事、新出现的概念它一概不知。为什么会这样它的知识不是实时更新的而是被冻结在训练完成那一刻的参数里。缓解方式一些应用通过联网搜索来补充实时信息但模型自身的基础知识是静止的。4. 容易被诱导通过精心设计的提示绕过限制尽管经过了RLHF的安全训练模型仍然可能被“越狱”。通过巧妙的提示词可以诱使它说出本应被禁止的内容。为什么会这样RLHF给模型的行为加了一层约束但没有从根源上改变模型的能力。只要找到一个它没见过的角度就可能绕过这层约束。5. 缺乏真正的理解和常识模型在处理物理常识、空间关系、时间逻辑时可能会犯人类永远不会犯的错误。因为它没有生活在真实世界中它的所有知识都来自文本的统计关联而非亲身体验。一句话总结能力边界大语言模型最擅长生成流畅的、符合人类语言习惯的文本它最不擅长的是提供需要严格事实核查、精确计算或真实世界体验的答案。

相关新闻