提示词，上下文，RAG对llm来说都是一样的-尧图网站设计

首先我们得明确一个点llm的本质根据前面每一个字预测下一个字也就是自回归模型。举个例子把“我爱”发给llmllm会根据前前两个字预测第三个字可能是“你”“吃”“玩”然后拼接成“我爱你”、“我爱吃”“我爱玩”。预测下一个字的范围很大“你”“吃”“玩”等等可能的词很多范围很大每个词指向的方向都不一样“你”是表白、恋爱方向“吃”是美食方向“玩”是娱乐方向而提示词就是在这些话前面拼接上一段话则是将这个范围缩小方向更加明确。最基本的提示词是告诉llm它的身份比如“你是一个吃遍天下美食的吃货”然后将提示词和内容组合到一起就变成了“你是一个吃遍天下的吃货你爱__”可选项范围就收窄了很多方向“美食”更明确原来的“你”“吃”“玩”只剩下了“吃”。所以我们给的提示词并不是让模型成为某一个人或者具有某一种特质而是把这个“方向”告诉他但我们的写法依然是“你是一个……”多轮对话也是如此他将之前每次跟模型的对话都记录下来与现在最新的问题拼接在一起给到LLM让他明确下一个字的方向然后自回归生成回答。RAG也是如此看似你将答案给到llm他理解了答案然后回复你。但实际上它依然是根据方向来自回归生成回复而答案本身就是回复你的问题的最佳方向。举个例子提问llm“什么是苹果”RAG召回了“苹果公司的信息”一起给到模型苹果公司的信息将你提问的苹果更加明确“一家公司的信息具体的时间地点等等”的方向而模型就往这个方向生成回复。这就解释了为什么当我们把一个问题的答案未作为模型训练数据放在上下文然后让llm生成回复的时候的准确率仅为17%左右。因为他一直在根据方向生成回复而不是理解内容。更加解释了为什么RAG可以有效减少幻觉因为把方向更加明确了。这个方向是模型训练过程中训练出来的这就是模型权重计算后的结果。个人见解如有问题或错误请指正。

提示词，上下文，RAG对llm来说都是一样的

相关新闻

QML实现贪吃蛇

Linux内核内存管理：内存回收水位线机制深度解析

JVM 对象分配排查：Minor GC 频繁不一定是堆太小

【Azure AI Search】 searchMode=any 和 searchMode=all 有什么区别？

13-HBase的安装与配置

长高产品的作用机制是什么科学解读长高营养补充的底层逻辑

通信与接口协议面试四、SPI

老鸟对菜鸟的一些建议

【OpenCloudOS、CubeSandbox安装体验】

通达OA SQL注入漏洞深度剖析：从手工注入到自动化利用与防御

YOLO目标检测实战：从环境搭建到模型部署的保姆级教程

威胁模型全解析：从新手入门到实战应用，助你构建安全产品！

通达OA SQL注入漏洞深度剖析：从手工注入到自动化利用与防御

YOLO目标检测实战：从环境搭建到模型部署的保姆级教程

威胁模型全解析：从新手入门到实战应用，助你构建安全产品！

餐饮老板必看：扫码点餐小程序3步搞定，别再让顾客干等了！

国产DSP FT-M6678 DDR3配置避坑指南：从PLL时钟到PHY寄存器，手把手调通你的第一块板

Coze与Dify对比指南：低代码AI应用开发从入门到实战

相关新闻

QML实现贪吃蛇

Linux内核内存管理：内存回收水位线机制深度解析

JVM 对象分配排查：Minor GC 频繁不一定是堆太小

【Azure AI Search】 searchMode=any 和 searchMode=all 有什么区别？

13-HBase的安装与配置

长高产品的作用机制是什么 科学解读长高营养补充的底层逻辑

通信与接口协议面试四、SPI

老鸟对菜鸟的一些建议

【OpenCloudOS、CubeSandbox安装体验】

通达OA SQL注入漏洞深度剖析：从手工注入到自动化利用与防御

YOLO目标检测实战：从环境搭建到模型部署的保姆级教程

威胁模型全解析：从新手入门到实战应用，助你构建安全产品！

通达OA SQL注入漏洞深度剖析：从手工注入到自动化利用与防御

YOLO目标检测实战：从环境搭建到模型部署的保姆级教程

威胁模型全解析：从新手入门到实战应用，助你构建安全产品！

餐饮老板必看：扫码点餐小程序3步搞定，别再让顾客干等了！

国产DSP FT-M6678 DDR3配置避坑指南：从PLL时钟到PHY寄存器，手把手调通你的第一块板

Coze与Dify对比指南：低代码AI应用开发从入门到实战

长高产品的作用机制是什么科学解读长高营养补充的底层逻辑