AI技术名词解释

发布时间:2026/6/14 20:07:19

AI技术名词解释 AI技术名词解释一、AI愿景与目标AGI通用人工智能定义像人一样什么都能学、什么都能干的全能AI目前尚未实现详细解释AGI是AI研究的终极目标指能够像人类一样在各种任务中表现出智能的系统。与当前的窄AINarrow AI不同AGI能够跨领域迁移学习学会开车后能更快学会开船自主设定目标和规划理解抽象概念并进行推理具备常识和创造力示例窄AIAlphaGo只能下围棋不能下象棋 AGI理想学会围棋后能自己推导出象棋规则并下棋当前状态GPT-4、Claude等大模型展现出AGI的雏形但仍缺乏真正的自主性和跨领域泛化能力。ASI超级人工智能定义智力全面超越全人类总和的AI属于科幻范畴详细解释ASI是超越AGI的下一个阶段其智力水平远超人类最聪明个体的总和。特征包括解决人类无法解决的复杂问题如统一量子力学和相对论在所有认知任务上碾压人类可能具备自我改进能力递归自我优化风险与讨论ASI可能带来存在性风险是AI安全研究的核心议题。AIGCAI Generated Content定义用AI自动生成文字、图片、音频、视频等内容详细解释AIGC是内容生产方式的革命从PGC专业生产、UGC用户生产进化到AIGCAI生产。应用示例# 文字生成 - 使用OpenAI APIfromopenaiimportOpenAI clientOpenAI()responseclient.chat.completions.create(modelgpt-4,messages[{role:user,content:写一首关于春天的诗}])print(response.choices[0].message.content)# 图片生成 - 使用DALL-Eimageclient.images.generate(modeldall-e-3,prompt一只在樱花树下读书的猫,size1024x1024)print(image.data[0].url)代表工具文字ChatGPT、Claude、文心一言图片Midjourney、Stable Diffusion、DALL-E视频Sora、Runway、Pika音频ElevenLabs、Azure TTSVibe Coding氛围编程定义用自然语言描述功能AI生成代码详细解释Vibe Coding是Andrej Karpathy在2025年提出的新概念指开发者不再逐行编写代码而是通过自然语言描述意图让AI完成编码工作。特点开发者角色从码农转变为产品经理架构师更关注要做什么而非怎么做降低编程门槛让非专业人士也能开发应用示例传统编程写500行代码实现一个登录页面 Vibe Coding告诉AI做一个现代风格的登录页面支持邮箱和手机号登录 有记住密码功能适配移动端二、提示与交互Prompt Engineering提示词工程定义巧妙设计提问方式引导AI给出更好回答详细解释提示词工程是与大模型交互的核心技能通过精心设计的提示词可以显著提升AI输出的质量和准确性。核心技巧角色设定给AI一个明确的身份任务明确清楚说明要做什么提供示例Few-shot learning分步引导Chain of Thought输出格式指定返回格式示例# ❌ 糟糕的提示词prompt写一篇文章# ✅ 优秀的提示词prompt 你是一位资深的科技记者擅长用通俗易懂的语言解释复杂技术。 任务写一篇关于大语言模型原理的科普文章 要求 1. 目标读者非技术背景的普通大众 2. 字数800-1000字 3. 风格轻松幽默多用比喻 4. 结构 - 开头用一个生活中的例子引入 - 中间解释核心原理预测下一个字 - 结尾展望未来应用 请用Markdown格式输出。 Context Engineering上下文工程定义设计和管理喂给AI的上下文内容详细解释上下文工程比提示词工程更进一步关注如何组织、筛选和管理输入给AI的所有信息包括对话历史、知识库内容、系统指令等。核心要素系统提示System Prompt设定AI的行为准则对话历史维护多轮对话的上下文知识注入通过RAG等方式注入相关知识上下文窗口管理在有限token内最大化有效信息示例fromopenaiimportOpenAI clientOpenAI()system_prompt 你是公司的客服AI助手名叫小智。 【公司信息】 - 公司名称智云科技 - 主营业务云计算服务 - 客服电话400-123-4567 【回答规则】 1. 语气友好专业 2. 不确定的问题转人工 3. 涉及退款需询问订单号 messages[{role:system,content:system_prompt},{role:user,content:我想退款},{role:assistant,content:好的请问您的订单号是多少},{role:user,content:是ORD123456}]responseclient.chat.completions.create(modelgpt-4,messagesmessages)Harness Engineering驾驭工程定义标准化框架管理AI的输入输出和错误处理详细解释Harness Engineering是构建可靠AI应用的关键指通过标准化框架来约束和管理AI系统的行为确保输出可控、错误可处理、行为可预测。核心组件输入验证过滤有害输入格式化用户请求输出约束强制AI按指定格式输出错误处理捕获异常优雅降级监控日志记录AI行为便于调试HITL人在回路定义AI处理常规任务没把握的事转交人工详细解释Human-in-the-Loop是一种AI与人类协作的模式AI负责处理大部分确定性任务在遇到不确定或高风险情况时主动请求人工介入。应用场景内容审核AI自动审核敏感内容人工复核客服系统AI处理常见问题复杂问题转人工医疗诊断AI辅助诊断医生最终确认自动驾驶AI常规驾驶极端情况人工接管三、Agent架构与协作AgentAI智能体定义能自主感知环境、规划行动并完成复杂任务的AI系统详细解释Agent是大模型应用的高级形态不同于简单的问答Agent能够感知理解环境和用户需求规划分解复杂任务制定执行计划行动调用工具、执行操作反思评估结果调整策略代表框架LangChain最流行的Agent开发框架AutoGPT自主AI Agent先驱MetaGPT多Agent协作框架CrewAI角色扮演Agent框架Role-playing Agents角色扮演智能体定义给AI赋予特定身份和性格进行协作详细解释Role-playing Agents让多个AI扮演不同角色各司其职协同完成复杂任务。就像一个团队有产品经理、开发、测试等角色。应用场景软件开发团队产品经理、架构师、开发、测试内容创作策划、写作、编辑、审核商业分析数据分析师、策略师、执行者Workflow工作流定义多个任务按预定顺序自动执行详细解释Workflow是预定义的任务执行流程每个步骤明确适合确定性强的场景。与Agent的自主规划不同Workflow更像菜谱按步骤执行。特点流程固定可预测易于调试和监控适合标准化任务Function Calling函数调用定义让AI调用外部工具查天气、操作数据库等详细解释Function Calling让大模型能够动手做事通过调用预定义的函数来获取实时数据或执行操作。工作原理开发者定义可用函数及其参数用户提问时模型判断是否需要调用函数模型生成函数调用指令函数名参数系统执行函数并返回结果模型基于结果生成最终回答Skill技能定义封装多个工具或步骤的复合能力详细解释Skill是比Function更高层次的抽象将多个相关工具组合成一个完整的技能包。例如数据分析技能可能包含数据获取、清洗、分析、可视化等多个步骤。MCPModel Context Protocol定义AI界的USB-C接口统一标准连接各种数据源和工具详细解释MCP是Anthropic在2024年推出的开放协议解决了AI应用与外部数据源、工具连接的标准化问题。就像USB-C统一了充电接口MCP统一了AI与外部世界的连接方式。核心价值标准化一次开发到处使用解耦AI应用与数据源独立演进生态社区贡献各种MCP服务器A2A ProtocolAgent-to-Agent定义不同AI Agent之间互相发现、沟通和协作的协议详细解释A2A协议是Google在2025年提出的标准让不同厂商、不同框架开发的Agent能够互相通信和协作就像不同品牌的手机可以互相打电话一样。A2A vs MCPMCPAI的手和脚 连接数据源和工具数据库、文件、API 解决AI怎么访问外部资源 A2AAI的嘴和耳 Agent之间沟通协作 解决AI之间怎么配合四、推理范式Chain of Thought思维链定义让AI把思考过程一步步写出来详细解释CoT是最基础的推理增强技术通过让模型显式地展示中间推理步骤显著提升复杂问题的解决能力。Zero-shot CoTprompt问题[复杂问题]\n请一步步思考并回答。应用场景数学计算、逻辑推理、复杂决策、多步骤任务Self-ask自问式推理定义AI先向自己提问拆分子问题逐个解决详细解释Self-ask是CoT的进阶版模型主动生成子问题通过问答循环逐步解决复杂问题。工作流程复杂问题 → 生成子问题 → 回答子问题 → 综合答案Plan-and-Execute规划与执行定义先制定完整计划再分步执行详细解释Plan-and-Execute将任务分为两个阶段规划阶段制定完整方案执行阶段按计划逐步实施。ReAct推理行动定义边思考边行动推理和交互交替进行详细解释ReActReasoning Acting结合了推理和行动模型在思考过程中可以调用工具获取信息实现想-做-想-做的循环。ReAct循环Thought思考→ Action行动→ Observation观察→ Thought → ...ToT思维树定义同时生成多条思路分支评估后选最优详细解释Tree of Thoughts将推理过程扩展为树状结构模型可以探索多条可能的解决路径通过评估选择最优方案。应用场景数学证明、游戏策略、创意生成Reflexion迭代优化定义执行任务后反思错误下次做得更好详细解释Reflexion引入自我反思机制模型完成任务后会评估结果发现问题并在下一次尝试中改进。Reflexion循环任务 → 执行 → 反思 → 改进 → 再执行 → ...五、知识增强Embedding嵌入定义把文字、图片等变成数字向量语义相近的内容向量也相近详细解释Embedding是将离散信息文字、图片等转换为连续向量表示的技术。这些向量在高维空间中语义相似的内容距离相近。代码示例fromopenaiimportOpenAIimportnumpyasnp clientOpenAI()defget_embedding(text:str)-list:responseclient.embeddings.create(modeltext-embedding-3-small,inputtext)returnresponse.data[0].embeddingdefcosine_similarity(vec1:list,vec2:list)-float:vec1np.array(vec1)vec2np.array(vec2)returnnp.dot(vec1,vec2)/(np.linalg.norm(vec1)*np.linalg.norm(vec2))catget_embedding(猫)dogget_embedding(狗)print(f猫 vs 狗相似度:{cosine_similarity(cat,dog):.4f})# 约0.85Vector Database向量数据库定义专门存储和查找高维向量的数据库详细解释向量数据库是专门为向量检索设计的数据库能够高效地在海量向量中找到最相似的向量最近邻搜索。主流向量数据库数据库特点Pinecone云托管易用Milvus开源高性能Weaviate支持混合搜索Chroma轻量级Python原生QdrantRust编写高性能RAG检索增强生成定义给AI配上知识库先查资料再回答详细解释RAGRetrieval-Augmented Generation是解决大模型知识局限性的核心技术。模型在回答问题时先从知识库检索相关信息再基于检索内容生成答案。RAG vs Fine-tuningRAG开卷考试查资料答题 优点实时更新知识、无需训练、成本低 缺点依赖检索质量、上下文长度限制 Fine-tuning闭卷学霸知识内化 优点知识内化、响应快、风格定制 缺点训练成本高、知识难更新Fine-tuning微调定义在通用模型基础上用特定领域数据继续训练详细解释Fine-tuning是在预训练模型的基础上使用特定领域的数据进行进一步训练使模型适应特定任务或领域。微调类型全参数微调更新所有模型参数成本高LoRA低秩适应只更新少量参数高效QLoRA量化LoRA进一步降低成本六、模型基础与优化NLP自然语言处理定义让计算机理解、生成和处理人类语言核心任务文本分类判断文本类别情感分析识别文本情感倾向命名实体识别提取人名、地名、机构名等机器翻译跨语言翻译问答系统回答用户问题文本生成生成连贯文本NLP发展历程1950s-1980s: 规则系统 1990s-2000s: 统计方法 2010s: 深度学习RNN、LSTM 2018: Transformer时代BERT、GPTCV计算机视觉定义让计算机能看懂图像和视频核心任务图像分类判断图像类别目标检测识别图像中物体的位置和类别图像分割精确划分图像区域人脸识别识别和验证人脸姿态估计检测人体姿态和动作图像生成生成逼真图像CNN卷积神经网络定义专门处理图像的神经网络核心组件卷积层提取局部特征边缘、纹理等池化层降低维度保留关键信息全连接层进行最终分类经典CNN架构LeNet最早的CNNAlexNet2012年ImageNet冠军VGG深层CNN结构简洁ResNet引入残差连接EfficientNet高效平衡深度、宽度、分辨率RNN循环神经网络定义有记忆的神经网络处理序列数据RNN特点处理序列数据隐藏状态传递历史信息输出依赖当前输入和历史状态RNN问题长序列记忆衰减梯度消失/爆炸问题训练效率低无法并行LSTM长短期记忆定义带笔记本的RNN能记住长距离关键信息详细解释LSTM是RNN的改进版本引入了门机制和记忆单元能够有效保存长距离信息解决了RNN的记忆衰减问题。LSTM三大门遗忘门决定丢弃哪些旧信息输入门决定保存哪些新信息输出门决定输出哪些信息应用文本生成、语音识别、机器翻译、时间序列预测Transformer定义一眼看完整个句子并自动划重点的架构详细解释Transformer是现代大模型的基础架构通过自注意力机制Self-Attention并行处理整个序列彻底改变了NLP领域。核心创新自注意力机制每个词都能关注序列中所有其他词位置编码保留序列位置信息并行计算不像RNN逐个处理Transformer并行处理Transformer优势并行计算训练速度快能捕捉长距离依赖成为GPT、BERT、LLaMA等大模型的基础BERT定义双向语言模型像做完形填空一样理解上下文详细解释BERTBidirectional Encoder Representations from Transformers是Google提出的预训练模型通过双向理解上下文在多项NLP任务上取得突破。BERT特点双向理解同时看左边和右边的上下文预训练微调先大规模预训练再针对任务微调Masked LM随机遮住部分词让模型预测YOLO实时目标检测定义看一眼图片就说出所有物体及其位置详细解释YOLOYou Only Look Once是实时目标检测算法将目标检测作为回归问题解决速度极快适合实时应用。YOLO特点实时检测速度极快YOLOv8可达100 FPS端到端一次前向传播完成检测多目标同时检测多个物体MoE专家混合定义大模型里住很多小专家来什么问题派对应专家详细解释MoEMixture of Experts是一种模型架构将大模型分解为多个专家子网络根据输入动态选择激活哪些专家。MoE优势参数效率总参数大但每次只激活部分参数专业化不同专家处理不同任务可扩展容易增加新专家实际应用GPT-4使用MoE架构Mixtral 8x7B开源MoE模型RLHF人类反馈强化学习定义用人类打分训练AI让它更符合人类偏好详细解释RLHFReinforcement Learning from Human Feedback是训练大模型的关键技术通过人类反馈让模型输出更符合人类期望。RLHF三步骤预训练模型用海量文本训练基础模型训练奖励模型人类对模型输出打分训练一个能预测人类偏好的奖励模型强化学习优化用奖励模型的分数作为奖励用PPO算法优化原模型RLHF替代方案DPODirect Preference Optimization直接优化无需奖励模型RLAIFRL from AI Feedback用AI代替人类反馈核心概念对比速查对比项说明AGI vs ASIAGI 人类水平全能AIASI 超越全人类总和的超级AIRAG vs Fine-tuningRAG 开卷考试查资料答题Fine-tuning 闭卷学霸知识内化Agent vs Workflow vs ReActWorkflow 菜谱固定流程ReAct 大厨边做边调整Agent 私人厨师完全自主Function vs Skill vs MCPFunction 单个工具Skill 工具箱MCP 工具箱接口标准MCP vs A2AMCP AI的手脚连数据源和工具A2A AI的嘴Agent之间沟通协作推理范式对比CoT 一步步想Self-ask 自问自答Plan-and-Execute 先计划再干ReAct 边想边干ToT 多条路试Reflexion 干完反思再改进CNN vs RNN vs TransformerCNN看图图像RNN读序列有记忆Transformer一目十行注意力机制

相关新闻