
本文从AI发展史、大模型训练方式、核心概念等角度深入浅出地解析了大模型背后的原理。同时通过阿里云百炼DashScope平台的4个实战案例帮助读者快速上手调用大模型API。文章强调AI的本质是概率学强化学习是大模型进步的核心动力并指出大模型未来将在代码生成等领域发挥重要作用。本节课有代码实操部分一、课程概览本课分为两大模块原理篇AI 发展史、大模型训练方式、Token / Temperature / Top-P 等核心概念实战篇通过 4 个 Case 上手调用大模型 API基于阿里云百炼 DashScope二、AI 发展历程规则系统专家系统→ 机器学习 → 深度学习/神经网络 → 大模型万亿参数阶段特点样本量参数量规则系统if-then 人工穷举规则无法应对复杂场景——机器学习人工标注机器自己找规律数百~数千较小深度学习仿人脑神经网络处理复杂任务数百万百万级大模型生成式 AI万亿参数TB 级万亿级核心趋势从「人写好规则 → 机器执行」变成「机器从数据中自主学习规律」。三、AI 的两大分类决策式 AI分析式生成式 AI任务做判断Yes/No生成内容写文章、写代码数据小数据、专业数据海量数据价值密度高一个决策直接影响业务相对较低但应用面广举例反欺诈检测、违约预测、缺陷检测ChatGPT、DeepSeek、千问训练相对容易企业内有专业数据需要海量数据和算力 两者不冲突企业场景中往往同时需要。四、大模型怎么训练三步走1 监督学习Supervised Learning—— 从 0 分到 60 分人类标注好答案直接喂给模型本质是「填鸭式教学 / 死记硬背」-优点快速建立基础知识-缺点遇到灵活问题不会变通天花板明显2 强化学习Reinforcement Learning—— 从 60 分到更高-核心方式变了不再是「给答案让 AI 背」而是「让 AI 自己写答案人类给反馈」AI 针对一个任务写 4 个版本A/B/C/D人类通过 RankList排序 告诉它哪个好类比领导让员工干活——领导做选择题比做简答题更轻松还能培养出高智力的员工3 RLHFReinforcement Learning from Human Feedback早期方式人工打分0.5~5 分→ 问题AI 困惑于细微分差-现在方式只用排序不做精确打分ChatGPT 早期雇了大量肯尼亚员工做标注就是干这个-关键价值✅ 过滤有害内容不好的答案排到后面✅ 鼓励创新比当前最好的答案更好的排到前面去✅ 这是大模型每 3 个月迭代进步的根本原因4 AlphaGo 的启示AlphaGo 不是学人类棋谱赢的是自我对弈 3000 万盘赢的它走出了人类从未走过的棋路走到李世石的盲区同样的逻辑强化学习让 AI 突破人类知识上限5 参数量的进化模型代际参数量GPT-11.1 亿GPT-215 亿GPT-31750 亿当前GPT-5.5 / 万亿级上万亿~可能 100 万亿人脑神经元≈ 250 万亿 物理架构上AI 的参数量已经越来越接近人脑。五、核心概念5.1 Token大模型内部不看文字只看 Token数值 ID中文「人工智能」GPT-45 个 token对中文不够优化DeepSeek1 个 token中文做了专门汉化处理不同模型的 Token 编码方式不同LLaMA最早开源约 32,767 个 token千问约 75,000 个 token加了大量中文映射Token 还包含特殊符号起始符、结束符、分隔符 工具https://tiktokenizer.vercel.app/ 可查看不同模型的 token 切分2 Temperature温度控制输出概率分布范围0~2阿里云百炼文档-高温度如 1.0缩小高低概率差距 → 更有创造力、更多样-低温度如 0.1拉大高低概率差距 → 更稳定、更确定 比喻热带国家高温→ 创造力强寒带国家低温→ 保守稳定3 Top-P核采样也是一个阈值参数控制多样性原理把候选 token 按概率从高到低排序累加到 P 值为止P0.9 → 覆盖 90% 的可能性候选多P0.1 → 只覆盖前 10%候选少更确定Top-P 会过滤低概率词Temperature 不过滤只调节概率差距Temperature vs Top-P 怎么选TemperatureTop-P过滤低概率词❌ 不过滤✅ 过滤控制方式调节概率差异设定累积阈值使用建议日常编程更常用需要排除离谱结果时用能否结合✅ 可以先 Top-P 过滤再 Temperature 调节一般建议选一个就行 不需要同时用六、实战4 个 API 调用 Case所有 Case 基于dashscope阿里云百炼 Python SDKCase 1情感分析纯文本大模型输入产品评论文字 输出正向 / 负向关键要素-system角色扮演舆情分析师约束输出格式-user角色提问传入 review 文本调用dashscope.Generation.call()即可代码结构messages[{role:system,content:你是一名舆情分析师帮我判断产品口碑的正负向回复请用一个词语正向 或者 负向},{role:user,content:review}]responsedashscope.Generation.call(modelqwen-turbo-latest,messagesmessages,result_formatmessage,)Case 2天气查询Function Call / 函数调用核心流程LLM 调用两次用户问「深圳天气怎么样」 ↓ 第1次 LLM → 理解意图 → 输出要调用的工具 → function_call: {name: get_current_weather, arguments: {location: 深圳}} ↓ 代码截获 → 内部运行工具 → 拿到结果如37°C晴天 ↓ 第2次 LLM → 将工具返回的结果整理成自然语言 → 告诉用户关键LLM 只在需要时才会调用工具不是每次都调。Case 3表格提取视觉大模型 / 多模态换用视觉大模型qwen-vl-plus/qwen3.6-plus输入图片 URL 文本指令输出JSON 格式的表格内容content[{image:https://.../table.jpg},{text:这是一个表格图片帮我提取里面的内容输出JSON格式}]大模型识图 vs OCR 的区别OCR1:1 还原文字大模型在理解基础上输出可能微调措辞但不影响准确性Case 4运维事件处置多工具排查场景收到「数据库连接数超阈值」告警 → 需要排查流程注册排查工具getComputerStatus查连接数/CPU/内存系统角色 → 运维分析师用户角色 → 提告警问题第1次 LLM → 决定调工具工具返回连接数 48CPU 73%内存 81%第2次 LLM → 分析原因 给建议七、对话中的四种角色角色说明system角色扮演定义 AI 的行为边界user用户提问assistantAI 的回复tool第三方工具返回的结果八、大模型的产品能力外挂大模型本身只是一个推理引擎需要外挂实现更多能力能力实现方式 联网搜索Web Search 工具Kimi、千问自带火山方舟 GLM 不提供 读文件PDF/Word/Excel 解析器 OCR 短期记忆上下文窗口≈200K tokens存最近几轮对话 长期记忆写入文件系统agent.md/profile.md沉淀用户偏好 多模态原生支持图像/音频≠ 用工具读文件两者是不同的实现路径。九、工具推荐 生态AI 编程工具工具特点CursorAI-native IDECtrlI 打开对话框需要会员Trae (TIE)免费版可用推荐入门Claude Code终端 CLI 工具Qoder / OpenCode阿里的开源方案Agent 框架框架来源DeepAgentsLangChain/LangGraph 出品NanoBot香港大学开源模型选择建议场景推荐开发/生产力复杂任务Claude Opus 4.8应用端/批量调用DeepSeek V4便宜性价比极高中文优化千问系列多模态千问 VL Plus / Gemini DeepSeek 比 Claude Opus 便宜 10 倍微软等企业已因成本取消 Opus 订阅。十、课程核心观点AI 本质是概率学写代码、写文字都是概率事件我们通过参数控制概率分布强化学习是 AI 进步的核心动力不是死记硬背是让 AI 自我思考 人类排序反馈大模型 推理引擎真正的产品能力靠外挂工具Function Call / Tool / MCP / Skill以后写代码的是 AI人的角色是发号指令、做判断、定方向你的知识面决定你的上限越懂大模型越能有效地指导 AI 干活代码不要背语法理解逻辑流程即可有现成代码后让 AI 照猫画虎改写API Key 不要明文写进代码存到环境变量中十二、相关资源阿里云百炼控制台https://bailian.console.aliyun.com/Token 可视化https://tiktokenizer.vercel.app/模型下载开源https://modelscope.cn/课程代码网盘含 4 个 Case 的 .py 和 .ipynbAPI Key 配置环境变量DASHSCOPE_API_KEYsk-xxxx最后如果说程序员已经是高薪职业那么干AI的程序员就是高薪中的高薪。现在的市场已经用数据给程序员指明了方向学AI大模型就是冲刺高薪的最优解看着身边越来越多的同行转型大模型、拿到高薪offer很多人心里都动了心但真正的难题来了零基础小白不知道从哪入门有基础的程序员找不到系统学习路径实战项目练手无门面试不知道考什么别慌今天就给大家整理了一份【2026年最新版】AI大模型免费学习资源包覆盖从入门到实战、从理论到面试、从基础到进阶的全流程所有资料均已整理归档无冗余、无套路免费分享给每一位想抓住AI风口的程序员和小白扫码免费领取全部内容1、大模型系统化学习路线2、大模型学习书籍文档3、AI大模型最新行业报告4、大模型项目实战配套源码5、大模型大厂面试真题四阶段精细化学习规划附时间节点可直接照做结合上述资源给大家整理了一份可直接落地的四阶段学习规划总时长约2个月小白可循序渐进程序员可根据自身基础调整节奏高效掌握大模型核心能力快速实现从“入门”到“能落地、能面试”的跨越。第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器 损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…扫码免费领取全部内容6、这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】