
本文总结了大模型面试高频考点涵盖Transformer架构、LoRA原理、SFT后训练、DPO与GRPO损失函数、Agent框架设计、高质量训练集构造、量化技术、ZeRO优化策略等关键技术点。同时深入探讨了显存优化方案、算法题合并区间、KV Cache计算及MoE模型推理特性。内容结合实习项目经验提供问题解决思路与实验设计要点助力求职者系统复习提升面试竞争力。一面1.自我介绍2.介绍主流 Transformer-based 模型架构3.讲一下 LoRA 原理4.为什么 SFT 之后还要进行后训练5.讲一下 DPO 的损失函数怎么计算6.讲一下 GRPO 原理7.使用 GRPO 时构造数据要符合什么要求8.熟悉哪些 Agent 框架9.如果要设计一个好的 Agent除了大模型还会设计哪些部分10.怎么构造高质量训练集11.Dense 模型和 MoE 模型有什么区别12.量化发挥作用的原理是什么13.讲一下 ZeRO-1、ZeRO-2、ZeRO-314.如果显存有限会选择哪个方案训练15.算法题LeetCode 56 合并区间二面1.自我介绍2.详细介绍实习工作3.重点讲清楚自己解决的是什么问题4.讲清楚背景、自己负责的问题、以及一步步解决的过程5.讲一下通过这段工作总结了哪些经验6.介绍最终各个指标7.SFT 的 LoRA 和 DPO 的 LoRA 有什么区别8.详细展开实习工作9.设计了哪些实验10.最终选择了哪个方案为什么11.最终交付是怎么交付的12.聊了一下 RAG13.反问组里大概工作方向三面1.自我介绍2.讲一下实习工作主要解决的是什么问题3.训练数据怎么来的最终几个评测集怎么用训练了多少个 Epoch4.为什么在做完一个项目后离职5.算法题和开放题计算 KV Cache 显存需要哪些前置数据KV Cache 显存怎么计算6.3B Dense 模型和 32B-a3B MoE 模型哪个推理延迟更低、推理速度更快7.MoE 模型第一次推理激活专家 1、3、5第二次激活专家 2、4、6专家切换的成本主要是什么8.大模型服务 API 定价问题不同服务方案下1K Token、32K 上下文、128K 上下文的输入输出定价如何设计9.算法题会议室预定问题判断某个时刻点是否可以预定假如你从2026年开始学大模型按这个步骤走准能稳步进阶。接下来告诉你一条最快的邪修路线3个月即可成为模型大师薪资直接起飞。阶段1:大模型基础阶段2:RAG应用开发工程阶段3:大模型Agent应用架构阶段4:大模型微调与私有化部署配套文档资源全套AI 大模型 学习资料朋友们如果需要可以微信扫描下方二维码免费领取【保证100%免费】配套文档资源全套AI 大模型 学习资料朋友们如果需要可以微信扫描下方二维码免费领取【保证100%免费】