腾讯Teg大模型暑期算法一二三面面经-尧图网站设计

本文总结了大模型面试高频考点涵盖Transformer架构、LoRA原理、SFT后训练、DPO与GRPO损失函数、Agent框架设计、高质量训练集构造、量化技术、ZeRO优化策略等关键技术点。同时深入探讨了显存优化方案、算法题合并区间、KV Cache计算及MoE模型推理特性。内容结合实习项目经验提供问题解决思路与实验设计要点助力求职者系统复习提升面试竞争力。一面1.自我介绍2.介绍主流 Transformer-based 模型架构3.讲一下 LoRA 原理4.为什么 SFT 之后还要进行后训练5.讲一下 DPO 的损失函数怎么计算6.讲一下 GRPO 原理7.使用 GRPO 时构造数据要符合什么要求8.熟悉哪些 Agent 框架9.如果要设计一个好的 Agent除了大模型还会设计哪些部分10.怎么构造高质量训练集11.Dense 模型和 MoE 模型有什么区别12.量化发挥作用的原理是什么13.讲一下 ZeRO-1、ZeRO-2、ZeRO-314.如果显存有限会选择哪个方案训练15.算法题LeetCode 56 合并区间二面1.自我介绍2.详细介绍实习工作3.重点讲清楚自己解决的是什么问题4.讲清楚背景、自己负责的问题、以及一步步解决的过程5.讲一下通过这段工作总结了哪些经验6.介绍最终各个指标7.SFT 的 LoRA 和 DPO 的 LoRA 有什么区别8.详细展开实习工作9.设计了哪些实验10.最终选择了哪个方案为什么11.最终交付是怎么交付的12.聊了一下 RAG13.反问组里大概工作方向三面1.自我介绍2.讲一下实习工作主要解决的是什么问题3.训练数据怎么来的最终几个评测集怎么用训练了多少个 Epoch4.为什么在做完一个项目后离职5.算法题和开放题计算 KV Cache 显存需要哪些前置数据KV Cache 显存怎么计算6.3B Dense 模型和 32B-a3B MoE 模型哪个推理延迟更低、推理速度更快7.MoE 模型第一次推理激活专家 1、3、5第二次激活专家 2、4、6专家切换的成本主要是什么8.大模型服务 API 定价问题不同服务方案下1K Token、32K 上下文、128K 上下文的输入输出定价如何设计9.算法题会议室预定问题判断某个时刻点是否可以预定假如你从2026年开始学大模型按这个步骤走准能稳步进阶。接下来告诉你一条最快的邪修路线3个月即可成为模型大师薪资直接起飞。阶段1:大模型基础阶段2:RAG应用开发工程阶段3:大模型Agent应用架构阶段4:大模型微调与私有化部署配套文档资源全套AI 大模型学习资料朋友们如果需要可以微信扫描下方二维码免费领取【保证100%免费】配套文档资源全套AI 大模型学习资料朋友们如果需要可以微信扫描下方二维码免费领取【保证100%免费】

腾讯Teg大模型暑期算法一二三面面经

相关新闻

TVA 颠覆常规 AI 视觉的底层逻辑（17）

从裸机到RTOS再到AMP：一个嵌入式老鸟的RK3568异构系统选型心路历程

Windows10下Langchain-Chatchat保姆级部署：手把手搞定ChatGLM2-6B与M3E-Base模型（含CUDA 11.7+Pytorch版本匹配避坑）

保姆级教程：用公司那台京瓷打印机，把文件直接扫描到你自己Win10电脑的指定文件夹

3大策略掌握Avidemux视频编辑：从源码编译到专业级处理

Mentor DFT实战：手把手教你搞定Wrapped Core的Scan Insertion（附完整TCL脚本）

RK3576+Hailo-8异构计算实战：突破端侧高帧率AI视觉实时分析瓶颈

Spring Boot嵌入式Web容器启动时序深度解析：从源码到实战

SigmaStudio子程序实战：用模块化设计搞定ADAU1701复杂音效框架（附工程文件）

Claude Code 在 AI Agent 项目上线阶段的 4 类运维问题与自动化迭代方案

m4s-converter：开源跨平台工具实现B站缓存视频无缝转换

保姆级教程：在Ubuntu 20.04上用kitti2bag工具把KITTI Raw Data转成ROS Bag（避坑实录）

2026年十大最佳地区搜索排名优化工具：权威榜单赋能企业高效增长

DDR3内存Row Hammer问题解析与防护方案

为ItsyBitsy ESP32设计3D打印外壳：从原型到产品的完整实践

别再手动点关了！用PowerShell永久关闭Windows Defender的保姆级教程（含Server 2016/2019）

别再只换芯片了！BP2832A替换CL1502，你的电感参数算对了吗？

全平台智能资源下载工具：res-downloader 完整使用教程