
距离最后一场大模型相关面试结束已有一段时间趁着记忆还清晰整理了这份完整复盘不管是刚入门大模型的小白还是想转行切入大模型领域的程序员都能从中找到有用的经验建议收藏慢慢看我是从4月份正式开始自学大模型的现在回想起来刚开始连LLM大语言模型是什么都一知半解完全是从零起步。最开始我就明确了定位——先从大模型应用入手不贪多、不冒进毕竟对于转行选手来说先站稳脚跟比盲目追求“高大上”更重要。我的学习节奏很规律每天下班抽出2-3小时深耕从4月到11月这大半年的时间里核心就是打基础、总结大模型相关八股文、啃专业书籍同时也没落下编程能力保持每天刷2道Leetcode的习惯兼顾工程能力和基础算法素养。这里也跟大家坦白一句期间只要遇到节假日我基本都会请假出去旅游算下来大概有2个月的时间在放松但只要是学习的时间我都全程专注没有摸鱼划水高效学习比熬时间更重要。到了10月份我觉得基础差不多扎实了就开始投递简历试水想看看市场对大模型应用岗的需求也检验一下自己的学习成果。但没想到最开始的几场面试明明投递的是应用岗面试官却总会时不时问一些算法相关的问题搞得我十分被动回答起来也很吃力。也是这次试水让我意识到哪怕是应用岗一点算法基础都没有也不行于是我立刻调整学习计划在自己的项目中补充了推理优化、模型加速、微调实战等相关内容让简历和能力更有竞争力。好在之前打基础的时候我也系统学过相关的理论知识我的应对思路是把算法核心流程过一遍不追求过度深入但要做到“知其然知其所以然”。就这样到了2月初我的项目已经完整包含了算法相关的实践内容再去面试时不管是面试技巧还是技术储备都成熟了很多应对面试官的提问也更加从容。下面就给大家统一公布一下我拿到的所有offer按投递和面试的时间先后排序每一家都给大家说说真实感受方便大家避坑、参考\1. 京东算法岗位这是我比较意外的一个offer我投递的其实是应用岗但面试官很认可我的学习能力和潜力并没有过多为难我。面试过程中问的大多是工程相关的问题算法方面也只是简单询问了我掌握的范围和程度。要知道当时我还没完全按照补充计划吃透算法知识面试技巧也不算完善但面试官真的很nice一个纯算法岗位给的薪资也很有诚意还愿意给我时间去学习、适应甚至主动说可以帮我保留offer一段时间。虽然最后因为个人规划没有去但真的特别感谢这位面试官的认可和包容。\2. 网龙算法工程全能岗这家公司相对来说规模小一些大模型相关岗位的划分也没有那么细致不像大公司那样算法和应用分得清清楚楚。面试官明确跟我说入职后可以根据自己的兴趣和擅长选择侧重算法还是工程自由度比较高适合想全面发展、不想被岗位边界限制的朋友。\3. SAP偏销售向的AI技术岗这个岗位比较特殊面试全程更像是聊天几乎没有问太多硬核的技术问题也不需要做编程题。整体感受下来这个岗位更看重个人背景、沟通能力和适配度运气成分也占了一部分适合擅长沟通、对AI销售类岗位感兴趣的朋友纯技术党慎选。\4. 夸克千问纯工程岗这家是我当时认真考虑过要接offer的公司目前其相关部门已经合并到千问C端事业群公司也在大力投入大模型相关业务发展潜力看起来不错。因为我的学习路线里包含了一些Infra基础设施和算法相关的内容所以面试时我回答问题偶尔会不自觉地把思路引到Infra和算法上但每次都会被面试官拉回来提醒我“从工程角度回答”。这里也给面这类岗位的朋友提个醒大公司的岗位划分真的很细致纯工程岗就专注把工程能力练到极致就好不需要额外花太多时间深耕Infra或算法避免画蛇添足。不过最后我还是放弃了这个offer最不满意的就是薪资——工作强度大到离谱身边很多人都跟我说这里经常无休、单休甚至有人加班到凌晨1点而薪资涨幅还不到20%真的有种不被尊重的感觉再加上纯工程岗的发展空间不符合我的长期规划就彻底打消了去的念头。\5. 平安证券常规工程岗面试流程比较常规中间有一轮线上测评面试内容中规中矩难度不算高没有太多偏题、怪题。这家公司的工作强度不大比较适合追求稳定的朋友但对应的薪资也很常规几乎没有涨幅对于想通过转行涨薪的朋友来说可能不太合适。\6. 华林证券技术岗4轮技术面这家的面试难度算是比较高的一共4轮技术面题目考察得很细致对技术能力的要求不低。和平安证券相比这里的工作强度要大很多每天大概要工作12小时但好在是双休而且薪资对标互联网待遇还不错。不过当时我已经拿到了比较满意的offer求职意向已经不强了所以面试时很坦诚地跟面试官说了自己的预期薪资要求也提得比较高大概有40%的涨幅但没想到面试官和HR很认可我还是帮我争取到了offer真的很感谢他们的认可。最后跟大家提一下之前说过的“被世界500强秒拒”的经历——那家公司是联想我连一面都没通过。不过说实话联想的面试官真的很厉害知识面极广什么都懂我回答问题时的小漏洞、不扎实的地方都被他一眼看穿也让我意识到自己还有很多不足算是一次很有价值的经历。重点来了转行大模型的核心感受和心得小白/程序员必看结合我大半年的自学经历和多场面试经验整理了2个最核心的心得尤其是对于想转行大模型的朋友能帮你们少走很多弯路\1. 找准定位比盲目学习更重要重中之重我发现很多想转行大模型的朋友最大的困惑就是不知道自己该走应用路线还是算法路线。网上很多大模型面经都没说清楚对应的是哪个岗位有的面经里问DPO、问Agent有的又问Attention、问微调导致大家分不清重点盲目跟风学习最后什么都学不精面试时也抓不住核心。这里给大家明确区分一下也给不同背景的朋友提个建议- 普通开发前端、后端、测试等优先走大模型应用路线。应用岗核心考察工程能力这正是你们的优势所在而且大部分应用岗不需要深厚的深度学习基础门槛相对较低。如果直接转算法岗需要先系统学习深度学习、模型训练等内容和你们之前的工作差异很大门槛高、周期长很容易半途而废。我的思路就是先把应用学好目前大模型应用开发的岗位需求很充足先有一份保底的工作之后再慢慢深入学习算法这样既稳妥面试算法岗时你的应用实战能力也会成为加分项。- 算法出身传统算法从业者可以优先考虑大模型Infra、算法路线发挥自己的专业优势。- 校招生不着急找工作的可以尝试“双修”既学应用也学算法拓宽自己的就业面但要注意不要贪多求全避免两边都学不深入。当然现在行业趋势是“应用算法”双能力都需要但我的建议是以一条路线为主深入深耕同时补充一些基础的算法知识把核心流程过一遍掌握基础理论这样面试时即使被问到算法问题也能从容应对——这正是我自己的学习路线亲测有效。\2. 项目不用求“高大上”自己动手就能做循序渐进就好很多朋友会纠结“自己没有真实项目经验简历上没东西可写”其实完全不用慌大模型相关的项目自己动手就能搞定。我之前在笔记里也分享过自己做项目的思路大家可以参考哪怕是一个很简单的小项目也不要嫌弃它“浅”可以一点点迭代、补充功能慢慢丰富自己的项目经历。我最近也在做一个新的大模型项目做完之后会更新到简历上到时候也会再跟大家分享项目细节和面试试水的结果感兴趣的朋友可以关注一下跟着我一起实操、避坑。最后想说转行大模型没有想象中那么难但也没有那么容易关键是找对路线、坚持下去。希望我的这份复盘能给正在入门、准备转行的小白和程序员们一点启发祝大家都能顺利拿到自己满意的offer在大模型领域站稳脚跟最后对于正在迷茫择业、想转行提升或是刚入门的程序员、编程小白来说有一个问题几乎人人都在问未来10年什么领域的职业发展潜力最大答案只有一个人工智能尤其是大模型方向当下人工智能行业正处于爆发式增长期其中大模型相关岗位更是供不应求薪资待遇直接拉满——字节跳动作为AI领域的头部玩家给硕士毕业的优质AI人才含大模型相关方向开出的月基础工资高达5万—6万元即便是非“人才计划”的普通应聘者月基础工资也能稳定在4万元左右。再看阿里、腾讯两大互联网大厂非“人才计划”的AI相关岗位应聘者月基础工资也约有3万元远超其他行业同资历岗位的薪资水平对于程序员、小白来说无疑是绝佳的转型和提升赛道。对于想入局大模型、抢占未来10年行业红利的程序员和小白来说现在正是最好的学习时机行业缺口大、大厂需求旺、薪资天花板高只要找准学习方向稳步提升技能就能轻松摆脱“低薪困境”抓住AI时代的职业机遇。如果你还不知道从何开始我自己整理一套全网最全最细的大模型零基础教程我也是一路自学走过来的很清楚小白前期学习的痛楚你要是没有方向还没有好的资源根本学不到东西下面是我整理的大模型学习资源希望能帮到你。扫码免费领取全部内容最后1、大模型学习路线2、从0到进阶大模型学习视频教程从入门到进阶这里都有跟着老师学习事半功倍。3、 入门必看大模型学习书籍文档.pdf书面上的技术书籍确实太多了这些是我精选出来的还有很多不在图里4、AI大模型最新行业报告2026最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。5、面试试题/经验【大厂 AI 岗位面经分享107 道】【AI 大模型面试真题102 道】【LLMs 面试真题97 道】6、大模型项目实战配套源码适用人群四阶段学习规划共90天可落地执行第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器 损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…扫码免费领取全部内容3、这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】