收藏!毕业三年自学大模型到就业,我仅用9个月的经验分享

发布时间:2026/6/9 23:55:07

收藏!毕业三年自学大模型到就业,我仅用9个月的经验分享 作者分享自己从专科毕业到自学大模型成功就业的经历强调积极寻找学习资源、加入交流群的重要性并给出AI大模型学习的建议包括不要只看书、找系统教程、避免钻牛角尖、多交流、学以致用、保持高效学习状态、看书写笔记、积累项目经验、寻求指导等。同时作者也指出AI行业对技术能力要求高学历专业只是加分项。最后作者以自身经历告诫年轻人要趁年轻多学习转行AI大模型最好有人指导并强调持续学习的重要性。毕业三年自学大模型到就业我用了9个月。先给大家分享一下我转行的经历17年毕业垃圾专科通信专业。当初选择这个专业是因为有一个校企合作承诺学生毕业之后给学生安排就业在学校里面混了三年之后学校也是履行了当初安排就业的承诺给我“发配”到了上海在上海工作两年每天的工作基本就是坐着地铁跑整个上海的机房给发生故障的服务器换硬盘完全没有技术性可言在上海混了两年几乎什么都没有学到用我朋友的话说这样的工作“栓条狗都可以”。当时想的是如果一直这样下去这辈子就废掉了 在网上了解之后都说互联网行业有发展前景加上自己对计算机这方面也是比较感兴趣的于是决定转行学习编程做程序员。选择了市场需求最高大模型开始学习。最开始的时候是在淘宝上面花了几块钱买了一套培训的教程利用工作之余每天下班回家看前面学习语法的时候感觉还挺简单的可是学着学着就会遇到很多问题自己根本就没办法解决去百度查的答案自己还看不懂加上感觉学习没有方向学的这些内容能做什么都不清楚一度让我产生了放弃的想法。后面的时候我就把我遇到的这些问题去知乎上面提问想知道大家在学习大模型的时候是不是也都这样还是说我不太适合学习编程。结果发现大部分的人都遇到了和我一样的问题。他们说应该多去加一些交流群在群里跟大家一起交流学习探讨一些问题然后我就加了很多的大模型交流群。不过加了很多都是一些培训机构的推广群那些客服就整天无脑的推销让我买课但是有个群是非常活跃的里面都是一些探讨学习的问题和交流找工作的经验的。这个群每天都在讨论大模型问题好多已经工作的大佬每天不忙的时候在群里解答问题。也有很多正在学习的人每天交流学习心得。气氛是非常好的大家可以在群里一起监督学习。我能坚持学完成功转行都离不开这个群。自己摸索真的太难了遇到问题有大佬指点自己琢磨可能要琢磨几个小时大佬几分钟就给我讲清楚了也是让我少走了很多弯路。在我的老家吉林工资不高只有5.5k我是比较满意的。因为东北这边互联网行业发展不好薪资本来就不高实习工作拿到这些也还是可以的。而且作为一个刚自学完对于找工作一脸懵逼的状态能省去网上海投简历直接进去公司面试我觉得已经非常好了。这份工作大概做了两个月之后之后感觉还是应该趁着年轻去大城市发展一下多学一些前沿的技术挑战一些高薪打算去北京发展一下离家也不算很远。来到北京之后发现北京做互联网的薪资和老家那边真是天翻地覆北京这边的工作基本都是10k起步的。在北京找到的第一份工作也是现在正在做的工作是做 AI 大模型应用开发的小公司开始的时候是 13k *13。经过一年的技术沉淀也积累的一定的工作经验外加在工作期间看了很多技术提升的书籍打算换一家大点公司。都说 AI 从业者的高薪是跳出来的我也要跳出去看看。现在经常会在网上看到说 AI 大模型行业专科找不到工作不是科班、不是算法专业找不到工作之类的话。作为已经成功转行大模型的我现在明白了一个道理那些顺利转行成功的不会去网上说自己转行有多么容易但是那些转行不成功的就会到网上宣传行业饱和了专科找不到工作。现在学的人确实越来越多了但是学的好达到公司招聘标准的却没有几个。这是一个技术行业最终能不能找到工作找到什么样的工作主要还是看技术学的怎么样学历专业对口只是一个人的加分项如果不是进大公司只是选择一些中小公司的话公司主要看重的还是这个人的实际业务能力。然后分享一下 AI 大模型学习方法①切记不要开始就只看书这样比较容易放弃。AI 相关书籍理论性极强、内容抽象晦涩对于零基础的小白非常不友好纯看书学习很容易越学越迷茫甚至直接放弃。②找一套完整系统的教程学习的内容不能过于陈旧有人学习还在看多年前的视频死磕老旧机器学习框架、过时深度学习版本、淘汰的传统 AI 算法这些早已不符合企业实际用人需求无法满足大模型相关岗位的招聘标准面试时很难跟上面试官的考察方向最终难以找到对口工作。要找一套最新且系统的大模型学习教程去学习。③学习的过程中不要 “钻牛角尖”遇到复杂理论、代码 bug 不要死磕浪费时间不说还会产生强烈的学习挫败感。遇到这种情况可以适当休息或者跳过当前知识点先学后续内容再回头回顾或者找人请教问题很快就能解决。④沟通交流拒绝 “闭门造车”多看 AI 技术社区、行业博主的学习经历与经验多加一些大模型交流群互相分享学习心得最终找到最适合自己的学习方式。遇到问题可以去问搜索引擎或者在技术交流群提问不要怕没人回答自己梳理问题的过程中往往就能找到答案。⑤学以致用多练多敲学 AI 大模型就像是学编程一样不是看懂理论、跑通示例代码就算学会了。一个模型知识点、算法原理有多种应用场景要把不同场景的实践都做通这个知识点才算是真正掌握不然就会陷入 AI 学习最常见的问题能看懂模型原理自己动手做项目就无从下手。⑥保持高效的学习状态短时间内看不到学习效果很容易产生自我怀疑进而失去学习动力。无论是看视频还是看书要学会调节自己累了就休息千万不要采用高强度透支式的学习方式。⑦看书巩固学习学过一段时间后回头精读 AI 大模型、深度学习经典书籍系统梳理知识点巩固效果会非常好。⑧记笔记 常复习“温故而知新”记笔记不是单纯抄录重点对于每个 AI 知识点一定要有自己的思考与理解再用自己的话把理解和总结整理出来才能真正内化知识。⑨积累项目经验可以去 AI 开源平台找实战项目比如Hugging Face、魔搭 ModelScope、GitHub这类平台。边做项目边查资料千万别照着源码照搬一定要独立思考实现锻炼自己的模型应用能力、代码逻辑思维和工程落地能力。⑩有人带高效学习少走弯路如果只靠自己摸索学习效率极低没有明确的学习方向不知道所学知识能落地到什么业务场景。遇到模型训练、部署问题也得不到及时解答网上搜索的答案杂乱不精准白白浪费时间。而且靠自学视频成功入职 AI 大模型岗位的难度极大不是每个人都能无师自通。真正的 AI 工程化经验是和行业大佬交流学到的实战技巧而非看视频学死板的理论知识点。我们学习大模型技术不是为了应付考试而是用 AI 技术落地实际产品、解决业务问题。最后总结我的学习转行经历送给大家几句话1、趁着年轻一定要多学习千万不要混日子不然等你上了年纪想转行进入 AI 行业、改变自己的时候就没有足够的精力去钻研新技术了。2、转行学习 AI 大模型最好有人指导自己闭门造车根本行不通。现在入行 AI 的人越来越多半吊子水平的从业者比比皆是企业的招人标准水涨船高经济允许的情况下花钱找专业老师指导非常有必要。3、对于专科学历的同学虽然学历也能找到 AI 相关基础岗位但后续职业晋升、大厂面试会有明显限制就算顺利入职也建议尽早提升学历。4、进入 AI 互联网行业后更需要持续学习AI 技术迭代速度远超传统 IT 行业不能 35 岁还在做 25 岁的基础 AI 执行工作这样的话公司不淘汰你淘汰谁呢AI 大模型学习路线一AI 大模型前置核心基础Python 数学 计算机基础编程基础Python 开发环境安装配置Anaconda、PyTorch/TensorFlow 环境搭建基础 Python 脚本编写Python核心语法变量、数据类型、条件 / 循环逻辑、函数、模块与包、文件 IOPython数据处理库NumPy 数值计算、Pandas 数据清洗、Matplotlib/Seaborn 数据可视化数学基础线性代数矩阵运算、向量、特征值 / 特征向量、张量基础概率论与数理统计概率分布、期望方差、极大似然估计、贝叶斯定理高等数学基础导数、梯度、偏微分、极值优化适配模型训练计算机基础Linux 基础命令服务器操作、文件管理、环境部署计算机网络基础HTTP/HTTPS、API 接口、网络通信原理数据结构与算法列表、哈希表、树结构、基础排序算法二机器学习核心基础传统机器学习算法监督学习线性回归、逻辑回归、决策树、随机森林、SVM、K 近邻无监督学习K-Means 聚类、PCA 降维、关联规则半监督 / 强化学习基础概念机器学习工程实践数据集处理数据采集、清洗、归一化、特征工程模型评估准确率、精确率、召回率、F1 值、ROC 曲线交叉验证、过拟合与欠拟合解决、正则化应用三深度学习核心原理深度学习基础框架PyTorch 实战主流首选张量操作、自动求导、模型搭建、训练流程TensorFlow/Keras 基础计算图、模型封装、训练推理深度学习基础组件全连接层、激活函数、损失函数、优化器SGD、Adam经典深度学习网络卷积神经网络 CNN图像分类、目标检测基础、经典网络ResNet、VGG循环神经网络 RNN/LSTM/GRU序列数据处理、NLP 基础注意力机制基础Transformer 前身核心原理四大模型底层原理与基础架构Transformer 核心架构Encoder-Decoder 结构、自注意力机制、多头注意力、位置编码GPT 系列Decoder-only、BERT 系列Encoder-only架构差异大模型基础术语参数量、上下文窗口、预训练、微调、Prompt大模型预训练基础预训练数据构建、文本预处理分词器 Tokenizer无监督预训练任务因果语言模型、掩码语言模型大模型训练基础流程分布式训练、混合精度训练五大模型微调、部署与推理优化大模型微调技术全量微调、参数高效微调 PEFTLoRA、QLoRA、Prefix Tuning指令微调 SFT、偏好对齐 RLHF/DPO微调数据集构建、微调框架实战Transformers、PEFT 库大模型推理与部署本地部署CPU/GPU 部署、量化推理INT4/INT8服务化部署FastAPI 封装 API、Docker 容器化、云端部署推理优化模型剪枝、蒸馏、批量推理、加速框架vLLM、TensorRT开源大模型实战主流开源大模型应用Llama 2、Qwen、ChatGLM、Baichuan模型调用、对话系统搭建、多轮对话逻辑实现六大模型应用开发与工程实践RAG 检索增强生成向量数据库Chroma、Milvus、FAISS文档切分、向量化、检索召回、RAG 全流程搭建企业知识库问答系统实战AI 应用开发大模型 工具调用Function Calling、智能体 Agent 基础多模态大模型图文理解、文生图 / 文生视频基础应用低代码 / 无代码 AI 应用搭建、行业场景适配客服、文案、数据分析七大模型进阶技术与行业落地多模态大模型图文多模态原理、多模态微调、多模态对话系统文生图模型Stable Diffusion、Midjourney 原理、AIGC 应用行业垂直大模型垂类数据微调、领域知识库构建、垂直场景落地教育、金融、电商、医疗大模型安全对齐、幻觉解决、内容合规优化八AI 工程化工具与项目管理版本与环境管理Conda/Pip 环境管理、Poetry 依赖管理Git/GitHub代码版本控制、分支管理、开源项目协作AI 工程化工具DVC 数据版本管理、MLflow 模型实验跟踪大模型训练日志监控、模型评估与迭代优化最后如果说程序员已经是高薪职业那么干AI的程序员就是高薪中的高薪。现在的市场已经用数据给程序员指明了方向学AI大模型就是冲刺高薪的最优解看着身边越来越多的同行转型大模型、拿到高薪offer很多人心里都动了心但真正的难题来了零基础小白不知道从哪入门有基础的程序员找不到系统学习路径实战项目练手无门面试不知道考什么别慌今天就给大家整理了一份【2026年最新版】AI大模型免费学习资源包覆盖从入门到实战、从理论到面试、从基础到进阶的全流程所有资料均已整理归档无冗余、无套路免费分享给每一位想抓住AI风口的程序员和小白扫码免费领取全部内容1、大模型系统化学习路线2、大模型学习书籍文档3、AI大模型最新行业报告4、大模型项目实战配套源码5、大模型大厂面试真题四阶段精细化学习规划附时间节点可直接照做结合上述资源给大家整理了一份可直接落地的四阶段学习规划总时长约2个月小白可循序渐进程序员可根据自身基础调整节奏高效掌握大模型核心能力快速实现从“入门”到“能落地、能面试”的跨越。第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器 损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…扫码免费领取全部内容6、这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

相关新闻