
“高考结束才是真正开始学习”给AI时代新人的一份真实学习路线图0. 一句话背后的信号2026年6月7日北京人大附中考点一位考生提前半小时走出考场。记者问高考后的打算他说“高考只是这个阶段的结束自己未来想学的专业也偏向AI高考结束后才是真正该开始学习的时候。”这句话火了。不是因为说得漂亮是因为它说对了一件事高考不是学习的终点是真正学习的起点。更关键的信号是一个刚考完的高中生第一反应是要学AI。这说明AI已经从技术圈的话题变成了普通人的选择。这篇文章的目的不是励志是给你一份从零到能干活的AI学习路线图。不谈概念谈具体怎么学、用什么学、踩了什么坑。1. 先说清楚学AI不是学怎么用ChatGPT很多人说我想学AI但脑子里想的是学会用AI工具提升效率。这没错但这不是学AI这是学使用工具。学AI指的是理解模型怎么工作、能训练或微调模型、能搭建基于AI的应用、能解决模型解决不了的问题。这两条路区别很大目标适合人群时间投入产出用AI提升效率所有人1-2周入门工作效率提升学AI技术想转行/深造的人6-12个月系统学能搭建AI应用、做相关研究这篇文章面向的是后者想系统学AI技术的人。如果你只是想用AI工具去用就行了不需要路线图。2. 路线图四个阶段从零到能干活阶段一数学编程基础4-8周为什么需要AI的底层是数学线性代数、概率统计、微积分工具是编程Python。没有这两样后面全是黑箱出了问题不知道怎么调。数学部分不需要学完够用就行线性代数矩阵运算、向量空间、特征值——深度学习的基础推荐3Blue1Brown 的线性代数可视化系列YouTube/B站直观不枯燥书《线性代数应该这样学》Axler——比国内教材直观概率统计贝叶斯、分布、期望方差——机器学习的核心推荐可汗学院概率统计课程免费讲得清楚实战用 Python numpy 随机模拟抛硬币、蒙特卡洛方法微积分梯度、偏导数、链式法则——神经网络反向传播的基础推荐3Blue1Brown 微积分系列重点看梯度下降那几集编程部分Python 是绝对主流# 第一周就能写出来的AI感觉代码importnumpyasnp# 手动实现一个最简单的线性回归不用任何AI框架deflinear_regression(X,y,learning_rate0.01,epochs1000):# 初始化参数wnp.zeros(X.shape[1])b0for_inrange(epochs):# 前向传播y_prednp.dot(X,w)b# 计算损失均方误差lossnp.mean((y_pred-y)**2)# 反向传播梯度下降dwnp.dot(X.T,(y_pred-y))/len(y)dbnp.mean(y_pred-y)w-learning_rate*dw b-learning_rate*dbreturnw,b,loss这个阶段的坑数学书买一堆看完前三章就放弃了——别买书先看视频有感觉了再翻书Python学了两个月还在学语法——语法一周够用剩下的在项目中练同时学C/Java——AI领域Python够用别分心阶段目标能用手写代码实现线性回归、逻辑回归、KNN不依赖任何框架。阶段二机器学习入门6-10周为什么需要深度学习是机器学习的一个子集。不理解机器学习的通用思想过拟合、交叉验证、特征工程直接上深度学习会一脸懵。核心概念必须搞懂监督学习 vs 无监督学习 vs 强化学习训练集/验证集/测试集的划分原则过拟合的表现和解决方法正则化、早停、数据增强特征工程什么特征有用、怎么处理缺失值、怎么处理类别变量推荐学习路径吴恩达《Machine Learning》课程Coursera/网易云课堂经典中的经典讲得清楚作业用MATLAB/Octave没关系思想是通用的时间6-8周每周6-8小时李宏毅《机器学习》课程YouTube/B站中文更贴近当前研究讲深度学习和生成模型讲得好适合作为吴恩达课程的补充实战《Hands-On Machine Learning》Aurélien Géron这本书值100个视频课用scikit-learn和TensorFlow实现重点做房价预测回归、手写数字识别分类、异常检测# 阶段二结束时的能干活代码用scikit-learn训练一个分类器fromsklearn.datasetsimportload_digitsfromsklearn.model_selectionimporttrain_test_splitfromsklearn.ensembleimportRandomForestClassifierfromsklearn.metricsimportaccuracy_score# 加载数据手写数字识别digitsload_digits()X_train,X_test,y_train,y_testtrain_test_split(digits.data,digits.target,test_size0.2)# 训练随机森林不需要调参就能得到不错的结果clfRandomForestClassifier(n_estimators100,random_state42)clf.fit(X_train,y_train)# 评估y_predclf.predict(X_test)print(f准确率:{accuracy_score(y_test,y_pred):.3f})这个阶段的坑课程看完就完了不动手——吴恩达的课后作业必须做不做等于没学一开始就上深度学习框架——先用手写代码理解原理再上PyTorch/TensorFlow数据集只用MNIST——MNIST是AI的Hello World做完就换真实数据集阶段目标能说清楚监督/无监督学习的区别能用手写代码实现逻辑回归能用scikit-learn解决分类/回归问题。阶段三深度学习LLM8-12周为什么需要当前AI的热点在深度学习尤其是大语言模型LLM。这个阶段学完你能理解ChatGPT为什么能聊天能微调一个模型能搭建一个基于LLM的应用。深度学习基础吴恩达《Deep Learning Specialization》Coursera神经网络、CNN、RNN、Seq2Seq全覆盖作业用TensorFlow但思想通用PyTorch官方教程pytorch.org/tutorials当前主流框架是PyTorch不是TensorFlow从张量操作到训练一个CNN官方教程是最好的起点# 用PyTorch实现一个简单的神经网络importtorchimporttorch.nnasnnimporttorch.optimasoptimclassSimpleNet(nn.Module):def__init__(self):super().__init__()self.fc1nn.Linear(784,128)self.fc2nn.Linear(128,64)self.fc3nn.Linear(64,10)self.relunn.ReLU()self.dropoutnn.Dropout(0.2)defforward(self,x):xself.relu(self.fc1(x))xself.dropout(x)xself.relu(self.fc2(x))xself.fc3(x)returnx# 训练循环简化版modelSimpleNet()criterionnn.CrossEntropyLoss()optimizeroptim.Adam(model.parameters(),lr0.001)forepochinrange(10):forbatch_x,batch_yindataloader:optimizer.zero_grad()outputsmodel(batch_x)losscriterion(outputs,batch_y)loss.backward()optimizer.step()LLM专项学习理解Transformer架构这是LLM的基础必读论文《Attention Is All You Need》2017推荐解读The Illustrated Transformerjalammar.github.io关键概念Self-Attention、Multi-Head Attention、位置编码动手微调一个LLM工具Hugging Face Transformers库入门项目用LoRA微调一个开源模型如Qwen、Llama数据集从Hugging Face Datasets找一个简单的分类/生成数据集# 用Hugging Face微调一个文本分类模型简化版fromtransformersimportAutoModelForSequenceClassification,Trainer,TrainingArgumentsfromdatasetsimportload_dataset# 加载预训练模型和数据集modelAutoModelForSequenceClassification.from_pretrained(bert-base-chinese,num_labels2)datasetload_dataset(csv,data_filesmy_data.csv)# 训练参数training_argsTrainingArguments(output_dir./results,num_train_epochs3,per_device_train_batch_size16,learning_rate2e-5,# 微调通常用很小的学习率)# 开始训练trainerTrainer(modelmodel,argstraining_args,train_datasetdataset[train])trainer.train()这个阶段的坑Transformer架构没搞懂就上LLM——Attention机制不理解后面全是背代码只看论文不写代码——LLM是工程不是理论必须动手调一开始就用最大的模型——从BERT-base开始别上来就Llama-405B阶段目标能说清楚Transformer的每个组件能用PyTorch训练一个CNN能微调一个开源LLM完成特定任务。阶段四项目实战持续学习持续进行为什么需要学完前三个阶段你有理论有工具但没做过完整项目等于没学。AI是工程学科不动手永远停留在知道层面。入门项目推荐难度递增Kaggle入门竞赛如Titanic、House Prices目的熟悉完整流程数据清洗→特征工程→建模→提交时间1-2周克隆一个经典论文的实现比如用PyTorch从零实现TransformerAurélien Géron的书里有目的验证你真的理解了架构时间2-4周做一个端到端的AI应用比如本地文档问答系统RAG、AI写作助手、图像分类API目的打通从模型到产品的全链路技术栈LangChain/LLM Vector DB FastAPI 前端时间4-8周# 阶段四的能干活代码一个简单的RAG系统fromlangchain_community.vectorstoresimportChromafromlangchain_community.embeddingsimportHuggingFaceEmbeddingsfromlangchain.chainsimportRetrievalQAfromlangchain_community.llmsimportOllama# 1. 构建向量库假设已有文档切分结果embeddingsHuggingFaceEmbeddings(model_nameBGE-small-zh)vectorstoreChroma.from_documents(documents,embeddings)# 2. 搭建检索问答链llmOllama(modelqwen2:7b)# 用本地模型不需要API Keyqa_chainRetrievalQA.from_chain_type(llm,retrievervectorstore.as_retriever())# 3. 问答answerqa_chain.run(我们公司的年假政策是什么)print(answer)持续学习的资源论文arXiv.org关注cs.AI/cs.LG/cs.CL类别社区Hugging Face、GitHub Trending、Reddit r/MachineLearning博客Andrej Karpathy的博客karpathy.github.io必读这个阶段的坑项目做了一半就放弃——第一个项目不求完美求完整只看中文资料——AI的前沿论文都是英文必须过英语关追新技术追得迷失——先把基础打牢新模型是旧组合的新排列阶段目标有一个能展示的完整项目能读懂ACL/NeurIPS的论文能跟上AI领域的最新进展。3. 避坑指南前人踩过的坑你不必再踩坑一买一堆书然后开始吃灰AI领域的好书很多但书是最慢的学习方式。正确的顺序是视频→动手→书→论文。书单推荐但别一开始就买《深度学习》Goodfellow et al.—— 又名花书理论权威但不适合入门《动手学深度学习》李沐—— 有中文版代码理论结合适合有一定基础后读《自然语言处理入门》何晗—— 中文NLP入门首选坑二一开始就用最牛的模型“我用Llama-405B做我的第一个项目”——这是作死。正确的模型选择策略学习原理用最小的模型BERT-base、GPT-2 small做项目用中等模型Qwen-7B、Llama-3-8B能跑得动生产环境才考虑大模型而且要考虑成本和延迟坑三数学基础不够就硬上有人问“我数学不好能学AI吗”能但有两个前提至少掌握线性代数和概率统计的基础不需要精通够用就行愿意在学的过程中补数学遇到不懂的数学再回头学比系统学完数学再学AI效率高推荐的补数学方式3Blue1Brown的视频系列直观不枯燥看完再翻书深化。坑四只学不用永远停留在知道AI是工程不动手等于白学。每个阶段学完必须做一个能跑的项目。最低要求阶段一手写线性回归阶段二用scikit-learn解决一个Kaggle入门赛阶段三微调一个开源模型阶段四做一个端到端的AI应用坑五英语不好只看中文资料坦白说AI的前沿进展都是用英文发布的。论文、技术博客、开源项目文档英文是绝对主流。英语不好不是借口是两个解决方案边学AI边补英语推荐因为AI资料太多翻译永远滞后用翻译工具辅助读英文资料可行但效率低4. 资源汇总收藏这篇就够了课程课程平台适合阶段费用吴恩达《Machine Learning》Coursera/网易云课堂阶段二免费/付费吴恩达《Deep Learning Specialization》Coursera阶段三付费可申请资助李宏毅《机器学习》YouTube/B站阶段二、三免费Fast.ai《Practical Deep Learning》fast.ai阶段三免费Hugging Face课程huggingface.co/course阶段三、四免费书籍书名适合阶段特点《动手学深度学习》李沐阶段二、三中文代码理论结合《深度学习》Goodfellow阶段三、四理论权威不适合入门《Hands-On Machine Learning》阶段二、三实战导向scikit-learnTensorFlow《自然语言处理入门》何晗阶段三中文NLP首选工具/框架工具用途入门难度Python NumPy基础编程⭐scikit-learn传统机器学习⭐⭐PyTorch深度学习⭐⭐⭐Hugging Face TransformersLLM微调/推理⭐⭐⭐LangChainLLM应用开发⭐⭐Ollama本地运行LLM⭐数据集/竞赛Kagglekaggle.com入门竞赛、数据集Hugging Face Datasetshuggingface.co/datasetsLLM训练数据集Papers With Codepaperswithcode.com论文代码数据集5. 最后学习的本质是持续不是冲刺回到开头那句话“高考结束后才是真正该开始学习的时候。”这句话的真正含义不是我要拼命学而是学习是一辈子的事高考只是其中一个节点。AI这个领域变化太快了。你今天学的框架明天可能就过时了。你今天追的新模型下个月可能就有更好的。所以与其追每一个新技术不如把基础打牢。数学基础、编程能力、学习能力——这三样东西任何技术浪潮都淘汰不了。那个说要学AI的人大附中考生如果他真的走上了这条路他会发现AI不难难的是持续学习。高考结束只是起点后面还有很长的路。祝他也祝所有想学AI的人走得快更走得远。数据来源腾讯新闻《谈及未来打算北京一考生称高考结束后才是真正该开始学习的时候》2026-06-07、吴恩达Coursera课程、Hugging Face官方文档、3Blue1Brown可视化课程系列、李沐《动手学深度学习》