AI是怎么学习的?一篇看懂机器学习

发布时间:2026/5/25 19:15:50

AI是怎么学习的?一篇看懂机器学习 AI是怎么学习的一篇看懂机器学习系列从0到1学AI入门系列第 2 篇适合人群知道AI是什么想了解AI如何学习的朋友⏱️阅读时长约 12 分钟前言上一篇我们搞清楚了AI是什么。这一篇我们来回答一个更有意思的问题AI 是怎么变聪明的它跟人类学习有什么区别这就涉及到 AI 的核心技术——机器学习Machine Learning。一、什么是机器学习先看一个对比传统编程规则驱动 人类写规则 输入数据 → 输出结果 程序员 │ ↓ 手写 if/else 规则 程序 │ 输入邮件内容 │ ↓ 输出垃圾/正常 问题规则太多写不完遇到新情况直接失效机器学习数据驱动 输入数据 正确答案 → 机器自动学出规则 大量邮件样本 已标记垃圾/正常 │ ↓ 机器反复学习 模型 │ 输入新邮件内容 │ ↓ 输出垃圾/正常 ✅ 自动判断核心区别传统编程是人写规则机器学习是机器自己找规律。二、机器学习的三大类型机器学习根据学习方式分为三大类机器学习 ├── 监督学习Supervised Learning │ └─ 有老师带数据有标签 │ ├── 无监督学习Unsupervised Learning │ └─ 自学成才数据无标签 │ └── 强化学习Reinforcement Learning └─ 在试错中学习有奖惩机制2.1 监督学习——有老师带类比就像学生做练习题每道题都有答案学生对照答案不断纠错。训练数据示例 图片① → 标签猫 图片② → 标签狗 图片③ → 标签猫 图片④ → 标签狗 ... × 100万张 ↓ 喂给模型 模型学到猫的特征尖耳朵、竖瞳孔... 狗的特征垂耳、圆眼睛... 测试给一张新图片 输出猫置信度 98%✅常见应用任务输入输出图像分类图片类别标签垃圾邮件过滤邮件文本垃圾/正常房价预测房屋特征价格医学诊断CT图像正常/异常2.2 无监督学习——自学成才类比把一堆杂乱的物品丢给你让你自己分类没有任何提示。输入1000个用户的购物行为数据 没有任何标签 ↓ 机器自动分析 机器发现了3类用户 群体A爱买3C数码消费高 群体B爱买母婴用品频次高 群体C爱买食品零食客单低 用途精准营销、个性化推荐常见应用聚类分析用户分群、商品分类异常检测发现信用卡欺诈降维压缩图片压缩、特征提取主题建模从文章中自动发现主题2.3 强化学习——在试错中成长类比就像训练宠物——做对了给奖励做错了给惩罚它慢慢学会什么该做什么不该做。强化学习的基本框架 环境游戏/现实 │ ↓ 当前状态 智能体AI │ ↓ 执行动作 环境给出反馈 │ ┌────┴────┐ 奖励 惩罚- │ 智能体更新策略 │ 循环直到策略最优 ✅最著名的案例AlphaGo通过与自己对弈数百万局学会了超越人类的围棋策略游戏AIOpenAI Five 在《Dota2》中击败职业选手自动驾驶在模拟环境中学习驾驶策略三、机器学习的完整流程一个完整的机器学习项目要经历以下步骤第1步收集数据 ┌─────────────────────────────────┐ │ 原始数据来源 │ │ · 用户行为日志 │ │ · 图片/视频/音频文件 │ │ · 数据库记录 │ │ · 爬取的网页内容 │ └─────────────────────────────────┘ ↓ 第2步数据清洗 删除重复、填补缺失、统一格式 ↓ 第3步特征工程 从原始数据中提取有用的特征 例从房屋数据中提取面积、楼层、朝向 ↓ 第4步选择模型 决策树 / 随机森林 / 神经网络 / ... ↓ 第5步训练模型 用训练集数据让模型学习 ↓ 第6步评估模型 用测试集验证准确率、召回率等指标 ↓ 第7步调优部署 优化超参数 → 上线服务四、一个超简单的例子用Python体验机器学习以下是一个最简单的鸢尾花分类示例感受一下机器学习的代码是什么样的# 1. 导入必要库 from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.tree import DecisionTreeClassifier from sklearn.metrics import accuracy_score # 2. 加载数据集内置鸢尾花数据150条记录 iris load_iris() X, y iris.data, iris.target # 3. 切分训练集和测试集80%训练20%测试 X_train, X_test, y_train, y_test train_test_split( X, y, test_size0.2, random_state42 ) # 4. 创建决策树模型 model DecisionTreeClassifier() # 5. 训练模型一行代码 model.fit(X_train, y_train) # 6. 预测 评估 y_pred model.predict(X_test) print(f准确率{accuracy_score(y_test, y_pred) * 100:.1f}%) # 输出准确率96.7% 核心就这一行model.fit(X_train, y_train)这就是喂数据、让机器学习的过程五、机器学习 vs 深度学习 vs AI 的关系很多人分不清这三个词来看一张包含图┌─────────────────────────────────────────┐ │ 人工智能AI │ │ ┌────────────────────────────────┐ │ │ │ 机器学习ML │ │ │ │ ┌─────────────────────────┐ │ │ │ │ │ 深度学习DL │ │ │ │ │ │ ┌──────────────────┐ │ │ │ │ │ │ │ 大语言模型LLM │ │ │ │ │ │ │ │ ChatGPT / 文心 │ │ │ │ │ │ │ └──────────────────┘ │ │ │ │ │ └─────────────────────────┘ │ │ │ └────────────────────────────────┘ │ └─────────────────────────────────────────┘ AI ⊃ 机器学习 ⊃ 深度学习 ⊃ 大语言模型AI大概念包含所有让机器智能的技术机器学习AI 的主流实现方式深度学习机器学习的一个子集用神经网络大语言模型深度学习的应用专注语言理解六、机器学习的局限性机器学习不是万能的了解它的局限很重要局限说明需要大量数据数据越少效果越差黑盒问题难以解释为什么做出某个决策对分布敏感训练数据和真实数据差异大时会失效计算资源消耗大训练大模型需要昂贵的GPU集群无法处理全新问题遇到训练中没见过的类型会出错总结类型特点典型应用监督学习有标签数据学习映射关系图像识别、垃圾邮件无监督学习无标签数据自动发现结构用户分群、异常检测强化学习试错奖惩学习最优策略游戏AI、自动驾驶下一篇预告A-03问答式AI vs 智能体Agent它们有什么不同ChatGPT 只能回答问题而 AI Agent 能自己做事——这两者到底有什么本质区别作者Johnny2004 | 专栏AI专栏 | 系列从0到1学AI

相关新闻