
Week1机器学习入门摘要本周完成李宏毅《机器学习》课程第 1 讲的入门学习建立对机器学习的整体认知。首先梳理了人工智能、机器学习与深度学习的层级关系剖析了传统 “人工设定规则” 方法的局限性在此基础上理解了 “机器学习本质是从数据中寻找最优函数” 的核心逻辑。1机器学习基础1.1核心概念层级关系人工智能AI是最终目标旨在让机器具备类人的智能行为机器学习ML是实现人工智能的核心手段通过让机器从数据中学习规律而非依赖硬编码规则来完成任务深度学习DL是机器学习的一个分支以多层神经网络为核心通过非线性模型拟合复杂规律1.2 传统人工规则方法的局限性课程通过多个案例剖析了传统方法的瓶颈以河狸筑坝的本能为例河狸仅能对 “流水声” 这一固定触发条件做出反应无法适应水泥墙播放流水声这类异常场景以聊天机器人为例硬编码 “turn off” 触发 “关闭音乐” 的规则无法处理 “Please don’t turn off the music” 这类带否定词的变体指令这类方法的共性问题① 无法覆盖所有可能性复杂场景下规则编写成本极高② 模型表现永远无法超越人类设定者③ 对复杂任务的适配性差不适合小团队快速落地。1.3 机器学习的本质定义本讲提出了机器学习的核心定义机器学习≈从数据中寻找最优函数。课程通过多个案例具象化这一概念图像识别输入一张图片寻找函数将其映射为 “猫 / 狗 / 猴子” 的类别语音识别输入一段音频波形寻找函数将其映射为对应的文本围棋对弈输入棋盘状态寻找函数输出下一步的落子位置对话系统输入用户的问题寻找函数输出合理的回复。1.4 机器学习的三大核心流程课程将机器学习的实现逻辑简化为三个关键步骤类比 “把大象放进冰箱” 的流程清晰易懂Step 1定义函数集合模型空间预先设定可能的函数范围比如所有可能的线性模型、或所有结构的神经网络Step 2定义函数的 “好坏”评估指标 / 损失函数基于训练数据判断一个函数的预测结果与真实标签的差距差距越小函数表现越好Step 3选出最优函数优化过程通过算法从函数集合中筛选出在训练数据上表现最好的那个函数作为最终模型。2 机器学习的任务类型2.1 监督学习任务监督学习是机器学习中最常见的任务类型核心特点是基于带标签的训练数据学习输入到输出的映射关系。根据输出形式的不同可分为三类2.1.1 回归任务回归任务的输出是连续的标量数值目标是预测一个具体的数值结果。课程以 “预测 PM2.5” 为例输入是过去几天的 PM2.5 监测数据目标是训练一个函数输出未来一天的 PM2.5 浓度值。2.1.2 分类任务分类任务的输出是离散的类别标签根据类别数量可分为两类二分类仅需区分两个类别比如垃圾邮件过滤“是垃圾邮件 / 不是垃圾邮件”多分类需区分三个及以上的类别比如新闻文档分类“政治 / 经济 / 体育 / 科技”课程也以围棋为例说明每一个棋盘位置都是一个类别模型需要输出下一步的落子位置。2.1.3 结构化学习任务结构化学习是分类任务的延伸输出不是简单的标量或单个类别而是结构化的复杂数据课程举例语音识别输入音频波形输出对应的文本序列机器翻译输入中文文本输出对应的英文文本人脸检测输入一张图片输出图片中所有人脸的位置与边界框。3 机器学习的学习范式除了监督学习课程还介绍了其他主流学习范式根据数据是否带标签、数据与任务的相关性可分为以下几类3.1 无监督学习无监督学习的核心特点是使用无标签数据进行学习目标是挖掘数据本身的结构与规律而非直接预测标签。课程举例词向量学习通过阅读大量无标签文本让模型学习单词的语义含义图像生成通过学习大量无标签图片的分布生成新的图片内容。3.2 半监督学习半监督学习结合了少量带标签数据和大量无标签数据主要用于解决 “标注数据稀缺” 的场景。课程以猫狗识别为例仅用少量标注了 “猫 / 狗” 的图片结合大量无标注的猫狗图片训练模型完成识别任务降低数据标注成本。3.3 强化学习强化学习的核心逻辑是让智能体Agent与环境交互通过反馈信号奖励 / 惩罚优化策略与监督学习有明显区别监督学习是 “向老师学习”有明确的标准答案强化学习是 “从批评中学习”没有直接的标准答案仅通过最终结果的好坏比如围棋的输赢、对话的用户反馈来调整模型策略。课程以 AlphaGo 为例说明其结合了监督学习与强化学习先学习人类棋谱再通过自我对弈优化策略。3.4 迁移学习迁移学习的目标是利用与当前任务不直接相关的数据辅助模型学习提升模型的泛化能力。课程以猫狗识别为例除了标注的猫狗图片还可以用大象、老虎、动漫角色等其他数据帮助模型学习通用的图像特征提升对猫狗识别任务的适配能力。总结本周的学习搭建了机器学习的基础框架纠正了 “AI 复杂规则” 的误区理解了 “从数据中学习” 才是机器学习的核心逻辑。同时也对不同任务类型与学习范式有了清晰的认知明确了不同场景下的模型选型思路。后续将继续跟进课程进度补充线性回归的相关学习并尝试通过简单的代码案例将本周的理论知识落地实践。