机器学习_04_逻辑回归-尧图网站设计

逻辑回归一、概念与定位类型监督学习、分类任务虽叫“回归”但实际是分类算法定义预测一个事件发生的概率P(y1|x)输出值在 [0, 1] 之间核心思想在线性回归的基础上套上Sigmoid 函数将预测值压缩到 0~1 之间变成概率一句话逻辑回归线性回归 Sigmoid 激活函数二、模型形式第一步线性组合z w₁x₁ w₂x₂ ... wₙxₙ b WᵀX b第二步Sigmoid 压缩ŷ σ(z) 1 / (1 e⁻ᶻ)最终输出ŷ 表示样本属于正类的概率通常以 0.5 为阈值ŷ ≥ 0.5 → 预测为类别 1ŷ 0.5 → 预测为类别 0Sigmoid 函数特点特点说明值域(0, 1)可解释为概率单调性单调递增z越大输出越接近1可导性处处可导导数 σ(z)·(1-σ(z))方便梯度下降对称性σ(-z) 1 - σ(z)三、决策边界逻辑回归的决策边界是线性的。当 WᵀX b 0 时σ(z) 0.5这就是分类边界在特征空间中这是一条直线二维或超平面高维逻辑回归只能学习线性决策边界。对于线性不可分的数据需要特征工程多项式、交互项来间接实现非线性。四、损失函数为什么不用 MSEMSE 配合 Sigmoid 会导致损失函数非凸存在多个局部最小值梯度下降难以找到全局最优。交叉熵损失Log Loss这是逻辑回归的标准损失函数凸函数保证梯度下降能找到全局最优。二分类交叉熵公式L -[y·log(ŷ) (1-y)·log(1-ŷ)]真实值 y预测值 ŷ损失计算直观理解1接近1接近0预测对了损失小1接近0非常大预测错了损失大0接近0接近0预测对了损失小0接近1非常大预测错了损失大本质预测越准损失越小预测越离谱损失指数级增长。五、求解方法梯度下降与线性回归类似但梯度公式不同。梯度公式∂L/∂wⱼ (ŷ - y)·xⱼ参数更新wⱼnew wⱼold - α · (ŷ - y)·xⱼ参数含义说明α学习率超参数控制步长ŷ - y预测误差正/负决定更新方向xⱼ第j个特征值误差按特征值加权分配与线性回归梯度下降的对比对比项线性回归逻辑回归预测值ŷ WᵀXŷ σ(WᵀX)梯度(ŷ - y)·xⱼ(ŷ - y)·xⱼ公式形式完全相同完全相同形式上梯度公式一样但逻辑回归的 ŷ 经过了 Sigmoid 压缩。六、评估指标分类问题常用指标指标说明适用场景准确率预测正确的比例类别平衡时精确率预测为正例中实际为正例的比例看重“猜对的有多准”召回率实际为正例中被预测出来的比例看重“漏掉了多少”F1分数精确率和召回率的调和平均类别不平衡时AUC-ROC模型区分正负类的能力排序能力评估混淆矩阵预测为正预测为负实际为正TP真正例FN假负例实际为负FP假正例TN真负例七、优缺点与适用场景优点优点说明简单高效模型结构简单训练和预测都快可解释性强权重 w 直接反映特征对概率的影响方向和程度输出概率不仅给分类结果还给出置信度不容易过拟合模型表达能力有限适合高维稀疏数据小数据友好数据量不大时表现稳定缺点缺点说明只能线性决策边界对线性不可分数据无能为力对异常值敏感异常点可能拉偏决策边界特征相关性敏感多重共线性会导致权重不稳定类别平衡敏感类别严重不平衡时需特殊处理采样/加权适用场景需要概率输出的业务风控、医疗诊断需要强可解释性的场景金融审批、信用评分特征与标签存在近似线性关系在线学习场景可配合 SGD 增量更新作为深度学习输出层二分类任务的标准选择八、APIfrom sklearn.linear_model import LogisticRegression # 常用参数 model LogisticRegression( penaltyl2, # 正则化l1 / l2 C1.0, # 正则化强度的倒数越小正则越强 solverlbfgs, # 求解器lbfgs / liblinear / saga max_iter100, # 最大迭代次数 class_weightbalanced # 类别不平衡处理 ) model.fit(X_train, y_train) y_pred model.predict(X_test) y_proba model.predict_proba(X_test) # 输出概率九、逻辑回归 vs 线性回归对比项线性回归逻辑回归任务类型回归预测连续值分类预测离散类别输出范围(-∞, ∞)(0, 1) 概率激活函数无恒等连接Sigmoid损失函数MSE交叉熵求解方式正规方程 / 梯度下降梯度下降不能用正规方程参数解释特征每变化1单位y变化w特征每变化1单位对数几率变化w十、总分总总结总逻辑回归是一种用于二分类任务的监督学习算法核心是在线性回归的基础上套上 Sigmoid 函数将输出压缩为 [0,1] 之间的概率并以 0.5 为阈值进行分类。分模型形式z WᵀX b → ŷ 1/(1e⁻ᶻ)损失函数交叉熵损失凸函数保证能找到全局最优求解方法梯度下降梯度公式与线性回归形式相同决策边界线性边界WᵀX b 0评估指标准确率、精确率、召回率、F1、AUC-ROC优缺点优点简单高效、可解释强、输出概率、不易过拟合缺点只能线性边界、对异常值敏感、类别不平衡敏感适用场景需要概率输出和可解释性的二分类任务风控、医疗、金融总逻辑回归是分类任务的入门算法和基准模型也是深度学习中二分类输出层的标准选择。优点是简单、可解释、输出概率缺点是不能处理非线性边界。作为线性分类器的代表逻辑回归与线性回归共同构成了监督学习的基石。

机器学习_04_逻辑回归

相关新闻

VMware Unlocker 3.0：在Windows和Linux上免费解锁macOS虚拟机支持的完整指南

嵌入式开发调试实战：从内存泄漏到死锁的排查技巧与工具链

Linux存储管理：块设备与分区表的本质区别及实践指南

游戏资源编辑利器：ExtractorSharp完全入门指南

G-Helper：华硕笔记本用户的终极轻量级硬件控制方案

JDK17对比JDK8：新增核心特性全解析

声明式配置管理数据库架构革命：iTop如何通过XML驱动模型实现企业级ITSM解耦设计

Mac 安装jdk和nvm

为我的开源项目选择 Taotoken 作为大模型后端的经济性与灵活性考量

新闻编辑部正在悄悄部署NotebookLM，你还在用传统剪报法？

XUnity Auto Translator：Unity游戏多语言本地化的终极解决方案

Go语言轻量级分布式任务调度框架Roll：从架构到生产部署实战

2026年十大最佳地区搜索排名优化工具：权威榜单赋能企业高效增长

DDR3内存Row Hammer问题解析与防护方案

为ItsyBitsy ESP32设计3D打印外壳：从原型到产品的完整实践

别再手动点关了！用PowerShell永久关闭Windows Defender的保姆级教程（含Server 2016/2019）

别再只换芯片了！BP2832A替换CL1502，你的电感参数算对了吗？

全平台智能资源下载工具：res-downloader 完整使用教程