系列导读:本系列共15篇,系统覆盖机器学习从基础到工程化的完整知识体系。上一篇我们深入探讨了监督学习中的回归问题,本篇将转向监督学习的另一大核心任务——分类(Classification)。分类是机器学习中最常见、应用最广泛的任务类型,从垃圾邮件识别到医学影像诊断,从情感分析到信用风险评估,分类算法无处不在。一、分类问题概述1.1 什么是分类分类是监督学习中的一类核心任务,其目标是根据输入特征将样本划分到预定义的离散类别中。与回归问题预测连续值不同,分类问题的输出是离散的类别标签。具体来说,给定一个训练数据集D={ (x1,y1),(x2,y2),…,(xn,yn)}D = \{(x_1, y_1), (x_2, y_2), \ldots, (x_n, y_n)\}D