一、SVM 相关概念
1.1 通俗易懂的 SVM 算法描述
SVM(支撑向量机)呢,简单来说就是在两类数据中间找一条“最宽的路”。这条路的中间线就是用来分类的边界(也叫“决策边界”),路越宽,分类的效果就越好。核心思想就是找“最宽的路”(最大间隔):假设这两类数据是路上的两群行人,SVM 的目标就是在这两群人中间划出一条最宽的隔离带(称为“间隔”),隔离带的中间线就是最终的分类边界。关键在于“边缘的人(支持向量)”:隔离带的宽度是由离边界最近的那几个行人(叫做“支撑向量”)决定的,其他行人对隔离带的位置和宽度没啥影响。允许“少量越界”:要是这两群人交错得很厉害(数据线性不可分),SVM 会允许少量行人暂时走进隔离带,不过还是会尽量让隔离带足够宽,平衡好分类错误和间隔大小(这就是“软间隔”)。核函数:当数据线性不可分的时候(就像缠绕的毛线团),把数据映射到高维空间,让它变得线性可分。