机器学习100天(四十):040 线性支持向量机-公式推导
创始人
2024-05-29 08:37:03

《机器学习100天》完整目录:目录

机器学习 100 天,今天讲的是:线性支持向量机-公式推导!

首先来看这样一个问题,在二维平面上需要找到一条直线划分正类和负类。

在这里插入图片描述

我们找到了 A、B、C 三条直线。这三条直线都能正确分类所有训练样本。但是,哪条直线最好呢?直观上来看,我们会选择 C这条直线,因为这条直线不仅分类正确,而且距离正负类样本的距离都很远。这样的好处是增加了该分类线的容错能力和健壮性。因为若要保证对未知的测试数据也能进行正确分类,最好让分类直线距离正类负类的点都有一定的距离。这样能让每个样本点附近的圆形区域是“安全”的。圆形区域越大,表示分类直线对测量数据误差的容忍性越高,越“安全”。

因此, 距离分类线最近的点与分类线的距离越大,表明该分类模型越好。这就是支持向量机算法的核心思想。

首先,我们定义距离分类线最近的点与分类线的距离叫做最大间距,用 margin 表示。

在这里插入图片描述

我们的目标就是最大化 margin。必须满足的条件是:必须让每个训练样本都分类正确。即满足不等式:

相关内容

热门资讯

英媒:欧盟试图对世界贸易组织的... 格隆汇1月21日|据英国金融时报,欧盟已提议给予世贸组织成员国更多提高关税的自主权,这是该集团为应对...
北京产权交易所:“十四五”期间... (来源:中华工商网)转自:中华工商网  【记者郭钇杉北京报道】近日,记者从北京产权交易所获悉,“十四...
幸福零距离:一个山区城市的中国... 中新网丽水1月21日电(黄彦君)浙江省丽水市莲都区位于该省西南部,作为典型的山区城市,其一度面临公共...
加拿大总理卡尼:旧秩序不会回来... 中青报·中青网记者 赵婷婷“加拿大人知道,我们过去那种认为我们的地理位置和同盟关系能自动带来繁荣、安...
评论|电信运营商“二次放号”,... 您有没有遇到过这样的困扰:新手机号注册APP,却直接进入陌生人的云端相册;明明是刚启用的号码,却不断...