sklearn学习笔记9:逻辑回归
创始人
2024-03-24 21:36:43
0

linear_model.LogisticRegression

①penalty & C

penalty:可以输入‘l1’或‘l2’来指定使用哪一种正则化方式,不填写默认‘l2’。注意,若选择‘l1’正则化,参数solver仅能够使用求解方式‘liblinear’和‘saga’,若使用‘l2’正则化,参数solver中所有求解方式都可以使用

C:正则化强度的倒数,必须是一个大于0的浮点数,不填写默认1.0,即默认正则项与损失函数的比值是1:1。C越小,损失函数就越小,模型对损失函数的惩罚越重,正则化的效力越强,参数theta会逐渐被压缩的越来越小

L1正则化和L2正则化虽然都可以控制过拟合,但它们的效果并不相同。当正则化强度逐渐增大(即C逐渐变小),参数theta的取值会逐渐变小,但L1正则化会将参数压缩为0,L2正则化只会让参数尽量小,不会取到0

两种正则化下C的取值,都可以通过学习曲线来进行调整

②max_iter

设置参数max_iter最大迭代次数来代替步长,帮助我们控制模型的迭代速度并适时地让模型停下。max_iter越大,代表步长越小,模型迭代时间越长,反之,则代表步长设置很大,模型迭代时间很短

③solver & multi_class

使用参数multi_class来告诉模型,我们的预测标签是什么样的类型

输入‘ovr’,‘multinomial’,‘auto’来告知模型,我们要处理的分类问题的类型,默认是‘ovr’

ovr:表示分类问题是二分类,或让模型使用‘一对多’的形式来处理多分类问题

multinomial:表示处理多分类问题,这种输入在参数solver是liblinear时不可用

auto:表示会根据数据的分类情况和其他参数来确定模型要处理的分类问题的类型,比如数据是二分类,或者solver的取值为liblinear,auto会默认选择ovr,反之,选择multinomial

④class_weight

使用参数class_weight对样本标签进行一定的均衡,给少量的标签更多的权重,让模型更偏向少数类,向捕获少数类的方向建模。该参数默认none,此模式表示自动给与数据集中的所有标签相同的权重,当误分类的代价很高的时候,我们使用balanced模式,我们只是希望对标签进行均衡的时候,什么都不填就可以解决样本不均衡问题

相关内容

热门资讯

民生情报站丨电瓶车“飞线充电”... 川观新闻记者 刘珩据媒体报道,6月25日凌晨,成都市金牛区一小区发生一起电动自行车火灾,事故造成一家...
甬矽电子:6月份公司未回购股份 证券日报网讯 7月2日晚间,甬矽电子发布公告称,2025年6月份,公司未通过上海证券交易所交易系统以...
赛意信息:累计回购公司股份26... 证券日报网讯 7月2日晚间,赛意信息发布公告称,截至2025年6月30日,公司通过股份回购专用证券账...
华润材料:累计回购公司股份78... 证券日报网讯 7月2日晚间,华润材料发布公告称,截至2025年6月30日,公司累计通过回购专用证券账...
挪威人有什么忌讳 挪威人有什么忌讳挪威人与人庆穗谈话时,习惯双方的距离州歼稍远些,最好1.2米以外。公共场所禁止吸烟。...
2025年券商金融“五篇大文章... 中国证券报·中证金牛座记者7月2日从业内独家获悉,备受证券行业瞩目的券商“五篇大文章”试评价结果正陆...
热热热,来石景山首钢园“清凉一... 转自:北京号夏天逃进首钢园也太爽了!滑雪大跳台“顽酷心跳塔”品高空咖啡,群明湖上划浆板,无论智能科技...
华明装备:累计回购公司股份11... 证券日报网讯 7月2日晚间,华明装备发布公告称,截至2025年6月30日,公司通过股份回购专用证券账...
争光股份:7月18日将召开20... 7月2日晚间,争光股份发布公告称,公司将于2025年7月18日召开2025年第一次临时股东大会。本次...
智信精密:董事张国军拟减持公司... 人民财讯7月2日电,智信精密(301512)7月2日晚间公告,公司持股8.83%的股东、董事张国军计...