机器学习框架sklearn之转换器和估计器
创始人
2024-06-02 18:31:52
0

转换器

Scikit-learn (sklearn) 是一个用于机器学习的Python库。其中两个重要的概念是转换器(transformer)和估计器(estimator),它们是scikit-learn库中的两个核心概念。

转换器是将数据集从一种形式转换为另一种形式的工具。例如,将原始数据进行标准化处理,将文本数据转换为数值特征等。在sklearn中,转换器类的名称以Transformer结尾。转换器通常有一个fit_transform()方法,可以在训练集上拟合模型并将其应用于测试集。

做的特征工程的步骤?

  • 1.实例化(实例化是一个转换器类(Transformer))
  • 2.调用fit_tranformer(对于文档建立分类词频矩阵)

我们把特征工程的接口称之为转换器,其中转换器调用有这么几种形式:

  • fit_transform
  • fit
  • transform

常见的转换器:

  • StandardScaler:用于标准化数值特征。
  • OneHotEncoder:用于将分类变量转换为数值特征。
  • CountVectorizer:用于将文本数据转换为数值特征。
  • PCA:用于将高维数据集降低维度。

估计器

在sklearn中,估计器(estimator)是一个重要角色,是一类实现了算法的API。
估计器是一种从数据集中学习模型的工具。估计器的任务是使用拟合模型对新数据进行预测。在sklearn中,估计器类的名称以Estimator结尾。估计器有两个基本方法,fit()方法和predict()方法。fit()方法在训练集上训练模型,而predict()方法用于在新数据上进行预测。

需要注意的是,某些转换器也可以作为估计器使用,这意味着它们可以使用fit()方法在训练集上拟合模型,并使用predict()方法对新数据进行预测。这些转换器估计器也被称为“带监督的转换器”。

  • 用于分类的估计器

    • sklearn.neighbors k-近邻算法
    • sklearn.native_bayes 贝叶斯
    • sklearn.linear_model.LogisticRegression 逻辑回归
    • sklearn.tree 决策树与随机森林
  • 用于回归估计器

    • sklearn.linear_model.LinearRegression 线性回归
    • sklearn.linear_model.Ridge 岭回归
  • 用于无监督学习的估计器

    • sklearn.cluster.KMeans 聚类

    估计器工作流程

    1.实例化一个estimator类

    2.estimator.fit(x_train,y_train) 计算

    ​ ----调用完毕,模型生成

    3.模型评估

    ​ 1)直接比对真实值和预测值

    ​ y_predict = estimator.predict(x_test)

    ​ y_test == y_predict

    ​ 2) 计算准确率

    ​ accuracy = estimator.score(x_test,y_test)

相关内容

热门资讯

“倾听您的心声,服务您的需求”... 中国人民人寿保险股份有限公司(以下简称“人保寿险”)“倾听您的心声 服务您的需求”第十七届客户节于2...
佩斯科夫:俄不会对媒体有关俄乌... 转自:财联社【佩斯科夫:俄不会对媒体有关俄乌谈判报道发表评论】财联社5月18日电,据塔斯社当地时间1...
穆杰,调任新职 编辑 | 余晖山东省人民政府近日发布任免通知,山东省人民政府决定,任命穆杰为山东省煤田地质局副局长。...
融合文化、体育与生态,房山举办... 新京报讯(记者陈璐)5月18日,“登峰揽胜在房山”山地绿道徒步活动在房山区周口店镇永寿禅寺广场启幕。...
5月19日,“同”赴一场有“法... 【5月19日,“同”赴一场有“法”的旅行】锦绣河山,美好旅程。在第15个中国旅游日,人民法院新闻传媒...
探索电影+旅游的创新合作,盐城... 转自:上观新闻当120年胶片齿轮撞上Z世代的赛博心跳,一座城正用“轻舟计划”重构青年与电影的时空契约...
十位艺术大师联袂,绘就江南诗意... 转自:上观新闻艺术的笔触邂逅江南的灵韵,共赏“吴越江南”的水墨诗意。近日,位于闵行区万源路2800号...
痛惜!突发呼吸心跳骤停,他于深... 南京艺术学院5月17日发布讣告:南京艺术学院教授、博士生导师尹悟铭同志,因突发呼吸心跳骤停,经抢救无...
2024年我国卫星导航产业产值... 原标题:2024年我国卫星导航产业产值达5758亿元来源:人民日报客户端5月18日,中国卫星导航定位...
龙牙刀、结界兽、天元鼎……《哪... 新京报记者 展圣洁 编辑 白爽 校对 赵琳5月19日,年度重磅特展——“看·见殷商”展览将在北京大运...
中国铁建相关公司中标一项349... (转自:快查一企业中标了)快查APP显示,中国铁建相关公司中铁十八局集团有限公司于2025年5月15...
上海家庭医生签约数超1100万... 转自:中工网中新网上海5月18日电 (记者 陈静)家庭医生是居民健康的“第一道防线”。世界家庭医生日...
50多岁2女子无视预警爬野山被... 转自:京报网_北京日报官方网站 【#50多岁2女子无视预...
广东建工全资子公司中标一项31... (转自:快查一企业中标了)快查APP显示,广东建工相关公司广东省基础工程集团有限公司于2025年5月...
从工具到生态:金融科技的角色升... 转自:企业观察网数字金融,作为传统金融与现代信息技术深度融合的产物,正在重塑金融业务模式的底层逻辑。...
义乌至迪拜“铁海快线+中东快航... 5月18日,澎湃新闻(www.thepaper.cn)记者从中国铁路上海局集团有限公司(以下简称“上...
文化中国行|探寻国宝里的中国智... 03:12今年5月18日是第49个国际博物馆日。山西历史悠久,素有“地上文物看山西”的美誉。山西博物...
祝姜同学前程似锦!救人小伙姜昭... 来源:人民日报 【祝姜同学前程似锦!#救人小伙姜昭鹏完成...
印度南部一建筑起火,至少17人... 转自:上观新闻当地时间5月18日,印度南部特伦甘纳邦海得拉巴市一栋建筑发生火灾,目前已造成至少17人...
墨西哥海军船只撞上布鲁克林大桥... 转自:央视新闻  当地时间17日晚,一艘载有277人的墨西哥海军大型帆船在穿越美国纽约布鲁克林大桥时...