如何能快速高效的构建出一版满意的评分卡模型,sklearn库帮我们轻松搞定一切。小编今天就将能在评分卡中用到的sklearn库中的函数一一总结归纳,python的同学有福啦!
数据预处理篇
1、数据标准化
函数:sklearn.Preprocessing.StandardScaler
用法:from sklearn.Preprocessing import StandardScaler
#标准化,返回值为标准化后的数据
StandardScaler().fit_transform(iris.data)
2、数据归一化
函数:sklearn.preprocessing.Normalizer
用法:from sklearn.preprocessing import Normalizer
#归一化,返回值为归一化后的数据
Normalizer().fit_transform(iris.data)
3、对定量特征二值化
函数:sklearn.preprocessing.Binarizer
用法:from sklearn.preprocessing import Binarizer
#二值化,阈值设置为3,返回值为二值化后的数据
Binarizer(threshold=3).fit_transform(iris.data)
4、定性特征哑编码
函数:sklearn.preprocessing.OneHotEncoder
用法:from sklearn.preprocessing import OneHotEncoder
5、缺失值计算
函数:sklearn.preprocessing.Imputer
用法:from sklearn.preprocessing import Imputer
#缺失值计算,返回值默认为mean(均值)
Imputer().fit_transform(vstack((array([nan, nan, nan, nan]),iris.data)))
通知
本文发布于:2024-01-30 04:03:10,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170655859419071.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |