python机器学习及应用（Python机器学习5.1）

如此不安 2023-05-13 17:11:47

5.1读取“银行贷款审批数据.xlsx”表，自变量为x1~x15，决策变量为y（1-同意贷款，0-不同意贷款），其中x1~x6为数值变量，x7~x15为名义变量，请对x1~x6中存在的缺失值用均值策略填充，x7~x15用最频繁值策略填充。

[知识点及要求]缺失值填充

示例代码如下：

# -*- coding: utf-8 -*- import pandas as pd data = pd.read_excel("银行贷款审批数据.xlsx") from sklearn.preprocessing import Imputer #均值填充 d1 = data.iloc[:,0:6] imp = Imputer(missing_values='NaN',strategy='mean',axis=0) #按列填充 imp.fit(d1) fd = imp.transform(d1) #最频繁值填充 d2 = data.iloc[:,6:-1] imp1 = Imputer(missing_values='NaN',strategy="most_frequent",axis=0) imp1.fit(d2) fd1 = imp1.transform(d2)

运行结果如下图：

python机器学习及应用（Python机器学习5.1）(1)

更多内容请见网易云课堂Python大数据学习吧：

https://study.163.com/provider/480000002230206/index.htm?share=2&shareId=480000002230206

展开全文

免责声明：本文仅代表文章作者的个人观点，与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺，请读者仅作参考，并自行核实相关内容。文章投诉邮箱：anhduc.ph@yahoo.com

秒懂生活

python机器学习及应用（Python机器学习5.1）

猜您喜欢

成本法转权益法会计处理简单易懂（成本法转为权益法核算时要如何处理）

梦里梦外都是你原版叫什么歌（梦里梦外都是你）

miss大小姐收入（虎牙一姐Miss入职新浪）

白颈乌鸦和红嘴山鸦对比（黑尾地鸦百科知识）

元江芒果节欢迎你（元江正式向你发出邀请）

清明三天假采茶挖笋攻略（春分至采茶忙深山茶园有）

神奇宝贝剑盾小智（小智喷火龙回归）

热门推荐

排行榜