UCI心脏病数据集二分类预测(LightGBM + 贝叶斯参数调优 + plotly模型评价可视化)

阅读: 评论:0

UCI心脏病数据集二分类预测(LightGBM + 贝叶斯参数调优 + plotly模型评价可视化)

UCI心脏病数据集二分类预测(LightGBM + 贝叶斯参数调优 + plotly模型评价可视化)

目录

一、导入数据

二、数据预处理 探索性数据分析

三、特征工程

 四、模型训练,参数调优

五、模型评价


一、导入数据

# 导入数据集
import pandas as pd
data = pd.read_csv(r"C:UsersTerryDesktopheart.csv")
data

 数据集有1025行,14列。每行表示一个病人。13列表示特征,1列表示标签(是否患心脏病)

%%html
<style>table {display: inline-block}
</style>

看一下字段名的含义:

二、数据预处理 探索性数据分析

查看缺失值:没有缺失值

# 缺失值的检查
data.isna().sum()

 

import missingno as msno
import matplotlib.pyplot as plt
Params['font.sans-serif']=['Roboto'] 
msno.matrix(data, labels=True)

# 热力图绘制
def enhanced_corr_heatmap(data):"""绘制数据皮尔逊相关性系数的热力图(下三角显示)"""# 导包import numpy as npimport matplotlib.pyplot as pltimport seaborn as sns# matplotlib的图像大小和字体显示设置plt.figure(figsize=(10, 8)) # 可同比例放大Params['font.sans-serif'] = ['Roboto'] # 美化字体Params['axes.unicode_minus'] = False # 显示负数#保留下三角:data_corr = ()mask = np.zeros_like(data_corr)for i in range(1,len(mask)):for j in range(0,i):mask[j][i] = True # 上三角就mask[i][j] = True# 绘图sns.heatmap(data_corr,annot=True, f

本文发布于:2024-01-28 23:55:32,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/170645733711221.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:心脏病   模型   参数   评价   数据
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23