【机器学习】基于多变量特征的乳腺癌自动诊断

阅读: 评论:0

【机器学习】基于多变量特征的乳腺癌自动诊断

【机器学习】基于多变量特征的乳腺癌自动诊断

多变量特征实现乳腺癌诊断

本文立足于通过多分类模型实现乳腺癌诊断,基于WDBC(Breast Cancer Wisconsin ( Diagnostic) Data Set (WDBC))数据集进行代码实现。

数据集简介

数据集链接:WDBC乳腺癌数据集
该数据集是根据乳房肿块的细针抽取采样的数字化图像化后计算出来的,它描述了图像中肿瘤细胞核的特征。

  • 数据集特征:多变量的
  • 样本容量:569(357条良性benign,212条恶性malignant)
  • 每条样本特征数:32 (ID,标签,30个实值输入特征)
  • 相关任务:分类

其中数据集样本特征中除ID和标签外,主要包含半径、纹理、周界、面积等等细胞核实值特征,共计30个。在此就不再一一介绍,均放置于总体程序压缩包中。

以下以Random Forest模型举例:

数据读取

# 读取数据
import numpy as np
import pandas as pd
from sklearn import preprocessing
# 原始数据以csv格式读取
dataset = pd.read_csv(r'C:UsersLenovoDesktopanalysewdbc.data.csv',header=None)
# 标签化diagnosis列
encoder = preprocessing.LabelEncoder().fit(dataset['diagnosis'])
dataset['diagnosis'] = ansform(dataset['diagnosis'])
print('标签: %s' % encoder.classes_)

读取数据

# 获取数据
X = np

本文发布于:2024-02-02 00:28:08,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/170681036440195.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:乳腺癌   多变   特征   机器
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23