本文中的波士顿房价问题所需数据,在晚上是公共资源,将该数据存储到网盘中,分享就不存放到CSDN上了,CSDN的收费过于离谱
链接:
提取码:tg5n
以下为波士顿房价数据中的各个字段信息说明
亦或者使用包自带的数据,如下:
from sklearn.datasets import load_boston
dataset=load_boston()print(dataset)
将上面的信息再粘贴一次,描述以下波士顿数据字段的说明信息
首先我们基于上述波士顿数据,来预测房价,由于波士顿数据具有多个维度,且上述的维度过多,故我们将暂时只基于影响最为明显的维度来预测
有时间我来总结以下pandas工具包,一直帮别人看代码,看书中有很多重要的都是介绍pandas的,但是一直没有系统的总结,后续有时间我来梳理以下pandas工具包,现在我们使用pandas包来辅助分析我们的波士顿数据。
import pandas as pd
dataframe=pd.DataFrame(dataset['data'])print(dataframe)
lumns=dataset['feature_names']
print(dataframe)
dataframe['price']=dataset['target']
print(dataframe)
即分析数据中各个维度中对于房价的影响是最大的维度是什么?
以下使用的方式是采用手工的方式确定的,在大数据和人工智能中存在一定的算法做到自动推算出对房价影响最大的显著特征,由于此处是一个切入点话题,故在此将问题简单化
4.1 获取房价中的显著特征矩阵
df_corr()
print(df_corr)
4.2 使用matplotlib包显示特征举证
%matplotlib inline
import seaborn as snssns.(),annot=True,fmt='.1f')
在4的分析中我们发现卧室的个数与房屋价格成正相关
X_rm=dataframe['RM'].values
Y=dataframe['price'].values
rm_to_price={r:y for r,y in zip (X_rm,Y)}
print(rm_to_price)
import matplotlib.pyplot as pltplt.scatter(X_rm,Y)
plt.show()
当需要咨询房价是,输入RM信息,在上述的对应关系中查找,如果有则返回该信息,如果没有则返回该RM信息的相关信息值得算式值
import numpy as np
def find_price_by_similar(history_price,query_x,topn=3):most_similar_items=sorted(history_price.items(),key=lambda e:(e[0]-query_x)**2)[:topn]print(most_similar_items)most_similar_prices=[price for rm,price in most_similar_items]average_pricean(most_similar_prices)return average_pricefind_price_by_similar(rm_to_price,4)find_price_by_similar(rm_to_price,7)
代码是给人看的,只是偶尔给机器运行一下
本文发布于:2024-02-02 03:46:22,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170681740341158.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |