用pandas清洗数据具体步骤(基础篇二)

阅读: 评论:0

用pandas清洗数据具体步骤(基础篇二)

用pandas清洗数据具体步骤(基础篇二)

我们接着上一篇来做。我们可以先读取excel数据。然后进行以下操作:

选取数据和更改行索引和列索引

ad_excel('d://new.xlsx')
tt.columns=["m"+str(x).replace('/','') for x lumns ]
tt.index=tt.ix[:,0].values  # 将第一列作为索引。不需要进行重新索引。但是不能出现空值。
tt=tt.iloc[:,1:]  # 疏忽了,这里需要去掉第一列.因为我已经把这一列作为索引了
python还有很多函数来更改行索引和列索引。但是有很多需要注意的地方

例如rename更改索引名字要注意是行索引还是列索引?

reindex重新设定索引,则需要注意重新设定的索引是否能包含原有的索引?

列数据的互相计算比较方便。索引为了方便对数据进行处理。我需要进行行列转置。这里需要注意的有3个问题:

1.这里我要计算资产负债率的时候需要表现2位小数,而且后面的百分比显示也只能显示2位小数。所以这里需要使用format函数;

2.format以后显示的都是字符,如果要进行进一步的计算,需要把字符重新转换成数字;

3.我只需要查看年底也就是12月31日的数据。所以用loc抽取12月的数据进行处理。

行列转置;书籍类型转换;选取特定列索引

<

本文发布于:2024-02-01 16:10:04,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/170677500437840.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:具体步骤   基础   数据   pandas
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23