python数据导入pandas

阅读: 评论:0

python数据导入pandas

python数据导入pandas

导入pandas库

import pandas as pd

1.导入csvtxt文件数据

常用参数:

filepath_or_buffer:文件路径(必填,其他参数按需求填写)

sep:指定分隔符,默认逗号','。

header:指定第几行作为表头。默认为0(即第1行作为表头),若没有表头,需设置header=None,可以是int或list。

names:指定列的名称,用list表示,默认None。

index_col:指定行索引,可以是一列或多列,默认None。

usecols:需要读取的列,可以使用列序列也可以使用列名,默认None。

prefix:给列名添加前缀。如prefix=x,会出来X0,X1,....,默认None。

skiprows:需要忽略的行数(从文件开始处算起),或需要跳过的行号列表(从0开始),默认None。

skipfooter:需要忽略的行数(从最后一行开始算)

nrows:需要读取的行数(从文件头开始算起),默认None。

encoding:编码方式,乱码时使用,默认None。

例1:导入文件data.csv中数据:

例2:导入文件中数据:

2.导入excel数据

常用参数:

io:excel文件路径(必填,其他参数按需求填写)

sheet_name:需要导入数据的工作表表名,可以是intstringlist,None导入所有工作表数据,默认0。

参数header、names、index_col、usecols、skiprows、nrows、skip_footer、encoding的用法与pd.read_csv相同。

例:导入文件data.xlsx中数据:

3.导入mysql数据

方法一:使用pymysql

import pymysql

conn&#t(host="服务器地址",port=端口,user="用户名",passwd="密码",db="数据库名")

sql="select * from 表名;"

df&#ad_sql(sql,conn)

例:导入数据库test下cities表中数据

方法二:使用sqlalchemy

from sqlalchemy import create_engine

engine=create_engine('mysql+pymysql://用户名:密码@服务器地址:端口/数据库名')

sql='select * from 表名;'

df&#ad_sql(sql,engine)

例:导入数据库test下cities表中数据

4.导入html表格数据

常用参数:

io:目标网址

match:要匹配的正则表达式,默认'.+'。

flavor:解析器,默认None。

header:指定表头,默认None。

skiprows:跳过的行默认None。

attrs:属性,比如 attrs = {‘id’: ‘table’}。

parse_dates:解析日期,默认False。

encoding:编码方式,乱码时使用,默认None。

例:爬取财富中文网中2019年财富世界500强排行榜

本文发布于:2024-01-28 07:23:10,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/17063977935756.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   python   pandas
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23