基于Python(Pandas+Pyecharts)实现全国热门旅游景点数据可视化【500010037】

阅读: 评论:0

基于Python(Pandas+Pyecharts)实现全国热门旅游景点数据可视化【500010037】

基于Python(Pandas+Pyecharts)实现全国热门旅游景点数据可视化【500010037】

导入模块

import jieba
import pandas as pd 
from collections import Counter
from pyecharts.charts import Line,Pie,Scatter,Bar,Map,Grid
from pyecharts.charts import WordCloud
from pyecharts import options as opts
from pyecharts.globals import ThemeType
from pyecharts.globals import SymbolType
from pyechartsmons.utils import JsCode

数据说明

全国热门旅游景点数据,包含城市、名称、星级、评分、价格、销量、省/市/区、坐标、简介、是否免费、具体地址等字段信息

字段:城市、名称、星级、评分、价格、销量、省/市/区、坐标、简介、是否免费、具体地址

字段数据类型
城市string
名称string
星级string
评分float
价格float
销量int
省/市/区string
坐标string
简介string
是否免费bool
具体地址string

数据处理

读取数据

df = pd.read_excel(r'./data/旅游景点.xlsx')
df.head()

查看索引、数据类型和内存信息

df.info()

查看数值型列汇总统计

df.describe()

查看销量为0的行

df.loc[df['销量']==0,:].head()


一共有123行。

去除销量为0的行数据

df = df[df['销量']!=0]


去除后还剩下2320行数据。

统计各列空值

df.isnull().sum()


星级存在1407个空值,简介37个空值,具体地址2个空值,其他列不存在空值,数据还算比较完整。

将缺失值用‘未知’填充

df.fillna('未知', inplace=True)

按销量排序

df.sort_values('销量', ascending=False).head()

数据可视化

销量前20热门景点数据

假期出行数据全国地图分布


华东、华南、华中等地区属于国民出游热点地区,尤其是北京、上海、江苏、广东、四川、陕西等地区出行比较密集。

各省市4A-5A景区数量柱状图

各省市4A-5A景区数量玫瑰图

各省市4A-5A景区数量阴影散点图

各省市4A-5A景区地图分布


江苏、安徽、河南、北京、湖北等地区4A、5A级景区数量比较多。

门票价格区间占比玫瑰图

门票价格区间数量散点图

景点简介词云

本文发布于:2024-01-28 06:47:43,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/17063956665566.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:旅游景点   热门   数据   全国   Pandas
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23