目录
- pyecharts模块
- 简介
- 安装pyecharts
- 测试pyecharts模块
- pyecharts实战:绘制新冠肺炎疫情地图
- 需求分析
- 请求数据
- 提取数据
- 处理数据
- 制作可视化地图
- 设置可视化地图
- 完整代码
- 实现结果
pyecharts模块
简介
Echarts 是一个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。而 Python 是一门富有表达力的语言,很适合用于数据处理。当数据分析遇上数据可视化时,pyecharts 诞生了。
如果想要掌握pyecharts,可以阅读pyecharts中文文档,里面的图表类型和配置项写的非常详细,我就不过多的赘述了
安装pyecharts
安装的命令也非常简单:
pip install pyecharts
安装成功:
测试pyecharts模块
我们可以尝试运行官方文档所给出的几个小例子来测试一下pyecharts模块是否成功安装
打开编辑器,输入并运行以下代码:
from pyecharts.charts import Bar
from pyecharts import options as opts
# 内置主题类型可查看 pyecharts.globals.ThemeType
from pyecharts.globals import ThemeType
bar = (
Bar(init_opts=opts.InitOpts(theme=ThemeType.LIGHT))
.add_xaxis(["衬衫", "羊毛衫", "雪纺衫", "裤子", "高跟鞋", "袜子"])
.add_yaxis("商家A", [5, 20, 36, 10, 75, 90])
.add_yaxis("商家B", [15, 6, 45, 20, 35, 66])
.set_global_opts(title_opts=opts.TitleOpts(title="主标题", subtitle="副标题"))
)
bar.render() #保存为html文件
若此时在当前目录下生成了一个名为render.html的文件
打开此文件,看到如下的图片则证明安装模块成功
pyecharts实战:绘制新冠肺炎疫情地图
需求分析
想要制作全球疫情的地图(空气质量图,人口分布图也是同理),首先需要的就是每个国家的疫情数据,比如人数,治愈数,增长数...... 那么我们该如何获取到这些信息呢?
请求数据
我们发现很多app和网页上都会有最新的疫情信息公布,我选取的数据来源是腾讯地图。
首先打开腾讯地图的疫情信息页,可以发现疫情的信息展现在这一页中
获取这些信息的方法有很多种,可以是用表达式提取,也可以抓包分析,我更喜欢的一种方法是抓包分析。
右击《检查》,点击《network》选项卡并刷新界面,看到加载出来很多数据包,找到里面最像列表的一个list数据包
此时发现,这个list数据包正式我们要提取的数据列表,里面的每个键值对都代表着相应的数据,提取到这些键值对就可以获取到所有的数据信息了,再次回到headers,选项卡下面对应的网址就是我们即将请求的网址,这里我们需要注意的是,这个网址对应的请求是post而不是我们经常使用的get
向网页请求数据:
import requests
url = 'https://api.inews.qq.com/newsqa/v1/automation/foreign/country/ranklist'
response = requests.post(url).text
print(response)
可以看到这个网页并没有设置反爬虫,可以轻松的获取到数据
提取数据
我们刚刚请求到的数据格式是字符格式,并不能被我们直接提取到,必须想将字符格式的数据转换为字典格式才可以开始下一步的提取
resp = json.loads(response) #使用变量resp来接收字典格式的数据
将变量转化为字典格式后,就要开始提取数据了 提取json类型的数据可以使用取出列表元素的方法来提取,即先遍历列表将每个国家的信息提取出来,再分别从这些条信息中提取到我们想要的数据
提取数据:
import json
resp = json.loads(response) #使用变量resp来接收字典格式的数据
for data in resp['data']: #遍历提取每个国家的疫情数据
name = data['name'] #国家名
confirm = data['confirm'] #该国家疫情人数
print(name,confirm)
打印数据:
处理数据
在得到了国家和人数信息之后,还需要将数据存储到字典中才能传入图表中,这就需要我们手动的转换数据,并储存到字典中
map_version = {} #定义空字典
for data in resp['data']: #遍历提取每个国家的疫情数据
name = data['name'] #国家名
confirm = data['confirm'] #该国家疫情人数
map_version[name] = int(confirm) #将国家和人数以键值对的形式传入字典
输出字典:
此时打印出来的字典是标准的字典格式,但是这种格式并不是pyecharts所要求的格式,所以还需要一行代码来进行转换
element = list(map_version.items())
然后就可以输出传入数据的标准格式:
制作可视化地图
在将数据爬取、变换、整理后,所有准备工作都已经做完,下面我们来调用数据实现数据可视化
先写出一个初步的框架来接收内容
from pyecharts.charts import Map,Geo
map = Map().add(series_name="世界疫情分布图", #名称
data_pair=element, #传入数据
maptype='world', #地图类型
)
map.render('map.html') #命名并保存
运行代码,发现当前文件夹下出现了一个map.html文件,双击运行
看到这个图表之后,发现代码的运行并没有问题,但是数据却没有传到地图中,这是由于pyecharts默认的世界地图中的国家名是英文,所以我们就要传入一个字典来替代掉这些英文
设置可视化地图
生成了地图之后,接下来就是要保证地图的正确性和美观,所以我们要来设置世界地图
地图上显示国家名太多,影响可读性,所以设置为不显示国家名
from pyecharts import options
map.set_series_opts(label_opts=options.LabelOpts(is_show=False)) #不显示国家名
按照感染人数的不同,给地图添加不同的颜色
#设置全局配置项
map.set_global_opts(visualmap_opts=options.VisualMapOpts(max_=1100000,is_piecewise=True,pieces=[
{"min": 500000},
{"min": 200000, "max": 499999},
{"min": 100000, "max": 199999},
{"min": 50000, "max": 99999},
{"min": 10000, "max": 49999},
{"max": 9999},]))
代表国家首都的圆点不美观,去掉红点:
map = Map().add(
is_map_symbol_show=False, #不显示标记
)
设置背景颜色并为网页取名:
map = Map(options.InitOpts(bg_color="#87CEFA",page_title='世界疫情分布')).add()
到了现在所有的配置已经完成,但是图表要想显示数据还需要传入一个字典来替换掉默认的英文名,具体实现请看下面的完整代码。
完整代码
import requests
import json
from pyecharts.charts import Map
from pyecharts import options
url = 'https://api.inews.qq.com/newsqa/v1/automation/foreign/country/ranklist'
response = requests.post(url).text
resp = json.loads(response) #使用变量resp来接收字典格式的数据
map_version = {} #定义空字典
for data in resp['data']: #遍历提取每个国家的疫情数据
name = data['name'] #国家名
confirm = data['confirm'] #该国家疫情人数
map_version[name] = int(confirm) #将国家和人数以键值对的形式传入字典
element = list(map_version.items()) #将字典值调整为可以传入地图的格式
name_map = {
'Singapore Rep.': '新加坡',
'Dominican Rep.': '多米尼加',
'Palestine': '巴勒斯坦',
'Bahamas': '巴哈马',
'Timor-Leste': '东帝汶',
'Afghanistan': '阿富汗',
'Guinea-Bissau': '几内亚比绍',
"Côte d'Ivoire": '科特迪瓦',
'Siachen Glacier': '锡亚琴冰川',
"Br. Indian Ocean Ter.": '英属印度洋领土',
'Angola': '安哥拉',
'Albania': '阿尔巴尼亚',
'United Arab Emirates': '阿联酋',
'Argentina': '阿根廷',
'Armenia': '亚美尼亚',
'French Southern and Antarctic Lands': '法属南半球和南极领地',
'Australia': '澳大利亚',
'Austria': '奥地利',
'Azerbaijan': '阿塞拜疆',
'Burundi': '布隆迪',
'Belgium': '比利时',
'Benin': '贝宁',
'Burkina Faso': '布基纳法索',
'Bangladesh': '孟加拉国',
'Bulgaria': '保加利亚',
'The Bahamas': '巴哈马',
'Bosnia and Herz.': '波斯尼亚和黑塞哥维那',
'Belarus': '白俄罗斯',
'Belize': '伯利兹',
'Bermuda': '百慕大',
'Bolivia': '玻利维亚',
'Brazil': '巴西',
'Brunei': '文莱',
'Bhutan': '不丹',
'Botswana': '博茨瓦纳',
'Central African Rep.': '中非',
'Canada': '加拿大',
'Switzerland': '瑞士',
'Chile': '智利',
'China': '中国',
'Ivory Coast': '象牙海岸',
'Cameroon': '喀麦隆',
'Dem. Rep. Congo': '刚果民主共和国',
'Congo': '刚果',
'Colombia': '哥伦比亚',
'Costa Rica': '哥斯达黎加',
'Cuba': '古巴',
'N. Cyprus': '北塞浦路斯',
'Cyprus': '塞浦路斯',
'Czech Rep.': '捷克',
'Germany': '德国',
'Djibouti': '吉布提',
'Denmark': '丹麦',
'Algeria': '阿尔及利亚',
'Ecuador': '厄瓜多尔',
'Egypt': '埃及',
'Eritrea': '厄立特里亚',
'Spain': '西班牙',
'Estonia': '爱沙尼亚',
'Ethiopia': '埃塞俄比亚',
'Finland': '芬兰',
'Fiji': '斐',
'Falkland Islands': '福克兰群岛',
'France': '法国',
'Gabon': '加蓬',
'United Kingdom': '英国',
'Georgia': '格鲁吉亚',
'Ghana': '加纳',
'Guinea': '几内亚',
'Gambia': '冈比亚',
'Guinea Bissau': '几内亚比绍',
'Eq. Guinea': '赤道几内亚',
'Greece': '希腊',
'Greenland': '格陵兰',
'Guatemala': '危地马拉',
'French Guiana': '法属圭亚那',
'Guyana': '圭亚那',
'Honduras': '洪都拉斯',
'Croatia': '克罗地亚',
'Haiti': '海地',
'Hungary': '匈牙利',
'Indonesia': '印度尼西亚',
'India': '印度',
'Ireland': '爱尔兰',
'Iran': '伊朗',
'Iraq': '伊拉克',
'Iceland': '冰岛',
'Israel': '以色列',
'Italy': '意大利',
'Jamaica': '牙买加',
'Jordan': '约旦',
'Japan': '日本',
'Kazakhstan': '哈萨克斯坦',
'Kenya': '肯尼亚',
'Kyrgyzstan': '吉尔吉斯斯坦',
'Cambodia': '柬埔寨',
'Korea': '韩国',
'Kosovo': '科索沃',
'Kuwait': '科威特',
'Lao PDR': '老挝',
'Lebanon': '黎巴嫩',
'Liberia': '利比里亚',
'Libya': '利比亚',
'Sri Lanka': '斯里兰卡',
'Lesotho': '莱索托',
'Lithuania': '立陶宛',
'Luxembourg': '卢森堡',
'Latvia': '拉脱维亚',
'Morocco': '摩洛哥',
'Moldova': '摩尔多瓦',
'Madagascar': '马达加斯加',
'Mexico': '墨西哥',
'Macedonia': '马其顿',
'Mali': '马里',
'Myanmar': '缅甸',
'Montenegro': '黑山',
'Mongolia': '蒙古',
'Mozambique': '莫桑比克',
'Mauritania': '毛里塔尼亚',
'Malawi': '马拉维',
'Malaysia': '马来西亚',
'Namibia': '纳米比亚',
'New Caledonia': '新喀里多尼亚',
'Niger': '尼日尔',
'Nigeria': '尼日利亚',
'Nicaragua': '尼加拉瓜',
'Netherlands': '荷兰',
'Norway': '挪威',
'Nepal': '尼泊尔',
'New Zealand': '新西兰',
'Oman': '阿曼',
'Pakistan': '巴基斯坦',
'Panama': '巴拿马',
'Peru': '秘鲁',
'Philippines': '菲律宾',
'Papua New Guinea': '巴布亚新几内亚',
'Poland': '波兰',
'Puerto Rico': '波多黎各',
'Dem. Rep. Korea': '朝鲜',
'Portugal': '葡萄牙',
'Paraguay': '巴拉圭',
'Qatar': '卡塔尔',
'Romania': '罗马尼亚',
'Russia': '俄罗斯',
'Rwanda': '卢旺达',
'W. Sahara': '西撒哈拉',
'Saudi Arabia': '沙特阿拉伯',
'Sudan': '苏丹',
'S. Sudan': '南苏丹',
'Senegal': '塞内加尔',
'Solomon Is.': '所罗门群岛',
'Sierra Leone': '塞拉利昂',
'El Salvador': '萨尔瓦多',
'Somaliland': '索马里兰',
'Somalia': '索马里',
'Serbia': '塞尔维亚',
'Suriname': '苏里南',
'Slovakia': '斯洛伐克',
'Slovenia': '斯洛文尼亚',
'Sweden': '瑞典',
'Swaziland': '斯威士兰',
'Syria': '叙利亚',
'Chad': '乍得',
'Togo': '多哥',
'Thailand': '泰国',
'Tajikistan': '塔吉克斯坦',
'Turkmenistan': '土库曼斯坦',
'East Timor': '东帝汶',
'Trinidad and Tobago': '特里尼达和多巴哥',
'Tunisia': '突尼斯',
'Turkey': '土耳其',
'Tanzania': '坦桑尼亚',
'Uganda': '乌干达',
'Ukraine': '乌克兰',
'Uruguay': '乌拉圭',
'United States': '美国',
'Uzbekistan': '乌兹别克斯坦',
'Venezuela': '委内瑞拉',
'Vietnam': '越南',
'Vanuatu': '瓦努阿图',
'West Bank': '西岸',
'Yemen': '也门',
'South Africa': '南非',
'Zambia': '赞比亚',
'Zimbabwe': '津巴布韦',
'Comoros': '科摩罗'
}
map = Map(options.InitOpts(bg_color="#87CEFA",page_title='世界疫情分布')).\
add(series_name="世界疫情分布图", #名称
data_pair=element, #传入数据
is_map_symbol_show=False, #不显示标记
maptype='world', #地图类型
name_map=name_map,
)
#设置全局配置项
map.set_global_opts(visualmap_opts=options.VisualMapOpts(max_=1100000,is_piecewise=True,pieces=[
{"min": 500000},
{"min": 200000, "max": 499999},
{"min": 100000, "max": 199999},
{"min": 50000, "max": 99999},
{"min": 10000, "max": 49999},
{"max": 9999},]))
#设置系列配置项
map.set_series_opts(label_opts=options.LabelOpts(is_show=False)) #不显示国家名
map.render('map.html') #命名并保存
实现结果
这个结果可以动态的显示在网页中,可以根据人数来筛选地图的板块,而且方便缩放