想要知道中国长征系列火箭发射记录很简单

小白学大数据
• 阅读 611

今天,吉林一号高分03D09星等十六颗卫星发射成功,这又是CZ系列的又一次成功,该批卫星主要用于商业遥感、大气成像等领域。点赞中国航天。关于CZ系列火箭发射记录,没有深入去研究的朋友应该不是很清楚,所以今天我们就给大家分享下,通过python爬虫技术爬取中国长征系列火箭发射记录。 CZ系列运载火箭作为我国的金名片,以优质、高效、低成本等优势闻名海外,那么今天我们就以CZ系列火箭都在哪些发射场发射过,哪个月份是火箭发射的高峰期,哪个发射场承担过最多的火箭发射任务为此次爬虫任务的需求。 首先数据来源我们可以从官网获取:http://www.calt.com/n482/n505/index.html,在获取数据前我们需要先对目标网站进行分析,看下是否有反爬机制,并做好相应的应对措施。经过一系列的分析后发现这个网站访问比较简单,只需要加上代理IP就可以,代理IP的选择虽然比较简单,但是要选到一家代理产品质量好,服务好,后期技术支持给力的并不多,所有这里给有需要的小伙伴推荐亿牛云代理,接下来实现数据获取的代码里面也会使用到他们提供的隧道代理,简单的示例如下:

``` #! -- encoding:utf-8 --

import requests
import random

# 要访问的目标页面
targetUrl = "http://httpbin.org/ip"

# 要访问的目标HTTPS页面
# targetUrl = "https://httpbin.org/ip"

# 代理服务器(产品官网 www.16yun.cn)
proxyHost = "t.16yun.cn"
proxyPort = "31111"

# 代理验证信息
proxyUser = "username"
proxyPass = "password"

proxyMeta = "http://%(user)s:%(pass)s@%(host)s:%(port)s" % {
    "host" : proxyHost,
    "port" : proxyPort,
    "user" : proxyUser,
    "pass" : proxyPass,
}

# 设置 http和https访问都是用HTTP代理
proxies = {
    "http"  : proxyMeta,
    "https" : proxyMeta,
}


#  设置IP切换头
tunnel = random.randint(1,10000)
headers = {"Proxy-Tunnel": str(tunnel)}



resp = requests.get(targetUrl, proxies=proxies, headers=headers)

print resp.status_code
print resp.text```

终于在自己的努力下又增加一次实践的经验,不过获取到数据后还有很多的事情要处理,并不能马上就能得到一份完整干净的数据,所以接下来的过程比较繁杂就不一一的给大家展示了,整理好数据后下次直接分享出来大家了解下。学了爬虫后我们就需要他通过各种难度各异的网站去实践增加我们的经验。

点赞
收藏
评论区
推荐文章
Irene181 Irene181
3年前
3000字 “婴儿级” 爬虫图文教学 | 手把手教你用Python爬取 “实习网”!
1\.为"你"而写这篇文章,是专门为那些"刚学习"Python爬虫的朋友,而专门准备的文章。希望你看过这篇文章后,能够清晰的知道整个"爬虫流程"。从而能够"独立自主"的去完成,某个简单网站的数据爬取。好了,咱们就开始整个“爬虫教学”之旅吧!2\.页面分析①你要爬取的网站是什么?首先,我们应该清楚你要爬去的网站是什么?由于这里我们想要
浅谈字节码增强技术系列2-Asm与Cglib
日常工作中经常使用aop做一些业务功能的开发,但是如果让我解释"面向切面"这四个字的意思,我还是会"十脸懵逼",哈哈。那么今天的文章,作为字节码增强技术系列承上启下的第二篇,就让我们以aop为马,去追逐字节码的星光。
分享如何使用java写个小爬虫
爬虫行业的兴起是大数据时代下必须的产物,大家学习阿爬虫肯定是为了爬取有价值的数据信息。关于爬虫的基础知识我们这里不进行阐述,今天我们就只是进行一个简单的爬虫实践。那首先我们就需要确定下我们的目标网站,这里我们就以一些房产信息的网站为例统计一些信息。关于爬虫中的一系列反爬问题我们也不在这里做深入的了解,都是学习爬虫的必备知识,最简单的就是在访问过程中我们肯定会
Wesley13 Wesley13
3年前
50 行代码教你爬取猫眼电影 TOP100 榜所有信息
对于Python初学者来说,爬虫技能是应该是最好入门,也是最能够有让自己有成就感的,今天,恋习Python的手把手系列,手把手教你入门Python爬虫,爬取猫眼电影TOP100榜信息,将涉及到基础爬虫架构中的HTML下载器、HTML解析器、数据存储器三大模块:HTML下载器:利用requests模块下载HTML网页;HTML解析器:利用re正则表达
Stella981 Stella981
3年前
Rocketlab公司火箭Electron介绍
http://https://en.wikipedia.org/wiki/Rocket\_Labhttps://www.rocketlabusa.com/  Rocketlab(火箭实验室)是一家致力于发射低成本小火箭的美国初创公司。对于他的研究对于我国私营火箭公司的发展具有启发意义。该公司是创立于2006年,2009年第一个在南半球发射火箭的单
Stella981 Stella981
3年前
Python基础练习(一)中国大学定向排名爬取
说好的要从练习中学习爬虫的基础操作,所以就先从容易爬取的静态网页开始吧!今天要爬取的是最好大学网上的2018年中国大学排名。我个人认为这个是刚接触爬虫时用来练习的一个很不错的网页了。在说这个练习之前,给新着手学习爬虫的同学提供一个中国MOOC上北京理工大学嵩天老师的视频,Python网络爬虫与信息提取(https://www.oschina.n
目前明显的高端惯性传感器细分市场
惯性传感器在导航和飞行控制系统、所有类型的商用飞机和卫星轨迹校正和稳定中是必不可少的。用于全球互联网宽带和远程地球监测的微纳米卫星星座,如SpaceX和OneWeb的兴起,正在将卫星惯性传感器的需求推向前所未有的水平。商业火箭发射器子系统对惯性传感器的需求
安居客房源信息获取
最近身边有几个做房产销售的朋友经常在诉苦,找不到客户,没有业绩,所以就比较好奇他们现在的行情,所以今天我们就使用python获取下安居客的一些房源数据。之前分享过很多关于爬虫的实践示例,今天这个也算是实践内容。我们就以户型结构、装修情况、水肥情况进行房源数据获取。爬取数据的通用流程:1、根据url请求页面,获取页面响应对象2、将页面响应对象转化为对象3、定
如何应对亚马逊反爬机制
大家都知道亚马逊是全球最大的购物平台很多商品信息、用户评价等等都是最丰富的。但是对于爬虫来说,亚马逊的反爬机制应该也是数一数二的,想要获取亚马逊数据的人很多,但是真的能成功的确是少数,所以今天小编就手把手带大家,越过亚马逊的各种反爬机制爬取你想要的商品、评论等等有用信息。这里我们可以通过以下一些步骤去实现亚马逊数据的获取。一、使用requests的get请求
深度学习|太空“带货”,在轨放“卫星”!细说“梦天”那些“黑科技”
太空“带货”,在轨放“卫星”!细说“梦天”那些“黑科技”源自:北京日报作者:王鸿良2022年10月31日,长征五号B遥四运载火箭成功把“梦天”实验舱送入太空预定轨道。该实验舱在飞行了大约13个小时后,与我国“天宫”空间站的“天和”核心舱对接
小白学大数据
小白学大数据
Lv1
男 · 亿牛云 · python技术
宁为代码类弯腰,不为bug点提交!
文章
92
粉丝
5
获赞
18