URL请求过程中,浏览器或程序会按照标准的HTTP协议进行处理,下面以百度访问为例,我们可以用curl -v [https://www.baidu.com](https://www.oschina.net/action/GoToLink?url=https%3A%2F%2Fwww.baidu.com%2F)
来分析,会发现总共有4个处理阶段。
1、域名解析服务器IP
* Rebuilt URL to: [https://www.baidu.com/*](https://www.oschina.net/action/GoToLink?url=https%3A%2F%2Fwww.baidu.com%2F*) Trying 14.215.177.38...
通过域名解析获取服务器ip地址,原理和 nslookup www.baidu.com
相同,dns服务器返回两个IP地址,然后随机选用服务器IP访问。
2、SSL协商请求处理
* Connected to www.baidu.com (14.215.177.38) port 443 (#0)
通过443端口进行https加密协议处理。
3、根据URL向服务器发起****请求
> GET / HTTP/1.1
> Host: www.baidu.com
> User-Agent: curl/7.54.0
网站会检查当前请求的类型,例如是不是浏览器访问及其版本等。User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.1276.73 Safari/537.36
,就是一个标准的浏览器标示。
4、服务器响应请求,发回网页内容
< HTTP/1.1 200 OK
< Connection: keep-alive
< Set-Cookie: BDORZ=27315; max-age=86400; domain=.baidu.com; path=/
<
<!DOCTYPE html>...</html>
服务器响应终端请求,同时返回cookie来标识用户,终端如果接受并使用该cookie继续访问,服务器会认为终端是一个已标识的正常用户,可以获取需要的相关数据啦。