一、HTTP1.x存在的问题
Http1.0时Connection无法复用,同一时间一个Connection只能处理一个request。Http1.1引入了Request pipelining来解决这一问题,Request pipelining。
Requestpipeling在FIFO基础上支持同一Connection并发处理多个Request,这里的FIFO是指Http Response发送顺序必须与Request的发送顺序保持一致。
详情前往https://en.wikipedia.org/wiki/HTTP_pipelining。
然而它并不完美,仍然有HOL Blocking问题。
所谓的行首阻塞是因于FIFO的原因,导致后面的Reponse由于其之前的Response由于资源抢占等原因无法输出而Block。
由于这样的限制,HTTP/1.0及HTTP/1.1时代需要对Server端创建多个连接,通过提高并发度来降低Latency。
另外Http2支持Header压缩,而Header压缩在此前是不支持的,此前一般是对body进行gzip压缩。
二、HTTP2的解决方案
HTTP2在协议上真正要求不同的Request可以在同一个Connection上交错进行,真正做到多路复用。所带来的好处显而易见,更少的Connection,更好的并发,更高效的网络资源利用。
支持流量控制及请求优先级,使得重要的请求优先得到处理,这一点对于应用来说是个大的优化点,以体验为目标,对不同的请求划分优先级以及流量控制,比如异步加载的内容重要性低,可以设置较低优先级。但是个人觉得这一点要做好很难,要依赖于浏览器,应用服务器,应用程序三个地方都有非常好的实现,是否是合理的实现还需要好的度量平台,视效果而定。
Server Push机制支持Server端应用程序可以预先输出内容暂未需要的内容,从而降低潜在的延时。举例:可以把css内容与html内容同步输出,而不需要等待html完全输出后,浏览器再加载css。
支持对Http Header进行压缩。
高效的二进制格式(相对文本格式)传输。
三、原理分析
将通过Jetty源码来分析Jetty如何支持Http2的
Jetty源码地址:git://git.eclipse.org/gitroot/jetty/org.eclipse.jetty.project.git
A. Jetty.io&Jetty.server主要类结构图:
Jetty.io主要是对EndPoint及Connection的定义和基本实现,Jetty.server实现了络的交互过程,包装了Socket,Channel,多路复用等实现。这两个包一起对应用程序端或协议格式端提供了网络交互过程,从而实现网络交互过程对于协议及应用的透明。
B. 与Http2协议的结合:
Jetty Basic如上图已经介绍,HTTP2的实现只扩展ServerConnection,ServerConnectionFactory即可,相当于Jetty内核上增加插件,扩展性好,另外也不需要关注网络细节
C. 对重点类的重点解读:
类名
职责
详细介绍
HTTP2Flusher
Frame输出控制类
重点说明:
HTTP2Flusher类中保存了各种Entry队列,Entry中包含Frame数据,其对应的Stream引用,以及对应的CallBack。
主要属性:
Queue
ArrayQueue
主要方法:
window(), prepend(), append(), remove()等都是针对如上Queue的操作
process()真正执行Frame的输出。首先执行Window队列,将Window的窗口设置数据写入到对应的Stream或Session中;然后执行WindowsSize的限流逻辑,若对应的Session或Stream当前WindowSize不大于0,则不发送Frame,否则将WindowSize减去当前Frame的Size,应用于下次限流。最后调用Session中的EndPoint类的write方法将Frame输出
FlowControlStrategy
流控接口定义
重点说明:
其实现类主要实现了依据发送或接收的Frame的数据length,依据固定策略改写Session及Stream的WindowSize,以及Stream另一端EndPoint对于WindowSize的要求,完成输科和输出限流的完整逻辑
Http2Session
ISession的实现类
主要属性:
1. EndPoint endPoint, 表征了此Session的网络端点,对于网络的操作通过调用endPoint的方法实现
2. Generator generator,用于按需生成各种格式的Frame,Frame被最终写入endPoint中
3. Listener listener,Session中被动接口的逻辑实现,面向接口编程,支持多种实现
4. FlowControlStrategy flowControl前面已经讲述
5. HTTP2Flusher flusher前面也已讲述
主要方法:
1.newStream(),创建新的流对象,以及HeaderFrame,将流写入Session的流缓存中,流缓存通过ConcurrentHashMap实现;并将流和HeaderFrame追加到Http2Flusher对象的ArrayQueue中;
2. push(), settings(), ping(), reset()的实现雷同,最终都是将对应格式的Frame放入Http2Flusher的ArrayQueue中。Http2Flusher是真正输出Frame的控制类。
3. onData(),接收DataFrame时的处理方法,首先更新当前FlowControl对象中的WindowSize,并执行Window限流逻辑,若未超出限流控制,则调用Stream的处理方法处理接收到的数据,否则直接丢弃当前Frame,最后将WindowSize恢复之前值
4. onHeaders()接收HeaderFrame时的处理方法,抽象方法,交由子类实现
5. onPriority(),Jetty默认未支持客户端发起的对优先级的支持
6. onReset(), onSettings(),onPing(),onGoAway(),onWindowUpdate(),onConnectionFailure()执行对应逻辑,通过Listener接口,支持对于这些请求数据的自定义实现
HTTP2Stream
IStream的实现类
重点说明:
实现了IStream的主动接口及其被动接口Stream.Listener。其主动接口一般是通过调用对应的ISession接口实现
HTTP2ServerSession
继承HTTP2Session,实现Server端Session特有的逻辑
重点说明:
特有逻辑包括ServerSession在接收onPreface时,需回复一个Settings Frame;在接收Headers请求时需创建RemoteStream对象;当接收ServerPush时,报出异常,HTTP2中Client不能向Server发送Server Push。
DataFrame
HTTP2协议的各种数据格式的封闭
重点说明:
针对不同的数据格式,如ServerPush,Preface等,有对应的子类实现
DataGenerator
构建如上的DataFrame
重点说明:
对于不同的数据格式有不同的子类实现
parser包
对接收的数据格式进行解析
重点说明:
对接收的数据格式进行解析
四、如何实现HTTP2
HTTP2还未被所有浏览器所支持,因此在实施时要支持多种协议并存.
需要Http Server端支持HTTP2协议,据我所知Tengine尚未支持,已支持的Server列表https://github.com/http2/http2-spec/wiki/Implementations。
若要充分利用HTTP2的所有优点,需要在应用程序端(甚至是JAVA)的输出行为作智能处理,如通过大数据来分析哪些资源适合用Server Push并行输出,哪些资源优先级可以隐藏低,如何在性能与复杂度及维护成本之间做出平衡,需要业内更多的人努力和尝试,