本文分享自天翼云开发者社区@《聊聊Docker镜像》,作者: AE86上山了。
前言
回顾前面: 为什么需要Docker? Docker入门为什么可以这么简单?
在上篇也同样留下一个问题:我们知道Tomcat运行起来需要Java的支持,那么我们在DockerHub拉取下来的Tomcat镜像是不是也有Java环境呢? 所以,这篇主要来讲讲Docker镜像相关的知识点!
一、简单了解Dockerfile Dockerfile是用来构建Docker镜像的文件,是由一系列命令和参数构成的脚本。 简单来说:Dockerfile是镜像的源码。 上一篇我们pull了一份Tomcat的镜像,我们也可以去看看它的Dockerfile长的什么样: 我们随便点进去一个看一下:
我们在Dockerfile的第一行就可以发现FROM openjdk:8-jre,所以可以确定的是:在DockerHub拉取下来的Tomcat镜像一定有Java环境! 在这里我们先不说如何阅读/编写Dockerfile文件,先了解到Dockerfile是镜像的源码即可 简单来说:通过Dockerfile文件可以知道我们拉取下来的镜像究竟是怎么构建的。
二、解除镜像的疑惑 我们知道Docker Hub有很多常用的镜像,比如说Centos。我们去pull一个下来看看Docker中的Centos长啥样:
我们可以发现的是:Tomcat的SIZE竟然比Centos还要大!但按我们常规的想法,Centos的镜像可能是3或4GB(现在200M),Tomcat的镜像可能就200M(现在400M)。这是为什么呢? 如果我们在pull的时候观察得比较仔细的话,可以发现pull会拉下很多层镜像: 完全pull下来的之后,我们如果使用docker images只能查看到最终的镜像: 如果我们使用docker images -a命令的话,可以把中间层镜像都查出来: 理想效果:(在镜像列表里边除了tomcat和centos应该还夹杂着名为的镜像) 遗憾的是:博主一直没测出效果来,也就是我的镜像列表里没有的镜像(怀疑是版本的问题,我的版本是Docker版本是18.09.1,Centos的版本是CentOS Linux release 7.3.1611 。如果知道具体原因的不妨在评论区下告诉我) Emmm,我们可以使用history命令来看看,可以发现Tomcat包含很多个镜像层 还可以发现一点:Dockerfile有多少条命令,那就有多少个镜像层(不信你数数) 说了那么多,就想让大家知道:我们拉取下来的镜像实际上是由很多中间层镜像组成的。 再结合我们上一篇Docker入门为什么可以这么简单?,在解决Tomcat启动时一直卡住问题时,能够发现的是,我们可以使用cd, ls等基础命令,但无法使用vi命令(需要我自己去下载)。 我们可以推断出,pull下来的镜像由很多层镜像组成【这些镜像都是精简过的(甚至连vi命令都不支持)】 因为Tomcat镜像要的基础环境比Centos镜像要多,所以Tomcat镜像的SIZE比Centos要大
三、Docker镜像的特点 关于Docker镜像,有以下特点: 由Dockerfile生成 呈现层级结构 每层镜像包含:镜像文件以及镜像json元数据信息 3.1镜像呈现层级结构 联合文件系统(UnionFS)是实现Docker镜像的技术基础。在Docker中一般使用是AUFS(Another Union File System或Advanced Multilayered Unification File System)【具体还是得看宿主机用的什么系统】。 在搜索中文资料的时候,常常会发现有类似的解释: “AUFS是一种 Union FS, 简单来说就是“支持将不同目录挂载到同一个虚拟文件系统下的文件系统”, AUFS支持为每一个成员目录设定只读(Rreadonly)、读写(Readwrite)和写(Whiteout-able)权限。Union FS 可以将一个Readonly的Branch和一个Writeable的Branch联合在一起挂载在同一个文件系统下”。 看得我一头雾水….后来去官方文档介绍AUFS: AUFS is a union filesystem, which means that it layers multiple directories on a single Linux host and presents them as a single directory. These directories are called branches in AUFS terminology, and layers in Docker terminology 说白了,还是可以理解成:Docker的镜像的基础是联合文件系统,它支持将文件系统中的修改信息作为一次提交,并层层叠加,外界看到的是最外层的镜像。(比如外界只看到Tomcat镜像,而中间叠加了很多层镜像) (这里只是拿AUFS说明,Docker实际上支持很多存储驱动,比如还有devicemapper,overlay2(Ubuntu的14.04.4或更高版本,16.04或更高版本), overlay,zfs
3.1.1镜像继承(共享) Docker镜像可以通过分层来进行继承。 例如,hello-world的Dockerfile镜像FROM scratch镜像,scratch在Docker中是一个基础镜像 FROM scratch COPY hello / CMD ["/hello"] Centos的Dockerfile镜像也是FROM scratch镜像: FROM scratchADD centos-7-docker.tar.xz /LABEL org.label-schema.schema-version="1.0" \ org.label-schema.name="CentOS Base Image" \ org.label-schema.vendor="CentOS" \ org.label-schema.license="GPLv2" \ org.label-schema.build-date="20181205"CMD ["/bin/bash"] 那么Centos镜像和hello-world共享同一个基础镜像层scratch,提高了存储效率。 再说个例子,比如我们有一个Centos镜像,这个镜像大小是202M。然后,我们基于Centos镜像手动往里边添加一个Tomcat(假设这个Tomcat的大小是300M),生成一个镜像,总大小就是502M了。 如果仅仅是单纯的累加这两个镜像的大小:202M+502M=704M,但是由于镜像复用的存在,实际占用的磁盘空间大小是:202M+300M=502M AUFS uses the Copy-on-Write (CoW) strategy to maximize storage efficiency and minimize overhead。
3.2json文件 Docker每一层镜像的json文件,都扮演着一个非常重要的角色,其主要的作用如下: 记录 Docker 镜像中与容器动态信息相关的内容 记录父子 Docker 镜像之间真实的差异关系 弥补 Docker 镜像内容的完整性与动态内容的缺失 Docker镜像的json文件可以认为是镜像的元数据信息