Registry 容器镜像服务端细节 - HelloWorld开发者社区

引言

通常我们在使用集群或者容器的时候，都会接触到存储在本地的镜像，也或多或少对本地镜像存储有一定的了解。但是服务端的镜像存储细节呢？本文主要介绍容器镜像的服务端存储结构，对于自建镜像服务或是对容器镜像底层原理或优化有兴趣的同学可以了解一下。

镜像细节

在了解服务端之前，我们来了解一下客户端的镜像容器的存储环境。

联合文件系统 UnionFS(Union File System)

Docker的存储驱动的实现是基于UnionFS。简单列举一下UnionFS下存储镜像的一些特点。

首先，UnionFS是一个分层的文件系统。一个Docker镜像可能有多个层组成（注意他们是有顺序的）。

其次，只有顶层是可写的，其它层都是只读的。这样的机制带来的好处是镜像层可以被多个镜像共享。对于Docker镜像来说，所有层都是只读的。当一个镜像运行时，会在该镜像上增加一个容器层。十个相同的镜像启动，仅仅是增加十个容器层。销毁容器时也仅仅是销毁一个容器层而已。

UnionFS是一个分层的文件系统。一个Docker镜像可能有多个层组成（注意他们是有顺序的）。
只有顶层是可写的，其它层都是只读的。这样的机制带来的好处是镜像层可以被多个镜像共享。对于Docker镜像来说，所有层都是只读的。当一个镜像运行时，会在该镜像上增加一个容器层。十个相同的镜像启动，仅仅是增加十个容器层。销毁容器时也仅仅是销毁一个容器层而已。
- 当容器需要读取文件的时候：从最上层镜像开始查找，往下找，找到文件后读取并放入内存，若已经在内存中了，直接使用。(即，同一台机器上运行的docker容器共享运行时相同的文件)。
- 当容器需要添加文件的时候：直接在最上面的容器层可写层添加文件，不会影响镜像层。
- 当容器需要修改文件的时候：从上往下层寻找文件，找到后，复制到容器可写层，然后，对容器来说，可以看到的是容器层的这个文件，看不到镜像层里的文件。容器在容器层修改这个文件。
- 当容器需要删除文件的时候：从上往下层寻找文件，找到后在容器中记录删除。即，并不会真正的删除文件，而是软删除。这将导致镜像体积只会增加，不会减少。

由此可以思考很多安全和镜像优化上的问题。

在镜像构建中记录敏感信息然后再下一个构建指令中删除安全吗？（不安全）
在镜像构建中安装软件包然后再下一个构建指令中清理软件包能减小镜像体积吗？（并不能）

UnionFS一般有两种实现方案：1. 基于文件实现。文件整体的覆盖重写。2. 基于块实现，对文件的修改只修改少量块。

镜像的服务端存储细节

提供一个镜像元信息(manifest)用于参考：

➜  ~ docker pull ccr.ccs.tencentyun.com/paas/service-controller:7b1c981c7b1c981c: Pulling from paas/service-controllerDigest: sha256:e8b84ce6c245f04e6e453532d676f7c7f0a94b3122f93a89a58f9ae49939e419Status: Image is up to date for ccr.ccs.tencentyun.com/paas/service-controller:7b1c981cccr.ccs.tencentyun.com/paas/service-controller:7b1c981c


{   "schemaVersion": 2,   "mediaType": "application/vnd.docker.distribution.manifest.v2+json",   "config": {      "mediaType": "application/vnd.docker.container.image.v1+json",      "size": 4671,      "digest": "sha256:785f4150a5d9f62562f462fa2d8b8764df4215f0f2e3a3716c867aa31887f827"   },   "layers": [      {         "mediaType": "application/vnd.docker.image.rootfs.diff.tar.gzip",         "size": 44144090,         "digest": "sha256:e80174c8b43b97abb6bf8901cc5dade4897f16eb53b12674bef1eae6ae847451"      },      {         "mediaType": "application/vnd.docker.image.rootfs.diff.tar.gzip",         "size": 529,         "digest": "sha256:d1072db285cc5eb2f3415891381631501b3ad9b1a10da20ca2e932d7d8799988"      },      {         "mediaType": "application/vnd.docker.image.rootfs.diff.tar.gzip",         "size": 849,         "digest": "sha256:858453671e6769806e0374869acce1d9e5d97f5020f86139e0862c7ada6da621"      },      {         "mediaType": "application/vnd.docker.image.rootfs.diff.tar.gzip",         "size": 170,         "digest": "sha256:3d07b1124f982f6c5da7f1b85a0a12f9574d6ce7e8a84160cda939e5b3a1faad"      },      {         "mediaType": "application/vnd.docker.image.rootfs.diff.tar.gzip",         "size": 8461461,         "digest": "sha256:994dade28a14b2eac1450db7fa2ba53998164ed271b1e4b0503b1f89de44380c"      },      {         "mediaType": "application/vnd.docker.image.rootfs.diff.tar.gzip",         "size": 22178452,         "digest": "sha256:60a5bd5c14d0f37da92d2a5e94d6bbfc1e2a942d675aee24f055ced76e8a208f"      },      {         "mediaType": "application/vnd.docker.image.rootfs.diff.tar.gzip",         "size": 22178452,         "digest": "sha256:60a5bd5c14d0f37da92d2a5e94d6bbfc1e2a942d675aee24f055ced76e8a208f"      }   ]}

Registry 容器镜像服务端细节

*接下来是本文最为重要的内容，通过对上面这张图的理解，我们就可以了解到Registry服务端存储的细节。*

图中蓝色的是服务端存储的目录。文字是目录名称，这个名称是固定的。
图中紫色的是服务端存储的文件。文字是文件名称，link文件的内容都是一个sha256的哈希值。data文件存储了真正的元文件和镜像层。
图中橙色的是服务端的动态目录。目录的名称和仓库名、镜像标签或者sha256有关的。

整个图是从上往下的。举个例子，我们上面描述的manifest如果是存储在服务端的话（文件哈希:sha256:e8b84ce6c245f04e6e453532d676f7c7f0a94b3122f93a89a58f9ae49939e419）。它存储的路径应该是：/docker/registry/v2/blobs/sha256/e8/e8b84ce6c245f04e6e453532d676f7c7f0a94b3122f93a89a58f9ae49939e419/data。对应图上应该是沿着左侧一直向下。

我们开始拆解分析其结构细节。

左侧是镜像所有内容的实际存储，其几乎占据的绝大部分储存的空间，包括了镜像层和镜像元信息Manifest。
- 例如镜像层sha256:e80174c8b43b97abb6bf8901cc5dade4897f16eb53b12674bef1eae6ae847451的存储位置，应该在/docker/registry/v2/blobs/sha256/e8/e80174c8b43b97abb6bf8901cc5dade4897f16eb53b12674bef1eae6ae847451/data

Registry 容器镜像服务端细节

右侧是镜像元信息存储的地方。镜像元信息是按照命名空间和仓库名称分两级目录存储的。
- 每一个仓库下面又分为_layers、_manifests两个部分
- _layers负责记录该仓库引用了哪些镜像层文件。
- _manifests负责记录镜像的元信息
- - revisions包含了仓库下曾经上传过的所有版本的镜像元信息
  - tags包含了仓库中的所有标签
  - - current记录了当前标签指向的镜像
    - index目录则记录了标签指向的历史镜像。
- 对上述提供的manifest计算sha256，会得到元信息文件的哈希值sha256:e8b84ce6c245f04e6e453532d676f7c7f0a94b3122f93a89a58f9ae49939e419，这个元信息的存储位置应该在/docker/registry/v2/blobs/sha256/e8/e8b84ce6c245f04e6e453532d676f7c7f0a94b3122f93a89a58f9ae49939e419/data

举个镜像下载的例子：

我们想要知道ccr.ccs.tencentyun.com/paas/service-controller:7b1c981c这个镜像现在的元信息，如何在服务端存储中找到。

找到/docker/registry/v2/paas/service-controller/_manifests/tags/7b1c981c/current/link文件。里面有元信息的sha256信息。内容应该是sha256:e8b84ce6c245f04e6e453532d676f7c7f0a94b3122f93a89a58f9ae49939e419
找到实际存储文件（/docker/registry/v2/blobs/sha256/e8/e8b84ce6c245f04e6e453532d676f7c7f0a94b3122f93a89a58f9ae49939e419/data）。前文中给出了该文件的json内容。
根据源文件信息，客户端依次下载对应文件就可以了。（鉴权过程参考参考文档）

ImageConfig

sha256:785f4150a5d9f62562f462fa2d8b8764df4215f0f2e3a3716c867aa31887f827
ImageLayer

sha256:e80174c8b43b97abb6bf8901cc5dade4897f16eb53b12674bef1eae6ae847451 sha256:d1072db285cc5eb2f3415891381631501b3ad9b1a10da20ca2e932d7d8799988 sha256:858453671e6769806e0374869acce1d9e5d97f5020f86139e0862c7ada6da621 sha256:3d07b1124f982f6c5da7f1b85a0a12f9574d6ce7e8a84160cda939e5b3a1faad sha256:994dade28a14b2eac1450db7fa2ba53998164ed271b1e4b0503b1f89de44380c sha256:60a5bd5c14d0f37da92d2a5e94d6bbfc1e2a942d675aee24f055ced76e8a208f

Tips: