Kubernetes 有状态集群服务部署与管理

2018-08-02 377

核心提示：Kubernetes 有状态集群服务部署与管理在容器化时代，除了无状态的容器服务，比如Web服务器，用户也越来越多地使用容器部署有状态

Kubernetes 有状态集群服务部署与管理

在容器化时代，除了无状态的容器服务，比如Web服务器，用户也越来越多地使用容器部署有状态的应用，比如MySQL、Redis、Cassandra等。这些Pets（运行有状态服务的容器，需要特殊处理）就带来了新的需求，包括更长的生命周期，配置依赖，有状态的故障转移等。

本次分享将深入介绍Kubernetes如何满足有状态集群服务对容器编排系统提出的新需求，包括如何使用Kubernetes的动态存储请求与分配机制来实现服务状态的持久化存储，以及与高效部署和运行有状态集群服务相关的Kubernetes新特性，如Init Container、PetSet （StatefulSet）等。最后通过一个MySQL集群实例详解在Kubernetes中如何轻松部署一个高可用的有状态集群服务并实现自动化管理。

大纲：

- Kubernetes简介和运行有状态集群服务的挑战

- Kubernetes 存储系统

- Kubernetes 有状态集群服务相关特性

- 实战：在Kubernetes上部署和管理MySQL集群

正文：

在容器化时代，除了无状态的容器服务，比如Web服务器，用户也越来越多地使用容器部署有状态的应用，这就对容器编排系统提出了新的需求。

我今天要和大家分享的主题就是如何在目前主流的容器云平台Kubernetes 上部署和管理有状态集群服务。

这次分享的关键词有两个： 一个是Kubernetes，另一个是有状态集群服务。

我们会在第一部分了解一下什么是 Kubernetes，以及运行有状态集群服务面临的一些挑战。

接下来的两部分我们会重点介绍 Kubernetes 是如何应对这些挑战，以及通过哪些特性来解决有状态集群服务所特有的一些问题。

最后一部分是实战，通过一个MySQL集群的例子来展示如何在Kubernetes上轻松地部署和管理一个有状态集群服务。

首先来看什么是Kubernetes？

简单一句话来说，Kubernetes是一个运行和管理容器的平台。它在Docker、rkt等容器运行时之上，实现了容器的集群化和高可用。

Kubernetes简称K8S，来自Google，支持多种云计算环境，并且100% 开源，是云原生计算基金会的一部分，用Go语言开发的。

这里是Kubernetes的一些基本概念。

其中最核心的一个概念是Pod，它是Kubernetes对容器进行的封装，是Kubernetes管理的最小单位。

Pod通过Deployment来部署，Deployment会创建一个Replica Set 来保证Pod的个数始终是一个指定的值。

Pod一般不直接对外提供服务，而是通过Service对外提供一个稳定的访问接口，一个Service后面可以挂多个Pod实例。

Service是如何找到它匹配的Pod呢？靠的是Label。Label是联系各个K8S资源的纽带。Replica Set 和它管理的Pod之间也是通过 Label 来关联的。

如果Pod里的容器运行的是有状态服务，如数据库与缓存等，还需要挂载存储卷，用于存储服务状态。

讲完原理，我们来看一个实例。

这是一个在K8S集群里运行的容器化应用案例，这个应用有自己的Web 客户端，同时还从Twitter采集数据，处理完后存储到自己的DB。

可以看到容器里跑的服务有两类，无状态和有状态。像Web服务器，流处理器等无状态服务出现问题后，直接杀掉，新建一个，管理起来非常简单。

但是对有状态服务，像数据库，它要求有更长的生命周期。在一个集群的情况下，集群成员之间如何能保持稳定的成员关系？这都对容器编排系统提出了新的挑战。

那么K8S是如何应对这些挑战的呢？

K8S运行的服务，从简单到复杂可以分成三类：无状态服务、普通有状态服务和有状态集群服务。下面分别来看K8S是如何运行这三类服务的。

首先无状态服务，K8S使用RC（或更新的Replica Set）来保证一个服务的实例数量。通过Service来对外提供一个稳定的访问接口。

然后是普通有状态服务，它多了状态保存的需求。Kubernetes提供了以Volume和Persistent Volume为基础的存储系统，可以实现服务的状态保存。

最后是有状态集群服务，它又多了集群管理的需求。K8S为此开发了一套以Pet Set为核心的全新特性，方便了有状态集群服务在K8S上的部署和管理。

下面我们首先来看Kubernetes如何满足“状态保存”的需求。

K8S的存储系统大致分为三个层次：普通Volume，Persistent Volume 和动态存储供应。

对普通Volume，最简单的一种是“单节点存储卷”。它和Docker的存储卷类似，使用的是Pod所在K8S节点的本地目录。

具体有两种，一种是 emptyDir，是一个匿名的空目录，由Kubernetes在创建Pod时创建，删除Pod时删除。

另外一种是 hostPath，与emptyDir的区别是，它在Pod之外独立存在，由用户指定路径名。

这类和节点绑定的存储卷在Pod迁移到其它节点后数据就会丢失，所以只能用于存储临时数据或用于在同一个Pod里的容器之间共享数据。

普通Volume的第二种类型是“跨节点存储卷”。这种存储卷不和某个具体的K8S节点绑定，而是独立于K8S节点存在的。

跨节点存储卷由于可以在任何一个Kubernetes 节点上都能够被访问到，比较灵活，所以应用比较广泛。

Kubernetes上的Volume是通过插件方式来实现的，所以可扩展性很强。

目前来说几乎所有主流的存储在Kubernetes上都有相应的插件来支持。如果已有的存储不能满足要求，还可以开发自己的volume插件。

K8S存储系统的第二种存储方式叫persistent volume。它和普通volume的区别是什么呢？

普通Volume和使用它的Pod之间是一种静态绑定关系，我们无法单独创建一个普通volume，因为它不是一个独立的K8S资源对象。

而Persistent Volume 简称PV是一个K8S资源对象，所以我们可以单独创建。它不和Pod直接发生关系，而是通过Persistent Volume Claim，简称PVC来实现动态绑定。

接下来我们看一下这个动态绑定过程是怎样的？

这是PV的生命周期，首先是Provision，即创建PV，这里创建PV有两种方式，静态和动态。

所谓静态，是管理员手动创建一堆PV，组成一个PV池，供PVC来绑定。动态方式是通过一个叫 storage class的对象由存储系统根据PVC的要求自动创建。

一个PV创建完后状态会变成Available，等待被PVC绑定。一旦被PVC邦定，PV的状态会变成Bound，就可以被相应的Pod使用。Pod使用完后会释放PV，PV的状态变成Released。

变成Released的PV会根据定义的回收策略做相应的回收工作。有三种回收策略，Retain、Delete 和 Recycle。

Retain就是保留现场，K8S什么也不做。Delete 策略，K8S会自动删除该PV及里面的数据。Recycle方式，K8S会将PV里的数据删除，然后把PV的状态变成Available，又可以被新的PVC绑定使用。

刚才提到PV的供给有两种方式，静态和动态。其中动态方式是通过StorageClass来完成的，这是一种新的存储供应方式。

使用StorageClass有什么好处呢？除了由存储系统动态创建，节省了管理员的时间，还有一个好处是可以封装不同类型的存储供PVC选用。

比如这里就有两个StorageClass，它们都是用谷歌的存储系统，但是一个使用的是普通磁盘，名字为slow。另一个使用的是SSD，名字为fast。

在PVC里通过annotation指定了storage class的名字为fast，这样这个PVC就会绑定一个SSD，而不会绑定一个普通的磁盘。

好，到这里Kubernetes的整个存储系统就都介绍完了。

下面进入Kubernetes与有状态集群服务相关的两个新特性。Init Container 和 Pet Set。

什么是Init Container？

从名字来看就是做初始化工作的容器。可以有一个或多个，这些 Init Container 按照定义的顺序依次执行，只有所有的Init Container 执行完后，主容器才启动。

由于一个Pod里的存储卷是共享的，所以 Init Container 里产生的数据可以被主容器使用到。

这是Init Container的一个使用样例。

这个例子创建一个Pod，这个Pod里跑的是一个nginx容器，Pod里有一个叫workdir的存储卷，访问nginx容器服务的时候，就会显示这个存储卷里的index.html 文件。

而这个index.html 文件就是通过一个 busybox的初始化容器获得的。

介绍完Init Container，千呼万唤始出来，该今天的主角Pet Set出场了。

什么是Pet Set？顾名思义是Pet的集合，那什么是Pet呢？它是一种需要特殊照顾的Pod。它有状态、有身份、当然也比普通的Pod要复杂一些。

具体来说，一个Pet有三个特征

一是有稳定的存储，这是通过我们前面介绍的PV/PVC 来实现的。

二是稳定的网络身份，这是通过一种叫 Headless Service 的特殊Service来实现的。和普通Service相比，Headless Service没有Cluster IP，用于为一个集群内部的每个成员提供一个唯一的DNS名字，用于集群内部成员之间通信。

Pet的第三个特征是序号命名规则。比如 Pet Set 的名字叫 mysql，那么第一个启起来的Pet就叫mysql-0，第二个叫mysql-1，如此下去。

当一个Pet down 掉后，新创建的Pet 会被赋予跟原来Pet一样的名字，通过这个名字就能匹配到原来的存储，实现状态保存。

好，与有状态服集群服务相关的K8S特性就介绍到这里。

理论讲完了，下面进入实战，以Galera MySQL集群为例子，介绍如何在 Kubernetes如何上部署和管理一个有状态集群服务。

首先大致了解一下Galera MySQL。

它不是那种主从式的集群，而是多Master集群，通过 Galera Replication 把多个MySQL实例关联起来组成一个集群。由Galera Replication 负责节点间的数据同步。

用户访问时可以连接到任何一个节点进行读写操作。每次写入的数据会被Galera Replication同步到整个集群，才算写入成功。

节点之间没有数据延迟，在某个节点失效后，直接退出集群即可，无需失效转移。

对Galera MySQL集群有了基本了解后，我们来看看如何在Kubernetes上部署和运行它。这是整体结构图：

左边的Headless Service用于为每个MySQL Pet实例提供一个DNS名字，右边的PV池为MySQL提供存储。

这里有两个初始化容器，第一个用于安装需要的文件，第二个做MySQL的初始化工作。

一个Pet Set里有多个Pet，每个Pet对应MySQL集群里的一个节点。通过Pet Set可以管理整个MySQL集群。

这是部署MySQL集群具体的YAML文件。

右边是一个Headless Service，名字是galera。

左边是Pet Set，它用到了右边的Headless service。Replicas的数目为3，会创建3个Pet。

在 Pet Set 的annotation里定义了两个初始化容器。

Install容器安装的文件可以被bootstrap容器使用到；同时bootstrap容器生成的MySQL配置文件会放到config存储卷里，供后面的MySQL 容器使用。

这是主容器 Galera MySQL 的定义：

除了常规的3306端口外，它还暴露了其它一些端口，用于集群内部的数据同步和状态转移等操作。

这里MySQL启动参数里用到的文件，是在初始化容器里生成的，通过共享存储卷传递过来。

最后是数据存储卷的定义。

这里定义了三个存储卷，其中config、workdir就是简单的本地目录，而 datadir是一个PVC，它可以去绑定PV来存储MySQL数据库的数据。

所以部署一个集群总共就需要两个YAML文件就可以了，一个Headless Service，一个 Pet Set。其中Pet Set里定义了初始化容器和存储卷。

用上面的方式部署完MySQL集群后，后面的运维工作是比较简单的。

假如某个集群节点由于某种原因Crash掉了，Kubernetes 会自动创建一个新的Pet来替代，实现自动恢复。

如果要扩容或缩容，也是一条命令、指定一下这个Pet Set 的Replicas的数目就行了。

如果要升级，只需要修改Pet Set 定义里 podTemplate 的image值，然后把老的Pet删除，新创建的Pet，就是最新版本的了。

对于在Kubernetes上部署有状态集群服务，我们补充两点：

第一点是在最新发布的 Kubernetes 1.5 里 PetSet 重新命名为StatefulSet。所以根据你使用的K8S版本不同，可能看到的名字也不一样。

第二点是简单介绍一下时速云提供的有状态集群服务：数据库与缓存。

如上图所示，这项服务最大程度的简化了有状态集群服务的创建工作，用户不再需要了解我们前面介绍的所有技术术语，只需要指定一下副本数目，存储的大小就可以了。

最后以下面这张图做为今天分享内容的总结。

有状态集群服务的两个需求，一个是存储需求。另一个是集群需求。

对存储需求，Kubernetes的解决方案是Volume、Persistent Volume 。对PV，除了手动创建PV池外，还可以通过Storage Class来让存储系统自动创建。

对集群需求，Kubernetes的解决方案是Pet Set。Pet Set 又通过Init Container来做集群初始化，通过Headless Service来为集群成员提供稳定的网络身份。

最后我们以MySQL集群为例，说明了如何在Kubernetes上部署和运行一个有状态集群服务。

目前有状态集群服务在Kubernetes上的部署还不是正式版，但完全可用。如果您的项目中有容器化的需求，可以尝试。

今天的分享到此结束，谢谢大家！

Q：前面提到init container，k8s里pod初始化是基于gcr的pause，这个初始化镜像是自定义的吗？

A：init container 和 gcr的pause 是不同的概念，一个是初始化容器（运行完就结束），一个是基础容器（一直运行）

Q：北京Q1:你介绍的k8s存储技术都是比较新的，能否适应企业生产大规模使用，有没有什么性能和稳定性问题？

A：性能和稳定性上我们也在不断尝试，先使用起来看看效果，目前创建过几百个集群，暂时没有碰到太多稳定性问题。

Q:能否提供一下k8s部署mysql的文档，以供交流[呲牙]

A：这个在后面的整理文档里会有部署样例提供。

Q：请问是时速云mysql集群的存储是用什么？cephfs 还是glusterfs,或者其他

A：目前出于效率考虑，主要是分布式块存储，没有用glusterfs这些

Q：存储系统如何动态创建StorageClass，如果 Headless Service没有Cluster IP，服务如何调用？

A：K8S 通过StorageClass 让存储系统动态创建PV，不是动态创建StorageClass。Headless Service 用于集群内部通信，外部调用，再建普通Service，二者并存。

Q：我想问个k8s比较基础的问题哈，是关于service type的，有三种，第一种clusterIP我不是很明白，不是k8s默认所有pod之间是互通的么，那还需要这个clusterIP干啥呢。比如我两个pod，一个跑redis,一个跑web, 那web那个pod肯定是可以访问到redis的呀，为啥还需要为redis create 一个service呢

A：Pod重建或迁移后IP可能变，用Service可以提供一个稳定的访问接口。

Q：有状态集群还有其他的实现方式吗？

A：在容器云里比较好的方式是用PetSet，当然也能自己做，相当于自己实现PetSet的一些功能。

Q：同步到整个集群才算写入成功，是不是意味着不适合高负载的项目使用？有可能增加其它策略供选择吗？

A：由于采用多主方式，对外只写入一个，内部扩散同步可以并行，而且每个节点都能对外提供服务，相当于增加了服务带宽，所以性能不是问题。

杭州Q：您好，你们是采用什么分布式存储的，io性能如何？好像一些开源分布式的存储写io的性能普遍比较低，能撑得住一些io高性能的应用吗？

A：性能上要等到支持host 模式后，才能满足一些IO要求比较高的场景

Q:时速云的mysql集群是RDS吗

A：目标就是基于容器的 RDS 服务

点赞 0举报收藏 0打赏 0

更多>同类云平台

admin
加关注2
~~没有留下签名~~~~

推荐图文

推荐云平台

点击排行

• 央企的“中央厨房”，泰裤辣！	• 中国数据中台行业研究报告
• 大数据基础平台KDP助力CDH国产化迁移	• 客户数据中台CDP是什么？真的能构建用户全景画
• 什么是DMP、CDP和数据中台？三者有什么区别和联	• 漫画：数据仓库、数据中台、数据湖，终于搞懂了
• 数据中台为什么这么火呀	• 数据中台为什么火起来了
• 企业数据中台（CDP）为什么突然火了？	• CDP的数据价值在哪里