Programming Kubernetes学习笔记

3. clieng-go库基础

3.4 Informers和Caching

3.4.1 Work Queue

client-go在k8s.io/client-go/util/workqueue包中为构建控制器提供了一种优先队列的强大实现。这个包中许多变量类型实现的基础接口如下：

type Interface interface {
	Add(item interface{})
	Len() int
	Get() (item interface{}, shutdown bool)  // 每个从Get()返回的item，当控制器处理完后都需要调用一次Done(item)
	Done(item interface{})
	ShutDown()
	ShuttingDown() bool
}

从上面的通用接口派生出来的队列类型有：DelayingInterface可以在后面的某个时间添加一个item，RateLimitingInterface扩展了前面的接口，可以限制添加进队列items的速率。

速率限制算法可以被传进构造函数NewRateLimitingQueue中，这个包里还定义了多种，如BucketRateLimiter, ItemExponentialFailureRateLimiter, ItemFastSlowRateLimiter和MaxOfRateLimiter。绝大多数控制器仅需使用DefaultControllerRateLimiter() *RateLimiter函数获取默认的控制器的速率限制器。

4. 使用自定义资源（CRs）

子资源(Subresources)

子资源有特殊的HTTP端点路径, 即在常规的HTTP路径后面添加后缀. 例如，Pod有以下几种子资源：

/api/v1/namespace/namespace/pods/name/logs
/api/v1/namespace/namespace/pods/name/portforward
/api/v1/namespace/namespace/pods/name/exec
/api/v1/namespace/namespace/pods/name/status

子资源端点往往使用与主资源端点不同的协议来访问。

而CR只支持两种子资源：/scale 和 /status，都需要在CRD中显性地开启。

The /status subresource solves this by providing two endpoints that are resources on their own. Each can be controlled with RBAC rules independently. 这叫做spec-status分离.

4.4 开发者的视角看自定义资源

在Golang中可以用多种客户端来访问自定义资源，常规的两种有：

用client-go的动态客户端
用有类型的客户端：由kubernetes-sigs/controller-runtime提供的被Operator SDK和Kubebuilder使用的有类型的客户端，或者由client-gen生成的有类型的客户端

4.4.1 动态客户端

在k8s.io/client-go/dynamic中的动态客户端没有用到任何Go类型，除了unstructured.Unstructured，它仅是封装了json.Unmarshal和它的输出。

动态客户端的输入和输出就是一个*unstructured.Unstructured—即一个对象，它有着和json.Unmarshal在反序列化时所输出的一样的数据结构:

对象用map[string]interface{}表示
数组用[]interface{}表示
基础类型是string, bool, float64, or int64

动态客户端也被Kubernetes自身用在一些通用的控制器上，例如垃圾回收控制器，因为其会处理系统中的任意资源，所以广泛使用了动态客户端。

适用场景：用在处理未知类型对象的通用控制器中。

4.4.2 通过client-gen生成的有类型的客户端

有了API包pkg/apis/group/version之后，客户端生成器client-gen就可以在默认的包路径pkg/generated/clientset/versioned下生成一个有类型的客户端，生成的顶层对象就是一个client set，它包括了很多API groups, versions和下面的资源。

这种代码生成机制让我们能和K8s核心资源一样为自定义资源编写逻辑代码，像informers这种上层的工具也可以用informer-gen生成。

适用场景：用在类型安全能极大地加强代码正确性的场合，如许多人协作的K8s项目自身。

4.4.3 Operator SDK和Kubebuilder使用的controller-runtime客户端

controller-runtime项目是Operator SDK and Kubebuilder这两种operator解决方案的基础。

和前面提到的client-gen生成的客户端不同，与动态客户端类似，controller-runtime客户端也只有一个实例，它能处理在某个scheme中注册过的所有类型。它使用API server的信息发现机制来把类型映射到HTTP路径。

适用场景：用在便捷性和高速率很重要的场合，减少经过的管道。

5. 自动化代码生成

5.1 为什么需要代码生成？

因为Go是一门设计简洁的语言，它缺乏高层次或者像元编程那样的机制，可以用一种通用（类型无关）的方式在不同的数据类型上表达同一种算法。Go的做法就是使用外部的代码生成。

5.2 调用生成器

通常，在每个控制器项目中，代码生成器几乎都是以同一种方式被调用，只有包名、资源组名和API版本会有所不同。调用k8s.io/code-generator/generate-groups.sh脚本，或诸如hack/update-codegen.sh之类的bash脚本，是在编译系统中为Go自定义类型资源添加代码生成的最简单方式。

$ vendor/k8s.io/code-generator/generate-groups.sh all \
    github.com/programming-kubernetes/cnat/cnat-client-go/pkg/generated
    github.com/programming-kubernetes/cnat/cnat-client-go/pkg/apis \
    cnat:v1alpha1 \
    --output-base "${GOPATH}/src" \
    --go-header-file "hack/boilerplate.go.txt"

这里的all意味着会调用为自定义资源准备的四种标准的代码生成器:

deepcopy-gen: 生成 func (t *T) DeepCopy() *T 和 func (t *T) DeepCopyInto(*T) 方法。
client-gen: 生成类型化的客户端 clientsets.
informer-gen: 为自定义资源生成 informers，提供一种基于事件的接口来响应服务器上自定义资源的变化。
lister-gen: 为自定义资源生成 listers，为GET和LIST请求提供一个只读的缓存层。

这四种代码生成器为构建全特性、生产可用的控制器提供了强大的支撑，它使用了和Kubernetes上游控制器一样的机制和依赖包。

为应对别的场景，k8s.io/code-generator中还提供了多种其它的代码生成器，例如，如果你要构建自己的聚合API server，除了版本化的类型你还会用到内部类型，这时候 Conversion-gen 会生成这些内部类型和外部类型之间的转换函数， Defaulter-gen 会为特定字段生成默认值。

5.3 用标签（Tags）控制代码生成器的行为

除了可以像上面这种从命令行参数控制代码生成器的行为之外，代码生成器更多的属性是通过Go文件中的tags标签来控制的。

有两种类型的tags：

在doc.go文件中package行上面的全局tags
在类型声明（比如结构体定义）上面的局部tags

5.3.1 deepcopy-gen Tags

Deep-copy方法生成默认对所有类型都是开启的，只需要添加一个全局tag：// +k8s:deepcopy-gen=package tag。

不需要开启的类型只要添加一个局部tag: // +k8s:deepcopy-gen=false。

5.3.2 runtime.Object和DeepCopyObject

把局部tag：// +k8s:deepcopy-gen:interfaces=k8s.io/apimachinery/pkg/runtime.Object放到你的顶层API资源类型之上，可以生成它的DeepCopyObject() runtime.Object方法（结构体中嵌有metav1.TypeMeta的都是顶层API资源类型）。DeepCopyObject方法属于runtime.Object接口，在Kubernetes中的泛化代码必须都能够创建对象的深度拷贝。

当别的接口也需要可以深度拷贝时，可以使用如下面例子里的局部tag：

// +k8s:deepcopy-gen:interfaces=<package>.Foo
type FooImplementation struct {
    ...
}

// Kubernetes源码中的一些例子
// +k8s:deepcopy-gen:interfaces=.../pkg/registry/rbac/reconciliation.RuleOwner
// +k8s:deepcopy-gen:interfaces=.../pkg/registry/rbac/reconciliation.RoleBinding

5.3.3 deepcopy-gen Tags

// +genclient
让client-gen代码生成器为这个Go类型创建一个客户端
// +genclient:noStatus
避免生成 UpdateStatus() 方法，否则默认都会生成
// +genclient:nonNamespaced
针对集群层面的资源类型，否则默认是生成一个命名空间客户端
// +genclient:noVerbs
// +genclient:onlyVerbs=create,delete
// +genclient:skipVerbs=get,list,create,update,patch,delete,watch

// +genclient:method=Create,verb=create,
// result=k8s.io/apimachinery/pkg/apis/meta/v1.Status
有这个标签的类型只可以创建，并且不返回API资源类型本身，而是返回一个`metav1.Status`，仅对用户提供的Go写的API servers的资源类型有意义。

// +genclient:method= 标签使用的一个常见场景是添加弹扩资源的方法。

5.3.4 informer-gen 和 lister-gen

informer-gen 和 lister-gen 代码生成器也会处理client-gen的// +genclient标签，每个选择生成客户端的类型也会自动生成对应的informers 和 listers。更多高级用法可以参考k8s.io/api和OpenShift API types。

6. 写Operators的方案

写自定义控制器和operators的三种方案：

6.1 sample-controller

6.2 Kubebuilder

Kubebuilder是Kubernetes SIG API Machinery维护的一套工具库，让你能简单高效地构建operators，深入探索Kubebuilder的最佳资源是在线的Kubebuilder电子书。

6.3 Operator SDK

Operator SDK是Operator Framework的一部分，它提供了一系列的工具来构建、测试和打包operators，让开发者不需要深入了解Kubernetes APIs就可以搭建operators。

The main stakeholder is the SIG API Machinery, which owns CRs and controllers and is responsible for the Kubebuilder project. The Operator SDK has increased its efforts to align with the Kubebuilder API, so there’s a lot of overlap.

7. 交付Controllers和Operators

7.1 生命周期管理和打包

下面我们会讨论如何打包和交付你的controller或operator，以及如何处理版本升级。

7.1.1 打包的挑战

为了克服构建时候的Kubernetes中静态YAML文件的限制，我们可以选择模板化YAML文件的方式（例如Helm），或者使用输入变量的方式（Kustomize）。

7.1.2 Helm

Helm通过定义和应用所谓的charts（实际就是参数化的YAML文件），帮助你安装和升级Kubernetes中的应用。

7.1.3 Kustomize

Kustomize遵循大家所熟悉的Kubernetes API，提供了一种声明式的方法，来对Kubernetes的YAML manifest文件做自定义配置。新版本的kubectl中也自带了Kustomize，可以通过 -k 命令行标志来激活使用。Kustomize能让你在不变动原本manifest文件的情况下，自定义配置YAML manifest文件，只需要定义一个kustomize.yaml文件，然后执行kustomize build就可以生成一个自定义的manifest文件，于是就可以用于kubectl apply命令。

Note that while it solves some problems (customization), there are other areas of the lifecycle management, such as validations and upgrades, that may require you to use Kustomize together with languages such as Google’s CUE.

7.2 为生产部署做好准备

关于如何使你的自定义controllers和operators为生产部署做好准备，可以参考如下的一些高层次检查列表:

Use Kubernetes deployments or DaemonSets to supervise your custom controller so that they are restarted automatically when they fail—and fail they will.
Implement health checks through dedicated endpoints for liveness and readiness probes. This, together with the previous step, makes your operations more resilient.
Consider a leader-follower/standby model to make sure that even when your controller pod crashes, someone else can take over. Note, however, that synchronizing state is a nontrivial task.
Provide access control resources, such as service account and roles, applying the least-privileges principle; see “Getting the Permissions Right” for details.
Consider automated builds, including testing. Some more tips are available in “Automated Builds and Testing”.
Proactively tackle monitoring and logging; see “Custom Controllers and Observability” for the what and how.

8. 自定义API Servers

除了CRDs，自定义API Servers也是扩展Kubernetes的一种备选方式，它能像常规Kubernetes API server一样服务资源组，但是与CRDs不同的是，你对自定义API Servers所能做的事几乎没有任务限制。

8.1 使用场景

一个自定义API Server可以当作CRDs的替换来使用，CRDs能做的事情它都能做，而且提供了无限的灵活性，不过这也带来了开发和维护的复杂性。

使用CRDs所带来的限制：

相反，一个自定义API Server就不会有如上限制，它能做下面这些事情： *

8.2 架构设计：聚合(Aggregation)

自定义API servers是提供API资源组服务的进程，通常是用API server库k8s.io/apiserver来构建的，这些进程可以跑在集群内或集群外，前者就是跑在pods容器中, 前面有一个service。

Kubernetes主API server叫做kube-apiserver，总是kubectl和别的API客户端的第一个接触点。由自定义API server提供服务的API资源组，被kube-apiserver进程代理到自定义API server进程。

在kube-apiserver进程中执行代理的组件叫做kube-aggregator, 这种把API请求代理到API server的过程叫做API aggregation。

kube-apiserver

kube-aggregator组件会代理某个API资源组版本的HTTP路径下的所有请求(即在/apis/group-name/version下的所有请求)，而它不需要知道在此API资源组版本中实际提供了哪些资源。相反，kube-aggregator组件会自己提供所有聚合自定义API servers的/apis和/apis/group-name端点发现（discovery endpoints）服务，靠的是APIService资源中的信息，而不必和自定义API servers交互。

8.2.1 API Services

For the Kubernetes API server to know about the API groups a custom API server serves, one APIService object must be created in the apiregistration.k8s.io/v1 API group. These objects list only the API groups and versions, not resources or any further details。

So using 2000 for PaaS-like APIs means that they are placed at the end of this list。

The order of the API groups plays a role during the REST mapping process in kubectl (see “REST Mapping”). This means it has actual influence on the user experience. If there are conflicting resource names or short names, the one with the highest GroupPriorityMinimum value wins.

8.2.2 自定义API Server的内部结构

A custom API server resembles most of the parts that make up the Kubernetes API server, though of course with different API group implementations, and without an embedded kube-aggregator or an embedded apiextension-apiserver (which serves CRDs).

custom-api-server

8.2.3 委派的认证和授信

The aggregated custom API server has to know when to trust these headers; otherwise, any other caller could claim to have done authentication and could set these headers. This is handled by a special request header client CA. It is stored in the config map kube-system/extension-apiserver-authentication (filename requestheader-client-ca-file).

有一种叫做TokenAccessReview的机制，它把bearer tokens回传给Kubernetes API server来确认token的合法性。

8.2.4 委派的授权

聚合自定义API server通过SubjectAccessReviews委派授权评估到Kubernetes API server的RBAC规则来授权请求，也可以使用自身定义的另一套授权方式。

8.3 编写自定义API Servers

Options are coupled with flags; that is, they are conventionally on the same abstraction level as flags. As a rule of thumb, options do not hold “running” data structures. They are used during startup and then converted to configuration or server objects, which are then run.

Options are converted to a server configuration (“config”) by the Config() (*apiserver.Config, error) method. This is done by starting with a recommended default configuration and then applying the options to it。