Windows 节点的资源管理

本页概述了 Linux 和 Windows 在资源管理方式上的区别。

在 Linux 节点上,cgroup 用作资源控制的 Pod 边界。 在这个边界内创建容器以便于隔离网络、进程和文件系统。 Linux cgroup API 可用于收集 CPU、I/O 和内存使用统计数据。

与此相反,Windows 中每个容器对应一个作业对象, 与系统命名空间过滤器一起使用,将所有进程包含在一个容器中,提供与主机的逻辑隔离。 (作业对象是一种 Windows 进程隔离机制,不同于 Kubernetes 提及的 Job)。

如果没有命名空间过滤,就无法运行 Windows 容器。 这意味着在主机环境中无法让系统特权生效,因此特权容器在 Windows 上不可用。 容器不能使用来自主机的标识,因为安全帐户管理器(Security Account Manager,SAM)是独立的。

内存预留

Windows 不像 Linux 一样提供杀手(killer)机制,杀死内存不足的进程。 Windows 始终将所有用户态内存分配视为虚拟内存,并强制使用页面文件(pagefile)。

Windows 节点不会为容器中运行的进程过量使用内存。 最终结果是 Windows 不会像 Linux 那样达到内存不足的情况,Windows 将进程页面放到磁盘, 不会因为内存不足(OOM)而终止进程。 如果内存配置过量且所有物理内存都已耗尽,则换页性能就会降低。

你可以使用 kubelet 的 --kubelet-reserve 和/或 --system-reserve 参数设定工作负载的内存使用边界;这些参数负责表示节点上(容器外)的内存用量,并会减少 节点可分配(NodeAllocatable)内存量。 在你部署工作负载时,会对容器设置资源限制值。 这个限制值也会从 NodeAllocatable 中减去,并防止调度器在节点已满时增加更多 Pod。

在 Windows 上,避免过量配置的良好做法是为 kubelet 配置至少 2GiB 的系统预留内存, 以满足 Windows、Kubernetes 和容器运行时开销。

CPU 预留

为了满足操作系统、容器运行时和 kubelet 等 Kubernetes 主机进程的 CPU 使用量, 你可以(且应该)从 CPU 总量中预留一定百分比。 你应该根据节点上可用的 CPU 核数来确定这个 CPU 预留量。 要决定预留的 CPU 百分比,需确定每个节点的最大 Pod 密度, 并监控节点上运行的系统服务的 CPU 使用量,然后选择一个满足工作负载需求的值。

你可以使用 kubelet 的 --kubelet-reserve 和/或 --system-reserve 参数设定工作负载的 CPU 使用边界,以统计节点上(容器外)的 CPU 使用量。 这会减少 NodeAllocatable。 然后集群范围的调度器在决定放置 Pod 时会考虑这个预留量。

在 Windows 上,kubelet 支持使用命令行标志来设置 kubelet 进程的优先级:--windows-priorityclass。 与 Windows 主机上运行的其他进程相比,此标志允许 kubelet 进程获取更多的 CPU 时间片。 有关允许值及其含义的更多信息,请访问 Windows 优先级类。 为了确保运行的 Pod 不会耗尽 kubelet 的 CPU 时钟周期, 要将此标志设置为 ABOVE_NORMAL_PRIORITY_CLASS 或更高。