1. k8s知识体系
以下整理了k8s涉及的相关知识体系。
思维导图:k8s体系
2. k8s重点开源项目
大类 | 小类 | 项目及链接 | 简介 |
---|---|---|---|
🧭 核心调度与资源管理 | 核心调度器 | kube-scheduler | 默认调度器,支持亲和性、优先级等策略 |
批处理调度 | Volcano | 支持 AI 训练、大数据任务 Gang 调度、队列管理 | |
混部调度 | Koordinator | 支持离在线混部、QoS 管理、NUMA 亲和等能力 | |
多集群调度 | Karmada | 多集群资源调度和统一控制 | |
Pod 优化调度 | Descheduler | 定期检测资源不均衡并重新调度 | |
🌐 网络与服务网格 | 网络插件(CNI) | Calico Cilium Flannel |
Pod 网络连接,Cilium 基于 eBPF 支持 L7 策略 |
服务网格 | Istio Linkerd |
微服务通信控制:认证、流量治理、可观测性 | |
DNS 服务 | CoreDNS | Kubernetes 默认 DNS 插件 | |
LoadBalancer | MetalLB | 裸金属集群中提供 LoadBalancer 类型服务 | |
Gateway 网关 | Apache APISIX Ingress Kong Ingress NGINX Ingress Envoy Gateway |
支持 Ingress/Gateway API,提供流量入口、认证、限流等 | |
🔐 安全与策略控制 | 策略控制 | Kyverno Gatekeeper |
对资源进行策略校验、合规控制 |
密钥管理 | VaultSealed Secrets | 管理和加密存储 Kubernetes 密钥和凭据 | |
运行时安全 | Falco | 实时监控容器中可疑行为 | |
镜像签名 | cosign | 为容器镜像提供签名与验证功能 | |
💾 存储与数据保护 | CSI 存储 | Longhorn Rook |
提供持久化块存储或对象存储能力 |
备份与恢复 | Velero | Pod 和卷的备份、恢复、集群迁移 | |
卷调度组件 | external-provisioner | Kubernetes 官方 CSI 卷调度器 | |
📊 监控与可观测性 | 指标采集 | Prometheus kube-state-metrics |
收集节点/Pod 状态与业务指标 |
可视化展示 | Grafana | 指标、日志、链路追踪可视化 | |
日志系统 | Loki Fluent Bit |
日志采集与聚合,低资源占用 | |
链路追踪 | Jaeger OpenTelemetry |
追踪服务调用链路、性能瓶颈 | |
🧪 CI/CD 与 GitOps | 工作流引擎 | Argo Workflows Tekton |
原生工作流与流水线管理 |
GitOps | Argo CDFlux | Git 驱动的自动部署与管理 | |
镜像构建 | Kaniko BuildKit |
无需 Docker daemon 的镜像构建工具 | |
应用包管理 | Helm | Kubernetes 最主流的应用部署工具,支持模板化部署 | |
⚙️ 集群运维与扩展 | 快速部署 | kubeadm kind k3s |
轻量化和本地环境 Kubernetes 集群安装工具 |
节点扩缩容 | Cluster Autoscaler | 根据 Pod 排队与资源使用率自动扩缩容节点 | |
多集群互联 | Submariner | 跨集群的网络互通方案 | |
故障检测 | Node Problem Detector | 检测节点硬件、系统异常并上报 K8s | |
混沌测试 | Chaos Mesh Litmus |
注入网络/CPU/磁盘等故障模拟场景 | |
Workload 扩展 | OpenKruise | 扩展原生 workload 控制器能力,如 Sidecar、InPlace 升级 | |
应用交付平台 | KubeVela | 基于 OAM 模型,提供开发者友好、平台团队可控的应用交付能力 | |
🤖 AI 与大数据 | AI 平台 | Kubeflow | 支持训练、调度、模型管理的机器学习平台 |
联邦学习 | KubeFATE | 基于 K8s 的联邦学习调度与部署平台 | |
模型推理 | Triton Inference Server vLLM |
高性能大模型/AI 模型推理服务 | |
分布式调度器 | Volcano | 支持 AI 大数据任务的 batch 资源调度 | |
⚡ GPU 与硬件加速 | GPU 驱动插件 | NVIDIA device plugin | 为 K8s 提供 GPU 发现、分配与隔离能力 |
GPU 监控工具 | DCGM Exporter | GPU 状态指标(温度、利用率、内存)采集器,用于 Prometheus | |
GPU 虚拟化 | vGPU manager | 管理 GPU 分片、vGPU 分配 | |
GPU 调度增强 | Koordinator Volcano |
支持 NUMA-aware、GPU topology-aware 的任务调度策略 |
赞赏一下