Kubernetes 运维首席专家工程师

芝加哥 6天前全职 网络
面议
职位名称:Kubernetes 运维首席专家工程师 工作地点:伊利诺伊州,芝加哥 工作经验:12年以上 雇佣类型:合同 面试类型:现场或视频 职位描述 Kubernetes 运维首席专家工程师将负责监督和管理企业级 Kubernetes 集群,确保容器化平台的最佳性能、可扩展性、安全性和可靠性。此角色涉及领导一个团队,负责日常 Kubernetes 运维、自动化、基础设施改进以及混合云和多云环境中的生产支持。候选人应具备高级的 Kubernetes、DevOps 工具、CI/CD 管道、云服务和容器管理的实践经验。 主要职责 • 领导 Kubernetes 运维,包括集群部署、配置、升级、扩展、监控和性能调优。 • 管理和维护跨云和本地环境的 Kubernetes 集群,如 AWS、Azure 或 GCP。 • 定义并执行与容器编排、安全性、网络策略、资源优化和工作负载管理相关的最佳实践。 • 利用 Prometheus、Grafana、ELK 等日志记录、监控和追踪工具实施可观察性解决方案。 • 监督事件响应、根本原因分析和事件后评审,以确保平台的可靠性。 • 使用基础设施即代码工具(如 Terraform、Helm 和 Ansible)设计和自动化基础设施操作。 • 与开发、安全和运维团队合作,支持 DevOps 工作流和 CI/CD 管道集成。 • 领导容量规划、资源预测、性能评估和升级计划。 • 文档化标准、部署程序、运行手册和操作最佳实践。 • 指导初级工程师并担任技术升级的联络点。 所需资格 • 12年以上整体 IT 经验,其中至少 6 年在 Kubernetes 和容器编排方面。 • 具备管理和操作大规模 Kubernetes 集群的实践经验。 • 在 AWS、Azure 或 Google Cloud 等云平台方面有强大的背景。 • 精通 Docker、Helm 图表、Terraform、YAML 配置和服务网格技术(如 Istio、Linkerd)。 • 熟练使用 CI/CD 工具,如 Jenkins、GitLab CI、Argo CD 或 Tekton。 • 对 Linux 系统、网络概念、负载均衡器和 DNS 有深入了解。 • 具备使用 Prometheus、Grafana、ELK 和 OpenTelemetry 等可观察性和监控框架的经验。 • 熟悉 Kubernetes 安全标准、RBAC、策略、证书管理和镜像扫描。 • 具备 Bash、Python 或 Go 的扎实脚本经验。 • 拥有强大的故障排除和性能优化技能。 优先技能 • 拥有 Kubernetes 认证,如 CKA、CKAD 或 CKS。 • 具备多集群、混合云或本地 Kubernetes 发行版(如 EKS、AKS、GKE、OpenShift 或 Rancher)的经验。 • 了解 GitOps 方法论和工具,如 Argo CD 或 Flux。 • 具备灾难恢复、备份解决方案和高可用架构的经验。 • 具备团队领导或技术架构师经验。 • 熟悉站点可靠性工程概念和自动化框架。