职位名称:Kubernetes 平台工程师
工作地点:加利福尼亚州罗斯米德(东洛杉矶)混合模式,每周现场工作 1 至 2 天
合同期限:12 个月(可能延长)
薪资:$50/小时 W2
客户:一家领先的公用事业公司(客户名称将在简历提交后披露)
职位概述:
我们正在寻找一名 Kubernetes 平台工程师,加入一个管理可扩展和安全的容器化平台的关键团队。选定的候选人将负责支持生产级 Kubernetes 环境,实施高可用性策略,优化性能,并与开发、运营和安全团队协作,以确保高可靠性和安全的 DevOps 实践。
主要职责:
管理和支持容器化平台(主要是 Kubernetes)及相关的 GE 技术。
维护平台的高可用性(HA)、冗余和故障转移机制。
在最小干扰的情况下,对 Kubernetes 集群和工作负载应用补丁和升级。
管理开发/测试/生产环境中容器和应用程序的版本控制。
使用 Prometheus、Grafana 或 ELK 等工具创建和管理监控仪表板。
确保平台可观察性和性能跟踪,使用 Fluentd、Elasticsearch 等日志工具。
与 DevOps、SecOps 和开发团队合作,构建安全、可靠的 CI/CD 工作流程。
作为 Kubernetes 主题专家,协助架构讨论和系统故障排除。
维护架构、配置和操作程序的详细文档。
为生产中的停机和性能下降提供二级/三级支持。
所需资格:
在生产环境中管理 Kubernetes 的丰富实践经验。
对容器化系统的高可用性、故障转移和冗余设计原则有深入理解。
具备监控/日志工具的经验:Prometheus、Grafana、ELK Stack、Fluentd 等。
在工作负载的补丁管理和生命周期自动化方面证明了技能。
熟悉容器/应用程序版本控制实践。
精通 Linux 系统管理。
在分布式平台上具备强大的诊断和故障排除技能。
具备基础设施即代码(IaC)工具的经验:Helm、Terraform、Ansible 是加分项。
优先资格:
认证:CKA(认证 Kubernetes 管理员)、CKAD 或类似认证。
在受监管或安全敏感行业的相关经验。
熟悉 GE 技术栈或生态系统者优先。
候选人筛选问题(提交时必填):
您是否拥有计算机科学或相关领域的学位?
您有多少年的专业经验?
您在生产环境中管理和支持基于 Kubernetes 的容器平台方面有多少年经验?
您在平台级高可用性、冗余和故障转移策略方面有多少年经验?
您在监控和日志工具(例如 Prometheus、Grafana、ELK Stack、Fluentd 等)方面有多少年实践经验?
您是否能够每周在罗斯米德现场工作 1 至 2 天?
您还有其他想分享的内容吗,使您成为这个职位的合适人选?