成功的候选人需要 (i) 使用丰富的 AWS 服务组合(EKS、EC2、RDS、S3、IAM、VPC、Route 53、CloudWatch 等)架构和构建可扩展、容错和安全的云基础设施,(ii) 领导使用 Terraform、PowerShell 和其他自动化框架设计和实施基础设施即代码(IaC),以实现快速和可重复的环境配置。要求具有 10 年以上的站点可靠性工程、软件开发、云基础设施架构或相关领域的专业经验,并具备领导和交付复杂、大规模项目的强大记录。具备之前的领导或指导经验,推动团队成长、技术卓越和协作文化,并且至少拥有计算机科学、工程、信息技术或相关技术学科的学士学位。相关认证(例如,AWS 认证解决方案架构师、AWS 认证 DevOps 工程师、Kubernetes 管理员)非常受欢迎。工作职责包括:• 使用丰富的 AWS 服务组合(EKS、EC2、RDS、S3、IAM、VPC、Route 53、CloudWatch 等)架构和构建可扩展、容错和安全的云基础设施。• 领导使用 Terraform、PowerShell 和其他自动化框架设计和实施基础设施即代码(IaC),以实现快速和可重复的环境配置。• 通过 Argo CD 推动 GitOps 的卓越,确保 Kubernetes 工作负载的持续交付和部署。• 使用 Datadog 构建行业领先的可观察性平台,通过指标、日志、跟踪和合成监控为团队提供实时洞察。• 负责 AWS 和混合环境的网络安全和网络管理的架构和执行,确保我们的基础设施既具韧性又安全。• 定义、测量和优化与业务影响直接相关的 SLI、SLO 和 SLA。• 构建和完善自动化事件响应、运行手册和主动监控,以减少停机时间并加速恢复。• 与软件工程、产品和安全团队紧密合作,从一开始就将可靠性和安全性融入开发生命周期。• 影响容量规划、成本优化和云战略,以支持激进的增长和创新。• 间接监督领导、指导并激励一支致力于运营卓越的高绩效 SRE 和 DevOps 团队。• 遵守健康和安全指南及规则;管理者还应确保团队的合规性。• 通过保持信息机密来保护声誉。• 通过参加教育研讨会、阅读专业出版物、建立个人网络和参与专业协会来保持专业和技术知识。• 通过完成相关结果和根据需要参与项目为团队努力做出贡献。工作要求:• 计算机科学、工程、信息技术或相关技术学科的学士学位。• 相关认证(例如,AWS 认证解决方案架构师、AWS 认证 DevOps 工程师、Kubernetes 管理员)非常受欢迎。• 具有 10 年以上的站点可靠性工程、软件开发、云基础设施架构或相关领域的专业经验,并具备领导和交付复杂、大规模项目的强大记录。• 具备之前的领导或指导经验,推动团队成长、技术卓越和协作文化。• 旅行时间最多约 5%。知识、技能和能力:• 在架构和管理云原生基础设施方面具有公认的专业知识,特别是在 AWS 上。• 在基础设施即代码工具(如 Terraform)和脚本语言(包括 PowerShell、Python 或 Bash)方面具有实践经验。• 具有使用 Argo CD 等工具领导和实施 GitOps 工作流的经验。优先工作要求:• 计算机科学、工程、信息技术或相关技术学科的硕士学位。• 拥有 AWS 认证解决方案架构师、AWS 认证 DevOps 工程师、Kubernetes 管理员认证之一或多个。• 精通使用 Datadog 或可比平台设计和维护可观察性解决方案。• 对网络安全、VPC 设计、防火墙管理和安全连接有深入了解。• 具备卓越的故障排除和事件管理能力,以及强大的沟通技巧。• 对指导团队和培养创新、可靠性和运营卓越文化充满热情。• 具有全球和分布式基于云的 IoT 平台和设备的经验。知识、技能和能力:• 在 Terraform 和其他基础设施即代码框架方面具有深厚的专业知识,并具有生产经验。• 精通 Kubernetes 架构、部署和使用 Argo CD 或同等工具的 GitOps 自动化。• 在 PowerShell、Python、Go、Bash 或类似语言方面具备强大的编程和自动化技能。