首席云站点可靠性工程师 (SRE)

伦敦 3天前全职 网络
面议
职位描述 - 我们正在寻找一位拥有强大 Azure、Kubernetes、Terraform 和 GitHub 专业知识的首席云站点可靠性工程师 (SRE),以领导大规模项目并指导不断壮大的团队。 主要职责 • 领导大规模云项目的 SRE 活动,为工程师提供技术指导。 • 提供 VM 和 Kubernetes 的解决方案,确保高效部署、扩展和管理。 • 使用 GitHub Actions 或类似工具实施 CI/CD 管道。 • 使用 Terraform(优选)、Ansible、Jenkins 等设计和管理基础设施即代码 (IaC)。 • 评估网络需求并设计安全解决方案(负载均衡、防火墙、路由)。 • 排查和解决复杂的云基础设施和应用程序问题。 • 指导初级工程师并促进团队内的知识共享。 • 与利益相关者、供应商和跨职能团队(网络安全、测试、应用程序)合作。 • 使用 CAF、AzureRM、Google Cloud 等框架支持云迁移计划。 • 在项目交付期间代表团队,并确保遵循变更控制流程。 • 参与 24/7 值班支持轮班,并偶尔支持以前的采纳工作。 我们寻找的候选人 • 具有强大的 DevOps 背景,具备自动化优先的思维方式 • 精通 Azure、Kubernetes、Terraform、GitHub • 具有云迁移和网络解决方案的经验 • 能够领导项目并有效沟通 • 熟悉变更控制流程 额外加分项 • 云认证(Azure、GCP 等) • 有多租户解决方案的经验 • 对持续学习和创新的热情