网站可靠性工程师 (SRE)

伦敦 10天前全职 网络
84.8万 - 94.3万 / 年
位置:伦敦 薪资:每年 £100k + 奖金 + 福利 我正在为一家大型数字组织寻找多名网站可靠性工程师 (SRE),该组织正在进行重大工程现代化转型。这不是一个日常支持角色,而是一个机会,帮助定义 SRE 在首次全面内部化时的“优秀”标准。 您将跨多个高影响力平台(网页/移动、支付、CRM、运营、云)工作,并在将组织从以工单驱动的支持转向主动、自动化、以 AWS 为首、以工程为主导的可靠性方面发挥关键作用。 职责 • 嵌入 SRE 原则,以提高可用性、可靠性、性能和事件响应 • 通过引入自动化、可观察性、左移实践和 CI/CD 来现代化传统支持 • 在多个领域(网页/移动、支付、CRM、云基础设施、航空系统)工作 • 与供应商和内部工程团队合作;影响技术和财务决策 • 定义并推动 SLOs/SLIs、服务健康指标和标准 • 使用 Datadog、Splunk 等工具进行故障排除、监控和系统改进 • 参与基础设施即代码(IaC)、容器化和云原生采用(AWS、Terraform、Docker/K8s) • 在组织中引入 SRE 工作方式时,指导和支持工程师 经验 / 您的背景 • 3-5 年 SRE 或密切相关的可靠性/DevSecOps 学科经验 • 深入了解 SRE 实践:监控、可观察性、事件响应、自动化 • 熟悉 AWS 和基础设施即代码(Terraform、Ansible 或 CloudFormation) • 有 CI/CD 管道和容器平台(Docker / Kubernetes)的经验 • 能够与供应商、供应商和内部产品/工程团队进行良好沟通 • 能够清晰沟通并影响工程文化,而不仅仅是构建解决方案 • 有接触大型、复杂或供应商密集环境的经验者优先 • 通过影响力而非直接管理的方式领导实操角色 想了解更多信息吗?请联系本杰明·阿普尔韦特(Benjamin Applewhaite),以保密的方式讨论该职位。