猎鹰追踪国际
DevOps工程师/可靠性工程师(SRE)
私人日费
伦敦
远程或混合办公
最近发布
毕业生
初级
中级
高级
领导者
描述
角色概述
我们正在寻找一位经验丰富的云工程师/SRE,在交付和发展基于云的服务中发挥关键作用。您将向云平台负责人汇报,负责领导各种项目的云解决方案的技术交付。
该角色结合了实际操作的工程、技术领导力和云平台的所有权。根据项目需要,您可能在共享云平台上工作或嵌入到产品团队中。您还将支持现有的云环境和之前交付的采用工作。
作为团队的高级成员,您将负责复杂项目,为其他工程师提供指导,并在云采用、自动化和可靠性工程方面推动最佳实践。
关键职责 云工程与交付
领导使用传统基础设施和云原生技术的云解决方案的设计和实施。
交付和支持运行在虚拟机和Kubernetes平台上的工作负载。
确保解决方案安全、可扩展、具有弹性,并符合云最佳实践。
使用公认的行业框架支持云迁移计划。
DevOps与自动化
设计、实施和维护使用GitHub Actions或等效工具的CI/CD管道。
使用Terraform(首选)、Ansible或类似工具开发和管理基础设施即代码(IaC)。
推动构建、部署和运营过程中的自动化优先方法。
站点可靠性与运营
作为主要计划的SRE负责人,确保服务的可靠性、可用性和性能。
排查和解决复杂的云基础设施和应用程序问题。
参与24/7随叫随到的支持轮班,支持实时服务和核心云平台。
推广和执行稳健的变更控制和运营流程。
技术领导与协作
为初级和中级云工程师提供技术领导和指导。
审查设计、项目计划和交付方法,必要时进行建设性挑战。
与项目经理、网络安全、测试、网络和应用团队密切合作。
在项目交付和利益相关者讨论中代表云工程团队。
文档与治理
制作高质量的技术设计文档、运营交接文档和运行手册。
确保遵守组织标准、安全政策和治理框架。
倡导云架构、DevOps和SRE领域的最佳实践。
基本技能与经验
在复杂环境中领导云或SRE计划的丰富经验。
具有实际云交付经验的强大DevOps背景。
扎实的专业知识:
云平台(首选Azure)
Kubernetes
Terraform(IaC)
GitHub/GitHub Actions
在基于VM和容器化平台上交付解决方案的经验。
对网络概念的强烈理解,包括负载均衡、防火墙、路由和网络安全。
支持和排查生产云环境的经验。
能够在敏捷或项目交付环境中工作。
愿意并能够参与24/7随叫随到的支持轮班。
理想技能与经验
云认证(如有需要可提供培训)。
设计或支持多租户云解决方案的经验。
接触云迁移框架(如Azure CAF或等效框架)。
对持续学习和保持云和DevOps技术的最新动态有浓厚兴趣。
在平台和流程中推动持续改进的经验。
角色技术栈
GitHub
Ansible
Kubernetes