DevOps工程师/可靠性工程师 (SRE)

伦敦 12天前 远程 全职 网络
面议
猎鹰追踪国际 DevOps工程师/可靠性工程师(SRE) 私人日费 伦敦 远程或混合办公 最近发布 毕业生 初级 中级 高级 领导者 描述 角色概述 我们正在寻找一位经验丰富的云工程师/SRE,在交付和发展基于云的服务中发挥关键作用。您将向云平台负责人汇报,负责领导各种项目的云解决方案的技术交付。 该角色结合了实际操作的工程、技术领导力和云平台的所有权。根据项目需要,您可能在共享云平台上工作或嵌入到产品团队中。您还将支持现有的云环境和之前交付的采用工作。 作为团队的高级成员,您将负责复杂项目,为其他工程师提供指导,并在云采用、自动化和可靠性工程方面推动最佳实践。 关键职责 云工程与交付 领导使用传统基础设施和云原生技术的云解决方案的设计和实施。 交付和支持运行在虚拟机和Kubernetes平台上的工作负载。 确保解决方案安全、可扩展、具有弹性,并符合云最佳实践。 使用公认的行业框架支持云迁移计划。 DevOps与自动化 设计、实施和维护使用GitHub Actions或等效工具的CI/CD管道。 使用Terraform(首选)、Ansible或类似工具开发和管理基础设施即代码(IaC)。 推动构建、部署和运营过程中的自动化优先方法。 站点可靠性与运营 作为主要计划的SRE负责人,确保服务的可靠性、可用性和性能。 排查和解决复杂的云基础设施和应用程序问题。 参与24/7随叫随到的支持轮班,支持实时服务和核心云平台。 推广和执行稳健的变更控制和运营流程。 技术领导与协作 为初级和中级云工程师提供技术领导和指导。 审查设计、项目计划和交付方法,必要时进行建设性挑战。 与项目经理、网络安全、测试、网络和应用团队密切合作。 在项目交付和利益相关者讨论中代表云工程团队。 文档与治理 制作高质量的技术设计文档、运营交接文档和运行手册。 确保遵守组织标准、安全政策和治理框架。 倡导云架构、DevOps和SRE领域的最佳实践。 基本技能与经验 在复杂环境中领导云或SRE计划的丰富经验。 具有实际云交付经验的强大DevOps背景。 扎实的专业知识: 云平台(首选Azure) Kubernetes Terraform(IaC) GitHub/GitHub Actions 在基于VM和容器化平台上交付解决方案的经验。 对网络概念的强烈理解,包括负载均衡、防火墙、路由和网络安全。 支持和排查生产云环境的经验。 能够在敏捷或项目交付环境中工作。 愿意并能够参与24/7随叫随到的支持轮班。 理想技能与经验 云认证(如有需要可提供培训)。 设计或支持多租户云解决方案的经验。 接触云迁移框架(如Azure CAF或等效框架)。 对持续学习和保持云和DevOps技术的最新动态有浓厚兴趣。 在平台和流程中推动持续改进的经验。 角色技术栈 GitHub Ansible Kubernetes