职位描述 -
我们正在寻找一位拥有强大 Azure、Kubernetes、Terraform 和 GitHub 专业知识的首席云站点可靠性工程师 (SRE),以领导大规模项目并指导不断壮大的团队。
主要职责
• 领导大规模云项目的 SRE 活动,为工程师提供技术指导。
• 提供 VM 和 Kubernetes 的解决方案,确保高效部署、扩展和管理。
• 使用 GitHub Actions 或类似工具实施 CI/CD 管道。
• 使用 Terraform(优选)、Ansible、Jenkins 等设计和管理基础设施即代码 (IaC)。
• 评估网络需求并设计安全解决方案(负载均衡、防火墙、路由)。
• 排查和解决复杂的云基础设施和应用程序问题。
• 指导初级工程师并促进团队内的知识共享。
• 与利益相关者、供应商和跨职能团队(网络安全、测试、应用程序)合作。
• 使用 CAF、AzureRM、Google Cloud 等框架支持云迁移计划。
• 在项目交付期间代表团队,并确保遵循变更控制流程。
• 参与 24/7 值班支持轮班,并偶尔支持以前的采纳工作。
我们寻找的候选人
• 具有强大的 DevOps 背景,具备自动化优先的思维方式
• 精通 Azure、Kubernetes、Terraform、GitHub
• 具有云迁移和网络解决方案的经验
• 能够领导项目并有效沟通
• 熟悉变更控制流程
额外加分项
• 云认证(Azure、GCP 等)
• 有多租户解决方案的经验
• 对持续学习和创新的热情