这是一个令人兴奋的机会,可以加入一家快速发展的企业级AI技术领导者。由国际知名投资者支持,并在全球排名中如《福布斯AI 50》和《Inc. 5000》上榜,这家组织正在通过尖端解决方案改变法律行业。
我们正在寻找一位有才华和前瞻性思维的工程师,以DevOps和平台工程的身份加入基础设施团队。理想的候选人将拥有丰富的构建云原生环境的经验,专注于自动化、可扩展性和安全性,并在基础设施即代码(IaC)方面具有较强的能力。此角色将涉及塑造和发展公司的AWS平台——现代化部署流程、自动化环境创建,并确保系统可靠、一致且高度弹性。
职责
• 使用AWS服务(如EC2、EKS、RDS/Aurora、ElastiCache、OpenSearch和CloudFront)设计、构建和维护可扩展的云基础设施。
• 领导并支持在EKS上采用Kubernetes,用于生产和内部工作负载。
• 构建和实施基础设施即代码管道,将Terraform(或类似工具)集成到CI/CD工作流中进行配置、验证和自动化测试。
• 实施零停机部署策略(蓝/绿、滚动、金丝雀),并具备自动回滚和恢复功能。
• 推动基础设施改进,减少单点故障,增强自动扩展、高可用性和托管服务的利用。
• 与SRE、安全和工程团队合作,使用Prometheus、Grafana和CloudWatch等工具改进可观测性、监控和警报。
• 与安全团队密切合作,嵌入IAM、秘密管理、WAF和治理的最佳实践。
• 通过自动化和成本可见性工具优化性能和云支出。
• 参与值班轮换、事件审查和持续的可靠性增强。
要求
• 具有设计、自动化和维护AWS基础设施(EKS、RDS、EC2、CloudFront、VPC、IAM、安全中心)的经验。
• 具有使用Terraform构建IaC管道并与CI/CD工具(GitHub Actions、GitLab CI、Jenkins、AWS CodePipeline等)集成的实践经验。
• 对AWS上的Kubernetes操作有深入了解,包括扩展、部署自动化和监控。
• 具备Linux系统管理、网络和云安全的扎实背景。
• 熟悉Prometheus、Grafana和Loki等可观测性工具,以及结构化警报实践。
• 具有数据库迁移、高可用性配置、备份和灾难恢复的经验。
• 具备强大的脚本和自动化技能(Terraform、Python、Bash或类似)。
• 优秀的沟通和协作能力,致力于通过自动化和标准化提高工程效率。
Robert Walters Operations Limited是一家就业业务和就业代理,欢迎所有候选人申请。