加入 TieTalent 申请 网站可靠性工程师 (SRE) | DevOps | DevSecOps 职位。
职位概述
SR2 正在支持一个为期三年的重大项目,现寻求一位经验丰富的网站可靠性工程师 (SRE) 加入生产工程团队。此职能支撑所有实时环境的可靠性、安全性和性能,从生产系统到关键客户部署。您将运用软件工程思维来解决运营问题,将自动化、可扩展性和弹性构建到云原生基础设施中。除了支持实时系统外,该团队还作为卓越中心,指导项目团队在 DevSecOps、可观察性和成本优化方面采用最佳实践。
这是一个为期六个月的合同(不在 IR35 之内),有长期延续的机会。
主要职责
• 构建、维护和支持生产和演示环境
• 自动化基础设施的配置和部署工作流(Terraform、GitHub Actions、GitOps)
• 将应用程序打包并部署到客户环境
• 实施和优化可观察性工具(Prometheus、Grafana、Loki)
• 支持事件响应、监控和备份/恢复计划
• 在 DevSecOps 实践和环境管理方面指导项目团队
• 确保云环境安全、高效且成本优化
技术环境与技能
• 云工程:AWS / Azure / GCP,Linux,Terraform(基础设施即代码)
• 容器:Kubernetes,Docker,Helm(OpenShift 更佳)
• 可观察性:Prometheus,Grafana,Loki(网络可视化为佳)
• CI / CD 和 GitOps:GitHub Actions,ArgoCD / Flux
• 安全:云访问模型,零信任原则
• 编程:优先考虑 Python 或 Golang;Bash 脚本
• 数据库与管道:PostgreSQL 优化,Kafka 集成
• 优秀的问题解决能力,能够快速排查复杂问题
详情
• 合同:六个月(在三年项目中可延长)
• 不在 IR35 之内
• 地点:伦敦,混合工作 – 每周两次现场
• 安全审查:根据部署情况可能需要 SC 级别的安全审查
高级别
• 中高级
就业类型
• 合同
职位职能
• 工程与信息技术
行业
• 技术、信息与互联网