资深网站可靠性工程师
我们正在寻找一位资深网站可靠性工程师(SRE),加入一家快速成长、使命驱动的科技初创公司的工程团队。
作为资深 SRE,您将在构建和扩展我们的平台中发挥关键作用,重点关注可靠性、性能和自动化。您将与产品和工程团队紧密合作,开发和实施最佳实践,以确保正常运行时间、速度和安全性,同时指导他人并推动持续改进的文化。
该职位为混合办公模式,每周在纽约办公室工作 3 天(周二、周三、周四)。
职责:
• 架构与自动化:设计和构建可扩展、高可用的基础设施,使用基础设施即代码(优先使用 Terraform)。
• 跨职能协作:与软件工程师、数据团队和产品经理合作,提高系统的可靠性和性能。
• 驱动卓越:为可观察性、事件响应、CI/CD 和运营实践设定高标准。
• 领导与指导:支持其他工程师采用 SRE 最佳实践,并鼓励拥有、敏捷和创新的文化。
要求:
• 5 年以上 SRE、DevOps 或相关工程角色的经验,最好是在初创公司或快速增长的环境中。
• 对 AWS(VPC、Route 53、ECS、Lambda、API Gateway、RDS)有深入的经验。
• 具备 CI/CD 管道的实践经验(优先使用 GitHub Actions)。
• 精通现代编程语言(Python、Ruby、Go、JavaScript 等)。
• 深入理解监控、事件管理和可观察性工具(DataDog 优先)。
• 具有 Terraform 或类似基础设施即代码框架的经验。
申请者必须目前获得授权,能够在美国全职工作,未来也能继续工作。
该职位不提供签证赞助。