🔧 您将要做的工作:
• 在高流量系统中主导可靠性和可观察性策略
• 使用 New Relic 架构端到端监控(仪表板、SLO、警报、合成监控)
• 设计高可用性的基础设施,使用 Kubernetes、Docker 和 Terraform/CloudFormation
• 管理事件响应并进行无责备的事后分析
• 与开发、质量保证和产品团队合作进行性能和混沌测试
• 指导初级 SRE 并建立运营最佳实践
• 在高流量事件期间(例如黑色星期五)优化系统行为
✅ 必须具备的经验:
• 8 年以上 SRE、DevOps 或平台工程经验
• 精通 New Relic(实践和架构层面)
• 有大型零售或电子商务平台的经验
• 精通 Python、Bash 或 Go
• 深入了解 AWS/GCP/Azure 和基础设施即代码工具
• 出色的沟通和领导能力
🌟 加分项:
• 有 Shopify 或无头电商的经验
• 熟悉缓存、自动扩展、边缘优化
• 之前在分布式团队工作的经验
BayOne 是一个机会均等的雇主,不会因种族、肤色、性别、年龄、宗教、性取向、性别认同、退伍军人身份或任何联邦、州或地方保护类别的残疾而歧视任何员工或求职者。
此职位发布代表执行该职位所需的一般职责和要求,并不是对所有责任、职责和技能要求的详尽说明。管理层保留修改或更改此职位描述的权利。