高级网站可靠性工程师

旧金山 5个月前合同 网络
537 - 609 / 时
🔧 您将要做的工作: • 在高流量系统中主导可靠性和可观察性策略 • 使用 New Relic 架构端到端监控(仪表板、SLO、警报、合成监控) • 设计高可用性的基础设施,使用 Kubernetes、Docker 和 Terraform/CloudFormation • 管理事件响应并进行无责备的事后分析 • 与开发、质量保证和产品团队合作进行性能和混沌测试 • 指导初级 SRE 并建立运营最佳实践 • 在高流量事件期间(例如黑色星期五)优化系统行为 ✅ 必须具备的经验: • 8 年以上 SRE、DevOps 或平台工程经验 • 精通 New Relic(实践和架构层面) • 有大型零售或电子商务平台的经验 • 精通 Python、Bash 或 Go • 深入了解 AWS/GCP/Azure 和基础设施即代码工具 • 出色的沟通和领导能力 🌟 加分项: • 有 Shopify 或无头电商的经验 • 熟悉缓存、自动扩展、边缘优化 • 之前在分布式团队工作的经验 BayOne 是一个机会均等的雇主,不会因种族、肤色、性别、年龄、宗教、性取向、性别认同、退伍军人身份或任何联邦、州或地方保护类别的残疾而歧视任何员工或求职者。 此职位发布代表执行该职位所需的一般职责和要求,并不是对所有责任、职责和技能要求的详尽说明。管理层保留修改或更改此职位描述的权利。