职位描述:
我们正在寻找一位高级DevOps工程师,帮助构建和维护支撑我们电子商务平台的基础设施。我们相信快速行动是我们的竞争优势;快速行动使我们能够更好地为用户服务,因此我们为所有应用程序构建了完全自动化的CI/CD流水线。我们也知道,我们移动得越快,面临的风险就越大,可能会导致中断,因此我们大量投资于可观察性工具。
你将会:
• 让产品团队专注于开发业务逻辑,而DevOps负责可靠地运营我们的平台和生产站点,并专注于持续改进。
• 积极寻找和识别通过监控和观察学习来改善系统可用性和性能的机会。
• 独立领导关键项目,支持业务和技术战略。
• 广泛使用自动化来设计、配置、管理和监控系统,以支持我们的产品开发团队。
• 通过自动化管理基础设施(基础设施即代码 - 最好了解terraform)。
• 对事故和故障进行无责任的根本原因分析,积极寻找能够防止事故再次发生的答案。
• 定义、设计和实施DevOps实践,确保生产系统的可用性、可扩展性和可观察性,并始终关注卓越的客户体验。
• 管理事故和紧急响应,跟踪故障,确保数据完整性,并工程化发布以促进安全、高效和快速的部署。
• 将轮值负责,但轮值将在团队中公平分配,包括经理,他也会每周轮值!
• 解决各种生产或非生产问题和警报,并确定根本原因。
• 根据HIPAA、PCI和NIST等相关规定,实施与安全性和合规性相关的控制。
• 支持以数据为先导思维的多云环境。还要与数据平台工程等团队合作,交付数据管道和MLOps。
你需要:
• 5年以上DevOps工程师经验
• 在规模化的面向服务的架构和微服务方面的经验
• 熟练掌握公共云提供商(AWS、GCP)
• 掌握Terraform或其他IaC工具,如Chef、Puppet或Ansible的经验
• 掌握Jenkins、CircleCI或GitHub Actions等CI/CD工具的经验
• 能够使用容器和编排框架(Kubernetes、Docker、容器注册表等) - 有EKS经验者优先考虑。
• 精通Git
• 熟练使用Python、Bash、Go或其他一种或多种语言进行脚本编写
• 有配置、定制和扩展监控工具(Datadog、ELK、Prometheus等)的经验
• 出色的调试和故障排除能力
• 具备强大的技术能力,以数据驱动的分析方法解决复杂的挑战
• 具备系统性的问题解决方法,同时具备强大而有效的沟通能力和驱动力
• 熟悉与信息安全标准、规则和信息安全和数据保密相关的法规(如HIPAA、PCI DSS、NIST、ISO等)。
我们的福利(还有更多,以下是一些亮点):
• 全职职位具有有竞争力的薪资和股权报酬
• 无限制的带薪休假、公司假期和每季度心理健康日
• 全面的健康福利,包括医疗、牙科、视力和产假
• 员工股票购买计划(ESPP)
• 提供hims & hers & Apostrophe在线产品的员工折扣
• 雇主匹配的401k福利
• 团队外出活动