高级 DevOps 工程师 - 平台 1 (P1)

旧金山 13天前全职 网络
面议
关于 Zipline 您想改变世界吗?Zipline 的使命是改变货物的运输方式。我们的目标是通过建立、制造和运营第一个即时交付和物流系统,解决全球最紧迫和复杂的获取挑战,使所有人都能平等地获得服务,无论他们身在何处。从支持卢旺达的国家血液交付网络和加纳的 COVID-19 疫苗分发,到为沃尔玛提供按需家庭交付,再到使医疗服务提供者能够直接将护理带到美国家庭,我们正在改变企业、政府和消费者的运输方式。技术虽然复杂,但理念简单:一种传送服务,可以在您需要时交付您所需的物品。通过使用机器人和自主技术,我们正在减少交付过程中的碳排放,缓解道路拥堵,降低化石燃料消耗和空气污染,同时为数十亿人提供公平的获取机会,构建一个更具韧性的全球供应链。 加入 Zipline,帮助我们兑现承诺,为数十亿人建立一个公平且更具韧性的全球供应链。 关于您和这个角色 Zipline 的平台 1 系统为我们的长距离自主飞行器和交付基础设施提供动力,这是一个集成的本地硬件、机器人和云连接服务的堆栈,必须在现实世界中全天候无缝运行。作为 DevOps 工程师,您将成为确保这些系统在全球扩展时保持可靠、可观察和可扩展的团队的一部分。您将跨越软件和硬件的边界,构建监控框架,自动化部署,并管理保持 Zipline 实体运营连接和高效的基础设施。您是一个在复杂环境中茁壮成长的人,喜欢解决系统挑战,并为您所接触的每一件事构建可靠性而感到自豪。您具备深厚的技术背景、实践经验,以及将工程精确性与操作务实相结合的思维方式。 您将做什么 • 确保平台 1 的混合基础设施的可靠性和正常运行,涵盖本地服务器、边缘设备和云服务基础设施。 • 支持应用工程师的工作,负责软件部署 - 拥有部署工具链和服务运行的基础设施管理。 • 设计、实施和演变可观察性系统;指标、日志记录、追踪和警报,以提供对系统健康和性能的深入可见性。 • 自动化和扩展我们本地服务器的维护操作,减少人工干预,提高使用 Terraform 和 Ansible 等工具的部署重复性。 • 管理和优化支持关键任务操作的 Linux 系统和网络配置。 • 领导和参与事件响应,推动快速解决和通过事后分析和自动化实现长期预防。 • 与软件、飞行系统和运营团队合作,诊断、解决和防止跨环境的系统级问题。 • 成为平台 1 的 DevOps 内部专家 - 学习、理解并努力改善我们的计算基础设施和开发实践。 • 持续改进系统配置、部署和监控的标准和流程,帮助提升 Zipline 的可靠性技术标准。 您将带来什么 • 6年以上 DevOps、站点可靠性和/或基础设施工程角色的专业经验。 • 深厚的 Linux 系统管理、性能调优和故障排除的专业知识。 • 管理和扩展本地和混合基础设施环境的经验。 • 精通监控和日志记录工具(如 Prometheus、Grafana、ELK 等)以及对可观察性原则的深刻理解。 • 熟悉基础设施即代码工具(如 Terraform、CDK)。 • 具备 Python 和 Bash 的脚本或编程技能。 • 较强的沟通和跨职能协作能力 - 您能够在硬件、软件和运营领域中良好合作。 • 具备解决问题的思维方式,具有在动态、不断发展的系统中茁壮成长的韧性和适应能力。 • 具备容器编排(Kubernetes、Docker/DockerCompose)的经验;如果有混合或本地部署的经验则更佳。 • 具备网络、裸金属服务器管理或机器人基础设施的背景者优先。 • 熟悉硬件-软件系统的 CI/CD 和部署管道者优先。 您还需要知道的其他信息 Zipline 是一个机会均等的雇主,禁止对任何类型的歧视和骚扰,不论种族、肤色、祖先、国籍、宗教或宗教信仰、心理或身体残疾、医疗状况、遗传信息、性别(包括怀孕、分娩和相关医疗状况)、性取向、性别身份、性别表达、年龄、婚姻状况、军事或退伍军人身份、公民身份或其他受州、联邦或地方法律或我们其他政策保护的特征。 我们重视 Zipline 的多样性,并欢迎传统上在科技领域中代表性不足的申请者。如果您喜欢这个职位的描述,但不确定自己是否完全合适,请申请!