DevOps工程师;中高级

纽约 2天前全职 网络
面议
职位:DevOps工程师(中高级) 地点:纽约 关于该职位 我们正在寻找一位才华横溢的DevOps工程师加入我们的远程团队,帮助扩展Resonance ONE背后的复杂基础设施。作为Resonance的DevOps工程师,您将在设计、构建和维护一个复杂的全栈平台中发挥关键作用,该平台支撑从数字设计工具到电子商务和制造自动化的一切。我们的技术栈涵盖了广泛的现代技术——从机器学习服务(OpenAI和其他ML模型)到强大的云后端(AWS基础设施,AWS Lambda)、数据和分析系统(Hasura GraphQL引擎、Snowflake数据仓库、Looker BI)、事件流(Kafka)和编排工具(Kubernetes与Argo Workflows,以及与Airtable等工具的集成)——所有这些都协同工作以实现我们的使命。 在这个角色中,您将确保这些不同的组件和谐、安全地协同工作,并有机会在一个前瞻性、以AI驱动的组织中从头开始塑造和实施可扩展的DevOps实践和系统。您将与软件工程师、数据科学家和产品团队密切合作,不断改进我们的开发管道、部署流程和基础设施自动化。 这是一个独特的机会,可以在一个推动技术边界的架构中解决具有挑战性的问题,同时使时尚品牌能够在无浪费的情况下进行创新。 职责 • 架构和维护云基础设施: 使用基础设施即代码和现代CI/CD管道(例如Argo Workflows)构建、维护和扩展我们的AWS云基础设施。确保我们的应用程序和机器学习服务在开发、预生产和生产环境中的可靠自动化部署。 • 容器编排: 管理我们的Kubernetes集群和容器化微服务,优化高可用性、安全性和资源使用效率。不断改进我们的集群部署、扩展策略和回滚流程,以支持快速增长的平台。 • CI/CD和自动化: 设计和实施持续集成和交付管道,使我们的开发团队能够快速、安全地发布代码和ML模型更新。通过脚本、AWS Lambda函数和其他自动化工具减少手动工作,实现例行操作和工作流的自动化。 • 监控和可靠性: 实施强大的监控、日志记录和警报(使用Prometheus、Cloud Watch等工具)以主动跟踪系统性能和可靠性。快速排除和解决基础设施问题或瓶颈,以保持高正常运行时间和响应服务。 • 数据和管道集成: 与我们的数据工程团队紧密合作,以支持数据在平台中的无缝流动。维护和优化我们的事件流和管道架构(Kafka)及其与下游系统(如我们的Snowflake数据仓库和Looker分析)的集成,确保数据准确及时地交付。 • AI/ML基础设施: 与机器学习工程师合作,在生产中部署和扩展AI/ML模型。支持OpenAI和其他ML模型在我们的应用程序中的集成,实施模型训练、推理和在实时环境中监控模型性能所需的基础设施(计算、存储、容器)。 • 工具集成和支持: 集成和管理扩展我们平台功能的内部和第三方工具——例如,维护与数据库接口的Hasura GraphQL引擎,或自动化涉及Airtable等外部服务的工作流。确保这些工具正确部署、更新,并符合我们的安全和合规标准。 • DevOps最佳实践和文化: 在工程组织中倡导DevOps最佳实践。这包括改进我们的发布流程(例如实施Git Ops工作流)、优化构建/测试管道,并指导开发人员使用基础设施工具。您将不断评估新技术和流程,以提高部署速度、可靠性和…