机器学习运维 (MLOps) 工程师

5个月前全职
面议 Allison Worldwide

Allison Worldwide

location 芝加哥
unsaved
关于我们 我们想象新事物。激励下一代。并利用我们的创造力的力量来帮助周围的人。 在艾利森,我们提供一个无限的环境,让您可以构建、创造和成长。我们开放协作和高度支持的文化没有官僚主义和繁文缛节。我们拥有超过 1,000 名来自不同背景的创新者,为全球 50 个市场和数十个行业的世界级客户开辟新天地。我们相信创造一个每个人都可以自由表达意见、分享想法和未来梦想的空间,并做自己。 我们培养一种包容的文化,吸引来自各个背景的建设者,他们能够设想新的解决方案并创造推动客户业务向前发展的结果,同时帮助团队中的每个人共同学习和成长。我们共享的建设者心态是无限的,适用于每个人,我们推动边界,为客户和我们自己创造新的创新解决方案。 我们创造持久的影响和关系,我们的文化促进有意义的联系和友谊,这些关系超越工作场所。如果您准备好加入一个推动您成为最佳的团队,支持您每一步,并庆祝您的成功,欢迎来到艾利森。 概述 我们正在寻找一位熟练的机器学习运维 (MLOps) 工程师,以增强机器学习模型和数据管道的自动化、可扩展性和部署。该角色非常适合在 CI/CD 管道、云计算、Kubernetes 和数据管道自动化方面有经验的专业人士。MLOps 工程师将在改善模型部署、监控和运营效率方面发挥关键作用。 职责 模型部署与 CI/CD 自动化 • 设计并实施 CI/CD 管道,以自动化机器学习模型的开发、部署和监控。 • 将基于 Jupyter Notebook 的模型重构为可用于生产的模块化 Python 包。 • 使用 Docker 和 Kubernetes 开发可容器化的机器学习工作流,以实现可扩展的部署。 • 自动化模型测试、超参数调整和优化,以提高模型性能和可靠性。 数据管道与工程 • 构建和维护 ETL 和数据处理管道,以支持机器学习工作负载。 • 优化数据提取、转换和加载 (ETL) 过程,提高效率和可扩展性。 • 使用 Apache Spark、Airflow 和 BigQuery 管理批处理和实时数据管道。 • 领导将机器学习管道从 Vertex AI/GCP 迁移到 Databricks,提高性能和成本效率。 云基础设施与自动化 • 在 Google Cloud Platform (GCP) 和 AWS 上实施和管理基于云的机器学习环境。 • 使用 Databricks 模型服务、Hugging Face Transformers 和 Apache Spark 部署和监控机器学习模型。 • 开发基础设施即代码解决方案,以实现可扩展的机器学习部署。 • 使用日志记录和警报工具监控模型漂移、数据完整性和性能。 协作与最佳实践 • 与数据科学家、工程师和产品团队紧密合作,简化模型部署。 • 实施 MLOps 最佳实践,包括模型版本控制、可重复性和治理。 • 记录机器学习工作流、管道和故障排除协议,以便长期维护。 • 开发交互式仪表板和监控工具,以进行模型性能分析。 资格 必备资格 • 5年以上机器学习工程、数据工程或 MLOps 经验。 • 精通 Python、SQL、Airflow 和 Spark。 • 具有 Kubernetes、Docker 和基于云的机器学习部署 (GCP、AWS 或 Databricks) 的实际经验。 • 在机器学习和数据管道的 CI/CD 自动化方面有经验。 • 熟悉自然语言处理 (NLP)、聚类算法和统计建模。 • 具备版本控制 (Git)、自动化脚本和模型监控框架的扎实知识。 优先资格 • 具有使用 Hugging Face Transformers 和 Apache Spark 进行大规模机器学习工作流的经验。 • 对特征工程、模型再训练和 A/B 测试有深入理解。 • 具有使用 TensorFlow Serving 或 Databricks 模型服务等模型服务框架的实际经验。 • 在金融、广告或实时数据处理领域有经验。 福利 • 混合工作环境,居家和办公室安排(每周 2 天以上在办公室)和随时随地工作的周。 • 全面的健康福利(医疗、视力、牙科、宠物、家庭和汽车保险)。 • 慷慨的休假政策(无限带薪休假、健康日、国家假日、夏季星期五)。 • 每五年连续工作四周的休假。 • 优越的父母假福利。 • 全球导师和网络计划。 • 每月手机报销。 • 401k 储蓄和员工股票购买计划。 • 每年 20 小时的志愿者时间,用于指定的非营利合作伙伴和个人选择。 • 全球驱动的 IDE+A 倡议(员工倡导小组、多元文化卓越中心)。 • 职业成长机会,如艾利森大学(为每个级别定制的多日培训)。