关于我们
我们想象新事物。激励下一代。并利用我们的创造力的力量来帮助周围的人。
在艾利森,我们提供一个无限的环境,让您可以构建、创造和成长。我们开放协作和高度支持的文化没有官僚主义和繁文缛节。我们拥有超过 1,000 名来自不同背景的创新者,为全球 50 个市场和数十个行业的世界级客户开辟新天地。我们相信创造一个每个人都可以自由表达意见、分享想法和未来梦想的空间,并做自己。
我们培养一种包容的文化,吸引来自各个背景的建设者,他们能够设想新的解决方案并创造推动客户业务向前发展的结果,同时帮助团队中的每个人共同学习和成长。我们共享的建设者心态是无限的,适用于每个人,我们推动边界,为客户和我们自己创造新的创新解决方案。
我们创造持久的影响和关系,我们的文化促进有意义的联系和友谊,这些关系超越工作场所。如果您准备好加入一个推动您成为最佳的团队,支持您每一步,并庆祝您的成功,欢迎来到艾利森。
概述
我们正在寻找一位熟练的机器学习运维 (MLOps) 工程师,以增强机器学习模型和数据管道的自动化、可扩展性和部署。该角色非常适合在 CI/CD 管道、云计算、Kubernetes 和数据管道自动化方面有经验的专业人士。MLOps 工程师将在改善模型部署、监控和运营效率方面发挥关键作用。
职责
模型部署与 CI/CD 自动化
• 设计并实施 CI/CD 管道,以自动化机器学习模型的开发、部署和监控。
• 将基于 Jupyter Notebook 的模型重构为可用于生产的模块化 Python 包。
• 使用 Docker 和 Kubernetes 开发可容器化的机器学习工作流,以实现可扩展的部署。
• 自动化模型测试、超参数调整和优化,以提高模型性能和可靠性。
数据管道与工程
• 构建和维护 ETL 和数据处理管道,以支持机器学习工作负载。
• 优化数据提取、转换和加载 (ETL) 过程,提高效率和可扩展性。
• 使用 Apache Spark、Airflow 和 BigQuery 管理批处理和实时数据管道。
• 领导将机器学习管道从 Vertex AI/GCP 迁移到 Databricks,提高性能和成本效率。
云基础设施与自动化
• 在 Google Cloud Platform (GCP) 和 AWS 上实施和管理基于云的机器学习环境。
• 使用 Databricks 模型服务、Hugging Face Transformers 和 Apache Spark 部署和监控机器学习模型。
• 开发基础设施即代码解决方案,以实现可扩展的机器学习部署。
• 使用日志记录和警报工具监控模型漂移、数据完整性和性能。
协作与最佳实践
• 与数据科学家、工程师和产品团队紧密合作,简化模型部署。
• 实施 MLOps 最佳实践,包括模型版本控制、可重复性和治理。
• 记录机器学习工作流、管道和故障排除协议,以便长期维护。
• 开发交互式仪表板和监控工具,以进行模型性能分析。
资格
必备资格
• 5年以上机器学习工程、数据工程或 MLOps 经验。
• 精通 Python、SQL、Airflow 和 Spark。
• 具有 Kubernetes、Docker 和基于云的机器学习部署 (GCP、AWS 或 Databricks) 的实际经验。
• 在机器学习和数据管道的 CI/CD 自动化方面有经验。
• 熟悉自然语言处理 (NLP)、聚类算法和统计建模。
• 具备版本控制 (Git)、自动化脚本和模型监控框架的扎实知识。
优先资格
• 具有使用 Hugging Face Transformers 和 Apache Spark 进行大规模机器学习工作流的经验。
• 对特征工程、模型再训练和 A/B 测试有深入理解。
• 具有使用 TensorFlow Serving 或 Databricks 模型服务等模型服务框架的实际经验。
• 在金融、广告或实时数据处理领域有经验。
福利
• 混合工作环境,居家和办公室安排(每周 2 天以上在办公室)和随时随地工作的周。
• 全面的健康福利(医疗、视力、牙科、宠物、家庭和汽车保险)。
• 慷慨的休假政策(无限带薪休假、健康日、国家假日、夏季星期五)。
• 每五年连续工作四周的休假。
• 优越的父母假福利。
• 全球导师和网络计划。
• 每月手机报销。
• 401k 储蓄和员工股票购买计划。
• 每年 20 小时的志愿者时间,用于指定的非营利合作伙伴和个人选择。
• 全球驱动的 IDE+A 倡议(员工倡导小组、多元文化卓越中心)。
• 职业成长机会,如艾利森大学(为每个级别定制的多日培训)。