Salla 正在寻找一位优秀的高级 MLOps 工程师,帮助我们通过实施最佳实践和创新解决方案来优化机器学习生命周期。在这个角色中,您将与数据科学家、软件工程师和利益相关者密切合作,部署强大的机器学习模型并维护高效的运营。
职责:
• 设计、构建和维护可扩展的 MLOps 管道,以促进数据科学家与工程团队之间的协作。
• 实施和管理模型训练、验证、部署和监控的工作流程。
• 利用云平台(AWS、GCP 或 Azure)来配置和管理机器学习资源。
• 开发工具和框架,以帮助机器学习模型的持续集成和部署。
• 与数据科学家合作,理解模型需求,并协助特征工程和选择。
• 监控生产中的模型性能,识别问题并提供模型优化建议。
• 建立机器学习模型版本控制、测试和文档的最佳实践。
• 关注 MLOps 工具和方法的最新发展。
• 具备良好的沟通能力,能够向非技术利益相关者传达技术概念。
• 出色的问题解决能力和主动解决挑战的态度。
要求:
• 5 年以上 MLOps、机器学习基础设施或相关工程角色的经验。
• 有将机器学习模型部署到生产环境的实际经验。
• 精通 Python 编程,熟悉机器学习框架(如 PyTorch、TensorFlow、Scikit-learn)。
• 熟练使用容器化和编排技术(Docker、Kubernetes)。
• 具备云 ML 平台(AWS、GCP 或 Azure)的经验。
• 熟悉工作流编排(Airflow、Prefect、Mage 或同类工具)。
• 理解机器学习工作负载的 CI/CD 自动化。
• 具备 DevOps 概念的工作知识(基础设施即代码、日志/监控、网络基础知识)。
• 具备推荐系统的工作经验。
福利:
• 全面的培训与发展计划。
• 基于绩效的奖金激励。
• 灵活的远程工作选项。