描述
Salla 正在寻找一位有才华的高级 MLOps 工程师,帮助我们通过实施最佳实践和创新解决方案来简化机器学习生命周期。在这个角色中,您将与数据科学家、软件工程师和利益相关者密切合作,部署强大的机器学习模型并维护高效的运营。
职责:
• 设计、构建和维护可扩展的 MLOps 流水线,促进数据科学家与工程团队之间的协作。
• 实施和管理模型训练、验证、部署和监控的工作流程。
• 利用基于云的平台(AWS、GCP 或 Azure)来配置和管理机器学习资源。
• 开发工具和框架,以协助机器学习模型的持续集成和部署。
• 与数据科学家合作,理解模型需求,并协助特征工程和选择。
• 监控生产中的模型性能,识别问题,并提供模型优化建议。
• 建立机器学习模型版本控制、测试和文档的最佳实践。
• 跟踪 MLOps 工具和方法论的最新发展。
• 具备强大的沟通能力,能够将技术概念传达给非技术利益相关者。
• 优秀的解决问题能力和主动应对挑战的态度。
要求:
• 5 年以上 MLOps、机器学习基础设施或相关工程岗位的经验。
• 有将机器学习模型部署到生产环境的实践经验。
• 精通 Python 编程,并熟悉机器学习框架(如 PyTorch、TensorFlow、Scikit-learn)。
• 熟练使用容器化和编排技术(Docker、Kubernetes)。
• 有云机器学习平台(AWS、GCP 或 Azure)的经验。
• 熟悉工作流编排(Airflow、Prefect、Mage 或同类工具)。
• 理解机器学习工作负载的 CI/CD 自动化。
• 具备 DevOps 概念的工作知识(基础设施即代码、日志/监控、网络基础)。
• 有推荐系统方面的工作经验。
福利:
• 综合培训与发展计划。
• 基于绩效的奖金激励。
• 灵活的居家办公选项。