Salla正在寻找一位优秀的MLOps工程师,加入我们的团队。在MLOps工程师的角色中,您将负责设计、实施和维护我们的机器学习基础设施。
您将与我们的机器学习工程师和数据科学家紧密合作,以确保我们的机器学习模型的高效和无缝操作。理想的候选人应具有计算机科学、机器学习和软件工程的扎实背景,以及云系统设计和实施的专业知识。候选人还应具有使用MLOps框架(如Kubeflow、MLFlow、DataRobot和Airflow)的经验,并且熟悉Docker和Kubernetes等容器化技术。
职责
• 设计并实施机器学习基础设施的云解决方案,在云上构建MLOps(AWS、Azure或GCP)。
• 使用Jenkins CI、GitHub Actions、Circle CI、Airflow或类似工具构建CI/CD管道编排。
• 与机器学习工程师合作,部署机器学习模型,并记录相关过程。
• 数据科学模型审查,进行代码重构和优化,容器化,部署、版本控制及其质量监控。
• 数据科学模型测试、验证和测试自动化。
• 使用API在云系统之间构建自定义集成。
• 构建和维护自动化数据管道。
• 支持模型开发,强调可审计性、版本控制和数据安全性。
• 促进概念验证机器学习系统的开发和部署。
• 实施和维护监控和日志系统。
• 开发自动化工具以提高流程效率。
• 确保我们的机器学习基础设施可靠、可扩展和安全。
• 故障排除和解决基础设施问题。
要求
• 计算机科学、数学或相关领域的学士学位。
• 3年以上MLOps工程师或类似角色的经验。
• 能够设计和实施云解决方案,并能够在云解决方案(AWS、MS Azure或GCP)上构建MLOps管道。
• 具有使用MLOps框架(如Kubeflow、MLFlow、DataRobot、Airflow等)和使用Docker及Kubernetes进行容器化的经验。
• 对机器学习技术和框架(如TensorFlow、Keras和PyTorch)有深入了解。
• 能够理解数据科学家使用的工具,并具有软件开发和测试自动化的经验。
• 具有AWS、Azure或GCP等云平台的经验和证书。
• 对软件测试、基准测试和持续集成有深刻理解。
• 熟练掌握Python、Java或C++编程,及良好的Linux理解能力。
• 作为平台工程师、ML DevOps工程师或数据工程师,具有构建端到端系统的经验。
• 熟悉SQL和NoSQL数据库,如Click-house和Elasticsearch等。