Salla正在寻找一位成功的MLOps工程师加入我们的团队。作为MLOps工程师,您将负责设计、实施和维护我们的机器学习基础设施。
您将与我们的机器学习工程师和数据科学家紧密合作,以确保我们的机器学习模型高效、无缝地运行。理想的候选人应具备扎实的计算机科学、机器学习和软件工程背景,以及云系统设计和实施的专业知识。候选人还应具有MLOps框架的经验,例如Kubeflow、MLFlow、DataRobot和Airflow,并且熟悉像Docker和Kubernetes这样的容器化技术。
**职责**
- 设计和实施机器学习基础设施的云解决方案,在云(AWS、Azure或GCP)上构建MLOps。
- 通过Jenkins CI、GitHub Actions、Circle CI、Airflow或类似工具构建CI/CD管道的编排。
- 与机器学习工程师合作,部署机器学习模型,并记录过程。
- 数据科学模型审查,执行代码重构和优化、容器化、部署、版本管理及其质量监测。
- 数据科学模型测试、验证及测试自动化。
- 使用API在云系统之间构建自定义集成。
- 构建和维护自动化数据管道。
- 支持模型开发,着重于可审计性、版本控制和数据安全。
- 促进概念验证机器学习系统的开发和部署。
- 实施和维护监控和日志系统。
- 开发自动化工具以提高流程的效率。
- 确保我们的机器学习基础设施可靠、可扩展和安全。
- 解决和排除基础设施问题。
**要求**
- 计算机科学、数学或相关领域的学士学位。
- 3年以上MLOps工程师或类似角色的经验。
- 能够设计和实施云解决方案,以及在云解决方案(AWS、MS Azure或GCP)上构建MLOps管道的能力。
- 具有MLOps框架经验,如Kubeflow、MLFlow、DataRobot、Airflow等,具有使用Docker和Kubernetes的容器化经验。
- 对机器学习技术和框架(如TensorFlow、Keras和PyTorch)有深入了解。
- 能够理解数据科学家使用的工具,并具有软件开发和测试自动化的经验。
- 在AWS、Azure或GCP等云平台上有经验并持有相关认证。
- 对软件测试、基准测试和持续集成有深入理解。
- 在Python、Java或C++中具有强大的编程能力,并具备良好的Linux理解。
- 拥有作为平台工程师、ML DevOps工程师或数据工程师构建端到端系统的经验。
- 在ClickHouse和Elasticsearch等SQL和NoSQL数据库方面有良好的经验。