机器学习运维工程师

无个税21天前全职
Salla

Salla

location 吉达
unsaved
Salla正在寻找一位成功的MLOps工程师加入我们的团队。作为MLOps工程师,您将负责设计、实施和维护我们的机器学习基础设施。 您将与我们的机器学习工程师和数据科学家紧密合作,以确保我们的机器学习模型高效、无缝地运行。理想的候选人应具备扎实的计算机科学、机器学习和软件工程背景,以及云系统设计和实施的专业知识。候选人还应具有MLOps框架的经验,例如Kubeflow、MLFlow、DataRobot和Airflow,并且熟悉像Docker和Kubernetes这样的容器化技术。 **职责** - 设计和实施机器学习基础设施的云解决方案,在云(AWS、Azure或GCP)上构建MLOps。 - 通过Jenkins CI、GitHub Actions、Circle CI、Airflow或类似工具构建CI/CD管道的编排。 - 与机器学习工程师合作,部署机器学习模型,并记录过程。 - 数据科学模型审查,执行代码重构和优化、容器化、部署、版本管理及其质量监测。 - 数据科学模型测试、验证及测试自动化。 - 使用API在云系统之间构建自定义集成。 - 构建和维护自动化数据管道。 - 支持模型开发,着重于可审计性、版本控制和数据安全。 - 促进概念验证机器学习系统的开发和部署。 - 实施和维护监控和日志系统。 - 开发自动化工具以提高流程的效率。 - 确保我们的机器学习基础设施可靠、可扩展和安全。 - 解决和排除基础设施问题。 **要求** - 计算机科学、数学或相关领域的学士学位。 - 3年以上MLOps工程师或类似角色的经验。 - 能够设计和实施云解决方案,以及在云解决方案(AWS、MS Azure或GCP)上构建MLOps管道的能力。 - 具有MLOps框架经验,如Kubeflow、MLFlow、DataRobot、Airflow等,具有使用Docker和Kubernetes的容器化经验。 - 对机器学习技术和框架(如TensorFlow、Keras和PyTorch)有深入了解。 - 能够理解数据科学家使用的工具,并具有软件开发和测试自动化的经验。 - 在AWS、Azure或GCP等云平台上有经验并持有相关认证。 - 对软件测试、基准测试和持续集成有深入理解。 - 在Python、Java或C++中具有强大的编程能力,并具备良好的Linux理解。 - 拥有作为平台工程师、ML DevOps工程师或数据工程师构建端到端系统的经验。 - 在ClickHouse和Elasticsearch等SQL和NoSQL数据库方面有良好的经验。