我们的客户是加拿大的一家领先私募股权公司。他们正在寻找一名高级MLOps/DevOps工程师。
角色的具体职责:
云解决方案:
• 设计、部署和维护主要云平台上的可扩展解决方案,优先选择Google Cloud (GCP)、AWS或Azure。
• 确保核心基础设施、应用程序和服务的可用性、性能和准备就绪。
微服务和ML流水线:
• 实施和维护端到端的微服务和机器学习流水线。
• 管理从数据摄取到生产监控的整个机器学习生命周期。
CI/CD实施:
• 利用CI/CD原则简化代码部署和软件更新。
• 使用基础设施即代码工具自动部署ML算法到生产环境。
跨职能协作:
• 与软件开发人员、DL/ML工程师和其他团队合作,以实现高效交付。
• 加强整体软件交付流程,并确保基础设施的健康。
监控和安全:
• 实施和管理用于系统健康和性能的监控工具。
• 强制执行安全最佳实践和漏洞管理标准。
• 确保符合ML模型和数据流水线的法规和公司政策。
持续改进:
• 了解DevOps和MLOps领域的新兴趋势和工具。
• 积极寻求并推荐改进机会。
教育、经验和能力:
• 计算机科学、工程或相关领域的学士或更高学位。
• 在DevOps岗位上拥有7年经验,其中至少有1年专门从事MLOps或处理生产中的机器学习。
• 精通Python、Shell或等效的脚本语言。
• 对主要云平台特别是Google Cloud Platform (GCP)具有深入的专业知识。
• 具有容器化技术(Docker)和编排工具(Kubernetes)的实际经验。
• 在基础设施即代码工具(Cloud Deployment Manager、CloudFormation或Terraform)方面具有丰富经验。
• 具有版本控制系统(git)和协作平台(GitHub或GitLab)的经验。
• 熟悉TensorFlow、TFX、MLflow或KubeFlow(GCP)等MLOps工具。
• 在将ML模型部署到生产环境并理解模型架构方面具有经验。
• 文档和安全:
• 为ML和基础设施工作流程创建全面的文档。
• 了解网络架构、VPC设计和云环境中的安全最佳实践。
• 拥有Google Cloud Professional DevOps Engineer等相关认证将是一个加分项。