机器学习平台工程师,高级员工-47592BR

16个月前全职
90K - 120K CAD / 年 Synopsys Inc

Synopsys Inc

location 多伦多
unsaved
Synopsys的生成AI卓越中心定义了在公司内推进生成AI应用的技术战略。Gen AI COE开创了核心技术-平台、流程、数据和基础模型-以实现生成AI解决方案,并与业务团队和企业职能部门合作推进AI重点路线图。 我们正在寻找一位经验丰富、热情洋溢且自我驱动的个人,他既具备广泛的技术战略,又能应对架构和现代化挑战。作为理想的候选人,他将帮助构建企业级机器学习平台。他将与一支热情洋溢、充满活力的机器学习工程师和数据科学家团队合作,建立一个平台,帮助Synopsys的研发团队进行实验、训练模型和构建Gen AI和ML产品。 您将负责 • 构建机器学习平台,用于编排企业范围的数据流水线、机器学习训练和推理服务器。 • 开发“ML应用商店”生态系统,以便让研发团队在云端构建Gen AI和ML产品。 • 从Kubernetes生态系统内编排GPU调度(例如,Nvidia GPU Operator、MIG等) • 使用尖端技术(例如Kubernetes Cluster Federation、Azure Arc等)创建可靠且具有成本效益的混合云架构 所需资格 • 计算机科学/软件工程或等同学位的学士/硕士/博士学位 • 在构建系统软件、企业软件应用、机器学习应用和微服务方面具有10年以上的总体经验。 • 精通或具有以下编程语言的经验:Python和Go • 设计复杂的分布式系统(高级和低级系统设计) • 深入了解Kubernetes:能够在本地部署Kubernetes,并具有托管Kubernetes服务(AKS/EKS/GKE)的工作经验 • 在Linux内核、CGroups、命名空间和Docker方面具有强大的系统知识 • 至少有一家云服务提供商的经验(AWS/GCP/Azure) • 能够使用高效算法解决复杂问题。 • 使用RDBMS(首选PostgreSQL)存储和排队大量数据的经验 首选资格 • 具有AI/ML工作流程和工具(PyTorch、ML Flow、AirFlow等)的先前经验 • 在生产环境中进行大型数据集和分析数据流的原型、实验和测试经验。 • 在统计学、机器学习和/或深度学习方面有扎实的基础