概述 我们的银行客户正在寻找一位高级 Python/PyTorch 机器学习工程师,负责领导生产 AI/ML 模型的开发,同时在企业范围内架构 MLOps/AIOps 标准化和 ETL 最佳实践。这个战略角色将建立机器学习系统的质量保证框架,推动 Python/PyTorch 标准化计划,确保关键系统(包括聊天机器人、反洗钱检测、预测模型(PRISM 平台)和定价优化)的生产就绪模型部署,同时在受监管环境中维持质量、准确性和风险缓解。职责 领导开发银行各业务部门的生产 PyTorch 模型,涵盖零售银行、资本市场和风险管理 为超过 100 个机器学习用例架构 MLOps/AIOps 标准化框架,确保一致性和可扩展性 设计和实施企业级 ETL 管道,用于机器学习特征存储和数据预处理,规模达到 PB 级 建立机器学习模型质量保证最佳实践,包括测试框架、验证协议和性能基准 开发复杂的 PyTorch 实现,适用于大语言模型、深度学习模型和高级 AI 解决方案 领导 Python/PyTorch 标准化计划,将遗留系统从不同框架迁移 创建生产部署策略,确保模型的可靠性、监控和治理 设计 AIOps 解决方案,实现自动模型监控、漂移检测和再训练管道 使用 Spark、Databricks 和云原生服务架构可扩展的 ETL 工作流 建立机器学习工程标准,包括代码质量、文档和可重现性 为组织内开发团队提供 MLOps 最佳实践的技术领导 建立可重用的机器学习组件和库,供整个企业采用 定义机器学习管道的数据质量框架和验证标准 将复杂的业务需求转化为生产机器学习解决方案,并进行利益相关者管理 指导团队掌握 PyTorch 优化技术和生产部署模式 必备条件 7 年以上 Python 编程经验,具备专家级 PyTorch 经验,能够处理生产机器学习系统 在企业规模上开发和部署生产机器学习模型的成功经验 深厚的 MLOps 最佳实践和标准化专业知识,包括 CI/CD、模型版本控制和监控 在使用 Spark、Databricks 或类似工具的机器学习系统 ETL 管道架构方面拥有丰富经验 扎实的机器学习模型质量保证方法和建立测试框架的背景 具备架构 AIOps 解决方案以实现模型监控和自动再训练的能力 精通云平台(Azure 或 AWS),并在 Kubernetes、Docker 上进行生产机器学习部署 具备在跨团队提供 MLOps/AIOps 最佳实践的技术领导能力 具备在 PyTorch 中实施和部署大语言模型的经验 深刻理解深度学习架构和优化技术 具备将业务需求转化为生产机器学习解决方案的能力,具备高情商 在受监管环境中工作,专注于模型治理和风险管理 本科及以上学历,计算机科学、工程、数学或物理专业(硕士优先) 额外优先条件 具备使用 TensorFlow 作为次要框架的经验(用于迁移目的) 熟悉 Apache Airflow 或 Kubeflow 进行机器学习工作流编排 在金融服务行业背景,尤其是银行或资本市场 具备反洗钱(AML)系统和合规性经验 熟悉 PRISM 平台或类似的预测建模系统 了解实时机器学习推理架构和流处理管道 具备领导机器学习平台整合和迁移计划的经验 在客户参与策略和市场优化模型方面的背景 具备定价模型和金融风险建模的经验 理解数据网格或数据结构架构 对开源机器学习/PyTorch 项目的贡献 具备领导经验或指导他人工作的能力 法语语言技能(蒙特利尔职位必须) 在 MLOps 最佳实践方面的出版物或演讲 团队结构与机会 多个高级职位在不同团队中可用 适合个人贡献者和团队领导的角色机会 领导 AI/ML 基础设施的 Python/PyTorch 标准化 使用尖端技术处理高影响力的生产模型 工作地点与工作安排 远程选项:部分职位可选择远程工作 混合安排:多伦多职位的灵活工作选项 蒙特利尔职位:要求双语(法语/英语)技能,每周四天需在办公室工作 关键成功因素 专家级 Python/PyTorch 技能,适用于生产机器学习开发 深刻理解 MLOps/AIOps 最佳实践和建立标准的能力 具备机器学习 ETL 管道架构和数据工程经验 高情商,具备出色的利益相关者管理和沟通能力 能够优先考虑质量、准确性和风险管理,而非快速原型开发 具备指导团队进行机器学习平台标准化计划的经验 当前了解生产机器学习部署模式和最佳实践 关于我们的客户 我们的客户是全球领先的金融机构之一,也是北美第五大银行。我们为超过 2700 万个家庭和企业提供传奇般的客户体验。在构建我们的业务和实现战略的过程中,我们正在创新,以提升客户体验并塑造银行的未来。薪酬方案 我们的薪酬方案包括具有竞争力的基本薪资、可变薪酬、全面的健康和福利待遇、储蓄和退休计划、带薪休假、银行福利和折扣、广泛的职业发展机会以及奖励和认可计划。