云端机器学习运维工程师负责人,GFT

温哥华 12天前全职 网络
面议
职位描述 这个机会是什么? 您是否是一位才华横溢、富有创造力且注重结果的专业人士,热衷于交付高性能应用程序。加入我们吧! 全球职能技术(GFT)是RBC技术和运营部门的一部分。GFT的影响力深远,因为我们与公司各部门的合作伙伴合作,提供创新和变革性的IT解决方案。我们的客户包括风险、财务、人力资源、CAO、审计、法律、合规、金融犯罪、资本市场、个人和商业银行以及财富管理。我们还领导开发数字工具和平台以增强协作。 我们正在寻找一位高技能的MLOps工程师,帮助设计和构建用于金融风险模型训练和推理的生产级机器学习管道。 该管道将支持使用Python和PySpark在公共云(AWS)和本地基础设施上进行模型训练/测试/推理。 这个角色非常适合结合强大的Python和云工程技能,并对从数据准备到训练、验证、注册和操作推理的机器学习模型生命周期管理有扎实理解的工程师。 您将与数据科学家、DevOps和风险IT团队密切合作,构建一个可靠、自动化且可审计的MLOps平台,以满足企业在安全性、治理和可扩展性方面的标准。 您将做什么? • 设计和实施端到端的MLOps管道,以训练、测试、注册和部署信用风险机器学习模型。 • 构建和自动化模型生命周期管理工作流程,包括版本控制、推广、审批和废弃。 • 开发和集成模型注册表(例如,MLflow、SageMaker Model Registry或自定义解决方案)以管理模型元数据、血统和可重现性。 • 使用Airflow、AWS Step Functions、stonebranch或Prefect等工具编排数据和训练工作流程。 • 使用GitHub Actions、Jenkins或AWS CodePipeline实施CI/CD管道,确保一致和自动化的部署流程。 • 在AWS EMR或类似集群上用Python和PySpark构建数据准备和训练脚本,优化性能和可扩展性。 • 管理AWS和本地环境中的模型工件、依赖项和环境。 • 通过结构化日志记录、指标和模型性能跟踪确保强大的可观察性和可审计性。 • 与DevOps和数据工程团队合作,确保安全集成、数据治理和生产准备。 您需要什么才能成功? 必须具备: • 拥有AWS数据和ML服务的实际经验,例如S3、EMR、Lambda、Step Functions、ECS/EKS、SageMaker、CloudWatch、IAM。 • 具有构建和维护模型注册表、版本控制系统和工件库的经验(例如,MLflow、SageMaker、DVC)。 • 对从训练和测试到部署、监控和再训练的模型生命周期管理有扎实理解。 • 熟悉CI/CD实践,使用GitHub Actions、Jenkins或CodePipeline等工具。 • 熟悉混合部署环境(AWS和本地)及相关的网络/安全考虑。 • 精通用于生产质量脚本、自动化和ML工作流程集成的Python。 • 拥有使用PySpark进行分布式数据处理和模型训练的丰富经验。 所需经验 • 在企业规模或受监管环境中拥有5年以上软件工程、数据工程或MLOps经验。 • 在生产中构建ML管道的成功经验,最好是在金融服务或其他数据敏感领域。 • 管理模型工件和元数据以实现可审计性和合规性的经验。 • 具备容器化(Docker)和基础设施自动化(Terraform、CloudFormation)的实际知识。 • 在基于Linux的系统、shell脚本和环境管理方面有扎实背景。 • 具有与数据科学家和模型验证者合作以使模型投入运营、监控和维护的经验。 • 理解数据治理和监管要求(例如,模型审计跟踪、可重现性)。 所需认证(或同等经验) • AWS认证解决方案架构师助理或更高级别。(必须具备) • AWS认证机器学习工程师助理或AWS认证机器学习专业(强烈推荐) • AWS认证DevOps工程师专业(优先) • 计算机科学、工程、数据科学或相关定量和技术领域的学士或硕士学位。 • AWS CloudOps/SysOps工程师助理(可选) • Databricks认证数据工程师助理/专业或同等PySpark认证。(可选) • Python PCAP或Terraform助理证书。(可选) 加分项: • 具有实现模型监控和漂移检测的经验。 • 熟悉分布式训练和并行计算框架(Ray、Spark、Dask)。 • 具有特征存储、数据血统或元数据跟踪系统的经验。 • 接触过金融风险建模工作流程。 • 具备容器编排(Kubernetes、OpenShift)和混合部署的工作知识。 • 熟悉云和本地环境之间的安全数据交换模式。 • 接触过可观察性堆栈(ELK、Prometheus、Grafana、CloudWatch) 对您有什么好处? 我们在挑战中茁壮成长,努力做到最好,保持进步思维以不断成长,并共同努力提供值得信赖的建议,帮助我们的客户茁壮成长和社区繁荣。我们关心彼此,发挥潜力,为我们的社区做出贡献,实现共同的成功。 • 包括奖金和灵活福利、具有竞争力的薪酬、佣金和股票(如适用)在内的全面总奖励计划 • 支持您通过指导和管理机会发展的领导者 • 有能力做出改变和持久影响 • 在一个充满活力、协作、进取和高绩效的团队中工作 • 金融服务领域的世界级培训计划 • 灵活的工作/生活平衡选项 • 有机会从事具有挑战性的工作 #LI-Post #TechPJ 职位技能 Amazon Sagemaker, Amazon Sagemaker, Apache Airflow, Apache Spark, AWS架构, 大数据管理, 大数据平台, 大数据解决方案, 大数据工具, 云计算, 信用风险管理, 数据库开发, 数据挖掘, 数据仓库(DW), 分布式计算, ETL开发, 生成式AI, Kubernetes, 流动性风险, 机器学习模型管理, 机器学习操作, 市场风险管理, MLflow, Pandas Python库, PySpark {+ 6 more} 附加职位详情 地址: 410 GEORGIA ST W, FLOOR 3:VANCOUVER 城市: 温哥华 国家: 加拿大 每周工作小时: 37.5 就业类型: 全职 平台: 技术和运营 职位类型: 常规 薪酬类型: 工资 发布日期: 2025-07-16 申请截止日期: 2026-02-28 注意:申请将接受至上述申请截止日期前一天晚上11:59 包容性和平等机会就业 在RBC,我们相信一个拥有多元化视角的包容性工作场所是我们作为世界上最大和最成功的银行之一持续增长的核心。维护一个让我们的员工感到支持的工作场所,以最佳状态表现,有效协作,推动创新并在专业上成长,有助于实现我们的目标并为我们的客户和社区创造价值。RBC致力于通过旨在促进基于尊重、归属感和机会的工作场所的政策和计划来实现这一目标。 加入我们的人才社区 了解RBC的绝佳职业机会。注册并获取我们最新职位、职业建议和招聘活动的定制信息,这些信息对您很重要。 在RBC拓展您的界限,共同创造新的未来。了解我们如何利用我们的热情和动力来提升客户和社区的福祉,访问jobs.rbc.com。 RBC目前邀请候选人申请此现有职位。申请此职位可以表达您对RBC当前职业机会的兴趣。合格的申请人可能会被联系以更详细地审查他们的简历。