杰出工程师,生成式人工智能系统(可远程)

16个月前远程全职
RemoteWorker US

RemoteWorker US

location 旧金山
unsaved
职位描述 职位名称:杰出工程师,生成式人工智能系统(可远程工作) 地点:美国纽约 关于我们: 在Capital One,我们的使命是创建可信赖、可靠和包容性的人工智能系统,使银行业务简单易用,人人皆可享用。我们一直处于利用机器学习提升客户体验的前沿,从实时欺诈检测到即时客户支持。凭借我们在云基础设施和机器学习平台的投资,我们独特地处于利用人工智能的强大能力。加入我们,帮助我们重新构想如何为客户提供服务,并构建具有突破性的人工智能能力。 职位概述: 我们正在寻找一位经验丰富的高级杰出工程师,以帮助构建我们企业级人工智能能力的基础。在这个职位上,您将参与各种项目,例如设计安全基础设施、构建大规模分布式训练集群、部署实时应用场景的人工智能模型,并支持尖端的人工智能研究。您将与一支人工智能工程师和研究人员团队合作,设想和实施这些能力。 职责: • 设计和构建弹性基础设施,支持大规模训练任务,在节点故障的情况下确保可靠性。 • 开发用于在我们的云环境中高效提供大型机器学习模型的基础设施。 • 部署和优化带有存储和网络堆栈的训练集群,以利用并行策略。 • 设计和实施基准测试,以衡量人工智能系统的性能,并提供技术选择建议。 • 开发利用生成式人工智能模型的应用程序。 • 实施支持基础模型的MLOps能力。 基本资格: • 计算机科学、计算机工程或相关领域的学士学位。 • 至少7年的人工智能和机器学习分布式计算系统设计和构建经验。 • 至少5年的使用Python或C/C++开发人工智能和机器学习算法的经验。 • 至少3年的使用人工智能和机器学习框架以及云平台进行机器学习开发生命周期的经验。 优先资格: • 工程、计算机科学或相关领域的硕士或博士学位,专注于现代人工智能技术。 • 在AWS、Azure或GCP等云环境中设计大规模分布式平台和系统的经验。 • 在设计安全、可用、高性能、可扩展和具有成本效益的云系统方面具有架构专长。 • 从探索到提供大型模型的MLOps生命周期经验。 • 熟练构建在云中具有优化存储和网络的GPU集群。 • 熟悉ML编译器、分布式训练框架和Pytorch、Tensorflow和Lightning等开发框架。 • 了解不同的人工智能技术,包括提示工程、向量数据库、LLM托管和微调。 • 在神经网络、分布式训练和SysML领域有强大的出版记录或行业贡献。 薪资和福利: • 薪资范围根据地点而异。 • Capital One提供全面的福利计划,支持您的福祉。 • 可能有基于绩效的奖励补偿。 申请请在线提交。申请将至少接受5个工作日。 注意:Capital One是一家平等机会雇主,重视职场多样性和包容性。我们不以种族、肤色、年龄、宗教、残疾、基因信息、性取向、性别认同、性别重置、国籍或任何其他受保护的身份进行歧视。 如果您在申请过程中需要帮助,请联系Capital One招聘部门,电话号码:(电话号码已隐藏),或通过电子邮件:(url已隐藏)。 如需技术支持或有关招聘流程的问题,请发送电子邮件至(url已隐藏)。 请注意,此招聘职位是针对美国Capital One的。