员工软件工程师 - GEN AI

16个月前全职
Walmart Global Tech

Walmart Global Tech

location 纽约
unsaved
该职位可以选择在新泽西州霍博肯、华盛顿州贝尔维尤、加利福尼亚州圣尼维尔或德克萨斯州达拉斯设立。 我们正在寻找一位有经验的AI系统工程师加入我们的团队,并在开发我们的生成式AI平台及其相关服务中发挥关键作用。在这个充满活力的角色中,您将参与各种项目,如设计安全可靠的基础设施、构建大规模分布式训练集群、管理实时应用程序的LLMs,并支持我们公共和私有云基础设施中的高级AI研究和开发。 团队介绍: 与一组AI工程师和研究人员合作,您将帮助塑造我们平台的未来,并协助设计和实施关键服务。 您的职责: • 设计和构建容错基础设施,以支持长时间运行的大规模训练任务,使用容器和检查点库来保持可靠性,即使节点故障也能保持可靠性。 • 在我们的公共云中开发用于服务广泛的机器学习模型的基础设施。 • 创建技术路线图,就目标和关键结果进行咨询,审查设计,参与和解决技术讨论,并引导核心ML的工程投资。 • 设计和实施用于评估生成式AI平台中软件系统性能的基准,并提供技术选择建议。 • 开发利用LLMs和FMs的工具和应用,用于测试、构建工具等用例。 • 设计和实施支持基础模型的MLOps的平台功能。 • 优化AI算法和模型,以提高性能、效率、准确性和可扩展性。 • 与跨职能团队合作,与研究人员、数据科学家和其他利益相关者密切合作,了解他们的需求、收集需求,并开发基于AI的解决方案。通过与领域专家合作,确保AI模型和系统符合法规和行业标准。 • 准备和维护技术文档、报告和演示,以有效地向各种受众传达AI方法、结果和建议。 • 通过与零售领域的AI应用相关的最新进展、机器学习、行业趋势、监管指南、数据隐私和伦理考虑等方面的伦理考虑,了解最新的AI进展。 您需要具备: • 计算机科学、计算机工程或相关技术领域的学士学位 • 在大规模分布式系统设计和构建方面具有6年以上的经验 • 作为技术负责人或架构师具有4年以上的经验 • 使用开源AI/ML框架和公共云进行全面的ML开发生命周期经验1年以上 首选资格: • 工程、计算机科学或相关技术领域的硕士学位,或具有现代AI技术的实际经验 • 在云环境(如Azure或GCP)中设计大规模分布式平台和/或系统的经验 • 在安全性、可用性、性能、可扩展性和成本方面构建云系统的经验 • 从探索到服务的MLOps生命周期中交付非常大的模型的经验 • 在公共云中构建GPU集群,具有紧密耦合的存储和网络的经验 • 熟练掌握用于大模型分布式训练的完整堆栈,包括ML编译器、分布式训练框架和Pytorch、Tensorflow、Lightning等ML开发框架 • 熟悉GenAI技术栈,包括用于提示工程的框架、用于GenAI应用的防护栏和LLM微调 • 有与支持生成式AI训练流程和生产应用的数据基础设施相关的VectorDB和其他数据基础设施的经验 • 有训练和维护大型语言模型的经验 关于沃尔玛全球科技 想象一下,在一个代码行可以为数亿人带来便利的环境中工作。这就是我们在沃尔玛全球科技所做的。我们是一支由软件工程师、数据科学家、网络安全专家和服务专业人员组成的团队,是全球领先零售商的一部分,我们产生了巨大的影响,并处于零售领域的下一次颠覆的前沿。人是我们创新的原因,人推动着我们的创新。我们以人为本,以科技为力量。我们培训团队掌握未来的技能,并邀请像您这样的专家帮助我们成长。我们为那些追求第一个机会的人提供角色,也为那些寻找将定义他们职业生涯的机会的人提供角色。在这里,您可以启动一段伟大的科技职业,获得几乎所有行业的新技能和经验,或者利用您的专业知识进行规模化创新,影响数百万人,并重新构想零售的未来。 灵活的混合工作方式: 我们采用混合工作方式,主要是在办公室工作,不在现场时采用虚拟工作。我们的园区作为增强协作、使我们团结一致并满足业务需求的中心。这种方法帮助我们做出更快的决策,消除全球团队之间的地理障碍,并在个人生活中更加灵活。 福利待遇: 除了丰厚的薪酬福利外,您还可以根据绩效获得激励奖励。其他福利包括401(k)匹配、股票购买计划、带薪产假和育儿假、带薪休假、多种健康计划等等。 平等机会雇主: 沃尔玛公司是一家平等机会雇主,我们相信只有真正了解员工、客户和服务的社区,我们才能帮助他们过上更好的生活。这意味着理解、尊重和重视多样性-独特的风格、经历、身份、思想和观点-同时包容所有人。 上述信息旨在说明该职位的工作性质和水平。它并不旨在包含或解释员工在该职位上所需的所有职责和资格的全面清单。完整的职位描述可以作为招聘流程的一部分提供。