高级工程师,人工智能系统

圣弗朗西斯科 1天前全职 网络
1.9K - 2.9K / 年
请注意 为了在我们高申请量的情况下提供最佳的候选人体验,每位候选人在6个月内最多可申请10个职位。 共同推进世界科技 我们的技术解决方案为您每天使用的工具提供动力——包括智能手机、电动汽车、大规模数据中心、物联网设备等等。在这里,您将有机会成为全球领先企业的一部分,其创新设计正在突破可能性的界限并推动未来的发展。 我们相信,创新和增长是由包容的文化和多元化的员工推动的。我们致力于赋予人们做真实自我的力量。我们共同为我们的员工、客户、合作伙伴和社区建设一个更美好的明天。 AGI(通用人工智能)计算实验室致力于解决未来AI/ML工作负载不断增长的需求所带来的复杂系统级挑战。我们的团队致力于设计和开发可扩展的平台,这些平台能够有效处理这些工作负载的计算和内存需求,同时最大限度地减少能耗并提高性能。为了实现这一目标,我们与硬件和软件工程师密切合作,以识别和解决AI/ML工作负载带来的独特挑战,并探索新的计算抽象,以便在我们系统的硬件和软件组件之间提供更好的平衡。此外,我们在内存、计算、互连和AI/ML等新兴技术和趋势方面不断进行研究和开发,确保我们的平台始终能够处理未来最苛刻的工作负载。通过作为一个专注且充满激情的团队共同努力,我们旨在革新AI/ML应用的部署和执行方式,最终以可负担和可持续的方式推动AGI的发展。加入我们,共同塑造计算的未来! 此职位由AGICL实验室作为DSRA的一部分提供。我们是一个以研究为驱动的系统实验室,致力于在大型语言模型、加速器硬件和高性能软件栈的交汇处工作。我们的使命是通过紧密的硬件-软件协同设计来设计、原型化和优化下一代AI系统。 我们的团队亲身实践前沿的加速器硬件、实验性内存系统和新兴的领域特定语言(DSL)。我们构建和优化基于Triton的软件栈,以推动现代LLM工作负载的性能、效率和可扩展性的极限。 我们正在寻找一位具有丰富现代加速器高性能Triton内核开发经验的高级AI系统工程师。在这个角色中,您将设计、分析和优化用于大规模LLM推理和训练管道的性能关键内核。您将与硬件架构师、编译器工程师和ML研究人员密切合作,以识别性能瓶颈、解释分析数据,并共同设计跨越软件和硬件边界的解决方案。 此角色非常适合那些喜欢在硬件栈附近工作,同时深入思考模型级抽象的工程师。 地点:根据我们的灵活工作政策,每天在我们位于加利福尼亚州圣何塞的办公室/美国总部现场工作。 您的工作内容 • 设计、实现和优化现有加速器上的LLM工作负载的高性能Triton内核。 • 使用分析工具分析内核性能;解释延迟、吞吐量、占用率、内存带宽和计算利用率等指标。 • 识别内核设计中的性能瓶颈(例如,内存访问模式、同步、平铺策略)并提出具体优化方案。 • 跨栈工作;从模型架构到内核实现——确保端到端的性能效率。 • 与硬件和编译器团队合作进行硬件-软件协同设计,提供影响未来加速器和DSL设计的反馈。 • 使用即将推出的DSL和实验性编译器流原型化和评估内核优化。 • 为用于前沿研究和生产级实验的基于Triton的软件栈的演变做出贡献。 • 为内部和外部利益相关者清晰记录设计决策、性能权衡和优化策略。 您的能力 • 拥有5年以上行业经验的学士学位,或3年以上行业经验的硕士学位,或0年以上行业经验的博士学位。 • 在GPU或其他加速器上编写高性能Triton内核方面有丰富经验。 • 对LLM基础知识有扎实理解,包括注意力机制、变压器架构和推理/训练工作流。 • 深入了解加速器硬件架构,包括:内存层次结构(HBM、SRAM、缓存)。 • 具备读取和解释分析数据和性能计数器的能力。 • 具有诊断和解决内核级代码性能瓶颈的经验。 • 具备Python和面向低级性能的编程范式的强大系统编程技能。 • 具有硬件-软件协同设计或编译器辅助优化的经验。 • 熟悉FlashAttention、融合内核、MoE内核和不同的注意力机制。 • 具有使用新兴或实验性领域特定语言(DSL)进行加速器编程的经验。 • 在ML系统、编译器或性能工程方面有背景。 • 具有与不同加速器后端(包括但不限于CUDA)合作的经验。 • 有机会在前沿加速器硬件和实验性软件栈上工作。 • 直接影响下一代AI系统的性能和设计。 • 跨硬件、系统和ML研究的高度协作环境。 • 灵活性以发布、原型化和影响未来硬件和软件方向。 • 能够在跨职能、以研究为导向的环境中有效工作。 • 具备强大的分析和解决问题的能力。 • 您包容,能够根据情况和我们员工的多元全球规范调整自己的风格。 • 您是一个热衷学习的人,以好奇心和韧性应对挑战,寻求数据以帮助建立理解。 • 您具有协作精神,建立关系,谦逊地提供支持并开放欢迎各种方法。 • 创新和创造性,您积极探索新想法并快速适应变化。 我们的福利 下述薪资范围适用于所有美国地区和职能的所有此级别职位。个人薪资取决于多种因素——包括职位的职能和地点,以及个人的知识、技能、经验、教育和培训。我们还提供基于个人和公司绩效的激励机会。 这不仅包括我们多样化的福利包,围绕员工及其亲人的福祉。除了常规的医疗/牙科/视力/401k,我们的包容性奖励计划赋予我们的员工照顾自己整体的能力。对您未来的投资就是对我们未来的投资。 回馈社会 通过慈善捐赠匹配和频繁的参与机会,我们积极支持社区。 享受休息时间 您每年将有4周以上的带薪休假,加上假期和病假,以便休息和充电。 照顾家庭 无论家庭对您意味着什么,我们都希望在您需要时支持您——包括生育护理或收养津贴、医疗旅行支持以及为您的宠物提供的虚拟兽医护理。 优先考虑情绪健康 通过按需应用程序和免费的保密治疗课程,无论您身在何处,您都将获得支持。 保持健康 良好的饮食和积极的生活方式是健康生活的重要组成部分。我们的现场咖啡馆和健身房,以及虚拟课程,使其更容易实现。 拥抱灵活性 福利最佳时,您有空间使用它们。这就是为什么我们提供灵活的环境,以便您找到适合自己的平衡。 基本薪资范围 $138,000—$206,000 美元 平等机会就业政策 三星半导体以成为一个平等机会的工作场所而自豪,致力于营造一个所有人都感到有价值并能够卓越的环境,无论种族、宗教、肤色、年龄、残疾、性别、性别认同、性取向、祖先、遗传信息、婚姻状况、国籍、政治倾向或退伍军人身份如何。 在选择团队成员时,我们优先考虑才华和谦逊、善良和奉献等品质。我们在招聘过程中为有残疾、长期病症、神经多样性个体或需要怀孕相关支持的候选人提供全面的便利。所有安排面试的候选人将收到有关申请便利的指导。 招聘机构政策 我们不接受未经请求的简历。只有与三星半导体公司有当前有效协议的授权招聘机构才被允许提交任何职位空缺的简历。 申请者AI使用政策 在三星半导体,我们支持创新和技术。然而,为了确保公平和真实的评估,我们禁止使用生成性AI工具来歪曲候选人的真实技能和资格。允许的使用仅限于基本准备、语法和研究,但所有提交的内容和面试回答必须反映候选人的真实能力和经验。违反此政策可能导致立即取消招聘资格。 申请者隐私政策 https://semiconductor.samsung.com/about-us/careers/us/privacy/