深度学习软件开发工程师 - 训练库

4个月前全职
65.3万 - 98.0万 / 年 AMD

AMD

location 多伦多
unsaved
在 AMD 的工作改变一切 我们非常关心通过 AMD 技术改变生活,以丰富我们的行业、社区和世界。我们的使命是构建出色的产品,以加速下一代计算体验 - 数据中心、人工智能、个人电脑、游戏和嵌入式的基础构件。支撑我们使命的是 AMD 文化。我们推动创新的极限,以解决世界上最重要的挑战。我们追求卓越的执行力,同时保持直接、谦逊、协作,并包容多元的视角。 AMD 一起向前迈进_ 角色 AMD 正在寻找一位在 AI 组中具有影响力的软件工程师,热衷于提升关键应用程序和基准测试的性能。您将成为一支由行业专家组成的核心团队的一员,并将与最新的硬件和软件技术合作。 个人 理想的候选人应对软件工程充满热情,并具备解决复杂问题的领导能力。能够有效沟通,并与 AMD 各个团队高效协作。 主要职责 • 优化开源深度学习训练库,如 Megatron 和 Transformer Engine,以提高在 AMD GPU 上的性能。 • 在分布式计算环境中分析和优化关键深度学习模型的性能,针对扩展(多 GPU)和扩展(多节点)架构。 • 应用软件工程最佳实践,同时保持对软件、硬件、算法和架构趋势和创新的了解。 • 参与新 ASIC 和硬件的开发和启动。 • 采用数据驱动的方法进行优化工作,设计开创性的 AMD 技术。 • 调试和解决现有问题,同时研究更高效的替代方案以实现相同目标。 • 与内部 GPU 库团队合作,并与同事和合作伙伴建立技术关系,以优化深度学习训练。 优先经验 • * 编程与开发: • 精通 C/C++ 和 Python,具备面向对象编程、调试、性能优化和并发编程的强大技能。 • 熟悉源代码控制(GitHub)、CI/CD 和 Linux 调试/分析工具。 • GPU 内核开发: • 在 AMD GPU(GCN,RDNA)上使用 HIP 和 CUDA 进行深度学习的 GPU 内核优化方面经验丰富。 • 熟练使用 Composable Kernel (CK)、CUTLASS、Triton 和汇编(ASM)等工具进行编程和性能优化。 • 深度学习与优化: • 精通将 GPU 性能集成到 TensorFlow 和 PyTorch 中,以优化模型训练和推理。 • 具备分析和优化深度学习工作负载的经验,重点关注扩展和吞吐量。 • 合作与沟通: • 具备强大的问题解决和沟通能力,在团队合作中取得了成功。 学术资格 • 计算机科学、计算机工程、电气工程或相关领域的学士或硕士学位。 提供的福利描述:AMD 福利一览。 AMD 不接受猎头、招聘机构或收费招聘服务的主动简历。AMD 及其子公司是平等机会、包容性雇主,将考虑所有申请者,而不考虑年龄、祖先、肤色、婚姻状况、健康状况、精神或身体残疾、国籍、种族、宗教、政治和/或第三方关系、性别、怀孕、性取向、性别身份、军人或退伍军人身份,或任何其他法律保护的特征。我们鼓励所有合格候选人申请,并将在招聘和选拔过程的各个阶段满足申请者在相关法律下的需求。