在 AMD 的工作改变一切
在 AMD,我们的使命是打造出色的产品,以加速下一代计算体验——从人工智能和数据中心,到个人电脑、游戏和嵌入式系统。我们扎根于创新与合作的文化中,相信真正的进步源于大胆的想法、人类的智慧和共同创造非凡事物的热情。当你加入 AMD 时,你会发现真正的差异在于我们的文化。我们推动创新的极限,以解决世界上最重要的挑战——追求卓越的执行,同时保持直接、谦逊、协作,并包容多元的观点。加入我们,共同塑造人工智能及其未来。一起推进你的职业发展。
角色
作为一名高级人工智能/机器学习工程师,你将领导 AMD 的 GPU 和数据中心平台上先进的人工智能/机器学习架构的设计与实施。这个全球技术领导角色专注于定义基于人工智能的验证方法的策略,确保系统的强健性能、可扩展性和可靠性。你将与硅片、固件、硬件和软件团队合作,提供优化的人工智能解决方案,以实现下一代计算体验。
个人
你对人工智能/机器学习技术和系统架构充满热情,具有创新和解决复杂技术挑战的强大能力。你在协作环境中茁壮成长,影响跨职能团队并推动塑造人工智能计算未来的架构决策。你的好奇心和领导力将使 AMD 的人工智能解决方案不断改进和卓越。
主要职责
• 定义并推动基于 GPU 的平台和分布式系统的人工智能架构策略。
• 与工程团队合作,为性能、可扩展性和效率设计和优化人工智能/机器学习工作负载,同时架构与驱动程序代码和硬件的创新验证方法相结合的人工智能/机器学习解决方案。
• 开发基于人工智能的自动化测试、预测分析和智能缺陷分类框架,以加速验证周期。
• 领导架构审查,并为人工智能框架、驱动程序和系统集成的设计决策提供指导。
• 创建人工智能工作负载的参考设计和基准,确保与行业标准的一致性。
• 推动人工智能解决方案的自动化和验证策略,包括集群规模的部署。
• 与客户和内部团队合作,为数据中心和边缘平台提供端到端的人工智能解决方案。
• 指导初级工程师,并促进团队间的技术创新。
• 定期更新架构进展,并影响路线图决策。
优先经验
• 在人工智能/机器学习框架方面有扎实的背景,如 PyTorch、TensorFlow、ONNX Runtime,并熟悉 Hugging Face 进行模型微调和部署。
• 有 GPU 计算和 ROCm 软件堆栈的经验,包括 MIGraphX、rocBLAS 和 MIOpen 等库。
• 了解分布式系统和人工智能工作负载的性能优化。
• 精通 C/C++、Python 和 Linux 环境;有使用 HIP 进行 GPU 编程的经验。
• 熟悉网络技术,如 RDMA 和 RoCE,用于集群环境中的高性能数据传输。
• 出色的沟通、领导和解决问题的能力。
• 在快速变化的环境中交付复杂的多功能人工智能解决方案的成功记录。
学术资格
• 计算机或电气工程学士或硕士学位或同等学历。
提供的福利:AMD 福利一览。
AMD 不接受猎头、招聘机构或收费招聘服务的未经请求的简历。AMD 及其子公司是平等机会、包容性雇主,将在招聘和选择过程中考虑所有申请者,而不考虑年龄、血统、肤色、婚姻状况、健康状况、精神或身体残疾、国籍、种族、宗教、政治和/或第三方关系、性别、怀孕、性取向、性别认同、军人或退伍军人身份,或法律保护的任何其他特征。我们鼓励所有合格候选人申请,并将在招聘和选择过程的各个阶段根据相关法律满足申请者的需求。