解决方案架构总监 - GPU

旧金山 11天前全职 网络
167.0万 - 249.7万 / 年
在 AMD,您所做的事情改变一切。我们的使命是构建伟大的产品,推动下一代计算体验的加速——从人工智能和数据中心,到个人电脑、游戏和嵌入式系统。我们扎根于创新和协作的文化中,坚信真正的进步来自于大胆的想法、人类的创造力以及共同创造非凡事物的热情。当您加入 AMD 时,您会发现真正的差异在于我们的文化。我们推动创新的极限,以解决世界上最重要的挑战——追求卓越的执行,同时保持直接、谦虚、协作,并包容多元的视角。加入我们,共同塑造人工智能及其未来。一起推进您的职业生涯。\n\n角色\nAMD 数据中心 GPU 团队正在寻找一位经验丰富的解决方案架构总监,加入我们的团队,专注于为 AI 和 HPC 工作负载启用大型集群。\n\n个人\n候选人将是数据中心基础设施的技术专家,深谙数据中心设计,具备强大的计算(CPU/GPU)、网络和存储解决方案的知识,并拥有与客户合作支持 RFP 开发的经验。这个角色提供了在 AI 和 HPC 基础设施前沿工作的机会,解决复杂的技术挑战,并帮助客户大规模实施变革性的数据中心解决方案。\n\n主要职责\n• 与数据/机器学习、平台和基础设施利益相关者领导客户技术发现;将业务目标映射到 AI 和 HPC 工作负载及成功指标。\n• 评估当前系统状态(GPU/加速器、存储、网络、安全),识别差距、风险,并定义所需的 POC。\n• 设计大型 AI 和 HPC 集群的参考架构(机架设计、GPU 拓扑、RoCE/InfiniBand、NVMe/并行文件系统),以满足客户的约束(电力、冷却、空间)。\n• 创建高层设计。\n• 与业务发展和产品团队合作,构建 ROI/TCO 模型(资本支出/运营支出,$/token,$/推理),并制定价值故事。\n• 支持 RFIs/RFP 的技术部分草稿;生成架构图、部署计划和实施时间表。\n• 与项目和工程团队合作,定义 POC 成功标准、测试计划和退出报告。\n• 与产品管理协作,促进产品路线图的改进。\n• 高吞吐量 GPU 集群的网络设计(向上/向外扩展/OOB)、布线。\n• 针对 AI 数据管道优化的存储架构。\n• 数据中心布局策略/电力/冷却。\n• 机架电力传输/机械设计。\n\n优先经验\n• 具备多年设计和实施大规模基础设施解决方案的经验。\n• 对数据中心网络和存储架构有深刻理解。\n• 具备 GPU 加速计算环境的经验。\n• 有创建技术文档和参考架构的成功记录。\n• 优秀的沟通能力,能够解释复杂的技术概念。\n• 有与客户技术团队直接合作的经验。\n\n学术资格\n• 计算机科学、电气工程或相关领域的学士学位或更高学位。\n\n地点:\n• 加州圣荷西\n\n提供的福利概述:AMD 福利一览。\n\nAMD 不接受猎头、招聘机构或收费招聘服务的主动简历。AMD 及其子公司是平等机会、包容性的雇主,将在所有申请者中考虑,不论年龄、血统、肤色、婚姻状况、医疗状况、心理或身体残疾、国籍、种族、宗教、政治和/或第三方关系、性别、怀孕、性取向、性别认同、军人或退伍军人身份或任何其他受法律保护的特征。我们鼓励所有合格候选人申请,并将在招聘和选拔过程的各个阶段满足申请者在相关法律下的需求。