NVIDIA是全球GPU计算的领导者。我们对游戏、汽车、视觉、高性能计算、数据中心和网络等市场充满热情,除了传统的OEM业务。NVIDIA也是“AI计算公司”的佼佼者,NVIDIA的GPU是驱动深度学习软件框架、分析、数据中心和自动驾驶车辆的智能之脑。我们拥有全球一流的经验丰富且专注的团队。如果你是敬业、有前瞻性思维和努力工作的技术人员,跨国团队工作听起来令人兴奋,那么这个职位适合你。NVIDIA正在寻找一位杰出的个人,他/她在多样化的工作环境中能够蓬勃发展,具备出色的人际交往能力,并具有强烈的参与感和持续流程改进意识。该候选人必须具备企业系统集成、强大的操作系统经验、各种遥测的可靠性测试、扩展集群、测试计划开发、CI/CD和DevOps经验,以加入我们的平台SWQA团队。
你将会做什么
• 负责根据设计文档开发和执行NVIDIA HGX/DGX/MGX平台的操作系统、固件和CUDA软件堆栈的测试计划。
• 安装和测试各种系统操作系统、系统固件和软件堆栈。
• 对可靠性和验证测试失败进行根本原因分析,以确定根本原因并实现缓解。
• 构建、开发/调试系统和操作系统级别的自动化前端和后端框架和测试。
• 审查合作伙伴和供应商的测试结果,并根据需要为组件、系统和封装进行额外的可靠性测试。
• 在高生产质量标准的敏捷软件开发团队中工作。
• 管理缺陷生命周期,并与各个部门合作解决问题。
我们需要看到的
• STEM(科学、技术、工程、数学或物理)领域的学士学位(或同等经验)
• 6年以上的经验;或者硕士学位并有2年以上有意义的工作经验
• 使用Python、SHELL、Ansible、Jenkins、C/C++、Java、JavaScript等进行操作系统和服务器级别自动化的经验
• 在裸金属和KVM/VMWare/Hyper-V环境中具有强大的操作系统(Ubuntu、RedHat、CentOS、SuSE、Fedora、Windows等)故障排除和调试经验。
• 能够编写以功能、性能、压力和负面测试为重点的测试计划。
• 有开发CI/CD自动化流程和DevOps贡献的经验,并对自动化有真正的热情。
• 具备良好的团队合作能力,能够独立工作。
• 在固件、BMC/OpenBMC、网络协议、内/外部企业存储设备、PCIe总线和设备、IO子设备、CPU和内存、ACPI、UEFI规范、Redfish方面具有丰富的经验-极大的优势
• 在GitHub/Gitlab/Gerrit、PXE、SLURM、Stack/Kubernetes/Docker方面有多年的经验-极大的优势
脱颖而出的方法
• 有与NVIDIA GPU硬件一起工作的经验是个很大的优势。
• 对Linux中的虚拟化(KVM、与Kubernetes编排的Docker)有扎实的理解是一个优势。
• 在Linux中打包软件的专业知识(rpm、debs)
• 并行编程背景,最好是CUDA/OpenCL-优势
基本工资范围为128,000美元-247,250美元。你的基本工资将根据你所在地区、经验和类似职位员工的薪酬来确定。
你还将有资格获得股权和福利。NVIDIA接受不断提出的申请。
NVIDIA致力于培育多样化的工作环境,自豪地成为一个平等机会雇主。由于我们非常重视当前和未来员工的多样性,我们不会因为种族、宗教、肤色、国籍、性别、性别表达、性取向、年龄、婚姻状况、退伍军人状况、残疾状况或任何受法律保护的特征而进行歧视(包括在招聘和晋升方面)。