系统GPU/AI实验室工程师

16个月前全职
AMD

AMD

location 多伦多
unsaved
系统GPU/AI实验室工程师 职位描述: 数据中心图形和加速计算(DCGPU)组织正在寻找有能力解决复杂系统/SOC问题的技术人员。个人将成为一个不断壮大的实验室团队的一部分,并需要进行与问题管理和电路板级改装相关的实验。该职位涉及一系列活动,包括部署预生产平台和测试站点以实现硅片启动和验证,为解决复杂的系统级问题而进行的分析、调试和改装。 主要职责: - 设置硬件以便在DCGPU验证实验室中进行远程/本地测试执行和用户定义的工作负载 - 在维护大量开发系统完整性的同时,对各种系统、固件或软件问题进行初步故障排除和调试 - 复现问题并验证DCGPU平台负责人和首席工程师确定的修复方案 - 提供日志和统计数据,以帮助进一步调试问题 - 在CI/CD环境(如Jenkins、Ansible)中集成自动化测试 - 在管理的工单系统中工作,并清楚地沟通步骤/活动 首选经验: - 在嵌入式系统方面具有经验的测试台设置经验 - 能够阅读和解释电路板原理图 - 在Windows和Linux操作系统中具有软件编程和脚本编写经验(Python、bash、C/C++) - PC/服务器环境的硬件和软件设置和管理 - 基本的网络技能 - 能够在包括Windows和Linux在内的不同操作系统环境中工作 - 出色的焊接技能 - 具有硬件和软件故障检测和管理经验 - 具有电源监测和顺序控制经验 - 精通电力电子学的基本原理,特别强调多相电源转换器 - 能够使用示波器、万用表、电流探头、电子负载和协议分析仪等工具,并能够通过直觉推理解释和纠正意外结果 - 能够以结构化的方式记录实验结果以便参考 - 具备计算机硬件(CPU/APU、显卡、内存、总线逻辑和显示技术)和软件架构(驱动程序/BIOS)的知识 - 能够设置硬件和构建计算机系统 - 基于逻辑的决策能力,用于分析/调试 - 使用Perl/Tcl/Python/LabView进行测试自动化的专业知识 - 具备团队合作精神和良好的沟通能力,能够在动态环境中工作 - 必须是能够自我激励、能够在最少监督下工作并完成任务的人 - 附加技能:熟悉低速行业标准协议,如I2C、Redfish、IPMI、SPI、I3C、SVI2、SVI3,以及高速行业标准协议,如PCIe Gen 5。 学术背景: 电气工程或计算机工程学士或副学士学位为佳 工作地点: 安大略省马克姆 薪酬待遇: 我们的竞争性薪酬福利帮助您规划未来,奖励绩效,并在生活的每个阶段提供安心: - 具有竞争力的薪酬 - 年度奖金 - RSU奖励 - 退休和储蓄计划 财务福祉: 我们的财务福祉计划使您能够成为AMD股东,帮助您规划退休,并在您和您的家人准备应对意外情况时提供支持: - 员工股票购买计划(ESPP) - 退休和储蓄计划 - 寿险和生存者收入福利 休假: 确保AMD员工有时间休息和恢复对我们来说很重要,我们努力确保您有灵活性来做到这一点,提供各种休假选择: - 带薪休假 - 带薪假期 - 公司恢复日 - 带薪产假 - 额外休假 健康与健康: 我们的计划关注您的心理和身体健康的知识和预防措施-通过对我们的健康保持积极主动,我们可以在健康需求出现之前、期间和之后准备好工具来保护我们。 - 全面的健康计划 - 免费的机密咨询 - 健身中心使用权(特定地点) - 员工折扣 - 几乎任何需求的免费研究和推荐服务 家庭: AMD理解家庭是我们员工生活的核心,我们为每一步提供计划和支持。 - 领养/代孕福利 - 额外休假 - 寿险和生存者福利 - 儿童、老人和宠物照顾(仅限美国) - 持续关怀的研究和推荐服务 额外福利: AMD的福利也为您提供了职业发展、与他人联系、支持社区等机会。 - 社会互助计划 - 志愿者奖励计划 - 学习和发展计划 - 员工资源小组 - 环保计划 - AMD折扣