AI编译器工程师

14个月前全职
Renesas Electronics

Renesas Electronics

location 新加坡
unsaved
地点:新加坡 职位类型:永久(全职) 职位概述: 在这个职位上,您将成为机器学习核心团队的一员。该团队一直在开发一种全面的AI编译器策略,为各种硬件架构提供高度灵活的平台,用于探索新的DL/ML模型架构,并结合自动调优的高性能,用于生产环境中。编译器框架、ML图优化和针对硬件的内核编写对AI训练和推理平台的性能、开发效率和部署速度产生影响。您将开发AI编译器框架,加速下一代AI硬件上的机器学习工作负载。您将与AI研究人员密切合作,分析深度学习模型以及如何在AI平台上高效地降低它们。您还将与硬件设计团队合作,为高性能开发编译器优化。您将应用软件开发的最佳实践,设计功能、优化和性能调优技术。您将在开发机器学习编译器框架方面获得宝贵的经验,并在推动AI领域特定问题的下一代硬件软件协同设计方面发挥帮助。 机器学习核心团队是新成立的AI+云全球研发组织的一部分,截至2023年拥有约150名软件工程师。我们计划在未来三年内将规模扩大两倍,因此您有很大的空间帮助我们一起发展和塑造新的组织。机器学习核心团队创建了支撑所有产品AI能力的基础技术。瑞萨是全球领先的汽车电子产品供应商,每年出货数十亿台设备。 主要职责: • 开发AI编译器框架、高性能内核编写和加速到下一代硬件架构。 • 为开发业界领先的ML框架核心编译器做出贡献,支持新的最先进的推理和训练ML硬件加速器,并优化其性能。 • 分析深度学习网络,开发和实施编译器优化算法。 • 与AI研究科学家合作,加速下一代深度学习模型,如推荐系统、计算机视觉、自然语言处理。 • 对深度学习框架进行性能调优和优化。 主要要求: 最低资格要求 • 计算机科学、计算机工程、相关技术领域的学士学位或同等实际经验。 • 有效的C/C++/Python编程技能。 • 在硬件架构上加速深度学习模型或库的经验。 • 具备CUDA编程、OpenMP/OpenCL编程或AI硬件加速器内核编程的经验。 • 能够用商务水平进行英语口语和写作。 首选资格 • 有关编译器优化(如循环优化、向量化、并行化、SIMD等)的相关工作或经验。 • 有MLIR、LLVM、IREE、XLA、TVM、Halide的经验。 • 了解GPU、CPU或AI硬件加速器架构。 • 有使用PyTorch、Caffe2、TensorFlow、ONNX、TensorRT等框架的经验。 • 有关延迟、内存带宽、I/O访问、计算利用率分析等运行时分析和优化的相关工作或经验。 为了让我们的生活更轻松 在瑞萨,我们不断努力通过全面的微控制器、模拟和功率设备组合推动创新。我们的使命是通过为我们的四个重点增长领域提供智能,开发一个更安全、更健康、更环保、更智能的世界:汽车、工业、基础设施和物联网,这些都是我们日常生活中至关重要的,也就是说,我们的产品和解决方案无处不在。了解更多信息,请访问renesas.com。关注我们的LinkedIn、Facebook、Twitter、YouTube和Instagram。 我们于2020年制定了瑞萨文化,这是一种应该在瑞萨集团和所有员工之间共享的思维方式或行为准则。该准则作为我们所有活动、行为和决策的参考点,由五个要素组成:“透明、灵活、全球、创新、创业”。这些要素构建了成为一个能够灵活应对变化、解决问题并持续创造价值的公司的基础。每个瑞萨集团的员工都可以通过体现这种文化并将其融入各种决策过程中来抓住主动权。 我们致力于创建一个多元化的文化,让每个人都被包容并感到归属。有关更多信息,请阅读我们的多元包容声明。