应用人工智能研究员

蒙特利尔 28天前全职 网络
面议
**关于我们**: 我们是一家深度科技初创公司,专注于构建**节能的快速边缘AI引擎**,特别针对最新的**笔记本电脑芯片**,包括CPU、集成GPU和NPU。我们的目标是推动**边缘设备上AI推理效率**的界限,在无需重新训练模型的情况下优化性能。我们正在寻找一位**高技能的应用AI研究员**加入我们的团队,帮助优化推理和微调技术,以提升最先进的AI模型。 • **职位概述**: 作为一名**应用AI研究员**,您将专注于**底层优化**,以加速AI推理和微调,利用先进的技术和框架。您将与我们的技术团队紧密合作,以在异构架构(CPU、GPU和NPU)上实现高效执行。 • **职责**: - 研究和开发**AI推理和微调**的底层优化。 - 优化**AI**工作负载以实现高效执行,包括量化、剪枝和稀疏技术。 - 研究**跨设备执行策略**,确保在CPU、GPU和NPU之间高效分配计算。 - 实施**内存和计算优化**。 - 改善实时AI工作负载的**延迟、吞吐量和能效**。 - 与软件工程师合作,将优化集成到生产流水线中。 - 了解AI推理、硬件加速和**强化学习(RL)**技术的最新进展(加分项)。 • **要求**: - **5-7年**AI研究、优化或系统工程经验。 - 在**PyTorch**方面有很强的专业知识,包括TorchScript、TorchDynamo和其他加速技术。 - 精通**底层优化**技术,如向量化、内存优化和CUDA/OpenCL编程。 - 具有量化、剪枝和知识蒸馏等**模型压缩**技术的经验。 - 熟悉**AI编译器**(如TensorRT、TVM、XLA、MLIR、Triton)。 - 理解**异构计算架构**(CPU/GPU/NPU)及其在AI工作负载中的交互。 - 在**数值计算、分析和性能调优**方面有很强的背景。 - 具有**ONNX、TensorFlow、JAX**或其他ML框架的经验是加分项。 - 具备**强化学习(RL)**知识是一个显著优势。 • **加分项**: - 有使用**英特尔OpenVINO**或其他特定供应商加速框架的经验。 - 对开源AI/ML项目有贡献。 - 熟悉**分布式训练**和推理技术。 - 在ML系统、优化或推理加速方面有研究发表。 • **为什么加入我们?** - 参与解决具有现实世界影响的前沿AI优化问题。 - 成为快速发展的初创公司的一部分,您的贡献将直接影响产品。 - 具有竞争力的薪资和股权选择。 - 灵活的工作环境(可混合/远程)。 - 与充满热情的AI和系统专家团队合作。 如果您对在下一代硬件上优化AI模型的效率和性能感到兴奋,我们期待您的加入。