您想参与创建世界上最快的生成模型推理吗?加入Cerebras推理团队,参与开发独特的软件和硬件组合,在运行最大模型时提供市场上最佳的推理特性。Cerebras晶圆级推理平台通过独特的硬件架构实现了前所未有的速度,提供最快的本地内存访问、超快速互连和大量可用计算能力。
您将成为团队的一员,与最新的开放和封闭生成AI模型合作,以优化Cerebras推理平台。您的职责将包括处理模型表示、优化和编译栈,以在Cerebras当前和未来的平台上产生最佳结果。
职责:
- 分析生成AI领域的新模型,并理解其对编译栈的影响
- 开发和维护模型定义框架,该框架由模型构建模块组成,以基于PyTorch和Cerebras方言表示大型语言模型,并准备在Cerebras硬件上部署。
- 开发和维护前端编译器基础设施,该基础设施摄取PyTorch模型并生成中间表示(IR)。
- 扩展和优化基于PyTorch FX / TorchScript / TorchDynamo的工具,用于图形捕获、转换和分析。
- 在功能实现过程中与其他团队合作
- 研究新的模型优化方法以改善Cerebras推理
资格:
- 工程、计算机科学或同等经验的学位,并有卓越能力的证据
- 强大的Python编程技能和深入的PyTorch内部经验(例如,TorchScript、FX或Dynamo)。
- 对计算图、张量操作和模型跟踪有扎实的理解。
- 有构建或扩展编译器、解释器或ML图优化框架的经验。
- 有使用PyTorch和HuggingFace Transformers库的经验
- 了解和有使用大型语言模型的经验(理解Transformer架构的变化、生成周期等)
- 强大的C++编程技能。
- 了解基于MLIR的编译栈
优先资格:
- 之前有为PyTorch、TensorFlow XLA、TVM、ONNX RT或类似编译器栈做贡献的经验。
- 了解硬件加速器、量化或运行时调度。
- 有多目标推理编译(例如,CPU、GPU、自定义ASIC)的经验。
- 理解数值精度权衡和算子降级。
- 对开源ML编译器项目的贡献。