您想参与创建世界上最快的生成模型推理吗？加入Cerebras推理团队，参与开发独特的软件和硬件组合，在运行最大模型时提供市场上最佳的推理特性。Cerebras晶圆级推理平台通过独特的硬件架构实现了前所未有的速度，提供最快的本地内存访问、超快速互连和大量可用计算能力。您将成为团队的一员，与最新的开放和封闭生成AI模型合作，以优化Cerebras推理平台。您的职责将包括处理模型表示、优化和编译栈，以在Cerebras当前和未来的平台上产生最佳结果。职责： - 分析生成AI领域的新模型，并理解其对编译栈的影响 - 开发和维护模型定义框架，该框架由模型构建模块组成，以基于PyTorch和Cerebras方言表示大型语言模型，并准备在Cerebras硬件上部署。 - 开发和维护前端编译器基础设施，该基础设施摄取PyTorch模型并生成中间表示（IR）。 - 扩展和优化基于PyTorch FX / TorchScript / TorchDynamo的工具，用于图形捕获、转换和分析。 - 在功能实现过程中与其他团队合作 - 研究新的模型优化方法以改善Cerebras推理资格： - 工程、计算机科学或同等经验的学位，并有卓越能力的证据 - 强大的Python编程技能和深入的PyTorch内部经验（例如，TorchScript、FX或Dynamo）。 - 对计算图、张量操作和模型跟踪有扎实的理解。 - 有构建或扩展编译器、解释器或ML图优化框架的经验。 - 有使用PyTorch和HuggingFace Transformers库的经验 - 了解和有使用大型语言模型的经验（理解Transformer架构的变化、生成周期等） - 强大的C++编程技能。 - 了解基于MLIR的编译栈优先资格： - 之前有为PyTorch、TensorFlow XLA、TVM、ONNX RT或类似编译器栈做贡献的经验。 - 了解硬件加速器、量化或运行时调度。 - 有多目标推理编译（例如，CPU、GPU、自定义ASIC）的经验。 - 理解数值精度权衡和算子降级。 - 对开源ML编译器项目的贡献。

Python / PyTorch 开发者前端推理编译器

Cerebras Systems

Python / PyTorch 开发者 前端推理编译器

Cerebras Systems

Python / PyTorch 开发者前端推理编译器