PyTorch 算子机器学习工程师

伦敦 17天前全职 网络
951 - 1.9K / 时
1) 角色概述 Mercor 正在寻找在操作符级别扩展和定制 PyTorch 框架的经验丰富的 PyTorch 专家。理想的贡献者是那些深刻理解 PyTorch 的调度系统、ATen 自动微分机制和 C 扩展接口的人。这些承包商将研究概念与高性能实现相结合,生成清晰、可维护的操作符定义,并无缝集成到现有代码库中。 2) 主要职责 • 设计并实现新的 PyTorch 操作符和 C/ATen 中的张量函数。 • 构建并验证具有正确梯度传播和测试覆盖率的 Python 绑定。 • 在即时模式下创建黄金参考实现以进行正确性验证。 • 与处理低级内核优化的 CUDA 或系统工程师异步协作。 • 在操作符和图级别进行性能趋势的分析、基准测试和报告。 • 记录假设、API 和性能指标以确保可重复性。 3) 理想资格 • 深刻理解 PyTorch 内部结构(TensorIterator 调度器、自动微分引擎)。 • 在 PyTorch 生态系统中具有 C17 和模板元编程的强大背景。 • 有编写或扩展 PyTorch 自定义操作或后端的经验。 • 具备性能分析工具和 GPU/CPU 交互的工作知识。 • 具备强大的书面沟通能力,能够交付文档完善的独立模块。 • 之前对 PyTorch、TorchInductor、Triton 或相关项目的开源贡献是加分项。 4) 更多关于机会的信息 • 适合喜欢在深度学习框架中构建干净高性能抽象的承包商。 • 工作是异步的、灵活的,并以结果为导向。 • 与 CUDA 优化专家合作,集成和验证内核。 • 项目可能涉及用于最先进 AI 模型和基准测试的原语。 5) 薪酬与合同条款 • 典型范围:$100-$200/小时,具体取决于经验和项目范围。 • 结构为独立承包商参与,而非雇佣。 • 按里程碑或每周发票节奏支付所提供的服务。 • 可能适用保密协议和知识产权转让协议。 6) 申请流程 • 分享您在 PyTorch 内部结构和系统级编程方面的经验简要总结。 • 包括开源工作、GitHub PR 或示例操作符实现的链接。 • 提供每小时费率、可用性和相关技术背景。 • 选定的专家可能需要完成一个短期付费试点模块以展示适合性。 7) 关于 Mercor • Mercor 将顶级独立专业人士与领先的 AI 实验室和研究机构连接起来。 • 承包商完全控制他们的工作时间表和交付物。 • 我们的合作专注于 AI 系统和优化领域的高技能、高自主技术工作。