1) 职位概述
Mercor正在寻找经验丰富的PyTorch专家,他们擅长在操作符级别扩展和定制框架。理想的贡献者是那些深入了解PyTorch的调度系统、ATen、自动微分机制和C++扩展接口的人。这些承包商在研究概念和高性能实现之间架起桥梁,生产出清晰、可维护的操作符定义,能够无缝集成到现有代码库中。
2) 主要职责
• 设计并实现新的PyTorch操作符和C++/ATen中的张量函数。
• 构建并验证具有正确梯度传播和测试覆盖率的Python绑定。
• 在即时模式下创建“黄金”参考实现以验证正确性。
• 与处理低级内核优化的CUDA或系统工程师异步协作。
• 在操作符和图级别进行性能分析、基准测试和报告性能趋势。
• 记录假设、API和性能指标以实现可重复性。
3) 理想资格
• 深入理解PyTorch内部机制(TensorIterator、调度器、自动微分引擎)。
• 在C++17+和PyTorch生态系统内的模板元编程方面有扎实的背景。
• 有撰写或扩展PyTorch自定义操作符或后端的经验。
• 具备性能分析工具和GPU/CPU交互的工作知识。
• 具备较强的书面沟通能力,能够交付文档完善的独立模块。
• 之前对PyTorch、TorchInductor、Triton或相关项目的开源贡献是加分项。
4) 更多关于该机会的信息
• 适合喜欢在深度学习框架中构建干净、高性能抽象的承包商。
• 工作是异步的、灵活的,并以结果为导向。
• 与CUDA优化专家合作,集成和验证内核。
• 项目可能涉及用于最先进AI模型和基准测试的原语。
5) 薪酬与合同条款
• 典型范围:$100–$200/小时,具体取决于经验和项目范围。
• 以独立承包商的形式进行,不是雇佣关系。
• 按里程碑或每周发票节奏支付所提供的服务。
• 可能适用保密和知识产权转让协议。
6) 申请流程
• 分享您在PyTorch内部机制和系统级编程方面的经验简要总结。
• 包括开源工作、GitHub PR或示例操作符实现的链接。
• 提供小时费率、可用性和相关技术背景。
• 选定的专家可能需要完成一个简短的、有偿的试点模块以展示适配性。
7) 关于Mercor
• Mercor将顶级独立专业人士与领先的AI实验室和研究机构连接起来。
• 承包商对其工作、时间安排和交付成果拥有完全控制权。
• 我们的合作专注于AI系统和优化领域的高技能、高自主技术工作。