MLIR软件工程技术总监

16个月前全职
d-Matrix

d-Matrix

location 旧金山
unsaved
d-Matrix彻底改变了内存计算集成的物理学,通过我们的数字内存计算(DIMC)引擎。人工智能计算的“圣杯”一直是突破内存壁垒以最小化数据移动。我们通过首款DIMC引擎实现了这一目标。d-Matrix已经获得了超过1.54亿美元的融资,其中1.1亿美元来自我们的B轮融资,我们正准备通过芯片和内存计算方法推动大型语言模型的生成推理加速。我们计划在2024年初发布我们的第一个商业产品。我们有能力满足这些大型语言模型的能源和性能需求。公司在硅谷、悉尼和班加罗尔拥有70多名员工。 地点: 在我们位于加利福尼亚圣克拉拉总部工作,每周3天。 职位:MLIR软件工程技术总监 你将要做什么 编译器技术总监/负责人的角色是推动基于MLIR的编译器框架的设计和实现。在这个角色中,您将监督开发将大规模NLP模型分区和映射到我们的可扩展的、多芯片、并行处理架构的编译器,该架构具有数百个数字内存张量处理器、向量处理器、数据整形处理器以及芯片上和芯片外内存。编译器还将协调并行任务的调度、数据移动和处理器间的同步。多通道编译器架构需要图优化传递、常量折叠、数据重塑、填充、平铺和其他各种特定于后端的操作。该软件将支持离线/在线分割映射过程,并实时映射到芯片、处理器和DDR内存通道。 这个角色需要与硬件和软件架构团队、Pytorch前端预处理团队、数据科学数值团队、AI内核团队、软件测试组、基准测试组以及开发各种模拟器和仿真平台的团队进行合作。它对整体解决方案的效率至关重要。因此,我们正在寻找一个在TVM、Glow或更好的情况下熟悉MLIR项目的AI编译器专家。熟悉LLVM项目也很重要。有经验将图操作映射到众核处理器(或空间织物)的经验将是可取的。 这个角色不需要硬件设计或验证经验。尽管如此,了解处理器架构师在为DNN、DCNN、变压器模型和注意机制实现加速器时所做的权衡是有用的,特别是当将非常大的NLP模型映射到这样的架构时。 最低要求 你将带来什么: • 计算机科学或等同学位研究生学历。 • 建立、发展和/或发展工程团队(特别是软件团队)的经验。 • 最好有领导敏捷开发方法的经验,包括协调Scrum、管理Sprint和使用看板或类似工具跟踪项目任务。 • 运行代码审查、缺陷跟踪会议,熟悉和经验CI/CD流程。 • 管理与其他团队的相互依赖,以达到里程碑和目标性能水平。 • 出色的文档编写和演示技巧。 这个角色包括技术领导方面的工作:具体包括激励、参与、目标设定、绩效跟踪、目标设定和绩效管理。 平等就业政策 d-Matrix自豪地成为一个平等机会的工作场所和积极行动的雇主。我们致力于营造一个包容的环境,让每个人都感到受欢迎和有能力发挥他们最好的工作。我们为团队招聘最优秀的人才,不论种族、宗教、肤色、年龄、残疾、性别认同、性取向、祖籍、遗传信息、婚姻状况、国籍、政治派别或退伍军人身份。我们的重点是聘请具有谦逊专业知识、友善、奉献精神和愿意每天一起迎接挑战和学习的团队合作伙伴。 d-Matrix不接受外部机构的简历或候选人提交。我们感谢招聘公司的兴趣和努力,但我们恳请有兴趣加入d-Matrix的个人直接通过我们的官方渠道申请。这种方式可以让我们简化招聘流程,并保持对所有申请者的一致和公正评估。感谢您的理解和合作。