机器学习研究科学家
Etched正在构建超级智能的硬件
GPU和TPU是灵活的人工智能芯片,可以运行许多种模型:CNN、RNN、LSTM等。但是今天,几乎所有的人工智能工作负载,从ChatGPT到自动驾驶汽车,都是在一个模型架构上完成的:transformers。使用灵活的人工智能芯片进行transformers的计算非常低效:H100上的晶体管只有不到5%用于矩阵乘法!
Etched正在构建专门用于transformer推理的单一用途芯片。我们只支持transformers,但是换取的是我们的芯片比H100具有数量级更高的吞吐量和更低的延迟。使用Etched,您可以构建使用GPU无法实现的产品,如思维树代理和超低延迟音频聊天机器人。
Etched正在寻找优秀的ML编译器前端工程师加入我们的团队,并与现有的transformer库进行生产级集成。理想的候选人具有与产品中的LLMs密切合作的经验,并且了解高效推理的内部工作原理。
Etched正在寻找一位ML研究科学家,帮助我们的客户共同设计模型和高度专业化的微芯片。我们相信,随着最大的LLMs的成本不断攀升,模型-硬件协同设计将成为保持推理可负担性的关键。
职责:
• 设计和实现在专用硅片上高效运行的深度学习架构
• 理解NLP的新进展,以及它们如何与我们的芯片架构配合工作
• 在Etched的专用架构上准确建模新的transformer模型的性能
• 就内核并行策略的进展向架构和硬件团队提供反馈,包括在一个系统内和跨多个系统之间
要求:
• 具有设计大型transformer模型架构的经验
• 计算机科学、电子与计算机工程、数学或相关科学学科的博士学位,或具有等同的经验
• 对当前大型语言模型研究有深入广泛的了解
• 深入了解反向传播的实现方式及其可能的替代方案
• 能够使用Python或其他脚本语言进行编程
• 对人工智能的扩展充满热情
期望的资格:
• 熟练掌握GPU编程。
• 理解当前高效人工智能推理技术(包括内存中的结构稀疏性、低精度浮点数和注意力的变体)。
• 具有工业规模训练运行的经验(成本超过1000万美元)
福利:
• 有竞争力的薪资和股权套餐
• 全面的医疗、牙科和视力保险,保费全额支付
• 每天与世界一流的人才和最先进的人工智能合作
Etched致力于公平和公正的薪酬制度。薪酬根据您的资格和经验确定。薪酬套餐还包括Etched的慷慨股权。
我们是一家平等机会的雇主,不以种族、宗教、国籍、性别、性取向、年龄、退伍军人身份、残疾或其他受法律保护的身份为基础进行歧视。