机器学习应用工程师
Etched正在为超级智能构建硬件
GPU和TPU是灵活的人工智能芯片,可以运行多种模型:CNN、RNN、LSTM等。但是今天,几乎所有的人工智能工作负载,从ChatGPT到自动驾驶汽车,都是基于一个模型架构进行的:transformers。使用灵活的人工智能芯片进行transformers的计算非常低效:H100上的晶体管中只有<5%用于矩阵乘法!
Etched正在构建一种专门用于transformer推理的单一用途芯片。我们只支持transformers,但作为交换,我们的芯片的吞吐量和延迟比H100高一个数量级。使用Etched,您可以构建使用GPU不可能实现的产品,例如思维树代理和超低延迟音频聊天机器人。
Etched正在寻找杰出的机器学习应用工程师加入我们的团队。构建针对特定模型的硅芯片可以释放出新的能力(例如树搜索和超低延迟应用)-这个职位的理想候选人将帮助开发产品,并与正在开发依赖于我们硬件的产品的客户合作。
此职位将向软件副总裁汇报。
职责:
• 为设计我们与当前特定于transformer的推理库的集成提供输入,例如TensorRT-LLM、TransformerEngine、Hugging Face TGI和vLLM。
• 帮助分析和了解现代LLM服务堆栈中延迟的来源
• 帮助客户创建利用特定模型硅芯片独特能力的产品
要求:
• 富有创造力,能够从第一原理出发思考
• 对LLM架构及其如何用于构建应用有良好的理解
• 在云服务提供商、AI公司或LLM初创公司有1年以上的工作经验
• 熟练使用Python
• 对当前大型语言模型的研究具有广泛的知识
期望资格:
• 具有半导体设计和开发经验
• 具有深度学习框架(如PyTorch、Tensorflow)的经验
• 具有深度学习运行时(如ONNX Runtime、TensorRT等)的经验
• 具有TensorRT、TensorRT-LLM、Transformer Engine或vLLM中至少一种的经验
• 具有CV(ResNet等)、NLP(BERT、GPT)和/或推荐系统(DLRM)的ML模型训练、调优和部署经验
福利:
• 有竞争力的薪资和股权套餐
• 全面的医疗、牙科和视力保险,保费全额支付
• 每天与世界一流的人才和最先进的人工智能合作
Etched致力于公平公正的薪酬制度。薪酬根据您的资格和经验确定。薪酬套餐还包括Etched的丰厚股权。
我们是一家平等机会的雇主,不以种族、宗教、国籍、性别、性取向、年龄、退伍军人身份、残疾或其他受法律保护的身份为由进行歧视。