技术人员成员 - LLMs

3天前全职
121.0万 - 156.6万 / 年 Amadeus Search

Amadeus Search

location 旧金山
unsaved
技术人员成员 - 基础设施与 LLMs 地点:加利福尼亚州旧金山(混合工作) 薪资:$170,000 - $220,000 基础 + 1-3% 股权 工作授权:需要美国工作授权(不提供签证赞助) 开始日期:尽快 类型:全职 关于该职位 我们正在寻找一位极具好奇心和技术实力的工程师,加入一个精简的高绩效团队,构建下一代 LLM 推理基础设施。这是一个从第一天起就拥有设计和开发性能关键系统的机会,直接解决以下问题: • 扩展多 GPU 推理工作负载 • 设计分布式作业调度器 • 进行 LLM 蒸馏和优化框架的实验 你将加入一个由两名工程师组成的团队,在最早的阶段,你的影响将对产品和文化产生基础性作用。没有官僚主义。没有政治。只有雄心勃勃、技术具有挑战性的工作,真正有意义。 为什么这个角色是独特的 • 大量技术所有权:在没有繁文缛节的情况下推动核心基础设施设计。 • 前沿工程:参与分布式系统、LLM 运行时、CUDA 编排和新颖的扩展解决方案。 • 基础股权:获得有意义的所有权,并成长为创始级角色。 • 使命驱动:专注于持久的基础设施,而非短期的炒作周期。 • 不需要证书:我们重视能力和驱动力,而非简历和学位。 理想候选人概况 • 2 年以上后端或基础设施工程经验 • 对分布式系统、GPU 编排或 AI 基础设施有深厚的兴趣或经验 • 通过副项目、开源贡献或社区参与展示强烈的技术好奇心 • 在以基础设施为重点的组织(如 Supabase、Dagster、Modal、Lightning AI、MotherDuck)有背景 • 精通 Python,具有 Docker、GPU 工作负载和分布式计算系统的生产经验 技术栈 • 核心语言:Python • 基础设施:用于多 GPU 推理的自定义分布式系统 • 部署:Docker、CUDA、Kubernetes(或同等技术) • 重点:批量推理、模型蒸馏、低延迟管道 软技能特征 • 快速学习者,具有责任心 • 从基本原则出发思考,对默认假设持怀疑态度 • 合作性强,积极的团队合作者 • 以建设为导向,而非凭借资历