技术人员成员 - 基础设施与 LLMs
地点:加利福尼亚州旧金山(混合工作)
薪资:$170,000 - $220,000 基础 + 1-3% 股权
工作授权:需要美国工作授权(不提供签证赞助)
开始日期:尽快
类型:全职
关于该职位
我们正在寻找一位极具好奇心和技术实力的工程师,加入一个精简的高绩效团队,构建下一代 LLM 推理基础设施。这是一个从第一天起就拥有设计和开发性能关键系统的机会,直接解决以下问题:
• 扩展多 GPU 推理工作负载
• 设计分布式作业调度器
• 进行 LLM 蒸馏和优化框架的实验
你将加入一个由两名工程师组成的团队,在最早的阶段,你的影响将对产品和文化产生基础性作用。没有官僚主义。没有政治。只有雄心勃勃、技术具有挑战性的工作,真正有意义。
为什么这个角色是独特的
• 大量技术所有权:在没有繁文缛节的情况下推动核心基础设施设计。
• 前沿工程:参与分布式系统、LLM 运行时、CUDA 编排和新颖的扩展解决方案。
• 基础股权:获得有意义的所有权,并成长为创始级角色。
• 使命驱动:专注于持久的基础设施,而非短期的炒作周期。
• 不需要证书:我们重视能力和驱动力,而非简历和学位。
理想候选人概况
• 2 年以上后端或基础设施工程经验
• 对分布式系统、GPU 编排或 AI 基础设施有深厚的兴趣或经验
• 通过副项目、开源贡献或社区参与展示强烈的技术好奇心
• 在以基础设施为重点的组织(如 Supabase、Dagster、Modal、Lightning AI、MotherDuck)有背景
• 精通 Python,具有 Docker、GPU 工作负载和分布式计算系统的生产经验
技术栈
• 核心语言:Python
• 基础设施:用于多 GPU 推理的自定义分布式系统
• 部署:Docker、CUDA、Kubernetes(或同等技术)
• 重点:批量推理、模型蒸馏、低延迟管道
软技能特征
• 快速学习者,具有责任心
• 从基本原则出发思考,对默认假设持怀疑态度
• 合作性强,积极的团队合作者
• 以建设为导向,而非凭借资历