Lambda,超智能云,构建千兆瓦级别的 AI 工厂用于训练和推理。Lambda 的使命是让计算像电一样普及,让每个人都能接触到人工智能。每个人,一块 GPU。
如果您想建立世界上最好的深度学习云,欢迎加入我们。
• 注意:此职位要求每周在我们位于旧金山的办公室工作 4 天;Lambda 当前指定的居家办公日为星期二。
Lambda 的工程团队负责构建和扩展我们的云服务。我们的工作范围包括 Lambda 网站、云 API 和系统,以及用于系统部署、管理和维护的内部工具。
关于这个角色
我们正在寻找一位高级软件工程师加入我们的管理式 Kubernetes (Mk8s) 团队。您将在塑造我们基于 Kubernetes 的基础架构的架构、可靠性和自动化方面发挥关键作用,该基础架构为我们全球平台的关键工作负载提供支持。
您将做什么
• 设计、构建和维护可扩展的控制平面服务、操作员和自定义 Kubernetes 控制器,同时使用 Python/Go 开发自动化,以实现端到端集群生命周期管理——包括配置、升级、打补丁和删除。
• 识别差距并开发内部工具、API 和命令行接口 (CLIs),使客户和 ML/AI 团队能够有效部署和监控推理服务。
• 编写能够在大规模分布式环境中优雅处理故障的弹性系统。
• 开发自动化测试以确保质量和稳定性,并验证集群以识别和解决交付前的硬件问题。
• 通过轮班值班支持和调试生产问题。
您
• 具备 6 年以上的软件工程经验,3 年以上领导大规模复杂项目或技术领导经验。
• 至少 2 年的编排和部署系统工作经验。
• 具备使用 Kubernetes 和第三方操作员 (CRDs、CSI、CNI 等) 的经验。
• 精通 Go 和 Python 编程;能够在共享代码库上有效协作。
• 对拥有和交付产品和平台的核心组件感到自豪。
• 具备基础设施即代码工具 (例如 Terraform、Pulumi) 的经验。
• 对 Linux 系统、网络、容器和云基础设施有扎实的知识。
加分项
• 深厚的 Kubernetes 和 Linux 专业知识。
• 有操作大规模 Kubernetes 集群的控制平面和低级组件的经验。
• 具备用户级限制和强化 (例如 AppArmor) 的经验。
• 有 HPC 集群、环境和工具的经验。
• 具备机器学习/AI 框架的经验。
• 在混合或多云 Kubernetes 环境中的专业知识。
• 熟悉 GPU、Infiniband 或 K8s 上的高性能计算。
• 以前对 CNCF 项目或 Kubernetes SIGs 的贡献是加分项。
如果您不完全符合所有要求,但认为自己可能适合该职位,请仍然申请并提供一封求职信,帮助我们了解您的经验和对该角色的准备。
薪资范围信息
该职位的年薪范围已根据市场数据和其他因素设定。然而,对于资格与职位描述中列出的要求有显著差异的候选人,可能会适当提供高于或低于该范围的薪资。
关于 Lambda
• 成立于 2012 年,员工约 400 人(2025 年)并快速增长。
• 我们提供丰厚的现金和股权补偿。
• 我们的投资者包括 Andra Capital、SGW、Andrej Karpathy、ARK Invest、Fincadia Advisors、G Squared、In-Q-Tel (IQT)、KHK & Partners、NVIDIA、Pegatron、Supermicro、Wistron、Wiwynn、US Innovative Technology、Gradient Ventures、Mercato Partners、SVB、1517、Crescent Cove。
• 我们的系统需求极高,季度和年度盈利能力持续增长。
• 我们的研究论文已被接受到顶级机器学习和图形会议,包括 NeurIPS、ICCV、SIGGRAPH 和 TOG。
• 为您和您的家属提供健康、牙科和视力保险。
• 为特定角色提供健康和通勤津贴。
• 401k 计划,提供 2% 的公司匹配(美国员工)。
• 灵活的带薪休假计划,大家都能实际使用。
最后说明:
您不需要完全符合所有列出的期望才能申请此职位。我们致力于建立一个拥有多样背景、经验和技能的团队。
平等机会雇主
Lambda 是一名平等机会雇主。申请者不论种族、肤色、宗教、信仰、国籍、年龄、性别、性别认同、婚姻状况、性取向和身份、遗传信息、退伍军人身份、公民身份或任何其他地方、州或联邦法律禁止的因素,均受到考虑。
薪资范围:266K - 455K