高级软件工程师 - 管理Kubernetes

28天前全职
248.3万 - 372.1万 / 年 Lambda

Lambda

location 旧金山
unsaved
我们在这里帮助地球上最聪明的头脑构建超级智能。推动边界的实验室?它们运行在Lambda上。我们的设备训练并提供它们的模型,我们的基础设施与它们一起扩展,我们快速行动以跟上。如果你想与热爱行动和解决困难问题的人一起从事大规模、改变世界的人工智能部署,我们就是你要去的地方。 如果你想构建世界上最好的深度学习云,加入我们。 • 注意:此职位要求每周在我们旧金山办公室工作4天;Lambda目前指定的在家工作日是星期二。 Lambda的工程团队负责构建和扩展我们的云服务。我们的范围包括Lambda网站、云API和系统以及用于系统部署、管理和维护的内部工具。 关于这个角色 我们正在寻找一位高级软件工程师加入我们的管理Kubernetes(Mk8s)团队。你将在塑造我们的Kubernetes基础设施的架构、可靠性和自动化中发挥关键作用,这些基础设施支持我们全球平台上的关键工作负载。 你将做什么 • 设计、构建和维护可扩展的控制平面服务、操作员和自定义Kubernetes控制器,同时使用Python/Go开发端到端集群生命周期管理的自动化——包括配置、升级、修补和删除。 • 识别差距,开发内部工具、API和命令行接口(CLIs),使客户和机器学习/人工智能团队能够部署和有效监控推理服务。 • 编写具有弹性的系统,以优雅地处理大规模分布式环境中的故障。 • 开发自动化测试以确保质量和稳定性,并验证集群以识别和解决交付前的硬件问题。 • 通过轮班值班支持和调试生产问题。 你 • 具有6年以上软件工程经验,3年以上领导大规模复杂项目或担任技术负责人。 • 至少有两年在编排和部署系统方面的工作经验。 • 有使用Kubernetes和第三方操作员(CRDs、CSI、CNI等)的经验。 • 精通Go和Python编程;能够有效协作共享代码库。 • 以拥有和交付产品和平台的核心组件为荣。 • 有基础设施即代码工具(例如Terraform、Pulumi)的经验。 • 具备Linux系统、网络、容器和云基础设施的扎实知识。 加分项 • 深厚的Kubernetes和Linux专业知识。 • 有操作控制平面和大规模Kubernetes集群底层组件的经验。 • 有用户级限制和强化(例如AppArmor)的经验。 • 有高性能计算集群、环境和工具的经验。 • 有机器学习/人工智能框架的经验。 • 对混合或多云Kubernetes环境的专业知识。 • 熟悉GPU、Infiniband或K8s上的高性能计算。 • 过去对CNCF项目或Kubernetes SIGs的贡献是加分项。 如果你不符合所有这些要求,但相信自己可能适合这个角色,请仍然申请,并提供一封求职信,帮助我们了解你的经验和对这个角色的准备情况。 薪资范围信息 此职位的年薪范围是根据市场数据和其他因素设定的。然而,对于资格与职位描述中列出的要求有显著不同的候选人,可能适合更高或更低的薪资。 关于Lambda • 成立于2012年,约400名员工(2025年)并快速增长。 • 我们提供丰厚的现金和股权补偿。 • 我们的投资者包括Andra Capital、SGW、Andrej Karpathy、ARK Invest、Fincadia Advisors、G Squared、In-Q-Tel (IQT)、KHK & Partners、NVIDIA、Pegatron、Supermicro、Wistron、Wiwynn、US Innovative Technology、Gradient Ventures、Mercato Partners、SVB、1517、Crescent Cove。 • 我们的系统需求极高,季度和年度盈利。 • 我们的研究论文已被顶级机器学习和图形会议接受,包括NeurIPS、ICCV、SIGGRAPH和TOG。 • 为你和你的家属提供健康、牙科和视力保险。 • 为特定职位提供健康和通勤津贴。 • 提供401k计划,2%公司匹配(美国员工)。 • 灵活的带薪休假计划,我们都实际使用。 最后一点: 你不需要满足所有列出的期望即可申请此职位。我们致力于建立一个拥有各种背景、经验和技能的团队。 平等机会雇主 Lambda是一个平等机会的雇主。申请者在考虑时不会因种族、肤色、宗教、信仰、国籍、年龄、性别、性别、婚姻状况、性取向和身份、遗传信息、退伍军人身份、公民身份或当地、州或联邦法律禁止的任何其他因素而受到影响。 薪资范围:$349K - $523K