Crusoe 的使命是加速能源和智能的丰富性。我们正在打造一个引擎,推动一个人们可以大胆创造 AI 的世界——而不牺牲规模、速度或可持续性。
成为 Crusoe 可持续技术 AI 革命的一部分。在这里,您将推动有意义的创新,产生切实的影响,加入一个为负责任的、变革性的云基础设施设定节奏的团队。
关于这个角色:
Crusoe 云软件开发团队正在寻找一位热情且经验丰富的高级/资深软件工程师,专注于系统应用程序。这个关键角色在我们计算平台的设计和开发中至关重要,特别专注于为虚拟化 AI 平台构建计算应用程序。对 Linux 内核、虚拟化、硬件调优、分布式系统、面向对象编程和低级系统编程的理解对这个角色至关重要。优秀的沟通技巧和与 Linux 堆栈中各种技术合作的意愿都是必须的。这是一个全职职位。
您将从事的工作:
• 计算应用程序开发与扩展:设计高可靠性和高性能的 Linux 应用程序,用于管理我们在多个全球数据中心的数千台 AI 计算服务器的虚拟化堆栈。
• AI 硬件平台集成:将 Crusoe 应用程序与各种硬件和软件 AI 芯片供应商堆栈集成。构建解决方案以优化和监控虚拟化硬件(GPU、Infiniband/ROCe NIC、临时存储等)在前沿 AI/HPC 环境中的表现。
• 内核与虚拟机监控程序集成:与我们的 Linux 内核和虚拟机监控程序团队紧密合作,确保我们的 Crusoe 应用程序与各种内核和虚拟机监控程序无缝集成。
• 性能分析与调优:分析并增强整个虚拟化堆栈的性能,从虚拟机监控程序到虚拟化客户操作系统,特别关注优化 AI/ML 工作负载。这包括性能分析、瓶颈识别和实施低级优化。
• 系统级故障排除:诊断和解决我们虚拟化堆栈(驱动程序、内核、虚拟机监控程序、客户操作系统和 Crusoe 应用程序)中的复杂系统问题。与内核和虚拟机监控程序团队紧密合作,以调试和解决集成挑战。
• 代码审查和质量保证:进行彻底的代码审查,以确保计算应用程序和虚拟化堆栈中软件的最高质量、可靠性和安全性。
• 跨职能协作:与其他工程团队(包括硬件设计、操作系统开发和 AI/ML 应用程序团队)合作,以确保产品开发的协调和集成。
• 技术领导:为初级工程师提供技术指导和指导,在计算应用程序团队内培养技术卓越和协作解决问题的文化。
您将带给团队的:
• Linux 系统熟悉度:在 Linux 内核上构建应用程序的经验,特别涉及虚拟化、设备驱动程序、内存管理和进程调度。
• 硬件集成:对 GPU、CPU、Infiniband 和以太网 NIC、临时磁盘和 PCI Express 等硬件设备有扎实的理解。
• 系统设计:对分布式应用程序和高度可扩展的系统设计有很强的把握。特别关注通信协议(GRPC、REST、TCP/IP 等)、数据库(Postgres、Redis)和系统设计应用(Pub/Sub、Kafka)。
• 软件架构:在构建软件应用程序方面具有丰富经验,包括高层(Golang、Java、Python)和低层(C、C++、Rust)。对干净、可维护的代码有敏锐的眼光,并具备单元测试驱动的思维方式。
• 优秀的沟通技巧:能够与组织内的团队合作,屏蔽噪音,专注于完成项目所需的工作。
• 快速和灵活的学习者:能够快速适应,渴望研究新技术,并不被不熟悉的技术堆栈所压倒。
• 虚拟化概念:对虚拟机监控程序、虚拟机生命周期和 Linux KVM 工具有一般知识。
• CI/CD 和验证:理解如何构建 Gitlab 或 Github CI/CD 管道,以在众多计算平台上交付无缺陷的代码。
加分项:
• 具有针对 AI/ML 工作负载的虚拟化经验,包括 GPU 虚拟化。
• 之前在调试或贡献内核或虚拟机监控程序代码方面的工作,特别是在设备管理方面。
• 在裸金属生产环境中配置数千个实时计算节点的经验。
福利:
• 行业内具有竞争力的薪资
• 在一家快速增长、资金充足的科技公司中获得限制性股票单位
• 包括 HDHP 和 PPO 的健康保险套餐选项,涵盖您和您的家属的视力和牙齿保险
• 雇主对 HSA 账户的贡献
• 带薪父母假
• 带薪人寿保险、短期和长期残疾保险
• Teladoc
• 401(k) 计划,薪资的 4% 100% 匹配
• 慷慨的带薪休假和假期安排
• 手机报销
• 学费报销
• Calm 应用的订阅
• MetLife 法律服务
• 公司支付的每月 300 美元通勤 FSA 福利
薪酬:
薪酬范围为 172,000 - 209,000 美元。所有报价中均包括限制性股票单位。薪酬将根据申请者的教育、经验、知识、技能和能力,以及内部公平性和与市场数据的一致性来确定。
Crusoe 是一个机会均等的雇主。就业决定不考虑种族、肤色、宗教、残疾、遗传信息、怀孕、公民身份、婚姻状况、性别/性别、性取向、性别认同、年龄、退伍军人身份、国籍或法律或法规保护的任何其他状态。