位置
旧金山或帕洛阿尔托,加利福尼亚州
雇佣类型
全职
工作地点类型
混合
部门
工程
关于 Anyscale:
在 Anyscale,我们的使命是普及分布式计算,使其对各个技能水平的软件开发人员都可访问。我们正在商业化 Ray,这是一个流行的开源项目,正在创建一个用于可扩展机器学习的库生态系统。像 OpenAI、Uber、Spotify、Instacart、Cruise 等公司都在他们的技术栈中使用 Ray,以加速 AI 应用在现实世界中的进展。
通过 Anyscale,我们正在打造运行 Ray 的最佳场所,使任何开发人员或数据科学家都能将机器学习应用从他们的笔记本电脑扩展到集群,而无需成为分布式系统专家。
我们自豪地获得了 Andreessen Horowitz、NEA 和 Addition 的支持,目前已筹集超过 2.5 亿美元。
关于该职位:
Anyscale 正在寻找一名软件工程师加入基础设施团队。Anyscale 旨在提供下一代工具和基础设施,使在云中开发和运行分布式 AI 应用程序像在笔记本电脑上一样简单。作为基础设施团队的一员,我们构建了可扩展、安全和稳健的骨干,以实现这一愿景。
我们的团队负责控制平面,该平面协调集群管理、调度和用户访问,以及数据平面,确保分布式工作负载的高性能执行。
我们正在寻找一位在控制平面和数据平面开发方面具有扎实背景的软件工程师,并在 Kubernetes、容器编排和云原生基础设施方面具有专业知识。您将在设计、实施和优化支持 Anyscale 云平台的关键基础设施中发挥重要作用。
您将有机会参与开源 Ray 的工作,为我们的无限笔记本专有产品做出贡献,并开发两者之间的无缝集成,同时为我们的客户提供高影响力的功能。
您可能参与的项目快照
- 设计、构建和扩展服务,以在云和本地环境中编排 Ray 集群,支持基于虚拟机和基于 Kubernetes 的部署
- 优化大规模分布式 AI/ML 工作负载的控制平面组件
- 构建智能调度和资源管理系统,用于异构计算集群
- 开发功能以增强 Anyscale 管理的 Ray 工作负载的可靠性、性能、可扩展性和可观测性
- 支持和优化加速器集成(例如,GPU、TPU)
- 处理分布式工作负载的容器镜像管理和依赖解析
- 参与代码审查、设计和架构讨论
- 提供随叫随到的支持,与客户和现场团队密切合作以解决基础设施问题
- 与领先的分布式系统和机器学习专家合作,推动 AI 基础设施的界限
如果您具备以下条件,我们很想听到您的消息
- 计算机科学、工程或同等实践经验的学士学位
- 3 年以上编写高质量生产代码的经验
- 在构建和维护高可用、可扩展和高性能分布式系统方面的实践经验
- 在云原生技术(AWS、Azure、GCP)和基于 Kubernetes 的部署方面的专业知识
- 对云环境中的网络、安全和认证机制有深入了解
- 熟悉可观测性栈(Prometheus、Grafana 等)
- 精通 Go 和 Python
- 了解低级操作系统基础(Linux 内核、文件系统、容器)
Anyscale Inc. 是一个平等机会雇主。候选人评估不考虑年龄、种族、肤色、宗教、性别、残疾、国籍、性取向、退伍军人身份或任何其他受联邦或州法律保护的特征。
Anyscale Inc. 是一家 E-Verify 公司,您可以查看 E-Verify 参与通知和工作权利海报(英文和西班牙文)。