在 Phylo,我们正在打造最佳的 AI 代理,使生物学家的生产力提高 100 倍。我们正在寻找一位经验丰富的后端和基础设施工程师加入我们的核心团队。您将与世界级的研究人员和工程师合作,设计和运营智能生物医学代理背后的基础系统。在这个角色中,您将帮助构建科学工作负载的前沿基础设施,有机会对科学 AI 代理工作负载的执行、扩展和部署方式产生影响。
您的工作内容
- 架构、构建和维护支持生物医学 AI 代理工作流和面向开发者 API 的后端服务。
- 设计、部署和运营用于科学工作负载编排和数据管道的可扩展基础设施,涵盖消费者规模、多租户和本地企业部署。
- 开发用于沙盒执行、安全任务隔离和受控计算环境的系统。
- 实施和维护 CI/CD 管道、可观测性堆栈和生产可靠性工具。
- 跨工程、机器学习和科学团队协作,整合新的代理功能和计算工作流。
要求
- 精通至少一种主要编程语言,例如 Python、Go、Rust 或同等语言。
- 对容器化和分布式编排有深入理解,例如 Docker 和 Kubernetes。
- 具备至少一个主要云提供商的经验,例如 AWS、GCP 或 Azure。
- 对后端架构、分布式系统、性能优化和扩展考虑有扎实理解。
- 具备 CI/CD 系统、构建/部署自动化和可观测性工具(例如 Prometheus、Grafana、OpenTelemetry 或类似工具)的实际操作经验。
- 具备 Terraform 或其他基础设施即代码工具的实际操作经验。
- 能够在快速变化的环境中茁壮成长,具备高度的责任感和端到端责任。
加分项
- 具备沙盒或隔离执行框架的经验,例如 gVisor、Kata、Firecrackers。
- 拥有科学计算、生物医学工作流或基于代理的 AI 系统的背景。
- 拥有构建大规模消费者或企业软件产品的经验。
- 拥有大规模训练或服务生成式 AI 模型的经验,熟悉 LLM 服务基础。