关于公司
我们的客户是一家在AI革命前沿的上市公司,提供以AI为中心的云平台,正在重塑人工智能的格局。公司提供尖端的基础设施,包括大规模GPU集群、云平台、工具和服务,帮助开发者为全球AI行业的爆炸性增长服务,涵盖财富1000强公司、顶级创新初创企业和AI研究人员。
- 公司类型:上市公司
- 行业:AI/ML、云计算、基础设施即代码
- 候选人位置:美国远程
他们的使命是民主化AI基础设施的访问权限,赋能组织在任何规模上创建、优化和部署AI解决方案。他们的目标是通过提供结合强大硬件和用户友好工具与服务的全栈AI平台,简化AI开发的复杂性。
机会
我们正在寻找一位高级AI/ML专家解决方案架构师加入我们客户的团队。这个角色提供了为以AI为中心的客户设计和实施可扩展AI解决方案的机会,使用最先进的技术,并为最强大的商用超级计算机之一做出贡献。
你的职责
- 架构和优化大规模AI模型的分布式训练和推理系统
- 设计和交付以客户为中心的解决方案,最大化性能和业务价值
- 领导ML管道从POC到可扩展生产系统的过渡
- 建立长期客户关系,确保满意度和与战略目标的一致性
- 创建白皮书,提供技术演示,并举办网络研讨会分享见解和最佳实践
- 提供技术领导力,并指导团队关于AI基础设施和部署策略
- 与工程和产品团队合作,优先考虑客户反馈并影响产品路线图
你的优势
- 5年以上云技术和基础设施经验,理想情况下在高级MLOps或解决方案架构师角色中
- 在多节点和多GPU环境中扩展和优化AI工作负载方面的专业知识
- 在从POC到生产的ML产品交付方面取得成功
- 深入了解ML框架,如PyTorch和JAX
- 在NVIDIA HPC生态系统(CUDA、NCCL、Infiniband)方面有强大的背景
- 出色的沟通技巧,能够与技术团队和业务利益相关者互动
- 在美国全职工作无需赞助的合法授权
优先技术技能
- 编程语言:Python、Go、Java、C++
- 基础设施即代码(IaC):Terraform、Ansible
- 编排:Kubernetes(K8s)、Slurm
- DevOps工具:Git、Docker、Helm
- 大数据框架:Spark、Kafka、Hadoop
- 数据库:SQL、NoSQL和向量数据库
- ML框架:PyTorch、TensorFlow、JAX、HuggingFace、Scikit-learn
加入的理由
- 具有竞争力的薪酬:每年$180,000 - $300,000(根据经验和地点可协商)
- 全面的医疗福利:公司全额支付员工及家庭的医疗、牙科和视力保险
- 401(k)计划,提供4%的匹配计划
- 股票期权计划
- 灵活的远程工作环境
- 公司支付的短期、长期残疾和人寿保险
- 为主要看护人提供20周带薪育儿假,为次要看护人提供12周
- 每月最多$85的手机和互联网费用
- 使用最先进的AI和云技术,包括最新的NVIDIA GPU
- 成为运营最强大的商用超级计算机之一的团队的一员
- 为可持续AI基础设施做出贡献,拥有能效高的数据中心,回收废热为附近住宅楼供暖
面试流程
- 第一级 - 与人才招聘面试
- 第二级 - 与招聘经理面试
- 第三级 - 技术评估
- 背景调查和参考检查:在成功面试后进行
- 工作邀请:提供给被选中的候选人
我们自豪地成为一个平等机会的工作场所,并致力于无论种族、肤色、宗教、国籍、年龄、性别、婚姻状况、祖先、身体或精神残疾、遗传信息、退伍军人身份、性别认同或表达、性取向或任何其他受适用联邦、州或地方法律保护的特征,都提供平等的就业机会。