关于公司
我们的客户是一家在AI革命前沿的上市公司,提供以AI为中心的云平台,正在重塑人工智能的格局。该公司提供尖端的基础设施,包括大规模GPU集群、云平台、工具和服务,帮助开发人员为全球AI行业的爆炸性增长服务,包括财富1000强公司、顶级创新初创企业和AI研究人员。
公司类型:上市公司
行业:AI/ML,云计算,基础设施即代码
候选人地点:美国远程
他们的使命是民主化AI基础设施的访问权限,赋能组织在任何规模上创建、优化和部署AI解决方案。他们的目标是通过提供一个结合强大硬件与用户友好工具和服务的全栈AI平台,简化AI开发的复杂性。
机会
我们正在寻找一位高级AI/ML专家解决方案架构师加入我们客户的团队。这个角色提供了为AI专注的客户设计和实施可扩展AI解决方案的机会,使用最先进的技术,并为市场上最强大的商用超级计算机之一做出贡献。
您的职责
架构和优化大规模AI模型的分布式训练和推理系统
设计和交付以客户为中心的解决方案,最大化性能和业务价值
领导ML管道从POC到可扩展生产系统的过渡
建立长期客户关系,确保满意度和与战略目标的一致性
创建白皮书,进行技术演示,并举办网络研讨会以分享见解和最佳实践
提供技术领导力并指导团队关于AI基础设施和部署策略
与工程和产品团队合作,优先考虑客户反馈并影响产品路线图
您的能力
5年以上云技术和基础设施经验,理想情况下在高级MLOps或解决方案架构师角色中
在多节点和多GPU环境中扩展和优化AI工作负载方面的专业知识
成功交付ML产品,从POC扩展到生产
对ML框架如PyTorch和JAX有深入了解
在NVIDIA HPC生态系统(CUDA,NCCL,Infiniband)中有强大背景
卓越的沟通能力,能够与技术团队和业务利益相关者互动
在美国合法全职工作,无需赞助
优先技术技能
编程语言:Python,Go,Java,C++
基础设施即代码(IaC):Terraform,Ansible
编排:Kubernetes(K8s),Slurm
DevOps工具:Git,Docker,Helm
大数据框架:Spark,Kafka,Hadoop
数据库:SQL,NoSQL和向量数据库
ML框架:PyTorch,TensorFlow,JAX,HuggingFace,Scikit-learn
为什么加入?
有竞争力的薪酬:每年180,000 - 300,000美元(根据经验和地点可协商)
全面的医疗福利:公司100%支付员工和家庭的医疗、牙科和视力保险
401(k)计划,提供4%的匹配计划
股票期权计划
灵活的远程工作环境
公司支付的短期、长期残疾和人寿保险
主要看护人20周带薪育儿假,次要看护人12周
每月高达85美元的手机和互联网费用
使用最先进的AI和云技术,包括最新的NVIDIA GPU
成为运营市场上最强大的商用超级计算机之一的团队的一员
为可持续AI基础设施做出贡献,拥有能效数据中心,回收废热为附近住宅楼供暖
面试流程
第一轮 - 人才招聘面试
第二轮 - 招聘经理面试
第三轮 - 技术评估
背景调查和推荐信:成功面试后进行
工作邀请:提供给被选中的候选人
我们自豪地成为一个平等机会的工作场所,并致力于提供平等就业机会,无论种族、肤色、宗教、国籍、年龄、性别、婚姻状况、祖籍、身体或精神残疾、遗传信息、退伍军人身份、性别认同或表达、性取向或任何其他受适用联邦、州或地方法律保护的特征。