高级人工智能/机器学习专家解决方案架构师(AI基础设施与云)

纽约 5天前全职 网络
124.9万 - 208.2万 / 年
关于公司 我们的客户是一家在AI革命前沿的上市公司,提供以AI为中心的云平台,正在重塑人工智能的格局。公司提供尖端的基础设施,包括大规模GPU集群、云平台、工具和服务,帮助开发者为全球AI行业的爆炸性增长服务,涵盖财富1000强公司、顶级创新初创企业和AI研究人员。 - 公司类型:上市公司 - 行业:AI/ML、云计算、基础设施即代码 - 候选人位置:美国远程 他们的使命是民主化AI基础设施的访问权限,赋能组织在任何规模上创建、优化和部署AI解决方案。他们的目标是通过提供结合强大硬件和用户友好工具与服务的全栈AI平台,简化AI开发的复杂性。 机会 我们正在寻找一位高级AI/ML专家解决方案架构师加入我们客户的团队。这个角色提供了为以AI为中心的客户设计和实施可扩展AI解决方案的机会,使用最先进的技术,并为最强大的商用超级计算机之一做出贡献。 你的职责 - 架构和优化大规模AI模型的分布式训练和推理系统 - 设计和交付以客户为中心的解决方案,最大化性能和业务价值 - 领导ML管道从POC到可扩展生产系统的过渡 - 建立长期客户关系,确保满意度和与战略目标的一致性 - 创建白皮书,提供技术演示,并举办网络研讨会分享见解和最佳实践 - 提供技术领导力,并指导团队关于AI基础设施和部署策略 - 与工程和产品团队合作,优先考虑客户反馈并影响产品路线图 你的优势 - 5年以上云技术和基础设施经验,理想情况下在高级MLOps或解决方案架构师角色中 - 在多节点和多GPU环境中扩展和优化AI工作负载方面的专业知识 - 在从POC到生产的ML产品交付方面取得成功 - 深入了解ML框架,如PyTorch和JAX - 在NVIDIA HPC生态系统(CUDA、NCCL、Infiniband)方面有强大的背景 - 出色的沟通技巧,能够与技术团队和业务利益相关者互动 - 在美国全职工作无需赞助的合法授权 优先技术技能 - 编程语言:Python、Go、Java、C++ - 基础设施即代码(IaC):Terraform、Ansible - 编排:Kubernetes(K8s)、Slurm - DevOps工具:Git、Docker、Helm - 大数据框架:Spark、Kafka、Hadoop - 数据库:SQL、NoSQL和向量数据库 - ML框架:PyTorch、TensorFlow、JAX、HuggingFace、Scikit-learn 加入的理由 - 具有竞争力的薪酬:每年$180,000 - $300,000(根据经验和地点可协商) - 全面的医疗福利:公司全额支付员工及家庭的医疗、牙科和视力保险 - 401(k)计划,提供4%的匹配计划 - 股票期权计划 - 灵活的远程工作环境 - 公司支付的短期、长期残疾和人寿保险 - 为主要看护人提供20周带薪育儿假,为次要看护人提供12周 - 每月最多$85的手机和互联网费用 - 使用最先进的AI和云技术,包括最新的NVIDIA GPU - 成为运营最强大的商用超级计算机之一的团队的一员 - 为可持续AI基础设施做出贡献,拥有能效高的数据中心,回收废热为附近住宅楼供暖 面试流程 - 第一级 - 与人才招聘面试 - 第二级 - 与招聘经理面试 - 第三级 - 技术评估 - 背景调查和参考检查:在成功面试后进行 - 工作邀请:提供给被选中的候选人 我们自豪地成为一个平等机会的工作场所,并致力于无论种族、肤色、宗教、国籍、年龄、性别、婚姻状况、祖先、身体或精神残疾、遗传信息、退伍军人身份、性别认同或表达、性取向或任何其他受适用联邦、州或地方法律保护的特征,都提供平等的就业机会。