关于公司我们的客户是一家在AI革命前沿的上市公司，提供以AI为中心的云平台，正在重塑人工智能的格局。该公司提供尖端的基础设施，包括大规模GPU集群、云平台、工具和服务，帮助开发人员为全球AI行业的爆炸性增长服务，包括财富1000强公司、顶级创新初创企业和AI研究人员。公司类型：上市公司行业：AI/ML，云计算，基础设施即代码候选人地点：美国远程他们的使命是民主化AI基础设施的访问权限，赋能组织在任何规模上创建、优化和部署AI解决方案。他们的目标是通过提供一个结合强大硬件与用户友好工具和服务的全栈AI平台，简化AI开发的复杂性。机会我们正在寻找一位高级AI/ML专家解决方案架构师加入我们客户的团队。这个角色提供了为AI专注的客户设计和实施可扩展AI解决方案的机会，使用最先进的技术，并为市场上最强大的商用超级计算机之一做出贡献。您的职责架构和优化大规模AI模型的分布式训练和推理系统设计和交付以客户为中心的解决方案，最大化性能和业务价值领导ML管道从POC到可扩展生产系统的过渡建立长期客户关系，确保满意度和与战略目标的一致性创建白皮书，进行技术演示，并举办网络研讨会以分享见解和最佳实践提供技术领导力并指导团队关于AI基础设施和部署策略与工程和产品团队合作，优先考虑客户反馈并影响产品路线图您的能力 5年以上云技术和基础设施经验，理想情况下在高级MLOps或解决方案架构师角色中在多节点和多GPU环境中扩展和优化AI工作负载方面的专业知识成功交付ML产品，从POC扩展到生产对ML框架如PyTorch和JAX有深入了解在NVIDIA HPC生态系统（CUDA，NCCL，Infiniband）中有强大背景卓越的沟通能力，能够与技术团队和业务利益相关者互动在美国合法全职工作，无需赞助优先技术技能编程语言：Python，Go，Java，C++ 基础设施即代码（IaC）：Terraform，Ansible 编排：Kubernetes（K8s），Slurm DevOps工具：Git，Docker，Helm 大数据框架：Spark，Kafka，Hadoop 数据库：SQL，NoSQL和向量数据库 ML框架：PyTorch，TensorFlow，JAX，HuggingFace，Scikit-learn 为什么加入？有竞争力的薪酬：每年180,000 - 300,000美元（根据经验和地点可协商）全面的医疗福利：公司100%支付员工和家庭的医疗、牙科和视力保险 401(k)计划，提供4%的匹配计划股票期权计划灵活的远程工作环境公司支付的短期、长期残疾和人寿保险主要看护人20周带薪育儿假，次要看护人12周每月高达85美元的手机和互联网费用使用最先进的AI和云技术，包括最新的NVIDIA GPU 成为运营市场上最强大的商用超级计算机之一的团队的一员为可持续AI基础设施做出贡献，拥有能效数据中心，回收废热为附近住宅楼供暖面试流程第一轮 - 人才招聘面试第二轮 - 招聘经理面试第三轮 - 技术评估背景调查和推荐信：成功面试后进行工作邀请：提供给被选中的候选人我们自豪地成为一个平等机会的工作场所，并致力于提供平等就业机会，无论种族、肤色、宗教、国籍、年龄、性别、婚姻状况、祖籍、身体或精神残疾、遗传信息、退伍军人身份、性别认同或表达、性取向或任何其他受适用联邦、州或地方法律保护的特征。

高级AI/ML专家解决方案架构师（AI基础设施与云）

Lavendo