关于公司
我们的客户是一家上市公司,处于 AI 革新的前沿,提供一个以 AI 为中心的云平台,正在重塑人工智能的格局。该公司提供最先进的基础设施,包括大规模 GPU 集群、云平台、工具和服务,旨在为财富 1000 强公司、顶尖创新初创企业和 AI 研究人员服务,以应对全球 AI 行业的爆炸性增长。
• 公司类型:上市公司
• 行业:AI/ML、云计算、基础设施即代码
• 候选人地点:美国远程工作
他们的使命是使 AI 基础设施的访问民主化,并赋能组织以任何规模创建、优化和部署 AI 解决方案。他们旨在通过提供一个全栈 AI 平台,简化 AI 开发的复杂性,该平台结合了强大的硬件与用户友好的工具和服务。
机会
我们正在寻找一位高级 AI/ML 专家解决方案架构师加入我们客户的团队。这个职位提供了为以 AI 为中心的客户设计和实施可扩展 AI 解决方案的机会,使用最先进的技术,并为市场上最强大的商用超级计算机之一做出贡献。
您的工作内容
• 架构和优化大型 AI 模型的分布式训练和推理系统
• 设计和交付以客户为中心的解决方案,最大化性能和商业价值
• 领导 ML 管道从 POC 过渡到可扩展生产系统
• 建立长期客户关系,确保满意度并与战略目标保持一致
• 创建白皮书,进行技术演示,并主持网络研讨会,以分享见解和最佳实践
• 提供技术领导力,并指导团队在 AI 基础设施和部署策略方面
• 与工程和产品团队合作,优先考虑客户反馈并影响产品路线图
您需要具备的条件
• 5 年以上云技术和基础设施的经验,理想情况下在高级 MLOps 或解决方案架构师职位上
• 在多节点和多 GPU 环境中扩展和优化 AI 工作负载的专业知识
• 成功交付 ML 产品的经验,从 POC 扩展到生产
• 深入了解 ML 框架,如 PyTorch 和 JAX
• 在 NVIDIA HPC 生态系统(CUDA、NCCL、Infiniband)方面有强大的背景
• 优秀的沟通能力,能够与技术团队和业务利益相关者进行有效交流
• 有法律授权在美国全职工作,无需赞助
优先技术技能
• 编程语言:Python、Go、Java、C++
• 基础设施即代码(IaC):Terraform、Ansible
• 编排:Kubernetes(K8s)、Slurm
• DevOps 工具:Git、Docker、Helm
• 大数据框架:Spark、Kafka、Hadoop
• 数据库:SQL、NoSQL 和向量数据库
• ML 框架:PyTorch、TensorFlow、JAX、HuggingFace、Scikit-learn
为什么加入?
• 竞争力薪资:每年 $180,000 - $300,000(根据经验和地点可协商)
• 全面的医疗福利:公司支付 100% 的医疗、牙科和视力保险,涵盖员工及其家庭
• 401(k) 计划,提供 4% 的匹配计划
• 股票期权计划
• 灵活的远程工作环境
• 公司支付短期、长期残疾和人寿保险
• 主要照顾者可享受 20 周带薪育儿假,次要照顾者可享受 12 周
• 每月最高 $85 的手机和互联网补贴
• 使用最先进的 AI 和云技术,包括最新的 NVIDIA GPU
• 成为运营市场上最强大的商用超级计算机之一的团队的一部分
• 为可持续 AI 基础设施做出贡献,拥有能量高效的数据中心,回收废热以加热附近的居民建筑
面试流程
• 第 1 轮 - 与人才招聘团队面试
• 第 2 轮 - 与招聘经理面试
• 第 3 轮 - 技术评估
• 参考和背景调查:在成功面试后进行
• 工作邀请:提供给被选中的候选人
我们自豪地成为一个平等机会的工作场所,并致力于提供平等的就业机会,不论种族、肤色、宗教、国籍、年龄、性别、婚姻状况、祖先、身体或精神残疾、遗传信息、退伍军人身份、性别认同或表达、性取向,或任何其他受适用的联邦、州或地方法律保护的特征。
薪资范围:$180K - $300K