数据中心现场经理
我们正在寻找一位才华横溢的数据中心现场经理加入我们的数据中心运营团队,领导管理我们旗舰AI基础设施站点,该站点拥有数十万GPU。您将在监督我们数据中心基础设施的运营和维护方面发挥关键作用,确保我们的世界级GPU超级计算机的最大正常运行时间和性能。
重点
- 通过内部工具管理和优先处理任务,以确保高效运营
- 与内部团队合作,排除故障并进行根本原因分析和纠正措施
- 与本地托管合作伙伴联络,充分了解站点拓扑结构,并在需要时清晰表达问题
- 领导技术人员和工程师团队,维护关键AI基础设施99.99%的正常运行时间
- 监督支持大规模GPU部署的电力、冷却和网络系统
关于您
- 7年以上管理大规模数据中心运营的经验,最好有HPC或AI基础设施经验
- 在数据中心机械和电气系统(配电、冷却、消防)方面具有扎实的技术背景
- 拥有管理团队和数百万美元设施预算的成功经验
- 具有GPU集群经验并了解AI工作负载要求
- 出色的沟通能力,与技术团队、供应商和高管利益相关者对接
加分项
- 管理AI/ML工作负载设施的背景
- 具有可持续发展计划和PUE优化经验
- 了解合规框架(SOC2,ISO 270001)
福利
- 具有竞争力的总薪酬方案(现金+股权)。
- 符合当地标准的退休或养老金计划。
- 健康、牙科和视力保险。
- 符合当地标准的慷慨PTO政策。