需要至少2个参考人
远程角色
仅需要W2形式的候选人
需要PST时区的候选人
职位描述
作为一名具有Infiniband专业知识的网络工程师,您将在设计、实施和维护支持我们先进计算和云服务的高性能网络基础设施中发挥关键作用。您还将负责利用您在GPU构建和管理方面的知识,优化我们的系统以实现最大性能。此外,您与所有主要的云服务提供商合作的专业知识将使我们能够将我们的服务与这些平台无缝集成。
主要职责
• Infiniband网络设计:设计和实施基于Infiniband的网络解决方案,支持我们的HPC和云计算环境的高速数据传输和低延迟通信。
• GPU集成:与我们的硬件和软件团队合作,构建、配置和管理GPU,以有效支持各种计算工作负载。
• CSP集成:将我们的系统和服务与主要的云服务提供商集成,确保无缝连接和最佳性能。
• 网络优化:持续监控和优化网络性能,识别和解决瓶颈和延迟问题。
• 网络安全:实施和维护网络安全措施,以防范潜在的威胁和漏洞。
• 文档编制:创建和维护详细的网络和GPU相关文档,以确保团队内的有效知识传递。
• 协作:与跨职能团队合作,包括软件开发人员、数据科学家和硬件工程师,提供尖端解决方案。
• 故障排除:快速诊断和解决网络和GPU相关问题,以最大程度减少停机时间和中断。
资格:
• 计算机科学、信息技术或相关领域的学士学位(研究生学位优先)。
• 在高性能计算环境中使用Infiniband技术的经验。
• 对于不同计算工作负载的GPU架构、构建和优化的深入了解。
• 熟悉主要的云服务提供商(AWS、Azure、Google Cloud等),并具有与这些平台集成系统的经验。
• 熟练掌握网络设计、配置和故障排除。
• 对网络安全原则和最佳实践有扎实的了解。
• 出色的沟通和协作能力,能够在多样化的团队中有效工作。
• CCNP、CCIE或等同认证者优先考虑。
• 强大的问题解决和批判性思维能力。
• 能够适应快速变化的技术和业务需求。