概述
作为一名具有InfiniBand专业知识的网络工程师,您将在设计、实施和维护高性能网络基础设施方面发挥关键作用,以支持我们的先进计算和云服务。您还将负责利用您在GPU构建和管理方面的知识,优化我们的系统以实现最大性能。此外,您在与所有主要云服务提供商合作方面的专业知识将使我们能够将我们的服务与这些平台无缝集成。
主要职责:
• InfiniBand网络设计:设计和实施基于InfiniBand的网络解决方案,以支持我们的高性能计算和云计算环境中的高速数据传输和低延迟通信。
• GPU集成:与我们的硬件和软件团队合作,构建、配置和管理GPU,以有效支持各种计算工作负载。
• CSP集成:将我们的系统和服务与主要的云服务提供商集成,确保无缝连接和最佳性能。
• 网络优化:持续监控和优化网络性能,识别和解决瓶颈和延迟问题。
• 网络安全:实施和维护网络安全措施,以防范潜在的威胁和漏洞。
• 文档编制:创建和维护详细的网络和GPU相关文档,以确保团队内部的有效知识传递。
• 协作:与跨职能团队合作,包括软件开发人员、数据科学家和硬件工程师,提供尖端解决方案。
• 故障排除:快速诊断和解决与网络和GPU相关的问题,以最小化停机时间和中断。
资格要求:
• 计算机科学、信息技术或相关领域的学士学位(硕士学位优先)。
• 在高性能计算环境中使用InfiniBand技术的经验。
• 对于各种计算工作负载的GPU架构、构建和优化有深入了解。
• 熟悉主要的云服务提供商(AWS、Azure、Google Cloud等),并具有与这些平台集成系统的经验。
• 熟练掌握网络设计、配置和故障排除。
• 对网络安全原则和最佳实践有扎实的理解。
• 出色的沟通和协作能力,能够在多样化的团队中有效工作。
• CCNP、CCIE或等效认证是一个加分项。
• 强大的问题解决和批判性思维能力。
• 能够适应快速变化的技术和业务要求。