系统工程师 - 硬件 HPC | SUSE Linux | 高性能计算

新加坡 14天前全职 网络
面议
• 硬件专注:硬件 HPC | SUSE Linux | 高性能计算 • 软件专注(DevOps):SUSE Linux, Ansible 工作经验 必备技能和资格: • 在计算机硬件设计方面有丰富经验,特别是在计算集群或服务器环境中。 • 熟悉 Linux 系统管理和操作系统定制(最好是 SUSE Linux)。 • 理解系统级性能调优和硬件-软件交互。 • 优秀的文档编写和沟通能力。 优先属性: • 具有硬件验证和故障排除工具的经验。 • 了解高性能计算 (HPC) 或分布式系统。 • 能够在协作的跨职能工程环境中有效工作。 • 测试驱动开发思维和注重细节。 • 主动解决问题和持续改进的自我启动者。 软件专注(DevOps) 主要职责: • 开发和维护与客户硬件和软件要求一致的定制 SUSE Linux 操作系统镜像。 • 使用配置管理工具(如 Salt 或 Ansible)自动化和简化系统配置。 • 为所有开发的流程、配置和工具创建和维护全面的文档。 • 开发诊断脚本以与现有诊断套件集成,提高系统故障排除能力,包括配置和硬件相关问题。 必备技能和资格: • 在计算机硬件设计方面有丰富经验,特别是在计算集群或服务器环境中。 • 具有网络设计经验,包括 InfiniBand、以太网交换机,精通端口映射和配置。 • 熟悉现代内存技术(如 DDR4/DDR5、DIMM、LPDDR、HBM)。 • 具有 Linux 操作系统定制和镜像创建的经验。 • 熟练使用 SaltStack、Ansible 或类似的配置管理工具是一个加分项。 • 熟悉测试驱动开发实践和工具。 • 优秀的文档编写能力,注重细节。 • 能够在快节奏的环境中独立和协作工作。 优先属性: • 强大的问题解决和分析能力。 • 有效的沟通和协作能力。 • 自我激励,积极主动识别和解决问题。 • 具有硬件故障排除和与诊断工具集成的经验。 • 能够在以团队为导向的环境中工作,承担共同的责任和目标。 硬件专注 主要职责: • 设计和开发针对 KLA 系统中性能、可靠性和可扩展性优化的计算集群配置。 • 选择和验证硬件组件,包括 CPU、内存、存储、网络和专用加速器。 • 为内部和跨团队使用记录硬件设计决策、集成程序和诊断工作流程。 • 与包括硬件工程、软件开发和系统集成在内的多功能团队密切合作,以确保 Windows 系统的无缝部署和支持。 必备技能和资格: • 在计算机硬件设计方面有丰富经验,特别是在计算集群或服务器环境中。 • 具有网络设计经验,包括 InfiniBand、以太网交换机,精通端口映射和配置。 • 熟悉 Linux 系统管理和操作系统定制(最好是 SUSE Linux)。 • 具有 Windows 操作系统定制和镜像创建的经验。 • 强大的脚本编写技能(如 Bash、Python、PowerShell)用于自动化和诊断。 • 理解系统级性能调优和硬件-软件交互。 • 优秀的文档编写和沟通能力。 优先属性: • 具有硬件验证和故障排除工具的经验。 • 了解高性能计算 (HPC) 或分布式系统。 • 能够在协作的跨职能工程环境中有效工作。 • 测试驱动开发思维和注重细节。 • 主动解决问题和持续改进的自我启动者。