职责
DSO国家实验室(DSO)是新加坡最大的国防研究和发展(研发)机构,其关键任务是开发技术解决方案,提升新加坡国家安全的前沿优势。在DSO,您将发展不仅仅是一份职业。这是您将产生真正影响并塑造未来国防的地方,涵盖空中、陆地、海洋、太空和网络空间的各个领域。
数字化部门通过总体规划和政策制定,通过IT基础设施提供数字化能力,并为企业和研发部门提供一站式服务,领导DSO的数字化转型。数字化部门将改变我们的工作方式、工作场所以及我们为国防部/新加坡武装部队以及新加坡安全提供的能力。
人才是DSO最宝贵的资产。您将有机会实现职业目标,并发展自己的专业领域,无论是作为深度技术专家还是团队的领导者。通过频繁的职业对话和强大的培训和发展框架,我们将为您提供必要的发展工具,帮助您发挥潜力。您还将通过具有竞争力的薪酬福利和奖学金机会得到认可和回报。
AI/HPC基础设施工程师
我们正在寻找一位经验丰富的AI/HPC基础设施工程师加入我们充满活力的团队。作为一名AI基础设施工程师,您将在设计、实施和管理支持我们AI项目的基础设施方面发挥至关重要的作用。您的专业知识将有助于AI模型的开发、部署和扩展,确保其性能和可靠性的最佳状态。
在这个角色中,您将参与以下工作:
• 基础设施设计:与跨职能团队合作,包括AI研发工程师和软件工程师,设计和不断改进可扩展和高效的本地AI基础设施解决方案,用于训练和服务大型AI模型。创建、演进和维护与组织AI战略一致的基础设施路线图。
• 可扩展性和性能:识别和解决AI基础设施中的性能瓶颈、延迟问题和可扩展性挑战。利用您的专业知识优化资源分配,改进数据处理流程。
• 监控和维护:建立强大的监控系统,跟踪AI基础设施组件的健康状况、性能和利用率。主动识别和解决问题,确保AI系统高可用性和可靠性。
• 安全和合规性:实施安全措施和最佳实践,保护AI基础设施和数据。确保符合相关法规、隐私标准和行业最佳实践。
• 协作和文档编制:与跨职能团队密切合作,了解他们的需求并提供技术指导。记录基础设施配置、流程和故障排除程序,以实现高效的知识共享和入职培训。
要求
• 计算机工程/计算机科学/人工智能学位
• 熟悉集群管理工具(如Bright)、数据处理框架(如Apache Spark、Apache Beam)、机器学习框架(如TensorFlow、PyTorch)、HPC应用的网络架构、容器化技术(如Docker、Kubernetes)和HPC调度
• 基础设施优化:优化基础设施性能、可扩展性和成本效益的经验。了解分布式系统、网络架构和AI和/或HPC的存储技术
• 解决问题能力:表现出分析复杂问题、提出创新解决方案并有效实施的能力。较强的故障排除和调试技能,解决基础设施相关问题
• 协作和沟通能力:优秀的人际交往能力,能够在团队环境中有效合作。良好的口头和书面沟通能力,能够向技术和非技术利益相关者传达技术概念