软件工程师 - 人工智能系统基础设施

温哥华 8天前全职 网络
56.3万 - 107.4万 / 年
华为加拿大目前有一个永久性工程师职位的空缺。 关于团队: 智能云基础设施实验室旨在创新下一代云基础设施的技术、算法、系统和平台。该实验室解决现有云服务中的可扩展性、性能和资源利用率挑战,同时为未来的挑战做好准备,采用适当的技术和架构。此外,实验室还旨在了解行业动态和技术趋势,以创建一个强大的生态系统。 关于工作: • 理解人工智能系统和基础设施技术现状,并识别当前大规模语言模型/多模态大规模语言模型系统的可扩展性/性能问题或挑战。 • 启动和制定创新项目,以构建或重新架构人工智能基础设施平台,并相应规划里程碑。 • 提供/贡献可扩展的高性能架构设计或重新设计,以优化用于人工智能训练和推理的基础设施系统,包括但不限于集群管理和调度、大规模语言模型部署、弹性大规模语言模型以及人工智能容器冷/热启动优化等。 • 与内部和外部团队合作,交付改善我们整体系统可扩展性和性能的项目或项目特性。 该职位的基本薪资范围为110,000美元至210,000美元,具体取决于教育背景、经验和展示的专业技能。 关于理想候选人: • 计算机科学、计算机工程硕士/博士学位。 • 有构建大规模高性能分布式系统的经验。 • 有Nvidia TensorRT和/或Triton服务器的经验,熟悉容器虚拟化技术。 • 具备分布式系统设计与开发的知识和经验,包括无服务器技术。 • 在以下技术中的一种或多种方面有工作经验:vLLM、Ray、SGLang、Kubernetes、TensorRT-LLM、Pytorch框架、Cuda库、GPU技术。 • 在以下编程语言中的一种或多种方面有工作经验:C/C++、Go、Java、Rust、Python、C#。 • 具备出色的人际交往和沟通能力,能够有效地与多个团队合作并建立牢固的合作关系。 • 在解决跨多个产品的软件工程问题上取得成功的证明。