华为加拿大目前有一个工程师的永久职位空缺。
关于团队:
智能云基础设施实验室旨在创新下一代云基础设施的技术、算法、系统和平台。该实验室解决现有云服务中的可扩展性、性能和资源利用率挑战,同时为未来的挑战做好准备,采用适当的技术和架构。此外,实验室还旨在理解行业动态和技术趋势,以创建一个强大的生态系统。
关于工作:
• 理解人工智能系统和基础设施技术领域,识别当前大规模语言模型/多模态大规模语言模型系统的可扩展性/性能问题或挑战。
• 启动和规划创新项目,以构建或重新架构人工智能基础设施平台,并相应规划里程碑。
• 提供/贡献可扩展且高性能的架构设计或重新设计,优化用于人工智能训练和推理的基础设施系统,包括但不限于集群管理和调度、大规模语言模型部署、弹性大规模语言模型以及人工智能容器冷/热启动优化等。
• 与内部和外部团队合作,交付改善我们整体系统可扩展性和性能的项目或项目特性。
该职位的基本薪资范围为160,000美元至220,000美元,具体取决于教育背景、经验和展示的专业技能。
关于理想候选人:
• 计算机科学或计算机工程硕士/博士学位。
• 具备技术领导经验。
• 有构建大规模高性能分布式系统的经验。
• 有Nvidia TensorRT和/或Triton服务器的经验,具备容器虚拟化技术的经验。
• 具备分布式系统设计与开发的知识和经验,包括无服务器技术。
• 在以下技术之一或多个方面有工作经验:vLLM、Ray、SGLang、Kubernetes、TensorRT-LLM、Pytorch框架、Cuda库、GPU技术。在以下编程语言之一或多个方面有工作经验:C/C++、Go、Java、Rust、Python、C#。
• 具备出色的人际交往和沟通能力,能够有效地与多个团队合作,建立强有力的合作伙伴关系。
• 在多个产品中成功解决软件工程问题的经验。