领先的机器学习工程师(模型架构与能力团队)

14个月前全职
Nebius

Nebius

location 伦敦
unsaved
公司 Nebius AI是一个以人工智能为中心的公共云平台,专门为训练和推断AI模型提供服务。 我们的使命是帮助机器学习从业者专注于他们的核心工作,而将DevOps、MLOps和基础设施相关任务交给我们处理。我们的想法是构建一个从A到Z覆盖整个机器学习生命周期的机器学习专用云平台:从数据准备和标注到机器学习训练和推断。 我们认识到机器学习和人工智能技术的潜力,并致力于为未来的用户提供完美的训练和微调模型的环境。我们承诺提供最佳的用户体验和卓越的客户支持。 四个开发中心: Nebius总部位于荷兰,设有芬兰、塞尔维亚和以色列的分支机构。 欧洲数据中心: 我们在芬兰拥有自己的数据中心,其中的服务器机架是由我们自家设计的,用于处理机器学习特定的高负载,采用高效的解决方案,包括自由冷却系统。 500名专业人员: 我们成熟的工程团队在开发复杂的云和机器学习解决方案以及设计尖端硬件方面有着良好的记录。 我们的团队 Nebius的大型语言模型(LLM)团队致力于推动语言建模技术的发展。 我们专注于开发一套领先的LLM技术堆栈,涵盖了基础模型训练和大规模数据收集。我们的总体目标是开创前沿的语言生成技术,既用于内部使用,也用于客户应用,推动下一代人工智能产品的发展。 Nebius大型语言模型(LLM)团队致力于推动语言建模技术的发展。我们专注于开发一套领先的LLM技术堆栈,涵盖了大规模数据收集、基础模型训练和对齐。我们的总体目标是开创前沿的语言生成技术,既用于内部使用,也用于客户应用,推动下一代人工智能产品的发展。 职位 我们目前正在寻找模型架构与能力团队的团队负责人。该团队负责推动我们内部训练的各种规模的模型的能力。这包括寻找能够高效实现所需能力的模型架构,将这些模型扩展到我们硬件的极限,并探索可能扩展现有能力的新颖想法。 在这个职位上,您的责任将包括: •领导负责模型架构和能力的团队 •制定战略和策略,即确定推动技术发展的研究和工程方向,并帮助团队计划和执行能够高效实现这些目标的实验 •确保团队内的工程和研究活动符合高标准 •不断改进我们用于训练大型模型的内部基础设施的设计,以确保尽管技术不断发展,它仍然保持快速和灵活 •指导我们的工程师和研究人员 我们希望您具备: •对机器学习的理论基础有深入的了解 •对现代深度学习在语言处理和生成方面有深入的专业知识 •在巨大集群上进行预训练大模型的丰富经验 •对大型神经网络训练的性能方面有良好的理解(分片策略、自定义内核、硬件特性等) •扎实的软件工程技能(我们主要使用Python) •深入了解现代深度学习框架(我们使用JAX) •熟练掌握当代软件工程方法,包括CI/CD、版本控制和单元测试 •良好的沟通和领导能力 如果您还具备以下经验,那将是额外的加分: •计算机科学、人工智能、数据科学或相关领域的学士学位,研究生或博士学位更佳 •在充满活力的创业环境中构建和交付产品(不一定是与机器学习相关的) •在工程复杂系统方面的经验,如大规模分布式数据处理系统或高负载的Web服务 •展示您工程能力的开源项目 •优秀的英语掌握能力,以及出色的写作、表达和沟通能力 这是否符合您的挑战?那就加入我们吧!