要求
• 在生产环境中至少有3到5年的模型训练、部署和维护经验,
• 精通自然语言处理(NLP)、语言模型(LLMs)和深度学习,
• 熟悉包括transformers在内的最新架构,
• 扎实的算法、数据结构和面向对象编程基础,
• 有使用云技术栈(如AWS或GCP)和在云环境中开发机器学习模型的经验,
• 强大的高级编程技能(例如Python),以及Pytorch、kubernetes、TensorFlow等框架和工具的使用能力,
• 出色的书面和口头沟通能力,能够在跨职能团队环境中运作,并能高效地传达你的工作成果,
• (可取)在处理大规模人工智能问题方面有经验,最好是在生成式人工智能领域,
• (可取)了解数据工程的最佳实践,
• (可取)在后训练方法和/或大型语言模型的下一代用例(包括指令调整、RLHF、工具使用、推理、代理和多模态等)方面具有研究专长。
职位内容
• 你将与Scale的生成式人工智能产品团队密切合作,致力于加速世界上一些最大公司的人工智能采用,
• 你的重点将是开发支持生成式人工智能数据引擎的服务,这是公司和整个人工智能领域增长最快的业务部门,
• 你将领导模型开发、评估和服务创建,对公司最重要的工作产生巨大影响,
• 你将从规划和计划到实施、评估和部署新的机器学习服务,全程参与其中,
• 评估、调整和开发新的最先进的语言和/或多模态基础模型,
• 开发新的机器学习服务,确保大型语言模型的训练和评估数据的成本、质量和吞吐量,
• 探索将模型和人类整合到高效的数据创建和评估工作流程中的方法,用于新产品线和现有产品线,
• 与内部客户密切合作,原型设计、构建和将你的模型集成到生产服务中。