机器学习研究员 - 代理

3个月前 远程 全职
面议 Alldus

Alldus

location 纽约
unsaved
关于我们 我们是一家快速发展的人工智能研究机构,致力于构建下一代代理系统,赋能人类,无论是通过增强开发者的生产力,还是自动化复杂的企业工作流程。利用先进的大型语言模型、强化学习和多代理架构,我们设计并部署生产级的人工智能代理,这些代理能够学习、适应,并在真实环境中提供真正的价值。 角色:研究科学家,代理与模型优化 作为我们应用人工智能团队的研究科学家,您将负责从头到尾的研究与实验,推动代理抽象、模型编排、后训练技术(微调、强化学习等)、提示工程和多代理工作流程的前沿。您将与工程师、产品团队和领域专家紧密合作,原型设计、验证并生产化新颖的方法,使我们的人工智能代理更智能、更安全、更具上下文意识。 您将做的工作: 设计与运行实验 • 构建和实施大规模强化学习实验,以优化代码生成和任务导向的代理 • 在最先进的语言模型上开发和评估后训练技术(微调、RLHF、提示调优) 原型设计与生产化 • 构建快速原型以测试新的代理设计、提示策略和模型编排模式 • 与软件和机器学习工程师紧密合作,将研究原型转化为可靠、可扩展的生产服务 协作与指导 • 与跨职能团队(代理设计、世界建模、产品)合作,优先考虑研究问题并对交付物达成一致 • 指导初级研究人员和实习生,促进实验设计、代码质量和科学沟通的最佳实践 保持前沿 • 持续关注强化学习、LLM研究和代理人工智能的最新学术和行业发展 • 在顶级会议上发表研究成果或在有机会时参与开源项目 我们正在寻找的候选人: 经验 • 3-8年应用机器学习研究的实际经验,成功开发和扩展强化学习算法或大型语言模型的后训练管道 • 有从构思到生产推动项目的成功记录——如果您曾发布过基于LLM的服务或开发工具将是加分项 技术技能 • 精通Python和机器学习框架(例如,PyTorch、TensorFlow、JAX) • 深入理解强化学习方法(策略梯度、演员-评论家、离策略学习)以及微调/LLM优化技术 • 熟悉多代理系统、提示工程和模型编排架构 教育背景与出版 • 计算机科学、机器学习、机器人或相关领域的硕士或博士学位;或具有相应的行业经验 • 在顶级机器学习/人工智能会议上有强有力的出版记录或展示的开源贡献(优先但不是必需) 软技能 • 优秀的问题解决能力和实验倾向 • 强大的沟通能力,能够向技术和非技术受众解释复杂的想法 • 渴望在快速变化的协作环境中工作,并乐于承担责任 薪资与福利 • 具有竞争力的薪资与股权——与经验和市场基准相符 • 灵活的工作选项——支持远程工作,在主要科技中心提供办公室协作机会 • 健康与福利——全面的医疗、牙科和视力保险;心理健康资源 • 职业发展——年度会议预算;支持您研究的工具和津贴 • 工作与生活平衡——慷慨的带薪休假、灵活的工作时间,注重信任而非坐在椅子上的时间 我们致力于建立一个包容的环境,让每位团队成员都能发挥最佳工作。如果您对推动增强人类潜力的人工智能代理充满热情,并且符合上述大部分资格,我们非常期待您的来信!