关于我们
我们是一家快速发展的人工智能研究机构,致力于构建下一代代理系统,赋能人类,无论是通过增强开发者的生产力,还是自动化复杂的企业工作流程。利用先进的大型语言模型、强化学习和多代理架构,我们设计并部署生产级的人工智能代理,这些代理能够学习、适应,并在真实环境中提供真正的价值。
角色:研究科学家,代理与模型优化
作为我们应用人工智能团队的研究科学家,您将负责从头到尾的研究与实验,推动代理抽象、模型编排、后训练技术(微调、强化学习等)、提示工程和多代理工作流程的前沿。您将与工程师、产品团队和领域专家紧密合作,原型设计、验证并生产化新颖的方法,使我们的人工智能代理更智能、更安全、更具上下文意识。
您将做的工作:
设计与运行实验
• 构建和实施大规模强化学习实验,以优化代码生成和任务导向的代理
• 在最先进的语言模型上开发和评估后训练技术(微调、RLHF、提示调优)
原型设计与生产化
• 构建快速原型以测试新的代理设计、提示策略和模型编排模式
• 与软件和机器学习工程师紧密合作,将研究原型转化为可靠、可扩展的生产服务
协作与指导
• 与跨职能团队(代理设计、世界建模、产品)合作,优先考虑研究问题并对交付物达成一致
• 指导初级研究人员和实习生,促进实验设计、代码质量和科学沟通的最佳实践
保持前沿
• 持续关注强化学习、LLM研究和代理人工智能的最新学术和行业发展
• 在顶级会议上发表研究成果或在有机会时参与开源项目
我们正在寻找的候选人:
经验
• 3-8年应用机器学习研究的实际经验,成功开发和扩展强化学习算法或大型语言模型的后训练管道
• 有从构思到生产推动项目的成功记录——如果您曾发布过基于LLM的服务或开发工具将是加分项
技术技能
• 精通Python和机器学习框架(例如,PyTorch、TensorFlow、JAX)
• 深入理解强化学习方法(策略梯度、演员-评论家、离策略学习)以及微调/LLM优化技术
• 熟悉多代理系统、提示工程和模型编排架构
教育背景与出版
• 计算机科学、机器学习、机器人或相关领域的硕士或博士学位;或具有相应的行业经验
• 在顶级机器学习/人工智能会议上有强有力的出版记录或展示的开源贡献(优先但不是必需)
软技能
• 优秀的问题解决能力和实验倾向
• 强大的沟通能力,能够向技术和非技术受众解释复杂的想法
• 渴望在快速变化的协作环境中工作,并乐于承担责任
薪资与福利
• 具有竞争力的薪资与股权——与经验和市场基准相符
• 灵活的工作选项——支持远程工作,在主要科技中心提供办公室协作机会
• 健康与福利——全面的医疗、牙科和视力保险;心理健康资源
• 职业发展——年度会议预算;支持您研究的工具和津贴
• 工作与生活平衡——慷慨的带薪休假、灵活的工作时间,注重信任而非坐在椅子上的时间
我们致力于建立一个包容的环境,让每位团队成员都能发挥最佳工作。如果您对推动增强人类潜力的人工智能代理充满热情,并且符合上述大部分资格,我们非常期待您的来信!