机器学习研究员 - 代理 - Alldus招聘

关于我们我们是一家快速发展的人工智能研究机构，致力于构建下一代代理系统，赋能人类，无论是通过增强开发者的生产力，还是自动化复杂的企业工作流程。利用先进的大型语言模型、强化学习和多代理架构，我们设计并部署生产级的人工智能代理，这些代理能够学习、适应，并在真实环境中提供真正的价值。角色：研究科学家，代理与模型优化作为我们应用人工智能团队的研究科学家，您将负责从头到尾的研究与实验，推动代理抽象、模型编排、后训练技术（微调、强化学习等）、提示工程和多代理工作流程的前沿。您将与工程师、产品团队和领域专家紧密合作，原型设计、验证并生产化新颖的方法，使我们的人工智能代理更智能、更安全、更具上下文意识。您将做的工作：设计与运行实验 • 构建和实施大规模强化学习实验，以优化代码生成和任务导向的代理 • 在最先进的语言模型上开发和评估后训练技术（微调、RLHF、提示调优）原型设计与生产化 • 构建快速原型以测试新的代理设计、提示策略和模型编排模式 • 与软件和机器学习工程师紧密合作，将研究原型转化为可靠、可扩展的生产服务协作与指导 • 与跨职能团队（代理设计、世界建模、产品）合作，优先考虑研究问题并对交付物达成一致 • 指导初级研究人员和实习生，促进实验设计、代码质量和科学沟通的最佳实践保持前沿 • 持续关注强化学习、LLM研究和代理人工智能的最新学术和行业发展 • 在顶级会议上发表研究成果或在有机会时参与开源项目我们正在寻找的候选人：经验 • 3-8年应用机器学习研究的实际经验，成功开发和扩展强化学习算法或大型语言模型的后训练管道 • 有从构思到生产推动项目的成功记录——如果您曾发布过基于LLM的服务或开发工具将是加分项技术技能 • 精通Python和机器学习框架（例如，PyTorch、TensorFlow、JAX） • 深入理解强化学习方法（策略梯度、演员-评论家、离策略学习）以及微调/LLM优化技术 • 熟悉多代理系统、提示工程和模型编排架构教育背景与出版 • 计算机科学、机器学习、机器人或相关领域的硕士或博士学位；或具有相应的行业经验 • 在顶级机器学习/人工智能会议上有强有力的出版记录或展示的开源贡献（优先但不是必需）软技能 • 优秀的问题解决能力和实验倾向 • 强大的沟通能力，能够向技术和非技术受众解释复杂的想法 • 渴望在快速变化的协作环境中工作，并乐于承担责任薪资与福利 • 具有竞争力的薪资与股权——与经验和市场基准相符 • 灵活的工作选项——支持远程工作，在主要科技中心提供办公室协作机会 • 健康与福利——全面的医疗、牙科和视力保险；心理健康资源 • 职业发展——年度会议预算；支持您研究的工具和津贴 • 工作与生活平衡——慷慨的带薪休假、灵活的工作时间，注重信任而非坐在椅子上的时间我们致力于建立一个包容的环境，让每位团队成员都能发挥最佳工作。如果您对推动增强人类潜力的人工智能代理充满热情，并且符合上述大部分资格，我们非常期待您的来信！