加入一个创新的研究团队,致力于开创在多样化物理环境中表现出色的人工智能系统。我们的使命是开发智能代理,能够进行实验、创造和工程解决方案,从而显著推动科学和工业的进步。
这个充满活力的团队结合了丰富的技术专长和实践成就,包括大量政府资助的项目。我们在先进模型研究与机器人技术、仿真和自动化工程系统的交汇处蓬勃发展,提供基于严格科学原则和大胆执行的深远影响解决方案。
为什么您会觉得这个角色令人兴奋
• 参与关于推理、规划和工具使用模型的开创性研究,这些模型直接支配自主工程系统。
• 扩展 SFT、RLHF、DPO、验证者引导的强化学习和长远规划的前沿,您的研究将转化为直接的现实应用。
• 成为一个快速发展的研究文化的一部分,与专注于代理系统、仿真、数据管理和复杂工具链的优秀同事一起工作。
• 在一个小团队中享有重要的主导权,解决我们时代最具挑战性的技术任务之一。
角色概述
我们正在寻找一位专注于大型语言模型的研究科学家,以推动下一代推理和代理架构的发展。您的贡献将包括模型创新、对齐策略、结构化工具编排以及在真实工程环境中对代理的实验应用。
该职位提供深度研究参与和实践系统集成的独特结合,提供必要的自主权和范围,以引领基础性进步。
主要职责
• 设计和开发前沿模型和提示系统,用于规划、多步骤推理和结构化工具使用。
• 领导以 SFT、RLHF/DPO、验证者引导的强化学习和模块化专家框架为重点的训练工作,以增强稳健性和可控性。
• 为代理操作建立模式、工具调用策略、政策约束、安全协议和恢复机制。
• 与工程、仿真和数据团队广泛合作,以在真实世界的生产类框架中实施、训练和评估集成模型。
资格要求
• 在大型语言模型研究、代理推理模型或结构化工具使用方法方面有丰富经验。
• 在 SFT、RLHF、DPO 或基于验证的强化学习技术方面有坚实的基础。
• 具备设计、分析和增强长远行为及分解方法的能力。
• 能够在动态环境中驾驭机器学习研究、系统工程和实践实验。
• 在技术严谨领域有卓越和责任感的历史。