加入一个创新的研究团队，致力于开创在多样化物理环境中表现出色的人工智能系统。我们的使命是开发智能代理，能够进行实验、创造和工程解决方案，从而显著推动科学和工业的进步。这个充满活力的团队结合了丰富的技术专长和实践成就，包括大量政府资助的项目。我们在先进模型研究与机器人技术、仿真和自动化工程系统的交汇处蓬勃发展，提供基于严格科学原则和大胆执行的深远影响解决方案。为什么您会觉得这个角色令人兴奋 • 参与关于推理、规划和工具使用模型的开创性研究，这些模型直接支配自主工程系统。 • 扩展 SFT、RLHF、DPO、验证者引导的强化学习和长远规划的前沿，您的研究将转化为直接的现实应用。 • 成为一个快速发展的研究文化的一部分，与专注于代理系统、仿真、数据管理和复杂工具链的优秀同事一起工作。 • 在一个小团队中享有重要的主导权，解决我们时代最具挑战性的技术任务之一。角色概述我们正在寻找一位专注于大型语言模型的研究科学家，以推动下一代推理和代理架构的发展。您的贡献将包括模型创新、对齐策略、结构化工具编排以及在真实工程环境中对代理的实验应用。该职位提供深度研究参与和实践系统集成的独特结合，提供必要的自主权和范围，以引领基础性进步。主要职责 • 设计和开发前沿模型和提示系统，用于规划、多步骤推理和结构化工具使用。 • 领导以 SFT、RLHF/DPO、验证者引导的强化学习和模块化专家框架为重点的训练工作，以增强稳健性和可控性。 • 为代理操作建立模式、工具调用策略、政策约束、安全协议和恢复机制。 • 与工程、仿真和数据团队广泛合作，以在真实世界的生产类框架中实施、训练和评估集成模型。资格要求 • 在大型语言模型研究、代理推理模型或结构化工具使用方法方面有丰富经验。 • 在 SFT、RLHF、DPO 或基于验证的强化学习技术方面有坚实的基础。 • 具备设计、分析和增强长远行为及分解方法的能力。 • 能够在动态环境中驾驭机器学习研究、系统工程和实践实验。 • 在技术严谨领域有卓越和责任感的历史。

大型语言模型开发的首席研究科学家

DeepRec.ai