研究助理 – 人工智能代理与大型语言模型原型设计

伦敦 2个月前全职 网络
412 - 440 / 时
职位名称:研究助理 – 人工智能代理与大型语言模型原型设计地点:英国伦敦 - 混合办公 - 每周三天在办公室工作时长:至2025年12月 - 可能延长角色概述:我们正在寻找一名具有2年以上原型设计和测试人工智能代理或大型语言模型(LLMs)经验的研究助理。您将设计测试提示,实验提示工程,并在Python/PHP软件堆栈中调试人工智能代理工具调用。您还将帮助创建内部基准,以评估人工智能代理的性能。主要职责:创建和完善测试提示,以引导人工智能代理朝着期望的行为发展。在Python/PHP环境中实现和故障排除人工智能代理工具调用。开发高质量的提示,以建立人工智能代理的内部评估基准。测试人工智能代理,以评估其执行任务的能力,例如下订单、安排或取消会议。分析测试结果,识别问题,并沟通发现以实现持续改进。导航并理解Python代码库,以将测试结果与底层代码关联。改进和测试现有的人工智能代理。识别代理表现良好的地方和失败的地方。提示测试和调优,以优化代理响应。根据预期行为标记测试结果为通过/未通过。技术技能与资格:计算机科学、计算机工程或相关领域的学士学位(或同等经验)。2年以上机器学习、深度学习或自然语言处理领域的研究或原型设计经验。精通Python,能够理解和处理包含多个相互关联文件的代码库。具有使用人工智能代理框架的经验,如模型上下文协议(MCP)和LangChain。熟悉大规模软件系统的架构模式。基本的SQL和数据分析知识是加分项。具有使用源代码控制系统(如Git)的经验。具有生成性人工智能和大型语言模型研究的经验者优先。必要技能:Python编程,生成性人工智能知识,理解MCP服务器和LangChain框架。