我们的客户正在寻找一位具有前瞻性思维的LLM工程师,加入他们的全球Agentic AI项目。这个角色具有很高的影响力,处于下一个AI前沿的前沿:自主代理工作流。在这个职位上,您将超越标准聊天机器人,设计和部署可靠的、生产级的多代理系统,旨在解决全球范围内复杂的零售挑战。作为一个多国和动态环境中的关键成员,您将加入一个高素质的转型团队,将创新桥接到不同的国际市场。利用先进的工具栈和LLMOps框架(包括LangGraph、Langfuse和RAG),您将构建可观察的企业级AI基础设施,定义“O+O”(线下加线上)零售的未来。
主要职责:
- 设计和协调复杂的多代理工作流。
- 构建能够进行多步骤协调、复杂工具/功能调用和强大错误处理的系统,以确保可靠的自主执行。
- 开发端到端的检索增强生成(RAG)管道。这包括优化数据摄取、分块策略、向量索引和重新排序,以确保高保真度的基础和精确的引用/归属。
- 通过高级提示协调、数据集策划和轻量级模型适应或选择性微调,不断改进系统输出,以平衡质量、延迟和成本。
- 实施严格的监控和评估框架。您将管理完整的应用程序生命周期——从部署和跟踪到事件响应和迭代优化。
- 与机器学习工程师和数据科学家密切合作,将LLM功能嵌入现有API和下游平台,通过生成UI组件确保无缝的AI与人类交互。
- 积极跟踪快速发展的LLM领域,将突破性研究转化为可衡量的生产改进和用例。
要求:
- 计算机科学、数学、工程或相关领域的学士或硕士学位。
- 3年以上AI或数据科学领域的专业经验,寻求高级影响力者优先4-8年。
- 在开发和成功部署生产级、LLM驱动的应用程序方面有良好的记录。
- 精通Python,熟练掌握现代LLM框架和可观察性工具,如LangChain、LangGraph和Langfuse。
- 深入了解提示工程、RAG优化、数据集迭代和模型微调。
- 对代理协调、向量数据库(如Pinecone、Milvus或Weaviate)和模块化、基于组件的AI设计有深刻理解。
- 科学的假设检验方法——利用统计数据验证代理驱动策略的有效性。
- 专业的英语流利程度是全球市场高水平合作的必要条件。