描述
我们正在中东构建未来的商业人工智能,为数百万商家提供智能助手和能够流利理解阿拉伯语和英语的生成式人工智能。作为我们的高级/资深生成式AI数据科学家,您将为我们的商家和客户AI助手、内容生成套件和对话式商业平台设计架构。
这不仅仅是另一个聊天机器人角色,您将设计最前沿的代理型AI系统,这些系统能够推理库存、撰写引人注目的阿拉伯语营销文案、解决商家问题,并从数百万笔交易中生成洞察。您的工作将直接影响到该地区商家如何经营他们的业务。
职责
• 构建和实施基于LLM的代理系统,包括客户支持故障排除、分析和内容生成工具。
• 构建结合结构化和非结构化来源(知识库、常见问题、政策)的RAG管道,优化延迟、真实性和基础性。
• 开发评估框架(LLM-as-a-judge,human-in-the-loop)以衡量帮助性、事实准确性、覆盖率和连贯性。
• 与产品和用户体验团队合作,定义提示层次结构、工具调用逻辑和处理多轮推理的对话工作流程。
• 推动LLM的微调或参数高效适应(LoRA,PEFT)以支持商业特定的推理和多语言支持(阿拉伯语和英语)。
• 为生成式AI套件做出贡献:产品描述生成、电子邮件和博客内容创建、登陆页面设计和品牌感知语调控制。
• 领导新LLM编排框架(LangGraph,语义路由器)的实验和使用Bedrock、SageMaker或Vertex AI的可扩展部署。
• 指导初级数据科学家并定义版本控制、提示评估和可观测性(例如,LangFuse,MLflow,Grafana)的最佳实践。
• 加分项:流利的阿拉伯语,多语言NLP的工作经验,或市场/SaaS平台经验。
要求
• 计算机科学、数据科学或定量学科的学士或硕士学位。
• 5年以上应用ML/NLP经验,包括2年以上在生产环境中构建和部署基于LLM的系统的经验。
• 证明的影响力:交付或扩展了服务10万+用户或处理每日100万+查询的LLM产品。
• 技术深度:对变压器架构、RAG设计和优化、提示工程和LLM评估技术有扎实的理解。
• 系统思维:具有分布式系统、异步工作流、向量搜索和延迟敏感工作负载缓存策略的经验。
• 商业意识:熟悉电子商务指标、商家痛点和市场平台动态。
• 沟通能力:能够将复杂的ML系统转化为非技术和领导层利益相关者的可操作洞察。