描述
我们正在中东构建未来的商业AI,为数百万商家提供智能助手和能够流利理解阿拉伯语和英语的生成式AI。作为我们的高级/资深数据科学家,您将为我们的商家和客户AI助手、内容生成套件和对话式商业平台设计架构。
这不仅仅是另一个聊天机器人角色,您将设计最前沿的代理AI系统,这些系统能够推理库存、撰写引人注目的阿拉伯语营销文案、解决商家问题,并从数百万笔交易中生成洞察。您的工作将直接影响整个地区的商家如何经营他们的业务。
职责
设计和实施基于LLM的代理系统,包括客户支持故障排除、分析和内容生成工具。
构建结合结构化和非结构化来源(知识库、常见问题、政策)的RAG管道,优化延迟、真实性和基础性。
开发评估框架(LLM作为裁判,人类参与)以衡量帮助性、事实准确性、覆盖率和连贯性。
与产品和UX团队合作,定义提示层次结构、工具调用逻辑和处理多轮推理的对话工作流。
推动LLM的微调或参数高效适应(LoRA、PEFT),以支持商业特定推理和多语言支持(阿拉伯语和英语)。
为GenAI套件做出贡献:产品描述生成、电子邮件和博客内容创建、登陆页面设计和品牌感知语调控制。
领导新LLM编排框架(LangGraph、语义路由器)的实验,并使用Bedrock、SageMaker或Vertex AI进行可扩展部署。
指导初级数据科学家,定义版本控制、提示评估和可观察性(例如,LangFuse、MLflow、Grafana)的最佳实践。
加分项:流利的阿拉伯语、多语言NLP的工作经验或市场/SaaS平台经验。
要求
计算机科学、数据科学或定量学科的学士或硕士学位。
5年以上应用ML/NLP经验,包括2年以上在生产中构建和部署基于LLM的系统的经验。
证明的影响力:交付或扩展服务于10万+用户或每天处理100万+查询的LLM产品。
技术深度:对变压器架构、RAG设计和优化、提示工程和LLM评估技术有扎实的理解。
系统思维:具有分布式系统、异步工作流、向量搜索和延迟敏感工作负载的缓存策略经验。
商业意识:熟悉电子商务指标、商家痛点和市场平台动态。
沟通能力:能够将复杂的ML系统转化为非技术和领导层利益相关者的可操作洞察。