关于该职位:
Smart Powered AI 正在扩展其核心人工智能工程团队,以帮助为阿联酋的政府机构提供一个主权、高性能的人工智能语音助手平台。
作为一名 人工智能工程师 – 自然语言处理,检索增强生成,微调,您将在构建、调整和优化多语言自然语言处理和大型语言模型管道方面发挥核心作用,支持六种语言的实时电话交互。您将负责模型微调、使用大型政府数据集(1–10TB)的领域适应、检索增强生成管道开发,以及根据小于 250 毫秒的延迟服务水平协议目标进行性能调优。
这是一个在高安全性、政府控制环境中的关键任务、本地部署,需要与 DevOps、后端、电话和合规团队进行密切协调。
主要职责:
大型语言模型与自然语言处理微调:
• 在特定领域数据上微调开源大型语言模型(LLaMA 3、Mixtral、Falcon),用于意图检测、槽位填充和响应生成。
• 为 50 多个客户的智能服务实施多轮对话跟踪和上下文连续性。
• 执行监督微调(SFT)、LoRA/QLoRA 和量化(GGUF/GGML),以优化受限的本地计算。
检索增强生成管道开发:
• 使用 FAISS、Weaviate 或 Vespa 在大型非结构化数据集(PDF、网站、数据库转储)上构建检索增强生成工作流。
• 设计文档切块、嵌入策略(兼容 OpenAI 或自定义模型)和向量索引,以支持实时问答。
多语言自然语言处理与测试:
• 训练和评估阿拉伯语(阿联酋方言)、英语、乌尔都语、印地语、他加禄语和法语的自然语言处理组件。
• 对意图准确性、实体识别和对话中语言切换进行严格测试。
• 与阿拉伯语自然语言处理语言学家合作,本地化提示,检测方言,并增强自然语言理解覆盖率。
集成与协作:
• 与后端团队合作,通过 RESTful API 暴露人工智能能力。
• 通过人工智能集成服务支持 CRM 自动填充、对话摘要和实时状态获取。
• 参与代码审查、数据验证、冲刺规划和缺陷分类会议。
所需资格:
• 计算机科学、人工智能/机器学习、计算语言学或相关领域的学士或硕士学位。
• 3–5 年自然语言处理、变换器和大型语言模型微调的实际经验。
• 扎实的 Python 开发技能,包括以下经验:
• HuggingFace Transformers、LangChain/Haystack
• PyTorch 或 TensorFlow
• OpenAI 兼容 API
• FAISS/Weaviate/Milvus 用于检索增强生成
• 分词、嵌入、提示工程
• 有多语言自然语言处理管道的工作经验,包括阿拉伯语等从右到左(RTL)语言。
• 熟悉提示注入防止、输出验证和人工智能合规框架(例如,阿联酋人工智能伦理原则)。
优先/附加资格:
• 在阿拉伯语自然语言处理方面的经验,特别是海湾方言(阿联酋、沙特、科威特)。
• 之前在政府、电信或安全本地人工智能系统方面的工作经验。
• 熟悉 CRM 数据模型、电话(SIP、IVR)或实时事件驱动系统。
• 有与向量数据库和非结构化数据摄取相关的工作经验。
工作类型:全职
薪资:每月 AED20,000.00 - AED25,000.00