我们正在招聘一位经验丰富的人工智能/机器学习架构师,负责设计、部署和优化一个本地多语言人工智能呼叫中心平台,为阿联酋某战略联邦政府实体服务。该项目每天支持超过25,000个语音电话,并利用大型语言模型、语音转文本和文本转语音技术,提供响应迅速、高可用性的公民服务,覆盖六种语言。
作为人工智能/机器学习架构师,您将负责端到端的人工智能系统设计,管理大型数据集上的大型语言模型微调,并跨职能合作,确保在高峰负载下的响应时间低于250毫秒——所有这些都在阿联酋的数据驻留和合规框架内。
主要职责:
架构与设计:
• 为高并发电话工作流程(150+个并发呼叫)架构可扩展的实时语音转文本、文本转语音和大型语言模型系统。
• 设计并实现优化的低延迟推理基础设施,以支持实时多语言语音交互。
大型语言模型微调与部署:
• 在本地计算环境中使用阿联酋特定和客户提供的数据集微调和部署开源大型语言模型(例如,Falcon、LLaMA、Mixtral)。
• 确保安全的离线训练(无云访问),完全符合本地数据隐私要求。
数据与知识集成:
• 设计基于结构化和非结构化数据(例如,PDF、网站、数据库)的检索增强生成(RAG)管道。
• 与数据工程师合作,索引、嵌入和检索1–10TB知识库中的内容。
多语言语音人工智能集成:
• 集成多语言语音转文本(Whisper、Coqui)和文本转语音(XTTS、Bark)模型,优化延迟(<250毫秒语音转文本,<200毫秒文本转语音)。
• 使用阿拉伯语(阿联酋方言)、英语、乌尔都语、印地语、法语和他加禄语样本自定义语音。
优化与基准测试:
• 持续优化人工智能模型推理,减少内存/计算开销,并保持高可用性。
• 为语音转文本/文本转语音/大型语言模型设计回退、故障转移和版本控制策略。
跨职能协作:
• 与DevOps、后端团队、合规官、语言学家和电信工程师紧密合作,确保平台的端到端交付。
• 支持质量保证过程及后期模型更新和审计。
所需资格:
• 人工智能、机器学习、计算语言学或相关领域的硕士或博士学位。
• 6年以上人工智能/机器学习架构经验,其中3年以上部署生产级大型语言模型/自然语言处理/语音转文本/文本转语音系统的经验。
具备以下实践经验:
• 大型语言模型微调(例如,Falcon、LLaMA、Mistral)
• 语音转文本/文本转语音模型(Whisper、XTTS、Bark、Coqui)
• 检索增强生成管道(FAISS、Milvus、Weaviate、LangChain/Haystack)
• 深度学习框架(PyTorch、TensorFlow)
• 分词器、量化(GGUF/GGML)、分布式训练
• 大规模数据集策划和向量嵌入的经验。
• 深刻理解阿拉伯方言(尤其是阿联酋方言)和多语言自然语言处理系统是一个重要加分项。
加分技能:
• 具备电话系统和基于SIP的呼叫路由经验
• 熟悉阿联酋数据保护法规和人工智能伦理章程
• 具备政府或公共部门部署经验
• 了解音频/视频管道、音频预处理和延迟分析
我们提供:
• 参与阿联酋最雄心勃勃的主权人工智能部署之一
• 在国家级项目中担任高影响力的领导角色
• 有机会塑造人工智能驱动的公共服务交付
• 在SPAI不断扩展的政府人工智能投资组合中实现长期增长
职位类型:全职
薪资:每月30,000.00 - 40,000.00阿联酋迪拉姆