数据科学家 – 生成式人工智能与自然语言处理

吉达 无个税18小时前全职 网络
面议
我们正在寻找一位在生成式AI、NLP和深度学习方面具有丰富专业知识的数据科学家,以构建智能的数据驱动解决方案。该职位专注于开发LLM驱动的应用程序、基于RAG的系统和高级分析模型,以大规模解决复杂的业务问题。 主要职责 设计、开发和部署生成式AI和NLP解决方案,包括LLM微调和基于RAG的架构。分析结构化和非结构化数据以提取洞察并构建预测和生成模型。构建和维护从数据收集和特征工程到模型部署和监控的端到端ML管道。应用高级NLP技术进行文本分类、摘要、问答、实体识别和对话式AI。开发和管理用于语义检索和知识系统的嵌入和向量搜索管道。使用适当的指标评估模型性能,进行错误分析,并迭代以提高准确性和稳健性。与产品、工程和数据团队合作,将业务需求转化为数据科学解决方案。向技术和非技术利益相关者清晰传达发现、模型行为和洞察。保持对数据科学、生成式AI、LLM和NLP领域新兴趋势和研究的了解。 所需技能和资格 扎实的数据科学、机器学习和深度学习基础。具备生成式AI和LLM微调的实际经验(例如,提示工程、LoRA、PEFT)。有构建基于RAG的系统和处理非结构化文本数据的经验。对NLP和基于transformer的模型(BERT、GPT、T5、LLaMA等)有扎实的知识。熟练使用Python及ML/DL库,如PyTorch、TensorFlow、scikit-learn。具备使用向量数据库(FAISS、Pinecone、Weaviate、Milvus)的经验。具备强大的数据分析、模型评估和实验技能。熟悉云平台(AWS、Azure或GCP)。具备强大的分析思维和沟通能力。 加分项 具备MLOps经验(模型版本控制、监控、CI/CD)。了解分布式计算或大规模数据处理。有处理大型、非结构化或半结构化数据集的经验。理解AI伦理、偏见检测和负责任的AI实践。