我们正在寻找一位在生成式AI、NLP和深度学习方面具有丰富专业知识的数据科学家，以构建智能的数据驱动解决方案。该职位专注于开发LLM驱动的应用程序、基于RAG的系统和高级分析模型，以大规模解决复杂的业务问题。主要职责设计、开发和部署生成式AI和NLP解决方案，包括LLM微调和基于RAG的架构。分析结构化和非结构化数据以提取洞察并构建预测和生成模型。构建和维护从数据收集和特征工程到模型部署和监控的端到端ML管道。应用高级NLP技术进行文本分类、摘要、问答、实体识别和对话式AI。开发和管理用于语义检索和知识系统的嵌入和向量搜索管道。使用适当的指标评估模型性能，进行错误分析，并迭代以提高准确性和稳健性。与产品、工程和数据团队合作，将业务需求转化为数据科学解决方案。向技术和非技术利益相关者清晰传达发现、模型行为和洞察。保持对数据科学、生成式AI、LLM和NLP领域新兴趋势和研究的了解。所需技能和资格扎实的数据科学、机器学习和深度学习基础。具备生成式AI和LLM微调的实际经验（例如，提示工程、LoRA、PEFT）。有构建基于RAG的系统和处理非结构化文本数据的经验。对NLP和基于transformer的模型（BERT、GPT、T5、LLaMA等）有扎实的知识。熟练使用Python及ML/DL库，如PyTorch、TensorFlow、scikit-learn。具备使用向量数据库（FAISS、Pinecone、Weaviate、Milvus）的经验。具备强大的数据分析、模型评估和实验技能。熟悉云平台（AWS、Azure或GCP）。具备强大的分析思维和沟通能力。加分项具备MLOps经验（模型版本控制、监控、CI/CD）。了解分布式计算或大规模数据处理。有处理大型、非结构化或半结构化数据集的经验。理解AI伦理、偏见检测和负责任的AI实践。

数据科学家 – 生成式人工智能与自然语言处理

TestCrew | Quality Engineering & Software Testing