职位名称：数据科学家 - 自然语言处理（NLP）地点：加利福尼亚州洛杉矶职位描述：我们正在寻找一位技术娴熟、积极主动的数据科学家，专注于自然语言处理（NLP），加入我们在加利福尼亚州洛杉矶的充满活力的团队。作为专注于NLP的数据科学家，您将在开发和优化用于检索增强生成（RAG）应用的大型语言模型（LLMs）方面发挥关键作用。您的职责将涵盖广泛的挑战，从设计有效模型到解决延迟问题和确保负责任的人工智能实践。职责：架构设计：开发和优化基于RAG的LLMs，解决上下文窗口大小、准确检索块和排序相关性等挑战。检索策略：实施上下文感知的块划分、混合大小块、知识图谱和关键词匹配技术，以实现高效检索。延迟优化：优化管道延迟，包括缓存向量化的标记和语义感知的向量缓存。推理和问题解决：利用ReACT、函数调用和思维推理的图/树等框架解决推理挑战。自定义嵌入和信息提取：在LangChain或LlamaIndex中集成自定义嵌入，利用LLMs进行信息提取，并扩展查询以改善检索效果。平台评估：评估Azure OpenAI中的Microsoft Copilot、LangChain等开源框架、AWS Bedrock和其他LLM实验平台。训练和微调：实施LORA等技术，对特定指令进行LLM的训练和微调。量化和基准测试：探索成本效益的GPU使用的量化方法，并参与Hugging Face Open LLM Leaderboard和Chatbot Arena等基准测试工作。协作与沟通：与跨职能团队有效合作，向技术和非技术人员传达复杂的技术概念，并为协作工作环境做出贡献。资格要求：计算机科学、数据科学或相关领域的硕士或博士学位。在NLP应用中开发和优化大型语言模型的经验。精通Python等编程语言，熟悉相关库和框架。深入了解NLP技术，包括检索增强生成、信息提取和自定义嵌入。具备负责任的人工智能实践和偏见缓解策略的经验。出色的问题解决能力和在快节奏、协作环境中工作的能力。首选技能：熟悉开源的LLMs和框架。以往基准测试和验证语言模型的经验。对基础模型、变压器架构和其他相关概念有深入了解。具备技术和非技术受众的有效沟通能力。生成AI NLP数据科学家加利福尼亚州

生成式人工智能自然语言处理数据科学家加利福尼亚

Chabez Tech LLC

生成式人工智能自然语言处理数据科学家 加利福尼亚

Chabez Tech LLC

生成式人工智能自然语言处理数据科学家加利福尼亚