我们正在寻找一位高技能、积极主动的机器学习科学家,专注于自然语言处理(NLP)和大型语言模型(LLM),如GPT和LLMA。理想的候选人应具备扎实的数学和统计背景,深入理解变压器模型和数据分析。
主要职责
• 作为高级机器学习科学家,您将参与机器学习、NLP、LLM和GenAI模型的设计、开发、评估和部署,重点关注基于变压器的解决方案。
• 进行实验和微调大型语言模型(LLM)以应用于各种应用。
· 在模型训练和微调中应用来自人类反馈的强化学习(RLHF)概念。
· 管理整个LLM的数据准备、模型构建和部署的生命周期。
• 模型组件包括数据摄取、预处理、搜索和检索、检索增强生成(RAG)、NLP/LLM模型开发、微调和提示工程,确保解决方案满足所有技术和业务需求。
• ML、NLP、LLM模型评估:与其他团队成员密切合作,开发、验证和维护强大的评估解决方案和工具,以评估模型的性能、准确性、一致性和可靠性,在开发和UAT期间。
• 领导复杂聊天机器人和对话式AI系统的创建和开发。
• 实施模型优化以提高系统效率。
• NLP、LLM、GenAI模型部署:与MLOps团队密切合作,将机器学习模型部署到生产环境中,确保可靠性和可扩展性。
• 内部协作:与其他跨职能团队合作,将NLP解决方案整合到业务流程和产品中,并确保机器学习模型顺利集成到生产系统中。
• 文档编写:撰写和维护ML建模过程和程序的全面文档,供参考和知识共享。
• 基于标准和最佳实践开发模型:确保在设计和开发模型时遵守指定的标准、治理和最佳实践。
• 协助解决问题:解决与机器学习模型开发相关的复杂问题,并开发创新解决方案。
关键技能和资格
· 扎实的数学和统计基础,特别是在NLP和AI领域的应用。
· 对变压器模型有丰富的经验,并对其架构和应用有深入理解。
· 熟练掌握大型语言模型(如GPT、LLMA),并具有实际应用、微调和模型开发经验。
• 精通Python编程
· 5年以上实际开发自然语言处理(NLP)模型的经验,最好是使用变压器架构。
· 5年以上实施大规模信息搜索和检索的经验,使用从关键字搜索到使用嵌入式的语义搜索等一系列解决方案。
· 在为LLM训练和预处理数据方面有丰富经验,并对RLHF概念有良好的理解。
· 开发聊天机器人或对话式AI系统的经验。
· 熟练使用Python,并熟悉Langchain等工具。
· 出色的解决问题的能力,并能在快节奏、动态的环境中工作。
• 对LLM的高级趋势和开源平台有很好的了解
· 出色的沟通能力,能够向非技术人员解释复杂的技术概念。
· 具有研究经验,能够从高层概念到操作理论的工作,包括在人工智能和/或医疗保健领域的相关期刊或会议上发表论文或演示。
· 最好有与医疗保健领域相关的数据和模型工作经验,描述医疗条件。最好熟悉ICD、SNOMED CT、HL7、ICF和MeSH等标准。
教育要求
计算机科学、统计学、电气工程、应用数学、数据科学或相关领域的硕士学位。博士学位优先。提示:提供该角色的摘要,成功在该职位上的表现如何,以及该角色如何适应整个组织。
职责
[在描述每个职责时要具体。使用性别中立、包容性的语言。]
示例:确定和开发生产系统的用户需求,以确保最大的可用性
资格
[您可能要包括的一些资格是技能、教育、经验或认证。]
示例:良好的口头和书面沟通能力