Dice是每个职业阶段的技术专家的领先职业目标。我们的客户SBasetech正在寻找以下职位。立即通过Dice申请!
职位:Azure GenAI数据科学家
地点:远程
职位描述:
• 这个人专注于构建LLM模型。
• 技能要求:LLMs(ChatGPT,ChatBots),Langchain,NLP,NLTK,
Azure GenAI数据科学家
职责:
模型
• 设计、开发、部署和改进实时可扩展的生产级机器学习和统计预测模型以及来自实时呼叫转录和话语的NLP。
• 使用NLP模型架构和算法(如BERT(以及BioBERT、RoBERTa、ALBERT等的衍生版本)、BiLSTM、XLNet、T5、ELECTRA、PaLM等)开发新算法和模型。
• 与跨职能团队合作,了解问题,并确定可以使用先进的分析和机器学习技术产生重大影响的机会,然后设计、开发、部署和监控这些ML解决方案。
部署
• 使用您对ML建模技术和问题的理解(包括模型选择、数据和特征选择、模型训练、超参数调整、维度、偏差/方差和验证)来捕捉和通知您的ML基础设施决策。
• 使用云技术(如Azure Databricks、ML Flows和Azure ML)设计、实施、部署和维护深度学习和ML模型。
• 编写可扩展到1亿个呼叫和数百万用户的生产就绪建模代码。
协作
• 提倡深入的科学专业知识、持续学习、注重细节和最佳实践,同时始终友好、谦虚并愿意挑战任何假设。
• 与数据工程师、机器学习工程师、产品经理和能力团队合作,协调从构思到发布的及时部署。
• 推广并整合数据科学的最佳实践,并遵守已建立的工作标准。
其他
• 研究复杂业务问题的新机器学习解决方案。
• 以非技术商业领导者能理解的术语,沟通高级ML和NLP概念和可交付成果的流程、要求、假设和注意事项。
经验:
• 计算机科学、统计学、应用数学、数据科学、经济学或相关量化领域的学士、硕士或博士学位。
• 在设计、开发和部署NLP领域的生产级机器学习解决方案方面有5年以上经验(如NLTK、Spark NLP、spaCy、HuggingFace、Flair、NLTK等),解决实际业务问题。
• 在NLP模型架构和算法方面有经验,如BERT(以及BioBERT、RoBERTa、ALBERT等的衍生版本)、BiLSTM、XLNet、T5、ELECTRA、PaLM。
• 在LLMs/Open Source LLMs(如ChatGPT、LLama、Falcon、Vicuna、Bard等)和Langchain框架方面有经验。
• 在Microsoft Azure平台上有开发和ML经验。
• 在深度学习神经网络(自动编码器、前馈网络、RNNs/CNNs等)方面有专业知识。
• 精通Python和SQL,并具有Apache Spark、Hadoop、Databricks、Snowflake或其他大数据系统的工作经验者优先。
• 具备深厚的技术技能和商业意识,能够与组织内的各个层级和学科进行接口。
• 出色的书面和口头沟通能力,能够向技术和非技术的受众解释复杂的研究内容。
• 自我激励,能够在动态环境中蓬勃发展。