薪资:$180k 到 $240k + 奖金 + 股权
混合工作模式
我们正在寻找一位高技能的数据科学家,专注于大型语言模型(LLMs)和机器学习(ML),加入我们的团队。理想的候选人应具备开发和部署人工智能解决方案的深厚经验,尤其是利用如GPT-3、BERT或类似技术的大型语言模型,解决复杂的商业问题。您将与跨职能团队紧密合作,设计、构建和部署数据驱动的模型,利用先进的语言处理技术和传统机器学习方法推动创新和商业成功。
主要职责:
大型语言模型(LLM)开发:
• 设计、开发和部署基于LLM的应用程序,使用如GPT-3、BERT或类似技术。
• 实施AI解决方案,利用LLMs来自动化和优化商业流程,例如文本生成、摘要、情感分析和文档分类。
• 微调LLMs,以提高模型在特定商业任务中的准确性和效率。
机器学习模型开发:
• 使用各种算法(例如回归、分类、聚类)和深度学习技术开发和部署机器学习模型。
• 将基于LLM的解决方案与传统机器学习模型集成,以解决复杂的多方面商业问题。
算法开发与优化:
• 构建和优化算法,以处理大规模数据并提高模型性能。
• 利用TensorFlow、PyTorch和Scikit-learn等机器学习框架实施和微调模型,特别关注语言处理任务。
Python编程与软件开发:
• 编写清晰、高效且可扩展的Python代码,进行LLM和机器学习模型开发。
• 利用Pandas、NumPy和SciPy等库来处理和分析数据,确保模型顺利集成到生产环境中。
模型评估与验证:
• 使用适当的指标(例如准确率、精确率、召回率、F1分数)评估模型性能,确保LLM和ML模型的稳健性、可靠性和普适性。
• 通过迭代性能和微调特定用例,持续改进模型结果。
协作与报告:
• 与业务领导、工程师和其他利益相关者紧密合作,将业务需求转化为LLM和ML解决方案。
• 向非技术利益相关者展示发现和模型结果,确保可操作的见解。
• 创建和维护详细的流程、模型和方法论文档。
要求:
• 作为数据科学家或机器学习工程师,专注于大型语言模型(LLMs)方面的证明经验。
• 精通Python,并具备使用Pandas、NumPy、TensorFlow、PyTorch和Hugging Face Transformers等库的经验。
• 在各种自然语言处理任务(例如文本生成、摘要、情感分析和文档处理)中,部署和微调LLMs(如GPT-3、BERT)的经验。
• 扎实理解机器学习算法和AI技术,包括监督学习和无监督学习、深度学习和强化学习。
• 具备数据可视化工具(如Matplotlib、Seaborn、Plotly)呈现见解和发现的经验。
• 具备云平台和大数据技术(如AWS、Google Cloud、Hadoop、Spark)的经验者优先。
• 熟悉版本控制系统如Git。
• 计算机科学、数据科学、数学或相关领域的学士或硕士学位。
优先技能:
LLM集成经验:
• 在构建基于LLM的解决方案的端到端管道方面具有实践经验,将模型集成到更大工作流中,并在生产环境中部署它们。
• 熟悉Hugging Face、OpenAI API或类似工具的框架,用于LLM开发和部署。
• 在高级NLP任务方面的经验,包括命名实体识别(NER)、情感分析、文本分类和问答。
• 具备良好的沟通能力,能够向非技术受众解释复杂的LLM和ML概念。
• 熟悉敏捷方法论,并在协作团队环境中工作。