HM备注:这个混合角色需要在办公室工作三天。
职责:
创建机器学习模型并利用数据进行模型训练
通过分析数据,找出输入和期望输出之间的关系
理解业务目标,开发能够帮助实现这些目标的模型,并制定跟踪进展的指标
设计和开发机器学习和深度学习系统
运行机器学习测试和实验
实施适当的机器学习算法
常规技能:
有管理可用资源(如硬件、数据和人员)以确保按时完成任务的经验
有分析可用于解决给定问题的机器学习算法并根据成功概率对其进行排名的经验
有探索和可视化数据以了解数据的经验,然后确定数据分布的差异可能会影响模型在现实世界中部署时的性能
有验证数据质量并通过数据清洗确保数据质量的经验;如果需要更多数据,有监督数据获取过程的经验
有寻找可用于训练的在线数据集的经验
有定义验证策略的经验
有定义给定数据集上要进行的预处理或特征工程的经验
具备统计学和计算机编程背景
具备团队合作精神,具备按时完成任务、处理竞争优先事项和客户关系管理经验的记录
技能
经验和技能要求
所有要求都是“必须具备”的:
(15%)深入理解机器学习概念:
• 熟练掌握机器学习的基本概念、算法和技术。
• 熟悉自然语言处理(NLP):了解NLP技术和模型,尤其是BERT和其他基于transformer的模型,用于文本分类、情感分析和语言理解等任务。
(20%)深度学习框架经验:
• 熟练掌握深度学习库,如TensorFlow或PyTorch。使用这些框架实现、训练和微调BERT模型的经验至关重要。
(30%)数据预处理技能:
• 能够进行文本预处理、分词,并理解词向量嵌入。
• 编程技能:熟练使用Python进行编程,包括使用NumPy、Pandas和Scikit-learn等库的经验。
(20%)模型优化和调整:
• 通过超参数调优来优化模型性能,并理解模型复杂性和性能之间的权衡。
(15%)迁移学习的理解:
• 知道如何利用预训练模型(如BERT)来处理特定任务,并将其适应自定义数据集。