角色概述
从需要解决的业务问题出发,收集数据以进行统计分析,选择合适的机器学习和/或深度学习建模方法。在生产环境中部署机器学习模型,以支持业务决策。
在项目协作中指导初级员工。
职责
• 理解业务需求并识别相关数据源。
• 执行数据聚合和特征工程;编写Python代码进行可视化、模型构建、验证和实施。
• 与数据科学家和工程师合作。
• 采用灵活和创新的问题解决方法。
• 有效地向非技术利益相关者传达结果。
要求
• 拥有统计学、数据科学、数学、经济学或相关领域的硕士学位或更高学位。
• 至少一年使用Python(或类似语言)开发端到端模型以进行生产部署的经验。持有博士学位者可免除此要求。
技能
• 精通SQL和Python编程语言,包括pandas、numpy、scipy和scikit-learn。
• 深入理解统计知识和机器学习算法,接触过深度学习技术。
• 必须具备线性回归、广义线性模型(GLM)、梯度提升机(GBM)、随机森林、XGBoost、分割技术和大型语言模型的专业知识。神经网络的知识是有益的,但不是必需的。
• 具备有效的沟通能力和独立学习新技能的能力。