关键职责:
• 理解业务部门负责人和服务经理/所有者的决策过程、工作流程和业务信息需求。
• 将业务需求转化为支持高管决策和工作流程所需的分析/报告要求。
• 主动挖掘数据仓库,识别趋势和模式,并为业务部门和高级领导层提供洞察。
• 在大规模实验中,以识别大数据集中变量之间的隐藏关系。
• 为团队的代码库和技术文档做出贡献。
• 研究并实施机器学习/深度学习/人工智能领域的尖端技术和工具,以提高数据分析效率。
• 确定用于训练和演化深度学习模型和算法的要求。
• 使用数据可视化工具对信息进行可视化,并开发有吸引力的报告。
• 通过基于数据的建议,为产品团队提供关于新产品、功能或更新的建议。
• 开发框架和流程,分析通过各种来源收集的非结构化信息。
• 支持用户体验专家和信息架构师,通过开发仪表板和用户界面来增强信息可视化。
• 向分析和产品团队传播最佳实践,并为他们基于数据的实验提供咨询。
技能:
• 掌握机器学习和数据分析工具和技术的最新知识。
• 在应用概率和统计到实际情况时对数据进行分析和批判性处理。
• 熟悉预测建模方法。
• 有利用结构化和非结构化数据源的经验。
• 愿意并能够在工作中学习新技术。
• 具备向技术和非技术受众传达复杂结果的能力。
• 具备在最少监督下工作的能力。
经验:
• 在机器学习和统计方面具有较强的背景,无论是通过项目还是以前的工作经验。
• 有使用多类分类、决策树、XGBoost和深度学习等机器学习算法的经验。
• 精通Python编程技能。
• 熟悉pandas。有SQL/NoSQL/Cassandra的经验者优先考虑。
• 有在Azure、GCP、AWS等云平台上工作的经验者优先考虑。
• 具备数据管道和流式处理的坚实基础。
• 具备良好的沟通、解决问题的能力和团队合作精神。
• 对PyTorch、scikit-learn、numpy等库有基本了解。
• 对NLP/提示工程/GPT感兴趣或有相关经验者优先考虑。
教育要求:
• 数据科学、应用数学、计算机科学学士学位。
• 优先考虑硕士学位。