主要职责:
• 理解业务部门负责人和服务经理/所有者的决策过程、工作流程和业务信息需求。
• 将业务需求转化为支持高管决策和工作流程所需的分析/报告要求。
• 主动挖掘数据仓库,识别趋势和模式,并为业务部门和高级领导层提供洞察。
• 进行大规模实验,识别大数据集中变量之间的隐藏关系。
• 贡献代码库和团队的技术文档。
• 研究和实施机器学习/深度学习/人工智能领域的前沿技术和工具,以提高数据分析效率。
• 确定用于训练和发展深度学习模型和算法的要求。
• 使用数据可视化工具对数据分析结果进行信息可视化和开发吸引人的报告。
• 基于数据的建议,为产品团队提供关于新产品、功能或更新的咨询。
• 开发框架和流程,分析通过各种来源收集的非结构化信息。
• 支持用户体验专家和信息架构师,通过开发仪表板和用户界面来增强信息可视化。
• 分发最佳实践给分析和产品团队,并为他们基于数据的实验提供咨询。
技能:
• 掌握机器学习和数据分析工具和技术的最新知识。
• 在应用概率和统计学处理数据时,对数据进行分析和批判性处理。
• 在预测建模方法论方面有较强的知识。
• 有利用结构化和非结构化数据源的经验。
• 愿意并能够在工作中学习新技术。
• 展示将复杂结果传达给技术和非技术受众的能力。
• 能够在最少监督下工作的能力。
经验:
• 在机器学习和统计学方面有较强的背景,无论是通过项目还是以前的工作经验。
• 有使用多类分类、决策树、XGBoost和深度学习等机器学习算法的经验。
• 优秀的Python编程能力。
• 熟悉pandas。有SQL/NoSQL/Cassandra经验者优先考虑。
• 有使用Azure、GCP、AWS等云平台的经验者优先考虑。
• 在数据管道、流处理方面有坚实的基础。
• 出色的沟通、解决问题的能力和良好的团队合作精神。
• 对PyTorch、scikit-learn、numpy等库有基本了解。
• 对自然语言处理/NLP/提示工程/GPT感兴趣或有经验者优先考虑。
教育要求:
• 数据科学、应用数学、计算机科学学士学位。
• 优先考虑硕士学位。