NLP数据科学家职位详情
部门:技术部
汇报给:首席机器学习工程师
工作地点:阿布扎比,阿拉伯联合酋长国
职位目标:一位热爱数据并希望应用机器学习技术解决现实世界问题、对社会产生持久影响的实践型数据科学家。您将与团队紧密合作,确保按照项目目标和交付周期交付高质量算法。您将参与机器学习解决方案的设计、开发和交付的各个方面,包括从多样化来源获取数据、数据探索、特征工程、算法评估以及迭代部署模型以改进最终解决方案。
主要职责:
• 确定有价值的数据来源并自动化收集过程
• 对结构化和非结构化数据进行预处理
• 分析大量信息以发现趋势和模式
• 构建预测模型和机器学习算法
• 通过集成建模方法组合模型
• 使用数据可视化技术呈现信息
• 提出解决业务挑战的解决方案和策略
• 积极建议最佳实践
• 具备使用统计计算语言(R、Python、SQL等)操作数据并从大型数据集中获取见解的经验
• 具备强大的问题解决能力,注重产品开发
• 保持对机器学习领域快速变化的更新
• 使用数据可视化技术解释和呈现见解
• 与工程和产品开发团队合作
教育、经验和所需技能:
教育背景:计算机科学、运筹学、应用数学、工业/系统工程、应用统计学等数量领域的硕士(或博士学位)
经验要求:具备6年以上的数据驱动项目经验,包括3年以上的数据科学经验
基本技能:
• 使用SQL、Hive或其他工具从大型数据集中提取和聚合数据的经验
• 在预测建模、文本挖掘、信息检索、时间序列分析和统计建模等一个或多个领域具备机器学习算法和数据挖掘技术的知识
• 从结构化和非结构化数据中识别和提取有趣的模式
• 具备构建最先进的文本挖掘流水线以处理非结构化数据的经验
• 出色的口头、书面、演示、促进和互动能力,包括能够有效地向多个组织层级和高层管理层沟通架构问题和概念的能力
• 具备数据技术背景,深入了解数据获取和处理、数据管理、分布式处理和高可用性等多个领域的问题。具备统计学、数据挖掘、机器学习和生产系统的运营卓越经验者优先考虑
• 与数据科学家和软件工程师等跨职能团队合作
• 具备强大的问题解决能力,注重产品开发
• 熟悉自然语言处理(NLP)最重要的库
• 理解文本表征、语义提取技术、数据结构和建模的NLP技术
• 具备使用Theano、TensorFlow等机器学习框架的经验
• 熟练掌握Python和R
• 具备处理教育数据集的经验
• 优秀的沟通能力
• 注重细节,能够在高压环境下工作
• 具备自然的好奇心,学习技术、商业模式和行业趋势的能力