角色与职责
工作职责
• 使用面向数据的编程语言和可视化软件开发和实施技术和分析应用,将原始数据转化为有意义的信息。
• 应用数据挖掘、数据建模、自然语言处理和机器学习技术,从大型结构化和非结构化数据集中提取和分析信息。
• 可视化、解释和报告数据发现,并可能创建动态数据报告。
• 构建和优化“大数据”数据管道、架构和数据集。
• 对内部和外部数据和流程进行根本原因分析,回答特定的业务问题并找到改进的机会。
• 支持和开发数据建模、数据映射活动。
• 具备处理非结构化数据集的强大分析能力。
要求
· 具备数据工程工具(Python、Spark(Scala或Python)、Hadoop)或关系数据库(Oracle、MySQL、MS SQL)或NoSQL数据库(包括Postgres和Cassandra)的经验。
· 具备数据管道和工作流管理工具的经验。
· 具备面向对象/函数脚本语言的经验:Python、Java、C++、Scala、R等。
· 计算机科学或等同经验的IT学士学位。
告诉雇主你具备的技能
机器学习
Scala
Oracle
数据管道
Hadoop
MySQL
根本原因分析
脚本编写
Cassandra
工作流管理
数据工程
数据挖掘
Python
Java
数据库