职责:
简化原始数据进入我们的Azure数据湖的流程
执行生产支持和部署活动。
积极推动核心数据工程、商业智能和数据仓库框架的执行
构建数据管道,从CRM、电子商务等系统中提取数据,注重可扩展性和可靠性
利用中央数据仓库和其他数据源,将丰富的客户信息创建到CRM系统中
理解并将业务需求转化为支持长期、可扩展和可靠解决方案的数据模型
使用最佳实践创建逻辑和物理数据模型,确保高数据质量和减少冗余
推动整个组织的数据质量;制定标准命名约定和编码实践的最佳实践,以确保数据模型和跟踪的一致性
定义和管理在生产中运行的数据集和流程的SLA
不断改进我们的数据基础设施,保持技术领先
设计一个在系统故障时进行数据备份的系统
与数据科学家、分析师、产品经理和软件工程师建立强大的跨职能合作伙伴关系,了解数据需求并满足这些需求
技能
在大规模数据仓库项目方面有10年以上的经验。
精通Scala、Spark和SQL。
对数据结构和设计模式有很好的了解
具备数据集成工具的经验者优先
有零售/CRM/财务数据集的工作经验者优先
了解事实、维度、快照、SCD等设计
编写SQL以处理原始数据、数据验证和质量保证
了解使用API收集或摄取数据
具备较强的数据库知识,优先考虑SQL和NoSQL
沟通能力 数据工程师是团队的一部分,与数据库管理员、数据分析师和管理层合作,需要成为有效的沟通者。
注意细节 数据库是复杂的,一个微小的错误可能会引起巨大的问题。
解决问题的能力 数据工程师需要快速找到解决问题的方法。
具备设计和实施基于云和SaaS的数据仓库(例如WS、Hadoop、NoSQL)和开发ETL/ELT流程的经验
具备集成和构建数据平台以支持BI、分析、数据科学和实时应用的经验
具备良好的沟通能力,能够主动准确地发起和推动项目