我们正在寻找一名经验丰富的数据工程开发人员,要求在银行运营、变更管理流程和数据管道开发方面有丰富经验。理想的候选人将设计、构建和优化端到端的数据摄取管道,开发计算表,支持监管和业务报告,并与跨职能团队合作,提供高质量的分析和仪表板。
* 数据工程与管道开发
* 设计、开发和维护可扩展的ETL/ELT管道,从多个银行系统中摄取结构化和非结构化数据。
* 构建数据摄取框架、编排工作流和自动化验证检查,以确保高数据质量。
* 开发计算表、精心策划的数据集和语义层,以支持分析、仪表板和业务工作流。
* 优化管道性能,自动化可重复的流程,并确保遵循数据治理和血统标准。
* 维护数据工程代码部署的CI/CD管道,确保在变更管理中安全合规地交付。
技术技能要求
* 核心数据工程
* SQL(高级)、PL/SQL、存储过程
* Python / PySpark / Scala
* ETL/ELT工具(Informatica、DataStage、Airflow、NiFi或同等工具)
* 大数据平台:Hadoop、Hive、HDFS、Spark
* 云平台:AWS / GCP / Azure(优选:数据湖、数据仓库、存储、计算)
* 熟悉数据仓库概念(Kimball、星型/雪花模式)
* 数据管道与编排
* 工作流工具:Apache Airflow、Oozie、Control-M或同等工具
* 使用Jenkins、Bitbucket进行CI/CD
* 数据治理与质量框架(DQ规则、血统、元数据)
* 可视化与报告工具 - Power BI、Tableau或Qlik