至少5-8年在大数据生态系统中具有相关和丰富经验,包括HDFS、HIVE、SPARK、PYSPARK,具备开发、性能调优、故障排除和部署的专业知识。
- 在大数据、数据分析、ETL和各种数据仓库概念方面有经验。
- 拥有Linux/Unix的实际操作知识
- 拥有银行领域经验(零售银行优先,反洗钱知识)者优先。
- 了解各种关系型数据库(例如Oracle)和数据存储,以及跨各种数据库的迁移技术。
- 能够在紧迫、固定的截止日期下优先排序和管理日程。
- 能够提供专业、技术上可靠的解决方案
- 过程导向[遵循流程+在整个SDLC中按标准进行文档编制]。
- 能够独立且高效地处理业务请求。具有在大数据上,特别是在PySpark和Python上解决生产问题的丰富经验。
- 能够与我们的技术合作伙伴和其他利益相关者紧密合作并有效沟通。