要求
- 计算机科学或相关学科的大学毕业生
- 5-7年开发、维护和支持企业级大数据应用的经验,最好是在银行环境中
- 精通大数据技术/工具/平台,如Hadoop、HDFS、Hive、Impala、HDFS、Presto、Spark、Hive、Impala、Zeppelin、Yarn、Cloudera、Hortonworks
- 具备关系型数据库的经验
- 具备Spark作业的编码和性能调优的知识和经验。Java Spark优先,但不是必须
- 建立并遵循与Apache Spark编程相关的最佳实践
- 负责理解功能/非功能需求并在Apache Spark中实现
- 使用CI/CD工具Jenkins、Git、Bitbucket的经验
- 编写Linux基本Shell脚本的经验
- 具备Apache Spark批处理和流处理框架的知识和经验
- 了解不同文件格式的工作,如Parquet、ORC、AVRO和JSON
- 了解微服务架构
- 了解S3是一个附加优势
- 能够主动、独立地工作,并与跨职能和跨区域团队合作
- 具备较强的沟通和分析能力,并有敏捷项目经验