要求
计算机科学或相关学科的大学毕业生
5-7年开发、维护和支持企业级大数据应用的经验,最好是在银行环境中
精通大数据技术/工具/平台,如Hadoop、HDFS、Hive、Impala、HDFS、Presto、Spark、Hive、Impala、Zeppelin、Yarn、Cloudera、Hortonworks
有关系型数据库的经验
具备Spark作业的编码和性能调优的知识和经验。Java Spark优先,但不是必需
建立并遵循与Apache Spark编程相关的最佳实践
负责理解功能/非功能需求并在Apache Spark中实现
具有使用CI/CD工具Jenkins、Git、Bitbucket的经验
有编写Linux基本Shell脚本的经验
具备Apache Spark批处理和流处理框架的知识和经验
了解不同文件格式的工作,如Parquet、ORC、AVRO和JSON
了解微服务架构
了解S3是一个额外的优势
能够主动、独立地工作,并与跨职能和跨区域团队合作
具备较强的沟通和分析能力,并有敏捷项目经验