要求 - 计算机科学或相关学科的大学毕业生 - 5-7年开发、维护和支持企业级大数据应用的经验，最好是在银行环境中 - 精通大数据技术/工具/平台，如Hadoop、HDFS、Hive、Impala、HDFS、Presto、Spark、Hive、Impala、Zeppelin、Yarn、Cloudera、Hortonworks - 具备关系型数据库的经验 - 具备Spark作业的编码和性能调优的知识和经验。Java Spark优先，但不是必须 - 建立并遵循与Apache Spark编程相关的最佳实践 - 负责理解功能/非功能需求并在Apache Spark中实现 - 使用CI/CD工具Jenkins、Git、Bitbucket的经验 - 编写Linux基本Shell脚本的经验 - 具备Apache Spark批处理和流处理框架的知识和经验 - 了解不同文件格式的工作，如Parquet、ORC、AVRO和JSON - 了解微服务架构 - 了解S3是一个附加优势 - 能够主动、独立地工作，并与跨职能和跨区域团队合作 - 具备较强的沟通和分析能力，并有敏捷项目经验

大数据工程师

NTT Data Singapore