关键职责:
• 使用开源、现代数据湖和企业数据仓库技术(Hadoop、Spark、云等)设计、开发和维护端到端的数据解决方案
• 在整个解决方案的生命周期中贡献多个数据解决方案(从构思到发布)
• 与业务利益相关者合作,了解并满足他们的数据需求
• 设计、构建和维护机器学习数据流水线
• 根据银行安全政策维护安全性
• 参与敏捷开发环境
• 云/AWS是一个优势
资格:
• 计算机科学、工程或信息管理(或同等学历)学士学位
• 5年以上相关工作经验
• 专业经验支持大数据平台应用和解决方案
• 对多种大数据(Hadoop / Cloudera、云等)有实际经验
• 熟练掌握面向对象的脚本语言:Java(必需)、Python(优势)、等
• 有大数据、Hadoop、Spark、HDFS、Hive、HBase、Kafka、Impala、Spark和AWS、EMR方面的经验
• 精通SQL和有关系数据库的经验
• 有UNIX shell脚本和命令的经验
• 有版本控制(git)、问题跟踪(jira)和代码审查的经验
• 熟练掌握敏捷开发实践
• 能够清晰地记录操作程序和解决方案设计
• 能够有效地沟通(口头和书面)
• 能够在团队环境中进行合作
• 能够平衡竞争性的优先事项和期望