职位描述:
功能上向集团基础设施平台服务的大数据平台负责人汇报,大数据平台工程师将负责确保Cloudera数据平台、Cloudera数据服务及其运行组件的正常运行、性能和合规性,符合银行的标准。
该职位将负责数据平台的运营和自动化。他们将与规划、构建、变更和运行团队以及应用和开发团队合作,就大数据平台需求、标准以及大数据平台和其工具的使用、优化和故障排除等方面进行协作。
该职位将为实施、维护和维持CDP堆栈提供Cloudera数据平台(CDP)和Cloudera数据服务(CDS)支持。
职责:
- 执行和自动化CDP和CDS堆栈的操作、安装和监控
- 评估CDP和CDS基础架构需求,并设计/部署解决方案(高可用性、大数据集群、弹性负载容忍性)
- 在性能、可用性和安全性等方面提出建议并实施CDP和CDS堆栈的改进
- 协助应用团队解决与性能相关的问题
- 确保部署符合银行的标准和安全策略
- 开发和维护与Cloudera数据平台(CDP)和Cloudera数据服务(CDS)环境相关的技术文档,包括设计、配置、使用、故障排除、备份和恢复等方面
- 开发和维护用于自动化管理Cloudera数据平台(CDP)和Cloudera数据服务(CDS)环境的脚本/工具
- 参与内部和外部审计
- 提供对工程团队持续改进的反馈
经验/技能:
- 信息技术/计算机科学学士或同等学历
- 在企业环境中使用Cloudera Hadoop及其运行组件(如Spark、ZooKeeper、Ranger)的5年或更多工作经验
- 深入了解Apache Hadoop、Spark
- 熟悉自动化工具,如Terraform、Chef和Ansible
- 能够在不同优先级的多个任务之间工作
- 在压力下工作,并能解决复杂问题
- 具有协作精神,注重团队成果而非个人成果
- 在银行工作经验者优先
告诉雇主您具备的技能:
- Cloudera
- 技术文档编写
- 故障排除
- 大数据框架
- 大数据
- 数据管道
- Hadoop
- 自动化工具
- ETL
- 数据治理
- MapReduce
- 数据工程
- Apache Hadoop
- SQL
- Python
- 数据架构
- Ansible
- 数据仓库
- 数据可视化