职位描述和要求
• *工作范围**:
- 负责监控和保证所有生产和非生产大数据堆栈的运行时间。
- 估计大数据堆栈的容量;开发监控容量和使用情况的方法。
- 领导努力开发和改进自动监控和主动干预的程序,减少任何需要停机的需求。
- 提供并推动大数据解决方案的架构和设计
- 设计和实现支持大容量实时和批处理数据处理的高性能系统
- 开发具有强大监控和报警功能的ETL流水线
- 开发针对业务可用性和理解进行优化的数据模型
- 使用最佳实践开发和优化数据表的分区、压缩、并行化等
- 优化SQL和ETL解决方案以满足各种报表需求。