确保公司交易业务的稳定性,与研发团队快速响应事件,建立机制以提高处理效率
参与运维工具和平台的建设及系统风险识别(包括数据库/中间件),推动运维自动化
通过持续的全方位数据运营(包括历史事件、在线问题、资源利用率等)促进系统优化
处理警报以确保其得到妥善处置
制定各种运维标准,推动整体运维水平的提升
建立预算管理、成本测量、成本监控和成本优化系统,提供成本治理解决方案,并推动其实施
要求
计算机科学或相关领域的本科及以上学历,具有3年以上SRE/运维/云原生相关工作经验
扎实的计算机软件基础知识,熟练掌握Linux操作系统的日常运维和故障排除
精通分布式系统核心组件的原理及运维,如MySQL(主从复制、读写分离)、Redis(集群、持久化)、Kafka(消息传递可靠性)
熟悉一种或多种脚本语言,如Python/Shell/GO
具备系统性解决问题的能力,良好的沟通能力和责任感
有相关计算/分布式/大数据系统经验者优先(Nginx/Kubernetes/Docker等)
优先条件:
具有区块链节点运维和优化经验
具有交易所或DeFi项目运维经验
• 只有入围的候选人会被联系。