• 确保公司交易业务的稳定性,与研发团队快速响应事件,并建立机制以提高处理效率
• 参与运维工具和平台的建设及系统风险识别(包括数据库/中间件),推动运维自动化
• 通过持续的全方位数据运营(包括历史事件、在线问题、资源利用率等)推动系统优化
• 处理警报以确保其得到妥善处置
• 制定各种运维标准,促进整体运维水平的提升
• 构建预算管理、成本测量、成本监控和成本优化系统,提供成本治理解决方案,并推动其实施
要求:
- 计算机科学或相关领域的学士学位或以上,具有3年以上SRE/运维/云原生相关工作经验
• 扎实的计算机软件基础知识,熟练掌握Linux操作系统的日常运维和故障排除
• 精通分布式系统核心组件的原理及运维,如MySQL(主从复制、读写分离)、Redis(集群、持久化)、Kafka(消息传递可靠性)
• 熟悉一种或多种脚本语言,如Python/Shell/GO
• 具备系统性问题解决能力、良好的沟通能力和责任感
• 有相关计算/分布式/大数据系统经验者优先(Nginx/Kubernetes/Docker等)
加分项:
• 具有区块链节点运维和优化经验
• 具有交易所或DeFi项目运维经验
• 只有入围的候选人会被联系。