确保公司交易业务的稳定性,与研发团队快速响应事件,建立机制以提高处理效率。
参与运维工具和平台的建设及系统风险识别(包括数据库/中间件),推动运维自动化。
通过持续的全方位数据运营(包括历史事件、在线问题、资源利用等)促进系统优化。
妥善处理警报。
制定各类运维标准,推动整体运维水平的提升。
构建预算管理、成本测量、成本监控和成本优化系统,提供成本治理的解决方案,并推动其实施。
要求
计算机科学或相关领域的本科及以上学历,具有3年以上SRE/运维/云原生相关工作经验。
扎实的计算机软件基础知识,熟练掌握Linux操作系统的日常运维和故障排除。
精通分布式系统核心组件的原理及运维,如MySQL(主从复制、读写分离)、Redis(集群、持久化)、Kafka(消息传递的可靠性)。
熟悉一种或多种脚本语言,如Python/Shell/GO。
具备系统化的问题解决能力,良好的沟通能力和责任感。
有相关计算/分布式/大数据系统经验者优先(Nginx/Kubernetes/Docker等)。
优先考虑:
具有区块链节点运维和优化经验。
具有交易所或DeFi项目运维经验。
*只有入围的候选人会被联系。
显示更多 显示更少