职责
• 确保按照项目要求提供运营服务。
• 监控并向客户报告所涵盖系统的SLA/KPI情况。
• 确保达到相应的运营服务水平。
• 提供关于系统健康状况、状态、风险状态、变更请求/服务请求和系统问题的月度总结和/或进展报告。
• 与客户(利益相关者、运营经理和/或承包商)直接联络和合作,以实现项目交付和维护支持的目的。
• 监控并向客户更新运营关注事项和/或合规事项,并提出解决方案。
• 审查所有未达到SLA或OLA的事件。确保按照事件管理流程进行处理。
• 规划、协调、管理和控制基础设施的变更,以确保符合变更管理流程。
• 审查系统软件和硬件版本的变化,并制定升级计划以维护可支持的基础设施。
• 参与或主持管理更新会议 - CCC、运营、服务评审、审计和管理会议。
• 审查系统家族内运营和支持(O&S)项目团队的报告。
• 在审核、DR/BCP、备份和恢复演练期间为O&S项目团队提供支持。
• 提出持续改进的倡议,推荐加强IT治理和合规性,提高工作质量和流程效率。
• 准备管理计划并每年向客户提交编制汇总。
资格和能力
• 计算机科学或类似相关领域的学士学位
• 最好具备微软MCSA、MCSE、CCNA、CCIE或等同的技术认证。
• 具备ITIL基础认证
• 熟悉ISO 9001和ISO 27001
• 在信息技术(IT)领域拥有八(8)年的工作经验,尤其是在基础设施规划、数据中心运营和网络、服务器/平台和系统管理方面;
• 至少有五(5)年类似职位的团队领导经验;
• 深入了解服务器/网络基础设施的管理、控制和监控最佳实践
• 出色的组织和时间管理能力
• 出色的沟通和领导能力
• 分析思考者和问题解决者
• 注重细节
• 具备良好的人际交往、演示、书面和沟通能力;
• 与利益相关者保持有效的沟通渠道
系统特定经验
• 调优应用程序堆栈,如Tomcat、JBoss、Apache、Ruby、NGINX
• 最好具备云计算经验,如AWS(亚马逊网络服务)
• 具备备份、日志审查、虚拟化(VMware)经验
• 具备安装、配置和支持网络设备的良好工作知识,包括路由器、代理服务器、交换机、WAN加速器、DNS和DHCP
• 具备安装、配置和支持系统相关技术的良好工作知识,如Windows和Linux操作系统