• 积极监控工作队列。
• 执行操作任务,及时解决所有事件/请求,并在约定的服务水平协议(SLA)内完成。
• 更新工单,记录已执行的解决任务。
• 在事件发生前或发生时识别、调查和分析问题及错误,并及时记录所有此类事件。
• 收集所有所需和相关信息以便立即解决。
• 为所有事件和请求提供二级支持,并识别事件和问题的根本原因。
• 与其他团队和客户沟通以扩展支持。
• 执行变更,清晰识别风险并制定缓解计划,记录在变更记录中。
• 遵循交接流程,突出任何关键工单,并交接下一班次需执行的关键任务。
• 如有需要,升级所有工单以寻求 CoE 和其他团队的重点关注,并继续向管理层升级。
• 与自动化团队合作以优化工作量并自动化日常任务。
• 能够与各种其他解决小组(内部和外部)合作,如服务提供商、技术支持中心(TAC)等。
• 在影响客户服务之前识别问题和错误。
• 为 L1 安全工程师提供协助,以便更好地进行初步分诊或故障排除。
• 领导并管理所有初步客户因操作问题的升级。
• 通过记录所有变更请求的完整细节,参与变更管理过程,包括标准和非标准的补丁及其他配置项的变更。
• 确保所有变更都经过适当的变更批准。
• 计划并执行已批准的维护活动。
• 审核和分析事件及请求工单的质量,并推荐改进,更新知识文章。
• 制作趋势分析报告,以识别自动化任务,从而减少工单数量并优化工作量。
• 在需要时,可能还会参与/支持项目工作。
• 可能会参与实施和交付灾难恢复功能及测试。
• 执行任何其他相关任务。
所需经验:
• 精通 Windows 技术,如域服务、SQL 等,不限于此列表。
• 以 SRE 为导向和关注。
• 熟悉 AWS 管理、Nutanix、Apache(Web 服务器管理)、Linux 系统管理、BigFix。
• 熟悉 ELK 堆栈(Elasticsearch、Logstash、Kibana)与 AI/ML 集成。
• 熟悉 SNMP(简单网络管理协议)、F5(负载均衡器及相关技术)。
• 熟悉 JSON(数据格式化和处理)。
• 熟悉 API、自动化、Ansible、CI/CD 等。
• 语言:PS、Bash、Python 等。
• 具有适度的相关托管服务经验,处理跨技术基础设施。
• 对工单工具有适度的知识,最好是 Service Now。
• 对 ITIL 过程有适度的工作知识。
• 与供应商和/或第三方合作的经验适中。
原始职位 Linux 工程师 /Linux /Ansible / 发布于 GrabJobs ©。如需报告此职位的任何问题,请使用 GrabJobs 上的报告职位按钮。