• 主动监控工作队列。 • 执行操作任务,及时解决所有事件/请求,并在约定的服务水平协议(SLA)内完成。 • 更新工单,记录已执行的解决任务。 • 在事件发生之前或发生时,识别、调查、分析问题和错误,并及时记录所有此类事件。 • 捕获所有必要和相关的信息,以便立即解决问题。 • 为所有事件和请求提供二级支持,并识别事件和问题的根本原因。 • 与其他团队和客户沟通,提供扩展支持。 • 执行变更时,清楚识别风险和缓解计划,并记录在变更记录中。 • 遵循班次交接流程,强调需要关注的关键工单,并交接下一班次即将进行的关键任务。 • 如果需要,升级所有工单以寻求 CoE 和其他团队的正确关注,必要时继续向管理层升级。 • 与自动化团队合作,优化工作量并自动化常规任务。 • 能够与各种其他解决组(内部和外部)合作,如服务提供商、技术支持等。 • 在问题影响客户服务之前识别问题和错误。 • 为 L1 安全工程师提供帮助,以便更好地进行初步分类或故障排除。 • 领导和管理所有初步客户升级的操作问题。 • 通过记录所有变更请求的完整详细信息,为标准和非标准的变更管理过程做出贡献,包括补丁和其他配置项的变更。 • 确保所有变更都经过适当的变更批准。 • 计划并执行已批准的维护活动。 • 审计和分析事件和请求工单的质量,并推荐改进措施,并更新知识文章。 • 生成趋势分析报告,识别自动化任务,从而减少工单数量并优化工作量。 • 可能还会根据需要参与/支持项目工作。 • 可能会参与实施和交付灾难恢复功能和测试。 • 根据需要执行任何其他相关任务。
所需经验: • 熟悉 Windows 技术,如域服务、SQL 等(不限于此列表)。 • 以 SRE 为导向和重点。 • 熟悉 AWS 管理、Nutanix、Apache(Web 服务器管理)、Linux 系统管理、BigFix。 • 熟悉 ELK 堆栈(Elasticsearch、Logstash、Kibana)与 AI/ML 集成。 • 熟悉 SNMP(简单网络管理协议)、F5(负载均衡器及相关技术)。 • 熟悉 JSON(数据格式和处理)。 • 熟悉 API、自动化、Ansible、CI/CD 等。 • 熟悉 PS、Bash、Python 等编程语言。 • 拥有适度的相关托管服务经验,处理跨技术基础设施。 • 对工单工具(最好是 Service Now)有适度的知识。 • 对 ITIL 流程有适度的工作知识。 • 拥有适度的与供应商和/或第三方合作的经验。
原始职位 Linux 工程师 /Linux /Ansible / 发布在 GrabJobs ©。 如需标记此职位的任何问题,请使用 GrabJobs 上的报告职位按钮。