• 主动监控工作队列。 • 执行操作任务，以及时解决所有事件/请求，并在约定的服务水平协议 (SLA) 内完成。 • 更新工单，记录已执行的解决任务。 • 在事件发生之前或发生时识别、调查和分析问题及错误，并及时记录所有此类事件。 • 捕获所有所需和相关信息以便立即解决。 • 为所有事件和请求提供二级支持，并识别事件和问题的根本原因。 • 与其他团队和客户沟通以扩展支持。 • 执行变更时清晰识别风险，并将缓解计划记录到变更记录中。 • 遵循班次交接流程，强调任何需要关注的关键工单，并交接即将在下一个班次中执行的关键任务。 • 如有需要，将所有工单升级以寻求 CoE 和其他团队的正确关注，并继续向管理层升级。 • 与自动化团队合作，以优化工作量并自动化常规任务。 • 能够与各种其他解决小组（内部和外部）合作，如服务提供商、技术支持中心 (TAC) 等。 • 在问题影响客户服务之前识别问题和错误。 • 为 L1 安全工程师提供帮助，以便更好地进行初步分类或故障排除。 • 领导和管理所有初步客户对操作问题的升级。 • 通过记录所有变更请求的完整细节，参与变更管理流程，包括标准和非标准的补丁及其他配置项的变更。 • 确保所有变更都经过适当的变更批准。 • 计划和执行已批准的维护活动。 • 审核和分析事件和请求工单的质量，并推荐改进措施，同时更新知识文章。 • 生成趋势分析报告，以识别自动化任务，从而减少工单数量并优化工作量。 • 可能还会在需要时参与和支持项目工作。 • 可能会参与实施和交付灾难恢复功能及测试。 • 执行任何其他相关任务。所需经验： • 精通 Windows 技术，如域服务、SQL 等，但不限于此。 • 具备 SRE 方向和专注能力。 • 熟悉 AWS 管理、Nutanix、Apache（Web 服务器管理）、Linux 系统管理、BigFix。 • 熟悉 ELK 堆栈 (Elasticsearch, Logstash, Kibana) 及 AI/ML 集成。 • 熟悉 SNMP（简单网络管理协议）、F5（负载均衡器及相关技术）。 • 熟悉 JSON（数据格式化和处理）。 • 熟悉 API、自动化、Ansible、CI/CD 等。 • 精通 PS、Bash、Python 等语言。 • 具备适度的相关托管服务经验，处理跨技术基础设施。 • 对工单工具（最好是 Service Now）有适度的了解。 • 对 ITIL 流程有适度的工作知识。 • 具备与供应商和/或第三方合作的适度经验。

Linux 工程师 (Linux / Ansible)

NTT SINGAPORE PTE. LTD.