主要职责
• 操作、监控和排除Linux和Kubernetes平台的故障
• 执行Day-2操作支持、事件响应和根本原因分析
• 使用监控工具提高系统可见性和可靠性,并支持安全、补丁和合规活动
• 使用ITSM流程(ServiceNow)与跨职能团队合作,持续改进操作流程和平台稳定性。
主要要求:
• 计算机科学、信息技术或相关领域的学士学位。
• 拥有Linux和Kubernetes的丰富实践经验(必需)
• 拥有Kubernetes故障排除技能,包括:Pod故障、CrashLoopBackOff、网络、存储和资源问题,节点级和集群级问题分析
• 具有DevOps监控和可观测性工具的经验(指标、日志、警报)
• 熟悉ServiceNow用于事件、问题和变更管理
• 拥有Windows系统管理经验(AD、补丁、服务、基本故障排除)
• 基本了解网络管理,包括:TCP/IP、DNS、路由、防火墙、负载均衡
• 具备网络安全基础知识,如:访问控制、补丁、漏洞意识和安全最佳实践
• 接触或了解Google AI/ML服务或平台。
优先考虑:
• 具有认证的Kubernetes管理员(CKA)或同等Kubernetes认证。
• 有支持生产或关键任务环境中Kubernetes的经验
• 熟悉云平台(优先考虑GCP)
• 具有自动化、脚本或基础设施即代码工具的经验。
• 理解IT运营、SRE或Day-2托管服务环境。
申请请将更新的简历发送至akshya.raman@tg-hr.com。
只有入围的申请者会收到通知。
APBA TG人力资源私人有限公司 (14C7275) || Akshya R (R24122440)