主要职责:
• 提供应用 L1/L2 支持和系统检查(CPU,磁盘使用情况,日志,服务)
• 排查和解决系统及应用问题,并提供现场技术支持,以确保及时解决问题,最小化对业务运营的干扰
• 监控应用健康状况和系统警报,必要时升级问题
• 在工单系统中记录事件和服务请求,确保及时解决
• 与 L3 团队和供应商协调问题升级和跟进
• 执行例行维护任务,如应用更新,打补丁和备份
• 保持问题、解决方案和程序的清晰文档
• 参与系统测试、部署及部署后支持活动
• 协助用户访问管理和配置任务
理想候选人应具备:
• 电气工程、计算机科学、通信工程或相关领域的文凭/学位
• 至少 2 年的应用维护、支持或服务器基础设施设置经验
• 参与 Kubernetes 集群项目的经验,熟练使用相关命令检查应用日志
• 至少熟悉以下两个虚拟化技术/平台:VMware、Xen、KVM、OpenStack、Cloud Stack、Azure Stack
• 具备云编排、配置管理和自动扩展技术的经验
• 对网络、路由器、交换机和 WiFi 设置有深入了解
• 在使用不同文件系统(如对象存储、rbd、cephfs 存储)部署 ceph 方面有实践经验
• 对存储技术(如 NAS、SAN、SDS)有良好了解
• 具备使用 Salt/Chef/Puppet/Ansible 等自动化工具的经验
• 具备 TCP/IP、HTTP、DNS、路由的负载均衡设置经验
• 有使用软件版本控制的经验
• 了解 IT 安全标准,例如来自 CIS 或 IM8 的标准
• 具备 IT 安全政策管理和执行 IT 安全的经验
• 了解计算机硬件组件,并能够将故障服务器恢复到正常工作状态
• 具备编程或脚本语言(如 bash、Windows 批处理脚本、PowerShell、Perl、Python 等)的经验
• 能够安装、使用和配置各种 Linux 操作系统,如 Redhat、Ubuntu、CentOS。
在系统安装规划、执行、例行维护方面的经验。