作为团队的核心成员,您将提供云运营支持(包括代码级修复)、负责事件管理,并在生产和非生产环境中不断提高系统可靠性和运营卓越性。
- 工作时间:周一至周五
- 工作地点:中央
- 薪资待遇:最高可达 $8800(基本工资)+ AWS
- 职位类型:合同
主要职责
- 使用全栈可观测性工具监控和分析生产和非生产环境,以确保最佳性能、正常运行时间和用户体验。
- 全程负责事件管理:检测、分类、解决事件,进行根本原因分析(RCA),协调团队/供应商,并制作事件后报告。
- 通过与产品、开发和安全团队合作的数据驱动洞察推动持续改进计划。
- 构建和维护操作文档、运行手册和SOP,以支持审计合规和知识共享。
- 使用基础设施即代码和脚本工具自动化重复的操作和基础设施任务,以减少停机时间和人为错误。
- 在应用程序和基础设施层(APM)实施和增强监控、警报和日志记录。
- 管理日常运营活动,生成性能和可用性报告,并向利益相关者和领导层展示见解。
- 领导和协调24/7运营支持,与内部团队和外部供应商合作以满足SLA。
要求
- 计算机科学、信息技术或相关领域的学士学位。
- 至少3年运营支持、站点可靠性工程、DevOps或类似角色的经验。
- 提供L1–L3支持的实际经验,包括应用程序和基础设施级别的故障排除。
- 使用ITSM工具(如ServiceNow、Jira Service Management、PagerDuty)进行事件、问题和变更管理的丰富经验。
- 在测试和生产环境中实施安全控制和特权访问管理的经验。
- 在全栈监控和可观测性方面的验证经验,包括云原生和开源工具(如CloudWatch、Stackdriver、Prometheus/Grafana、OpenTelemetry)。
- 具有自动化和基础设施即代码(如Terraform、Ansible、脚本)的经验。
- 熟悉敏捷/DevOps实践、CI/CD管道、测试驱动开发和信息安全最佳实践。
- 管理云基础设施和服务(AWS、Azure、Google Cloud)的经验;云认证是加分项。
- 强大的问题解决、分析和沟通能力,能够向非技术利益相关者解释技术问题。
- 协作心态、积极主动的态度,能够在快节奏、高绩效的环境中茁壮成长。
提交简历即表示您同意根据ScienTec的隐私政策(scientecconsulting.com/privacy-policy)收集、使用和披露您的个人信息。
这授权我们:
- 联系您关于潜在的机会。
- 在此申请阶段不需要时删除个人数据。
所有申请将严格保密处理。只有入围的候选人会被联系。
Elane Yap Theng Yu- R1989397
ScienTec Consulting Pte Ltd - 11C5781