云开发运维工程师/高级可靠性工程师

洛杉矶 3天前全职 网络
992 - 1.3K / 年
申请类型: 常规 当前必须具备的安全许可级别: 无 必须能够获得的安全许可级别: 无 公共信任/其他要求: BI Full 6C (T4) 职位类别: 软件工程 职位资格: 技能: 云开发、云DevOps、DevSecOps 认证: 无 经验: 5年以上相关经验 是否要求美国公民身份: 否 职位描述: 成为云DevOps工程师/高级可靠性工程师,确保任务不被中断。在GDIT,我们通过云解决方案提供清晰度并提供有意义的工作。您的工作将是将我们的客户转变为现代化并帮助他们面对任何障碍的重要组成部分。 案件管理现代化(CMM)计划是一项支持美国法院行政办公室(AO)开发现代云解决方案以支持美国各地204多个联邦法院的倡议。云DevOps工程师/高级可靠性工程师将作为敏捷开发团队的一部分,构建和支持企业级软件应用程序的现代化。 职责: • 确保支持多个敏捷团队的生产和开发环境中云托管系统的操作稳定性、可用性、性能和可扩展性 • 提供基础设施和应用程序在所有云层(操作系统、应用程序、数据库)的实时监控、警报、事件响应和健康检查 • 使用本地CSP工具实施和维护系统健康、事件管理和成本优化的仪表板、可视化和报告 • 管理云资源阈值并自动化容量规划、预测和资源优化策略 • 执行事件和事件管理(SIEM)操作,并支持问题诊断、解决和报告,包括RCA文档 • 跟踪、记录和报告每月问题,包括系统性能、稳定性、工单量和解决时间指标 • 监控所有已部署的虚拟机、容器和PaaS组件的资源利用率(CPU、内存、磁盘空间) • 参与实施企业FinOps框架,包括预测、预算控制和适当规模分析 • 支持部署自动化,并通过基础设施即代码(IaC)确保系统具有弹性、可重复和可扩展性 • 将操作与DevSecOps、MLOps和CI/CD管道集成,实现无缝部署和管理 • 执行每日或商定频率的系统健康检查,并维护操作Runbooks和SOPs 所需经验和资格: • 需要技术培训、证书或学位。强烈推荐学士学位 • 5年以上IT系统工程、系统开发、系统编码和编程经验 • 深入掌握AWS服务,包括监控、日志记录、计算、存储和网络 • 熟练使用基础设施即代码(IaC)工具,如Terraform、AWS CloudFormation • 拥有监控和APM工具的实际经验,如CloudWatch、Datadog、Prometheus、Grafana、New Relic等 • 对事件响应、变更管理和基于ITIL的操作支持有扎实的理解 • 熟悉CI/CD工具链和自动化平台(Jenkins、GitHub Actions、GitLab、ArgoCD) • 具备强大的脚本编写技能(Python、PowerShell、Bash)用于自动化和编排 • 在使用GitOps或类似工具实施DevSecOps方面有高级经验 • 具备开发、测试和维护容器化应用程序的经验 • 对大型企业中由大量复杂应用程序组成的软件构建过程的源版本控制、构建/发布工具和方法有专家级知识 • 具备云平台内的FinOps实践、成本建模、预测和优化工具的经验 • 理解联邦合规和安全框架(如FedRAMP、NIST、JISF Rev 5) GDIT是您的地方: • 公司匹配的401K • 综合健康和保健套餐 • 内部流动团队致力于帮助您掌控职业生涯 • 包括带薪教育和认证的专业成长机会 • 通过带薪假期和假日休息和充电 该职位的可能薪资范围为$123,250 - $166,750。然而,这并不是薪酬或工资的保证。相反,薪资将根据经验、地理位置和可能的合同要求设定,并可能超出此范围。 每周计划工作小时数: 40 需要出差: 少于10% 远程办公选项: 远程 工作地点: 任何地点/远程 其他工作地点: GDIT的全面奖励: 我们为所有美国员工提供的福利套餐包括各种医疗计划选项,其中一些带有健康储蓄账户、牙科计划选项、视力计划和401(k)计划,提供在IRS年度限制内以税前和税后美元贡献并获得公司匹配的能力。为了鼓励工作/生活平衡,GDIT在可能的情况下为员工提供完全灵活的工作周和各种带薪休假计划,包括假期、病假和个人时间、假日、带薪育儿、军事、丧亲和陪审团假。GDIT通常为新员工每年提供15天的带薪休假,用于度假、个人事务和疾病,以及每年额外的10个带薪假日。带薪休假和带薪假日根据员工的入职日期按比例分配。GDIT带薪家庭假计划在滚动的12个月内为符合条件的员工提供最多160小时的带薪假。为了确保我们的员工能够保护他们的收入,还提供或可用短期和长期残疾福利、生命、意外死亡和伤残、个人事故、重大疾病和商务旅行及事故保险。我们定期审查我们的全面奖励套餐,以确保我们的产品具有竞争力,并反映出我们的员工告诉我们他们最重视的内容。 我们是GDIT。一家全球技术和专业服务公司,为美国政府、国防和情报界的每个主要机构提供咨询、技术和任务服务。我们的30,000名专家利用技术的力量创造即时价值,并在创新的前沿提供解决方案。我们在全球50个国家开展业务,提供数字现代化、AI/ML、云、网络和应用程序开发方面的领先能力。与我们的客户一起,我们努力通过利用深厚的专业知识和先进技术创造一个更安全、更智能的世界。 加入我们的人才社区,随时了解我们的职业机会和活动,请访问 gdit.com/tc。 平等机会雇主/残疾人/受保护的退伍军人 原始职位云DevOps工程师/高级可靠性工程师发布在GrabJobs ©。如需举报此职位的任何问题,请使用GrabJobs上的报告职位按钮。