高级云运营工程师

旧金山 10天前全职 网络
130万 - 203.5万 / 年
在 NVIDIA,我们正在寻找一位高技能的高级运营工程师加入我们世界级的 NGC 云团队。在这个角色中,您将帮助推动支持我们全球业务运营的系统的效率、可靠性和可扩展性。这是一个塑造我们如何自动化、简化和支持整个组织关键运营工作流程的绝佳机会。您将定义我们如何实施创新的自动化和支持解决方案,使团队能够无缝运作并在全球范围内产生影响——这一切都在一个鼓励和包容的环境中。 您将要做的事情 • 推动与 NVIDIA 广泛 IT 子系统的日常互动,确保基础设施和应用程序之间的顺畅运营工作流程。 • 制作和维护 GitLab CI/CD 管道以自动化构建、测试和部署工作流程。 • 监控系统健康状况,构建/维护仪表板,创建警报并生成操作报告。 • 执行用户离职、访问审核和跨多个系统的合规相关任务。 • 驱动与各种 IT 子系统的互动,确保 API 性能和集成稳定性符合定义的服务水平协议(SLA)和服务水平目标(SLO)。 • 协调工程、运营和安全团队之间的变更和发布。 • 执行安全指南,管理漏洞修复,并与安全团队合作进行审计和评估。 • 维护文档、标准操作程序(SOP)和流程改进,以提升运营成熟度。 我们需要看到的 • 8 年以上构建/支持复杂服务的实践经验,计算机科学学士/硕士学位(或同等经验)。 • 具备用于自动化、数据处理和工具开发的 Python 知识。 • 具有监控工具的经验(如 Prometheus、Grafana、Datadog、CloudWatch、Splunk)和报告能力。 • 熟悉 ITSM 实践,包括事件、问题和变更流程。 • 能够执行安全和合规的离职及访问相关任务。 • 对 IT 运营和系统工作流程有深入理解。 • 具备核心 Java 知识 - 集合 API、流 API、并发、I/O。 • 具备 RDBMS 和 NoSQL(Cassandra、DynamoDb、Redis)数据库知识。 • 优秀的沟通能力,能够跨多个团队进行协作。 • 出色的文档、问题解决和跨团队对齐的沟通能力。 脱颖而出的方式 • 设计或实施自动化管道或内部运营工具的经验。 • 客户支持、技术支持或面向客户的工程角色的背景。 • 在安全意识强或合规要求高的环境中工作过的经历。 • 能够构建端到端监控解决方案、仪表板和自动化报告。 • 强大的文档习惯和持续改进的方法。 NVIDIA 被广泛认为是科技界最受欢迎的雇主之一,提供高度竞争的薪资和全面的福利套餐。在您规划未来时,看看我们能为您和您的家人提供什么 www.nvidiabenefits.com/ 您的基本薪资将根据您的位置、经验和类似职位员工的薪资来确定。基本薪资范围为 184,000 美元 - 287,500 美元。 您还将有资格获得股权和福利。 此职位的申请将至少接受到 2025 年 12 月 6 日。NVIDIA 致力于营造多元化的工作环境,并自豪地成为一个平等机会的雇主。我们高度重视当前和未来员工的多样性,不会基于种族、宗教、肤色、国籍、性别、性别表达、性取向、年龄、婚姻状况、退伍军人身份、残疾状态或任何其他法律保护特征进行歧视。 JR2008645