我们正在寻找一名员工AI运营(AIOPS)工程师加入我们的团队!在这个角色中,您将与各级别和技术组织合作,利用您的经验应用创新的AI OPS技术和平台,以显著提高迪士尼系统、应用和基础设施的可靠性,同时为我们的运营组织提供预测和自愈能力。这个角色还将推动技术稳定性的提高,同时提高运营效率。
角色职责:
• 与多功能和IT基础设施和服务团队合作,创建标准化的运营数据模型,促进相关遥测数据的收集,从复杂数据集中获得有价值的洞察,并优化IT运营
• 设计、开发和部署AIOPS策略,增强IT基础设施监控、事件预测和自动解决能力
• 在规模上实施、维护和优化AIOPS解决方案,从各种来源高效地捕获操作、应用和基础设施的遥测数据
• 分析复杂的数据集,发现趋势、模式和异常,并应用洞察力开发主动的操作可靠性解决方案和改进IT基础设施管理
• 应用机器学习和AIOPS工具,显著减少IT运营噪声,改善关键操作事件的实时检测和预测
• 通过改进和加速根本原因分析,简化事件解决过程,从而减少解决问题所需的时间
• 设计和实施操作自动化平台,通过使用自动修复运行手册提高服务可用性
• 进行集成并开发与各种运营管理平台的完全互操作能力,包括服务管理、特权访问管理系统等
• 构建全面的文档和培训材料,以确保组织内AIOPS技术的顺利知识转移和有效使用
• 保持对AIOPS、机器学习和相关领域新趋势和进展的领先地位,以确保组织始终处于技术采用的前沿
基本要求:
• 7年以上与AIOPS技术和平台(BigPanda、MoogSoft)的工作经验和理解
• 精通IT运营遥测平台(Data Dog、New Relic、Splunk、App Dynamics)
• 对机器学习有深入的背景和理解:在大型运营数据集上开发、训练和应用机器学习模型
• 在企业IT运营环境中担任AIOPS工程师、SRE或数据科学家的经验
• 对IT可观察性和操作事件管理解决方案以及遥测数据和管理有很好的了解
• 熟练定义、实施和衡量运营服务水平指标和目标
• 对IT运营有扎实的理解,包括基础设施、网络、应用和服务
• 熟练使用数据可视化工具(R、Grafana)和编程/脚本语言(Python、R、Java)
• 计算机科学、数据科学、应用数学、人工智能、机器学习或相关领域的学士学位;或与此相当的工作经验
首选要求:
• 操作系统、虚拟化或硬件平台的技术认证
• ITIL v3认证
• IT系统、工商管理硕士学位(MBA)或技术领域的硕士学位
该职位属于迪士尼全球服务有限公司,属于我们称之为华特迪士尼公司(公司)的业务之一。
迪士尼全球服务有限公司是一个平等就业机会雇主。申请人将获得不受种族、肤色、宗教、性别、年龄、国籍、性取向、性别认同、残疾、受保护的退伍军人身份或任何其他受联邦、州或地方法律禁止的基础的考虑而获得就业机会。迪士尼倡导一个商业文化,在这个文化中,来自各个人的思想和决策帮助我们成长、创新、打造最好的故事,并在一个快速变化的世界中保持相关性。