众所周知,传统的网站可靠性团队在手动监控、被动故障排除和劳动密集型部署方面难以跟上步伐。人工智能的崛起为此提供了一个解决方案,但许多公司未能充分利用其潜力,导致系统性能不佳和瓶颈抑制创新。数据显示,73%的公司面临部署延迟和操作停机的问题,主要由于过时的流程和缺乏人工智能驱动的自动化。
在 IgniteTech,我们正面临这些问题,构建以人工智能为首的云解决方案,旨在在问题出现之前预测和防止它们。我们专注于将人工智能和机器学习整合到云基础设施管理的每一个方面,从自动化监控系统到智能 CI/CD 管道。这种方法创造了不仅能够自我修复而且持续进化的环境,减少停机时间,改善性能,推动云服务的边界。
这里并不是典型的网站可靠性角色,您不会在问题出现时被动反应和手动干预。在这里,您将领导构建增强人工智能的监控系统,检测并解决 95% 的问题,确保它们在到达最终用户之前得到处理。您还将架构和管理人工智能自动化的 CI/CD 管道,将部署时间减少 30%,同时大幅减少人工干预。理想的候选人在人工智能驱动的环境中蓬勃发展,对自动化优先的解决方案充满热情,并乐于推动云基础设施设计的边界。
在这个角色中,您将加入一个全球创新团队,重新定义云基础设施。您的工作将在我们实现下一代人工智能驱动的运营卓越的使命中发挥关键作用。我们正在寻找对人工智能充满热情并准备对云服务的未来产生持久影响的人。如果您就是这样的人,我们鼓励您申请,成为这一革命性变革的一部分。
您将做的工作
• 实施基于人工智能的监控服务,自动检测、预测和解决问题,以避免对操作的影响
• 管理 CI/CD 管道,利用人工智能驱动的自动化提高部署效率,减少人工干预
您不会做的工作
• 仅专注于系统的手动监控、故障排除和维护;您的目标是让人工智能为您完成这些工作
人工智能优先的网站可靠性工程师主要职责
• 实现无缝扩展,优化人工智能驱动的云服务性能,确保 99.99% 的正常运行时间,同时提供增强人工智能的软件升级和定制,以满足客户不断变化的需求
基本要求
• 人工智能优先的思维方式(如果您的直觉是先编写代码,然后使用人工智能工具来验证或增强您的代码,而不是反过来,请不要申请)
• 2年以上的 DevOps 经验,包括 CI/CD 管道的自动化和基础设施管理
• 2年以上使用亚马逊网络服务(AWS)或谷歌云平台(GCP)的经验
• 精通用于监控、自动化和预测分析的人工智能和机器学习工具(或强烈愿意学习和适应人工智能驱动的技术)
• 较强的编程和脚本技能,具有自动化任务和构建人工智能驱动流程的经验
关于 IgniteTech
如果您想在一家能够成长并成为动态团队一部分的公司努力工作,请加入 IgniteTech!
通过我们领先的企业软件解决方案组合,我们为全球数千客户激发业务表现。我们在一个完全远程的工作场所中实现这一目标,专注于建立顶尖人才团队,并在提供具有挑战性的机会和个人灵活性的模式下运作。
在 IgniteTech 的职业生涯充满挑战且节奏快速。我们始终在寻找充满活力和热情的员工加入我们的世界级团队。
我们提供个人贡献的机会,并促进职业发展。IgniteTech 是一个积极行动的平等机会雇主,重视多样性为工作场所带来的力量。