传统的站点可靠性团队在手动监控、反应式故障排除和劳动密集型部署方面难以跟上节奏,这已经不是什么秘密。人工智能的崛起提供了解决方案,但许多公司未能充分利用其潜力,导致系统性能不足和阻碍创新的瓶颈。数据显示,73%的公司在部署延迟和运营停机方面面临困扰,主要是由于过时的流程和缺乏基于人工智能的自动化。
在 IgniteTech,我们正面临这些问题,构建以人工智能为首的云解决方案,旨在在问题出现之前进行预测和预防。我们专注于将人工智能和机器学习整合到云基础设施管理的各个方面,从自动监控系统到智能 CI/CD 管道。这种方法创造了不仅能自我修复而且持续进化的环境,减少停机时间,提高性能,推动云服务的边界。
这不是你典型的站点可靠性角色,你不会仅仅是对问题做出反应并在出现故障时进行手动干预。在这里,你将带头构建增强人工智能的监控系统,能够在问题到达最终用户之前检测和解决95%的问题。你还将设计和管理人工智能自动化的 CI/CD 管道,减少30%的部署时间,同时减少手动干预。理想的候选人能够在以人工智能驱动的环境中蓬勃发展,对自动化优先的解决方案感到兴奋,并乐于推动云基础设施设计的边界。
在这个角色中,你将加入一个全球创新者团队,重新定义云基础设施。你的工作将在我们实现下一代、以人工智能驱动的卓越运营的使命中发挥关键作用。我们正在寻找对人工智能充满热情的人,准备对云服务的未来产生持久影响。如果你就是这样的人,我们鼓励你申请,成为革命性变革的一部分。
你将要做的事情
• 实施基于人工智能的监控服务,自动检测、预测和解决问题,以防其影响运营
• 管理具有人工智能驱动自动化的 CI/CD 管道,以提高部署效率并减少手动干预
你不会做的事情
• 仅专注于系统的手动监控、故障排除和维护;你的目标是让人工智能为你做这些事情
人工智能优先的站点可靠性工程师的主要职责
• 实现无缝扩展并优化人工智能驱动的云服务的性能,确保99.99%的正常运行时间,同时提供符合客户不断变化需求的人工智能增强软件升级和定制
基本要求
• 人工智能优先的思维方式(如果你的直觉是先编写代码,然后使用人工智能工具验证或增强你的代码,而不是反过来,请不要申请)
• 至少3年的DevOps经验,包括CI/CD管道和基础设施管理的自动化
• 至少2年的亚马逊网络服务(AWS)或谷歌云平台(GCP)经验
• 精通用于监控、自动化和预测分析的人工智能和机器学习工具(或强烈愿意学习和适应以人工智能驱动的技术)
• 强大的编程和脚本技能,具有自动化任务和构建以人工智能驱动的流程的经验
关于 IgniteTech
世界级人才。100%全球远程。
准备成为 IgniteTech 从全球数千名申请者中挑选出的顶尖人才的一部分吗?快来加入我们。
通过我们领先的企业软件解决方案组合,我们为全球数千名客户点燃商业表现。我们坚信远程工作生活方式,给我们的团队成员带来了自由,使我们能够从世界各地招聘最优秀的人才。在 IgniteTech 的职业生涯充满挑战且节奏快速,我们始终在寻找充满活力和热情的团队成员。
我们是一个平权行动和机会均等的雇主,重视多样性为我们的工作场所带来的力量。