传统网站可靠性团队在手动监控、被动故障排除和劳动密集型部署方面难以跟上步伐,这已不是什么秘密。AI的兴起提供了解决方案,但许多公司未能充分利用其潜力,导致系统性能不佳和瓶颈阻碍创新。数据显示,73%的公司在部署延迟和运营停机方面遇到困难,主要是由于过时的流程和缺乏AI驱动的自动化。
在IgniteTech,我们正通过构建以AI为先的云解决方案来正面解决这些问题,这些解决方案旨在预见和防止问题的发生。我们专注于将AI和机器学习集成到云基础设施管理的各个方面,从自动化监控系统到智能CI/CD管道。这种方法创造了不仅能自我修复而且能持续进化的环境,减少停机时间,提高性能,并推动云服务的能力边界。
这不是你典型的网站可靠性角色,在那里你需要对问题做出反应并在出现问题时手动干预。在这里,你将带头构建AI增强的监控系统,检测并解决95%的问题,防止它们到达最终用户。你还将设计和管理AI自动化的CI/CD管道,将部署时间缩短30%,同时减少人工干预。理想的候选人在AI驱动的环境中茁壮成长,对自动化优先的解决方案充满热情,并乐于挑战云基础设施设计的极限。
在这个角色中,你将加入一个重新定义云基础设施的全球创新团队。你的工作将在我们交付下一代AI驱动的卓越运营的使命中发挥关键作用。我们正在寻找对AI充满热情并准备对云服务的未来产生持久影响的人。如果这就是你,我们鼓励你申请并成为革命性的一部分。
你将要做的事情
- 实施基于AI的监控服务,以自动检测、预测和解决问题,防止其影响运营
- 管理具有AI驱动自动化的CI/CD管道,以提高部署效率并减少人工干预
你不会做的事情
- 仅专注于手动监控、故障排除和系统维护;你的目标是让AI为你完成这些工作
AI优先网站可靠性工程师的关键职责
- 实现无缝扩展性并优化AI驱动的云服务性能,确保99.99%的正常运行时间,同时提供满足客户不断变化需求的AI增强软件升级和定制
基本要求
- AI优先思维方式(如果你的本能是先编写代码,然后使用AI工具验证或增强代码,而不是相反,请不要申请)
- 至少3年的DevOps经验,包括CI/CD管道自动化和基础设施管理
- 至少2年使用Amazon Web Services(AWS)或Google Cloud Platform(GCP)的经验
- 熟练使用用于监控、自动化和预测分析的AI和机器学习工具(或强烈愿意学习和适应AI驱动的技术)
- 良好的编程和脚本技能,具有自动化任务和构建AI驱动流程的经验
关于IgniteTech
世界级人才。100%全球远程。
准备好成为IgniteTech从全球数千名申请者中精心挑选的顶尖人才的一员了吗?加入我们吧。
通过我们领先的企业软件解决方案组合,我们为全球数千客户点燃业务表现。我们坚信远程工作生活方式,这为我们的团队成员创造了自由,并使我们能够从世界各地招聘最优秀和最聪明的人才。在IgniteTech的职业生涯充满挑战且节奏快,我们始终在寻找充满活力和热情的团队成员。
我们是一个平权行动和机会均等的雇主,我们重视多样性为我们的工作场所带来的力量。