毫无疑问,传统的网站可靠性团队在手动监控、反应式故障排除和劳动密集型部署方面难以跟上步伐。人工智能的崛起提供了一个解决方案,但许多公司未能充分利用其潜力,导致系统性能不足和瓶颈阻碍创新。数据显示,73%的公司在部署延迟和操作停机方面面临困难,主要是由于过时的流程和缺乏人工智能驱动的自动化。
在 IgniteTech,我们正面临这些问题,构建以人工智能为首的云解决方案,旨在预见和防止问题的出现。我们专注于将人工智能和机器学习集成到云基础设施管理的每一个方面,从自动监控系统到智能 CI/CD 管道。这种方法创建了不仅能够自我修复而且不断进化的环境,减少了停机时间,提高了性能,并推动了云服务的边界。
这并不是典型的网站可靠性角色,您不会在问题出现时反应并手动干预。在这里,您将领导构建人工智能增强的监控系统,能够在问题到达最终用户之前检测和解决95%的问题。您还将设计和管理人工智能自动化的 CI/CD 管道,减少30%的部署时间,同时大幅减少手动干预。理想的候选人能够在以人工智能驱动的环境中茁壮成长,对自动化优先的解决方案充满热情,并乐于推动云基础设施设计的极限。
在这个角色中,您将加入一个重新定义云基础设施的全球创新团队。您的工作将在我们实现下一代人工智能驱动的运营卓越的使命中发挥关键作用。我们正在寻找对人工智能充满热情并准备对云服务的未来产生持久影响的人。如果您就是这样的人,我们鼓励您申请,成为革命性变革的一部分。
您将要做的事情
• 实施基于人工智能的监控服务,自动检测、预测和解决问题,确保在影响操作之前处理这些问题
• 管理 CI/CD 管道,利用人工智能驱动的自动化提高部署效率,减少手动干预
您不会做的事情
• 仅专注于系统的手动监控、故障排除和维护;您的目标是让人工智能为您完成这些工作
人工智能优先的网站可靠性工程师的关键职责
• 实现无缝可扩展性,优化人工智能驱动的云服务的性能,确保99.99%的正常运行时间,同时提供满足客户不断变化需求的人工智能增强软件升级和定制
基本要求
• 人工智能优先的心态(如果您的直觉是先编写代码,然后使用人工智能工具来验证或增强您的代码,而不是反过来,请不要申请)
• 至少3年的DevOps经验,包括CI/CD管道和基础设施管理的自动化
• 至少2年的亚马逊网络服务(AWS)或谷歌云平台(GCP)经验
• 精通用于监控、自动化和预测分析的人工智能和机器学习工具(或强烈愿意学习和适应人工智能驱动的技术)
• 强大的编程和脚本技能,具有自动化任务和构建人工智能驱动流程的经验
关于 IgniteTech
世界级人才。100%全球远程。
准备好成为 IgniteTech 从全球数千名申请者中挑选出的顶尖人才的一部分吗?来加入我们吧。
通过我们领先的企业软件解决方案组合,我们为全球数千客户激发业务绩效。我们坚信随时随地远程工作的生活方式,这为我们的团队成员创造了自由,并使我们能够从世界各地招聘最优秀的人才。在 IgniteTech 的职业生涯充满挑战和快节奏,我们始终在寻找充满活力和热情的团队成员。
我们是一个积极行动和机会均等的雇主,我们重视多样性为我们的工作场所带来的力量。