平台 SRE 和可靠性工程师

阿布扎比 无个税5天前合同 网络
面议
DeepLight AI是一家专业的AI和数据咨询公司,在多个行业中拥有实施智能企业系统的丰富经验,尤其是在金融服务和银行业方面。我们的团队结合了数据科学、统计建模、AI/ML技术、工作流程自动化和系统集成方面的深厚专业知识,并对复杂的业务运营有实际理解。 平台SRE和可靠性工程师负责确保银行下一代AI和数字平台的绝对质量、弹性和性能。此角色专注于站点可靠性工程(SRE)和AI质量保证的高风险交集,设计自动化框架以验证从对话式AI代理和RAG管道到核心银行微服务的一切。通过实施稳健的持续测试管道和可靠性治理,您将确保银行的AI驱动体验在现实条件下保持安全、可扩展和确定性准确。 作为平台SRE和可靠性工程师,您的职责包括: - 构建可重用的自动化框架,以测试对话式AI平台(语音和聊天)和基于LLM的代理的准确性、稳定性、延迟和安全性。 - 验证多代理编排、人机协作升级逻辑以及RAG管道和向量搜索结果的完整性。 - 测试AI/ML平台组件的扩展行为、故障切换弹性、高可用性和灾难恢复。 - 将自动化测试管道集成到MLOps的CI/CD工作流中,专注于漂移检测、再训练验证和模型注册表完整性。 - 验证Azure AI Foundry和AWS SageMaker上的AI/ML管道,确保存储服务(S3/Blobs)和无服务器功能的数据完整性。 - 对AI服务进行负载测试,确保工程护栏的公平性、可解释性和合规性。 - 充当工程和业务之间的桥梁,将复杂的技术可靠性要求转化为可操作的质量叙述。 作为一家AI咨询公司,我们最大的资产是我们员工的专业知识。 虽然技术掌握是我们工作的基础,但能够弥合复杂数据科学与可操作的业务价值之间的差距是您在Deeplight成功的定义。 我们正在寻找不仅在其专业领域内是世界级的人才,而且是引人注目的沟通者和自己技能的有力倡导者。 您将成为我们公司的代表,负责建立信任,阐明您技术决策背后的“原因”,并有效地向高层利益相关者“推销”您的愿景。 如果您在展示尖端解决方案的挑战中茁壮成长,就像在构建它们时一样,您将非常适合这个角色。 要求 为了在这个角色中取得成功,我们需要您具备: - 计算机科学、AI、软件工程或相关定量领域的学士学位。高度优先考虑AI/ML的硕士学位。 - 在QA、应用测试或可靠性工程方面有5年以上经验,理想情况下是在大型品牌或数字银行。 - 在金融服务领域内企业规模部署AI/ML QA解决方案的成功记录。 - 测试分布式架构、微服务和大规模数据平台(向量数据库、数据湖)的经验。 - 精通基于Python的自动化框架和工具,如Selenium、Playwright、PyTest、JMeter和Locust。 - 深刻理解LLM评估框架、提示稳定性测试和幻觉避免验证。 - 在Azure和AWS云环境中测试和验证服务的实际经验。 - 强大的SQL/NoSQL验证技能(Postgres、MongoDB)和测试REST、GraphQL和FastAPI集成的经验。 - 熟练在Docker和Kubernetes(EKS/AKS)环境中进行测试。 如果您还具备以下能力,将会有益: - 评估和采用AI框架的新兴QA工具,如LangChain、CrewAI和Bedrock的能力。 - 理解尖端质量趋势,包括多模态QA和RLHF(人类反馈强化学习)输出评估。 - 积极识别可能影响银行合规性或客户体验的AI代理边缘案例的能力。 - 强大的能力与不同的功能团队协调以实施模型并监控结果。 福利 福利与成长机会: - 具有竞争力的薪资。 - 为成功的个人提供签证赞助。 - 为成功的个人提供全面的健康保险。 - 职业发展和认证支持。 - 参与尖端AI项目的机会。 - 在快速增长的AI公司中获得职业晋升机会。 这个职位提供了一个独特的机会,可以在与一支处于技术创新前沿的专业团队合作的同时塑造AI实施的未来。成功的候选人将在推动我们公司成功交付变革性AI解决方案给客户方面发挥关键作用。 在DeepLight AI,我们认识到多样性推动创新。我们致力于营造一个包容的环境,让具有不同思维风格的个人能够茁壮成长,并将他们独特的优势贡献给我们的专业AI和数据解决方案。 我们的目标是确保我们的申请和面试过程对所有候选人都是可访问的、可预测的和公平的。 如果您在申请过程中需要任何特定调整,或者如果您在进入面试阶段后需要任何合理调整,请告知我们。此信息将被严格保密,不会影响招聘决策。