首席 MLOps/GenAI 基础设施工程师

伦敦 11天前全职 网络
面议
hackajob 正在与 BBC 合作,为此职位寻找杰出的技术专业人才。 职位详情 • 职位名称:首席 MLOps 工程师 • 工作地点:伦敦 / 萨尔福德 / 格拉斯哥 / 纽卡斯尔 / 卡迪夫(这是一个混合职位,成功的候选人将平衡办公室工作与在家工作) • 职级:D • 薪资:最高 £76,700 - £87,600(该职位的预期薪资范围反映了内部基准和外部市场见解。) • 申请截止日期:2025年6月22日(星期日)23:59 我们乐意讨论灵活工作。请在申请时的灵活工作问题中表明您的偏好。在申请阶段没有义务提出这一点,但如果您希望这样做,欢迎您提出。灵活工作将是录用阶段讨论的一部分。 职位目的 加入 BBC 的世界,成为英国最具标志性和受人喜爱的品牌之一,在这里,每个工作日都是独特而有价值的。随着时间的推移,我们的内容每天都能触及全球数百万人,这得益于我们一流的软件工程团队。他们在开创创新产品和独特功能方面发挥了重要作用,使我们在行业中处于领先地位。我们不仅适应不断变化的世界 - 我们引领潮流。 在这个角色中,您将处于一个激动人心的旅程的核心,打造最先进和变革性的工具和模式。我们是催化剂,使尖端的机器学习和人工智能技术的创造和协作成为可能。我们的工作在塑造 BBC 的未来中至关重要,赋能组织内的团队探索、创新并重新定义媒体的格局。我们的团队正在构建新的工具和能力,以加速数据科学活动和 ML/GenAI 应用程序的开发。我们使 BBC 各团队能够以规模化的方式构建、协作、管理和维护他们的机器学习平台。 您将在推动我们建立卓越软件工程团队、环境和文化的雄心中发挥关键作用。我们正在寻找一位首席工程师加入我们的技术社区,推动这一转型,利用令人兴奋的技术构建现代数字生态系统,并实现职业生涯中最好的工作。 您的主要职责和影响 • 领导设计、开发和演变强大的工具和平台,以支持组织内可扩展的数据科学、MLOps 和 LLMOps 工作流。 • 驱动策略和执行,使用 Amazon SageMaker、Bedrock 和相关服务在实时和批处理环境中部署、服务和监控大型语言模型(LLMs)。 • 指导使用基础设施即代码(IaC)实践,利用 AWS CDK 和 CloudFormation 来配置和管理安全且可维护的云环境。 • 使用 GitHub Actions、AWS CodePipeline、Jenkins 和其他工具设计和支持 CI/CD 流水线,强调可靠性、可重用性和性能。 • 参与设计和集成监控和可观察性解决方案(CloudWatch、Prometheus、Grafana),以确保基础设施和模型的健康。 • 通过测试驱动开发(TDD)、严格的测试自动化和持续质量保证实践,倡导软件工程卓越。 • 支持可扩展和可维护系统的架构决策,与工程和产品利益相关者合作,以符合业务和技术目标。 • 与架构师、产品领导和利益相关者合作,塑造长期技术愿景和系统架构。 • 在软件开发生命周期中使用 AWS 原生工具和 DevSecOps 原则,应用并倡导安全最佳实践。 • 通过指导、知识分享和思想领导,培养高绩效的工程文化,进行深入探讨、内部技术交流和跨团队合作。 您的技能和经验 • 在 DevOps/MLOps 角色中拥有丰富经验,能够在云原生环境中构建、扩展和保护 ML/AI 基础设施,取得显著成果。 • 对 AWS 服务(如 SageMaker、Bedrock、S3、EC2、Lambda、IAM、VPC、ECS/EKS)有深入经验,熟悉云解决方案架构。 • 在生产环境中熟练掌握基础设施即代码实践,使用 AWS CDK、CloudFormation 或 Terraform。 • 拥有设计和运营端到端 MLOps 流水线的成功记录,使用 MLflow、SageMaker Pipelines 或等效框架。 • 在使用 Docker 和 Kubernetes 构建和操作容器化应用程序方面有丰富经验,包括生产级编排和监控。 • 深入了解 CI/CD 最佳实践,具备 GitHub Actions、Jenkins 和 GitOps 工作流的实际经验。 • 对高级 DevOps 概念有深入了解,包括渐进式交付策略(蓝绿、金丝雀)、弹性工程和性能优化。 • 深刻理解云安全、治理和合规,能够定义和实施可扩展的安全框架。 • 具备推动跨职能技术倡议的能力,能够在没有权威的情况下影响他人,并通过合作和对齐取得成果。 • 深入理解机器学习生命周期,具有在生产中部署和管理 LLM 和生成 AI 模型的实际经验。 优先资格 • 计算机科学、工程或相关技术领域的学士或硕士学位。 • 行业认可的认证,如 AWS 认证 DevOps 工程师、AWS 机器学习专业或 AWS 解决方案架构师 - 专业。 • 良好的书面和口头沟通能力,具备在多个团队或业务单元中影响技术方向的经验。 • 积极参与开源 MLOps、GenAI 或 DevOps 项目和社区。 • 具有指导他人、以身作则和促进技术卓越文化的经验。