Insight Global正在寻找一位高级软件工程师(AI平台)加入一家领先的AAA游戏公司的基础设施和平台服务组织。这个团队是公司全球生态系统的支柱,支持创造卓越的游戏和沉浸式玩家体验。
AI平台团队在所有游戏系列中提供集中式AI和生成式AI功能,为数据建模、模型训练和微调、推理和代理开发提供共享基础设施和工具。该平台支持现代、云原生技术栈,旨在跨游戏开发、市场营销、销售和实时玩家体验进行扩展。
作为高级软件工程师,您将在架构和构建可扩展的生产级AI平台中发挥关键作用,该平台支持全球范围内的实时服务游戏。您将向AI平台的工程总监汇报。
主要职责
• 平台架构与开发
• 领导支持完整AI生命周期的下一代AI平台的设计和开发,包括数据摄取、特征存储、模型训练和验证、部署、监控以及实时服务游戏环境中的反馈循环。
• 架构可扩展、安全和高性能的多云平台,支持实时分析、低延迟推理和高可用性。
• 生产集成与MLOps
• 负责将AI/ML解决方案集成到实时生产游戏环境中。
• 与游戏工程师、ML工程师、数据科学家、制作人和实时运营团队紧密合作,确保可靠的部署、性能监控、回滚策略、漂移检测和生命周期管理。
• 推动端到端自动化,包括MLOps CI/CD管道、模型版本控制、A/B测试、特征管道编排和内部用户的自助工具。
• 标准、可靠性与治理
• 定义并执行平台范围内的标准,以确保可靠性、可扩展性、安全性、成本优化、可观测性和卓越运营。
• 建立与AI和ML系统行业最佳实践一致的治理实践。
• 领导力与协作
• 指导和引导初级工程师,在架构、云基础设施、可观测性和运营实时系统方面提供技术领导。
• 与游戏工作室、艺术家、数据科学、分析和实时运营团队合作,将业务和游戏挑战转化为AI平台解决方案。
• 领导可重用AI功能的概念验证和试点项目,如个性化、推荐、生成内容、玩家参与和反作弊。
• 战略影响
• 作为游戏服务优先事项与平台交付之间的桥梁。
• 将玩家体验和业务需求转化为平台功能,清晰阐述成本、延迟、风险和安全性之间的权衡,以推动跨职能对齐。
所需技能和经验
• 计算机科学、AI、ML或相关领域的硕士学位(或同等学历),并具有5年以上的专业经验:
• AI/ML系统
• 平台或基础设施开发
• 数据和分析平台
• 实时服务或实时系统
• 精通Python编程,并至少掌握一种其他语言(如Java、C++、Go)。
• 具有深度学习框架(如PyTorch)的实际经验,并在生产中接触过生成式AI技术(LLMs、扩散模型、代理系统)。
• 具有构建和操作基于云的生产级ML平台的经验。
• 熟悉主要云提供商(AWS、GCP或Azure)和云原生工具,包括:
• 基础设施即代码(Terraform、CloudFormation)
• 容器(Docker)
• 编排(Kubernetes)
• CI/CD管道
• 监控、日志记录和可观测性
• 在实时或近实时环境中部署和操作ML模型的丰富经验。
• 具备交付支持开发者生产力、治理、合规、模型监控、漂移检测和性能管理的自助平台功能的能力。
• 出色的领导和沟通能力,能够跨工程、数据科学、游戏开发、产品和运营团队进行协作,并向非技术利益相关者展示技术权衡。
优先经验
• 在实时服务游戏或大规模实时娱乐平台中工作的经验
• 构建多租户或内部SaaS平台的经验
• 在游戏中集成生成式AI的实际经验(如程序内容、对话NPC、AI代理)
• 深刻理解大规模游戏系统中的性能和延迟权衡
• 具有变更管理或支持合作团队采用AI平台的经验