职位概述: 我们正在寻找一位首席数据科学家,领导我们的机器学习机器人团队,通过训练能够理解游戏状态并据此做出决策的代理,创造引人入胜的玩家体验。 • 使用强化学习和模仿学习方法(如行为克隆和逆向强化学习)为多个游戏制定建模策略。 • 设计并实施混合系统,将学习到的策略与基于规则的脚本组件相结合,确保自主代理在真实玩家环境中的安全性、公平性和可信赖性。