我们的公司
Pax Historia 正在利用生成式人工智能的最新进展定义一种新的游戏玩法类别。我们的平台结合了大型策略游戏的深度和沙盒体验的创造自由,由一个充满热情的社区推动,该社区在我们的平台上创建和重混场景。
我们的社区每天发布数百个场景,每周进行数百万次游戏,并且正在快速增长。此外,我们得到了 Y Combinator、Pace Capital 和 Z Fellows 的支持。您的工作将立即应用于一个由数十万玩家使用的产品。
职位描述
我们正在招聘一名创始级别的机器学习系统工程师,全职在旧金山(Dogpatch)现场工作。您将直接向联合创始人汇报。
我们当前的状况:
- 最新的闭源模型在我们的游戏中表现出相当好的质量,但它们非常昂贵。
- 开源模型更为经济,但由于在我们平台上的表现较差,几乎从未被用户选择。
- 提示和工具在模型之间基本相同。
- 一个可用的内部评估系统(有很大的改进空间)
您的工作内容:
- 构建和运行基础设施,以严格定制每个 AI 模型的工具和提示,以最大限度地提高性能。
- 训练特定领域的模型,以缩小甚至消除开源和闭源模型在 Pax 游戏中的差距。
- 通过优化缓存策略来降低与闭源模型相关的成本。
- 通过训练调整的端点进一步提高闭源模型的性能。
- 在我们使用嵌入和重排序器的地方进行评估和改进。
- 基于即将推出的世界模型,启用全新的用户体验。
总结:您的工作将直接使游戏更具经济性和趣味性。
您将拥有的资源:
- 数万亿个来自数百万游戏轨迹的提示和响应日志。
- 每天数万次用户偏好投票(即将推出,配对算法想法在此描述)
- 慷慨的计算资源访问(目前有六位数预算,如果结果有希望,可达到七位数)
- 与许多在大规模推理上不断突破的团队的联系点(Chutes、OpenRouter、CanopyWave 等)
绩效衡量标准:
- 虽然我们理解结果可能需要几个月才能显现,但您的北极星指标将是提高用户偏好胜率,相对于相同推理预算的现成选项。
这是一个强度很大的职位,您应该预期在最初几个月每周工作 50-60 小时;之后,工作时间可能会开始减少。我们可能会有一些灵活性(例如,每周 1 天混合工作),但我们强烈倾向于能够承诺现场工作的候选人。
文化
我们的大多数玩家是通过自然途径(朋友、YouTube 评论)发现 Pax Historia 的,并且一直坚持下来,因为我们真正关心我们正在构建的游戏。这就是为什么我们希望每一位员工也能深切关心我们的产品。历史、幻想或科幻迷尤其受欢迎,但如果您能清楚地说明为什么您对我们的游戏感到兴奋,我们很乐意听到您的声音。
Pax Historia 仍然是一家非常小的公司,因此您将直接与联合创始人和其他几名员工一起工作。您应该是自我驱动的团队合作者,并愿意为您的想法辩护。联合创始人不会手把手指导:他们的领导策略是“让员工发挥最佳工作能力”。
最后,灵活性也非常重要。由于我们正在快速扩展并且仍在与一个小团队合作,您应该愿意在工作中即兴解决各种问题。
您的资格
核心能力:
- 您已经向真实用户交付了机器学习系统并在生产中操作它们。
- 您在已部署系统中进行了明确的成本/质量权衡。
- 您已经调试并修复了生产中意外的模型故障(例如,专家热点、结构化输出错误等)。
- 您设计、批评或迭代过评估框架,并了解其失败模式。
产品与责任心态:
- 您倾向于杠杆和复合改进(更好的评估、更好的反馈循环、更好的基础设施)。
- 您愿意处理“无聊”但重要的问题,如仪器、数据卫生、调试和可靠性。
- 您对问题负责,并愿意为您的想法辩护(同时保持开放态度)。
- 您知道何时对自己和我们说“不”,当某事不值得复杂性或风险时。
加分项:
- 偏好建模、成对排名或人机交互评估系统的经验。
- 在游戏、模拟、叙事系统或其他定性判断重要的领域有背景。
- 在高请求量下操作系统的经验。
- 在早期创业公司或作为创始工程师的工作经验。
我们不要求:
- 特定学位、学术背景或出版记录。
- 之前的游戏行业经验。
- 对上述每种技术的完美了解。
薪酬
薪资范围为 $150,000 至 $240,000,具体取决于您的相关资格和经验。对于真正优秀的匹配(高级/员工级别),我们可能愿意超出公布的范围。
入选候选人可期望获得 0.25% - 1+% 的股权。归属计划为 12 个月悬崖期和 4 年月度归属。我们还将提供不匹配的 401k 计划。
该职位是 W-2 员工机会。我们目前无法赞助签证(除 O1 外)。Pax Historia 是一个平等机会的雇主,不会因种族、肤色、宗教、性别、性别认同或表达、性取向、国籍、年龄、残疾或退伍军人身份而歧视。