关于职位
A1正在构建一个主动的AI系统,该系统能够理解对话中的上下文、规划行动,并随着时间的推移推进工作。
工作内容
• 构建和负责端到端的机器学习流水线,涵盖数据、训练、评估、推理和部署。
• 使用最先进的方法(如LoRA、QLoRA、SFT、DPO和蒸馏)微调和调整模型。
• 设计和操作可扩展的推理系统,平衡延迟、成本和可靠性。
• 设计和维护用于高质量合成和真实世界训练数据的数据系统。
• 与研究领导合作,实施涵盖性能、鲁棒性、安全性和偏见的评估流水线。
• 负责生产部署,包括GPU优化、内存效率、延迟减少和扩展策略。
• 与应用工程紧密合作,将机器学习系统整合到后端、移动和桌面产品中。
• 做出务实的权衡,快速推出改进,从实际使用中学习。
• 在实际生产约束下工作:延迟、成本、可靠性和安全性。
技术栈
• Python
• PyTorch / JAX
• 基于GPU的训练和推理系统
理想经验
• 你曾构建或发布过人们使用的真实机器学习系统,而不仅仅是演示。
• 你能轻松处理大型模型并理解其失败模式。
• 你编写强健的生产级代码,并关心系统的正确性。
• 你自我导向、务实,并对结果负全责。
• 你能清晰沟通,并在小型高信任团队中良好合作。
我们的工作方式
我们的组织结构非常扁平,团队规模小,动力强,专注于工程和产品卓越。所有成员都需亲力亲为,直接为公司的使命做出贡献。
面试流程
如果合适,我们会安排3次但不超过4次面试。
申请由我们的技术团队成员评估。面试将通过虚拟会议和/或现场进行。
• 我们重视透明和高效,因此会做出快速决策。如果你展示了我们所寻找的卓越技能和心态,我们将向你发出加入我们的邀请。这不仅仅是一份工作邀请,而是加入一个将AI带来全球实际利益的团队的邀请。