LLM 应用数据科学家(RAG/NLP)| 香港,香港特别行政区

香港 2天前全职 网络
面议
LLM应用数据科学家(RAG/NLP) Binance是全球领先的区块链生态系统,背后是全球交易量和注册用户最多的加密货币交易所。我们因行业领先的安全性、用户资金透明度、交易引擎速度、深度流动性以及无与伦比的数字资产产品组合而受到100多个国家超过2.8亿人的信任。Binance的产品范围从交易和金融到教育、研究、支付、机构服务、Web3功能等。我们利用数字资产和区块链的力量,构建一个包容的金融生态系统,以推进货币自由并改善全球人们的金融获取。 关于该职位 我们正在寻找一位高技能的研究科学家/工程师,以提升大型基础模型的推理和规划能力。在这个角色中,您将通过数据获取、监督微调(SFT)、奖励建模和强化学习等整个开发生命周期来提升模型性能,同时推动推理和决策创新。您将通过重写、增强和生成技术合成大规模、高质量的数据集,以在预训练、SFT和RL阶段加强基础模型。该角色的一个关键部分是使用系统2思维解决复杂任务,并应用高级解码策略,如MCTS和A*。您将设计和实施稳健的评估方法,教会模型与外部工具、API和代码解释器进行交互,并构建能够解决复杂现实问题的代理和多代理系统。 职责 • 设计、开发和优化企业级生成任务和模式训练应用的数据处理和检索管道(客户服务、代币报告、Web3领域模型)。这包括嵌入、重新排序、上下文工程和查询重写模型。 • 研究和评估先进的AI原生检索算法(例如,低延迟、多模态检索、分层检索、GraphRAG),以加强Binance产品中的大规模LLM/VLM/Agentic AI能力。 • 与基础设施和应用团队合作,将RAG管道集成到生产系统中,确保可扩展性、可靠性和可衡量的业务影响。 • 开发和优化检索和排序管道(索引、向量搜索、检索评分、重新排序),以改善用户体验。 • 参与LLM培训和RAG系统,跟踪预训练、SFT和强化学习等技术,并将其应用于检索和生成任务。 • 应用NLP、CV和多模态方法分析用户生成内容(分类、质量评估、趋势检测、评论分析)。 要求 • 信息检索、NLP、机器学习、计算机视觉、多模态学习或相关领域的硕士学位。 • 精通PyTorch,具有Python或C++的强大编码能力。 • 强大的沟通能力、智力好奇心和终身学习的热情。能够识别机会并将尖端的检索和RAG技术应用于现实世界的应用。 • 在信息检索、NLP和深度学习方面具有扎实的理论基础(有嵌入、重新排序、查询理解经验者优先)。 • 具有RAG、向量数据库、多模态/图检索或大规模AI系统的实际经验。 • 强大的工程能力,将研究转化为可扩展的生产级系统。 • 自我驱动,能够独立完成项目(设计-实施-部署)。 • 在顶级会议/期刊(NeurIPS、ICML、ACL、CVPR、SIGIR、KDD、WWW)发表论文者优先;在ACM/ICPC或类似竞赛中获奖者优先。 为什么选择Binance • 与全球领先的区块链生态系统一起塑造未来 • 在以用户为中心的全球组织中与世界级人才合作,结构扁平 • 在创新环境中以自主方式处理独特、快速的项目 • 在以结果为导向的工作场所中茁壮成长,拥有职业发展和持续学习的机会 • 具有竞争力的薪资和公司福利 • 居家办公安排(安排可能因业务团队的工作性质而异) Binance致力于成为一个平等机会的雇主。我们相信拥有多元化的员工队伍是我们成功的基础。 通过提交工作申请,您确认您已阅读并同意我们的候选人隐私声明。 为什么选择Binance • 与全球领先的区块链生态系统一起塑造未来 • 在以用户为中心的全球组织中与世界级人才合作,结构扁平 • 在创新环境中以自主方式处理独特、快速的项目 • 在以结果为导向的工作场所中茁壮成长,拥有职业发展和持续学习的机会 • 具有竞争力的薪资和公司福利 • 居家办公安排(安排可能因业务团队的工作性质而异) Binance致力于成为一个平等机会的雇主。我们相信拥有多元化的员工队伍是我们成功的基础。 通过提交工作申请,您确认您已阅读并同意我们的候选人隐私声明。 我们可能会使用人工智能(AI)工具来支持招聘过程的部分环节,例如审查申请、分析简历或评估响应。这些工具协助我们的招聘团队,但不取代人工判断。最终的招聘决定由人类做出。如果您想了解更多关于您的数据如何处理的信息,请联系我们。