数据科学家/机器学习工程师

纽约 6天前全职 网络
面议
Sumble 知识图谱团队角色 Sumble 正在从网络数据构建一个知识图谱,首先专注于市场拓展团队的数据。我们使用职位发布和简历数据等来源来识别组织结构、技术栈和关键项目(例如,生成式 AI 项目、云迁移)。我们的产品已经具备了良好的产品市场契合度、早期收入和满意的客户,现在我们准备加速发展。 我们的长期愿景是成为获取高质量网络数据的主要目的地。我们的团队有15人,包括10名曾在谷歌、Meta、Stack Overflow 和 Kaggle 等公司工作过的工程师。 你的工作内容 • 微调小型语言模型 • 使用可扩展的方法提高现有数据的质量。例子包括:确保 URL 与正确的公司关联,我们有正确的总部地址,我们使用 LLM 验证、SERP 和跨来源三角测量等技术映射母公司-子公司关系。 • 添加新信号:这通常涉及清理、匹配和标准化新信号,并与我们现有的本体匹配 • 将解决方案推入生产环境,这可能涉及数据管道和/或后端系统的处理