要求
- 该职位需要在计算机视觉、实时系统和搜索基础设施方面具有丰富的专业知识,重点是将视觉数据转化为可操作的空间智能。
- 计算机科学、机器人学、电气工程或相关领域的硕士或博士学位。
- 在计算机视觉、图像检索或感知系统方面有5年以上的行业经验。
- 在使用多摄像头输入进行目标检测、跟踪和场景理解方面有扎实的背景。
- 深刻理解基于向量的检索系统,并具备使用OpenSearch、FAISS或类似工具的经验。
- 精通Python或C++,并具有PyTorch、TensorFlow和OpenCV的实际操作经验。
- 具有构建大规模图像检索管道的经验,包括特征提取、索引和搜索优化。
- 了解多视角几何和跨摄像头身份关联。
- 具有使用上下文和多模态信号评估和调整重排序策略的经验。
- 接触过基于云的搜索系统部署(例如,OpenSearch集群调优、分片、复制)。
- 具有感知管道的边缘部署经验(例如,Jetson、Qualcomm)。
- 在视觉搜索、本地化或多摄像头感知领域有发表论文或专利。
工作内容
- 我们正在寻找一位高级机器学习应用工程师,负责开发先进的多摄像头感知和定位系统,重点整合基于图像的搜索、向量数据库集成和重排序策略。
- 你将设计和构建算法,将目标跟踪、场景理解和跨摄像头推理与可扩展的检索系统结合起来,以支持大规模部署中的高精度定位和视觉匹配。
- 设计和实现多摄像头目标检测、分类和持续跟踪的算法。
- 构建场景理解模块,从图像流中提取地标、空间布局和语义上下文。
- 开发跨摄像头融合和定位方法,以实现对象的一致识别和定位。
- 使用向量数据库(例如,OpenSearch、FAISS、Milvus)架构和部署视觉搜索系统,用于基于图像的检索和匹配。
- 设计和实现重排序技术,以根据上下文、元数据和场景线索提高检索精度。
- 创建工具和指标来评估检索质量、定位精度和感知鲁棒性。
- 与机器学习、后端和基础设施团队合作,确保可扩展的实时部署。
- 调查系统级问题,推动调试工作,并提高模型和系统性能。
- 指导初级工程师,并为感知、定位和图像检索的长期愿景做出贡献。