角色:视觉 AI 工程师
地点:新加坡
雇佣类型:全职
关于该角色
我们正在寻找一位视觉 AI 工程师,帮助构建由现代视觉语言模型驱动的下一代视频智能系统。您将参与整个视频理解技术栈的工作——结合多模态基础模型与成熟的分析方法,提供可靠的、可投入生产的 AI 解决方案。
主要职责
- 使用视觉语言模型构建端到端视频分析管道。
- 微调和调整基础模型以实现特定领域的视频理解。
- 将 VLM 推理与传统视频分析组件集成。
- 开发和维护视频和多模态数据的推理管道。
- 部署和优化模型以实现可扩展的高性能生产使用。
- 诊断模型问题,加强系统的稳定性和鲁棒性。
- 与产品和工程团队合作,提供 AI 驱动的功能。
必备资格
- 在计算机视觉、视频分析或 AI 工程方面有扎实的背景。
- 在视觉语言和视频语言架构方面有实际经验。
- 具备微调、评估和部署深度学习模型的实践经验。
- 熟悉基础模型,如基于 CLIP 的架构、BLIP/BLIP-2 和开源 VLM(如 Qwen-VL、InternVL)。
- 精通 Python 和深度学习框架(如 PyTorch)。
- 对 CNN、Transformer 和注意力机制有深刻理解。
- 具有模型优化技术经验(量化、批处理、内存策略)。
- 具备在 Docker、云平台或本地 GPU 系统上部署模型的经验。
优先资格
- 拥有计算机视觉、机器学习、AI 或相关领域的硕士或博士学位。
- 具有实时或近实时视频分析经验。
- 熟悉传统 VA 方法(检测、跟踪、运动分析)。
- 接触过 MLOps 工作流(版本控制、CI/CD、监控)。
- 对现代 VLM 和视频理解研究感兴趣。
我们提供
- 参与尖端多模态 AI 技术的机会。
- 负责生产规模的视频智能管道。
- 融合研究与工程的协作环境。