角色：视觉 AI 工程师地点：新加坡雇佣类型：全职关于该角色我们正在寻找一位视觉 AI 工程师，帮助构建由现代视觉语言模型驱动的下一代视频智能系统。您将参与整个视频理解技术栈的工作——结合多模态基础模型与成熟的分析方法，提供可靠的、可投入生产的 AI 解决方案。主要职责 - 使用视觉语言模型构建端到端视频分析管道。 - 微调和调整基础模型以实现特定领域的视频理解。 - 将 VLM 推理与传统视频分析组件集成。 - 开发和维护视频和多模态数据的推理管道。 - 部署和优化模型以实现可扩展的高性能生产使用。 - 诊断模型问题，加强系统的稳定性和鲁棒性。 - 与产品和工程团队合作，提供 AI 驱动的功能。必备资格 - 在计算机视觉、视频分析或 AI 工程方面有扎实的背景。 - 在视觉语言和视频语言架构方面有实际经验。 - 具备微调、评估和部署深度学习模型的实践经验。 - 熟悉基础模型，如基于 CLIP 的架构、BLIP/BLIP-2 和开源 VLM（如 Qwen-VL、InternVL）。 - 精通 Python 和深度学习框架（如 PyTorch）。 - 对 CNN、Transformer 和注意力机制有深刻理解。 - 具有模型优化技术经验（量化、批处理、内存策略）。 - 具备在 Docker、云平台或本地 GPU 系统上部署模型的经验。优先资格 - 拥有计算机视觉、机器学习、AI 或相关领域的硕士或博士学位。 - 具有实时或近实时视频分析经验。 - 熟悉传统 VA 方法（检测、跟踪、运动分析）。 - 接触过 MLOps 工作流（版本控制、CI/CD、监控）。 - 对现代 VLM 和视频理解研究感兴趣。我们提供 - 参与尖端多模态 AI 技术的机会。 - 负责生产规模的视频智能管道。 - 融合研究与工程的协作环境。

视觉AI工程师

ST Engineering Group