我们的客户正在寻找一位高水平的机器学习工程师,以弥合模型开发与大规模生产之间的差距。作为全球Agentic AI计划的一部分,您将负责AI的“工业化”。您的任务是构建稳健且可扩展的管道,使我们的LLM和ML模型能够在全球数千家商店和数字接触点上可靠运行。
主要职责:
- 将ML/LLM模型容器化并部署到公司AI生态系统中,确保其性能和资源效率得到优化。
- 构建和维护端到端的MLOps工作流程,包括持续集成、持续部署和持续训练,以防止模型衰退。
- 管理容器编排(例如,Kubernetes)和云原生模式,以支持高并发应用程序。
- 实施稳健的监控以检测模型漂移、数据质量和系统健康状况,确保快速事件响应和恢复。
- 将AI应用逻辑与下游零售系统(POS、库存、CRM)和前端生成UI组件对齐。
要求:
- 计算机科学、数学、工程或相关领域的学士或硕士学位。
- 3年以上人工智能、机器学习工程、DevOps或模型部署的专业经验。
- 拥有分布式系统和生产级性能调优的实际经验。
- 具备LangGraph或类似框架的知识,深入了解如何测试和扩展代理循环。
- 精通Docker和Kubernetes,具有云原生部署模式的经验,用于编排大规模AI服务。
- 高水平的Python编码能力,专注于服务设计、并发性和故障处理。
- 专业的英语流利程度。会粤语或普通话者优先。