• 职位名称:人工智能/机器学习工程师 (DevOps | MLOps | 5000-7000 新加坡元 | 政府)
• 工作周期:24 个月
• 工作地点:武吉美拉中央 / 地铁路
• 薪资:5000-7000 + AWS + 绩效奖金
• 资格:仅限新加坡公民
职责
• 人工智能产品和人工智能驱动的后端服务的开发与部署:
• 设计和开发可重用和可扩展的后端 API 服务,以支持业务用例(例如:OCR、文档解析、嵌入模型 API)的人工智能功能
• 在容器化环境中使用工具(如 Kubernetes,优先考虑 Redhat OCP 和 vLLM)部署和管理大规模 LLM(例如:LLaMA、Mistral、基于 GPT 的模型),并集成到 RESTful 或 gRPC API 端点
• 使用 MLOps 框架(如 MLflow、Kubeflow)或企业人工智能/机器学习工具(如 Dataiku)打包、版本控制、文档化和部署人工智能/机器学习模型/服务。
推理优化
• 使用模型量化、张量并行、低级优化库(例如:TensorRT、ONNX Runtime、DeepSpeed)调整推理性能
• 实现动态批处理和请求复用,以实现低延迟、高吞吐量的服务
• 对模型推理工作负载进行分析和监控,以识别并消除性能瓶颈。
人工智能基础设施管理
• 设计和管理可扩展的 GPU/加速器基础设施(本地)以支持人工智能训练和推理工作负载
• 使用工具(如 Redhat OCP)维护高效的 GPU 作业调度
安全与合规
• 在人工智能部署生命周期中嵌入安全性,包括模型验证、镜像签名、运行时保护和 API 安全
• 确保基础设施符合企业安全标准(例如:NIST、ISO 27001)
• 与安全和合规团队合作,进行威胁建模和安全部署评估。
资格
• 计算机科学、数学、统计学或相关领域的学士或硕士学位
• 5 年以上的 DevOps、MLOps 经验,其中 2 年以上专注于人工智能/机器学习系统
• 对人工智能/MLOps 实践和工具有深入理解
• 在生产环境中部署和优化 LLM 或基于变换器的模型的实践经验
• 精通容器技术(优先考虑 Redhat OCP)
• 具备较强的脚本编写和自动化技能(Python、Bash 等)
• 熟悉推理优化技术(量化、批处理、并行性)
• 对 GPU 基础设施和性能调优有扎实理解
• 深入了解安全软件开发实践和 DevSecOps 工具
----------------
通过提交您的简历或个人数据,您同意 BGC Group Pte Ltd 收集、使用和披露您的个人数据,以便评估您对工作机会和相关招聘服务的适合性。您确认您已阅读、理解并同意我们的求职者隐私政策,该政策可在 https://bgc-group.com/notice-for-job-applicants 获取。
参考编号:SS – JO-27568-B
BGC Group Pte Ltd(外包)
EA 05C3053