机器学习工程师
技能:具有少量机器学习项目经验的Java-Spark编码专家
工作方式:远程
角色概述:
我们正在寻找一位技术娴熟且经验丰富的高级数据工程师,具备Java微服务、Apache Spark、机器学习的强大背景,并且在云平台上部署和操作基于Java的数据/机器工程流水线方面具有专业知识。
职责:
• 设计、开发和维护Java微服务,以支持数据工程/机器学习应用和数据流水线。
• 实施和优化Apache Spark代码,用于大规模数据处理和分析。
• 与数据科学家、架构师和跨职能团队合作,部署、扩展和维护LLM模型。
• 架构和构建可处理和处理机器学习工作负载的可扩展和高效系统。
• 使用向量数据库高效存储和检索数据的向量表示。优化向量数据库操作以提高性能。
• 与DevOps团队合作,确保在生产环境中顺利部署和运行ML模型。
• 保持对机器学习、Java和Spark技术的行业最佳实践和进展的更新。
资格:
• 计算机科学、数据工程、机器学习或相关领域的学士或硕士学位。
• 在数据工程和机器学习方面至少有3到5年的专业经验,重点是Java微服务和Spark。
• 具备部署和维护机器学习模型的经验,最好是大型语言模型。
• 熟练掌握Java编程,重点是微服务架构。在Apache Spark上具有丰富的实际经验,用于数据处理和分析。
• 对机器学习概念和工作流程有深入的了解。
• 出色的问题解决能力和在快节奏、协作环境中工作的能力。
• 良好的沟通能力,能够向技术和非技术利益相关者传达技术概念。
最好具备:
• 接触过OpenAI的GPT或其他大型语言模型。
• 有使用Scala或Java等语言编写Spark代码的经验。
• 了解Docker等容器化技术和Kubernetes等编排工具。