高级机器学习工程师 | GCP
Kaizen Analytix LLC是一家提供人工智能/机器学习解决方案和可操作的业务洞察力,通过分析产品和服务为客户提供无与伦比的价值速度的公司。我们正在寻找高技能和经验丰富的高级机器学习工程师,负责设计、开发和维护复杂的机器学习项目和托管大型数据仓库,用于存储模型中使用的大型数据集。理想的候选人应具备深度学习、向量嵌入和解决嵌入存储挑战的强大理解能力;并使用先进的数据工程原则和最佳实践,以及处理大规模非结构化数据集(100 GB+),如视频、音频、图像和文本。我们寻找具备深度学习、嵌入、数据工程技能的候选人,以支持具备存储基于深度学习结果所需的AI项目。
职责:
分析和设计
• 与用户进行事实收集会议。
• 与技术经理和业务所有者协商,以确定和分析技术需求和问题。
• 进行数据流图或流程建模(代码架构)。
• 设计、开发和部署用于各种任务的机器学习模型,如分类、图像识别、自然语言处理和异常检测。
• 评估机器学习模型的性能并调整以获得最佳性能。
• 设计、开发和实施可扩展且稳健的ML Ops。
• 收集、清理和准备机器学习模型的数据。
• 与数据科学家、工程师和其他利益相关者合作,定义和优先处理机器学习项目。
• 了解最新的机器学习研究进展和最佳实践。
• 与利益相关者合作,收集需求并定义数据模型。
• 解决数据问题和性能问题。
• 与其他工程师合作,开发和维护公司的数据基础设施。
• 了解最新的数据工程技术和趋势,特别是向量存储。
战略对齐
• 与其他技术团队成员合作,不断改进实施策略、开发标准、文档和其他部门流程。
• 向下属提供技术支持和指导。
• 定期向管理层沟通计划、状态和问题。
• 遵守部门的标准、政策、程序和行业最佳实践。
职位要求:
• 计算机科学或相关领域的硕士学位,课程涉及机器学习/深度学习和数据科学。
• 5年以上机器学习产品工作和生产经验。
• 在TensorFlow、PyTorch、Keras、向量存储等机器学习框架方面具有丰富经验。
• 熟练掌握Python编程和面向对象编程范例。
• 对数据工程原则和最佳实践有深入理解。
• 对Vertex AI和向量搜索有深入理解。
• 在Google Cloud Platform技术上具有分布式计算技术的经验,包括BigQuery、Cloud Dataproc、Cloud Dataflow和Cloud Data Fusion。
• 必须了解CI/CD流水线,并熟练使用Jenkins、Cloud Build和TeamCity等工具创建所需的CI/CD流水线。
• 主动性强,能提出解决方案和解决方法;能够在严格的截止日期下工作。
• 解决关键客户实施问题并展示推动成功解决的能力。
• 负责端到端解决方案设计、架构和与GCP生态系统和基础设施集成的最佳实践。
• 能够与领域架构师合作,开发端到端解决方案架构,包括应用程序、基础设施、数据、集成和安全领域。
优先考虑:
• 具备处理高容量和高频率数据的社交媒体数据分析经验。
• 曾参与任何以数据工程活动为重点的应用程序开发项目,使用任何编程语言(Python、SQL、Java)。
• 对生成式AI和LLMs领域有良好的理解,重点关注向量存储和检索技术。