职位名称:大数据人工智能开发人员
地点:沙特阿拉伯(朱拜勒)
职位简介:我们正在寻找一位熟练的大数据人工智能开发人员加入我们的大数据团队。该职位涉及在大数据环境中使用机器学习和深度学习技术设计和部署人工智能模型。您将使用分布式计算技术创建可扩展和高效的人工智能解决方案。
主要职责:
• 使用监督、无监督和半监督学习技术开发人工智能模型。
• 从数据摄取和预处理到模型训练、评估和部署,设计和实施端到端的机器学习流程。
• 利用TensorFlow、PyTorch和其他框架构建适用于计算机视觉、自然语言处理和其他人工智能领域的深度学习模型。
• 在分布式环境中管理和优化Spark-ML和Flink-ML任务,用于大规模机器学习任务。
• 实施自然语言处理和计算机视觉算法,解决数据分析中的复杂问题。
• 使用Neo4j进行基于图的机器学习,从连接数据中发现洞察。
• 与Cloudera套件合作,维护和管理大数据工作流程,确保与人工智能模型要求的兼容性。
• 使用Kafka、HDFS、HBASE、KUDU和Cloudera Machine Learning等技术优化数据存储和处理。
• 与基础设施团队合作,使用云原生技术和Kubernetes编排部署模型。
• 开发自定义数据模型和算法,并运用高级Python编程技能解决具有挑战性的数据科学问题。
• 保持对人工智能研究的最新了解,并实施能够为业务目标做出贡献的新算法。
• 与利益相关者合作,了解业务挑战,并将其转化为技术解决方案。
• 确保模型符合数据隐私和安全法规,应用数据治理的最佳实践。
• 在GPU上运行AI模型,调整模型以利用分布式GPU。
• 设计和实施强大的MLOps(机器学习运营)工作流程,自动化机器学习生命周期,从数据收集和模型开发到部署和监控,确保AI产品的持续集成和交付(CI/CD)。
技术资格:
• 在TensorFlow和PyTorch等框架上具有机器学习和深度学习的强大专业知识。
• 有分布式数据处理框架的经验,特别是SPARK-ML和Flink-ML。
• 熟练使用Python进行数据科学,并对人工智能和机器学习的库和工具包有扎实的理解。
• 有RAPIDS和GPU-Aware Scheduling的经验。
• 熟悉Cloudera数据服务和大数据环境中的Cloudera套件。
• 拥有利用Kubernetes部署可扩展的AI应用程序的能力。
• 熟悉人工智能的高级领域,如大型语言模型(LLM),并能够将其应用于实际场景。
• 具备计算机视觉、自然语言处理和基于图的机器学习技术的经验。
• 理解分布式环境中的数据管理实践和ETL流程。
教育背景:
• 计算机科学、数据科学、人工智能或相关领域的学士或硕士学位。
认证:
• 人工智能、大数据技术或Kubernetes相关的认证将是有利的。
软技能:
• 出色的解决问题能力和批判性思维能力。
• 强大的沟通能力,能够有效传达复杂的技术概念。
• 具有团队合作的心态,有在协作环境中工作的经验。
• 致力于持续探索和了解新兴的人工智能技术。