数据科学家的挑战
您将设计、开发、测试和记录数据收集框架。
数据收集包括从物联网传感器和低/高级控制组件到我们的数据科学平台的(复杂的)数据管道。
您将构建一个数据管道的监控解决方案,以提高数据质量。
您将开发可扩展的数据管道,以转换和聚合业务使用的数据,遵循软件工程的最佳实践。
对于这些数据管道,您将利用Spark和Splunk等最佳的数据处理框架。
您将开发我们的数据服务,将其转化为产品,使用(测试和部署)自动化、组件化、模板化和标准化,以减少我们为客户提供项目的交付时间。
该产品为全球各地的客户提供物料处理系统性能的洞察。
您将设计和构建CI/CD管道,包括数据管道的(集成)测试自动化。在这个过程中,您将努力实现越来越高的自动化程度。
您将与基础设施工程师合作,扩展存储能力和数据收集类型(例如流媒体)。
您具有开发API的经验。
您将指导和培训初级数据工程师,使用最先进的大数据技术。
我们对您的期望
计算机科学、信息技术或同等学历的学士或硕士学位,至少有7年相关工作经验
Python/Scala/Java编程
CI/CD、数据/代码测试(例如Bamboo、Artifactory、Git)
数据模式(例如JSON/XML/Avro)
存储格式(例如Azure Blob、SQL、NoSQL)
可扩展的数据处理框架(例如Spark)
Splunk或ELK堆栈等事件处理工具
以容器形式部署服务(例如Docker和Kubernetes)
流式和/或批处理存储(例如Kafka、Oracle)
使用云服务(最好是Azure)
期望的候选人资料
教育背景:任何学士学位
性别:国籍:任何国籍
▶️ 数据科学家
🖊️ Ruaa数据管理服务
📍迪拜