必备技能:
Java
Ansible/Terraform
Mesos/ Kubernetes
Apache Hadoop/Apache Spark
HDFS/ CEPH/ S3
Flink/Kafka
Hadoop
AI/ML DI隐私基础设施工程师职位描述
摘要
AI/ML组织中的数据基础设施团队为我们设备中所喜爱的机器学习技术提供了分析、实验和ML特征工程的动力。我们的使命是提供尖端、可靠且易于使用的基础设施,用于摄取、存储、处理和与数据交互,同时保护用户的数据隐私和安全。
数据安全和隐私团队隶属于AI/ML数据基础设施团队,正在寻找希望将他们对安全和隐私的热情带入到构建世界一流的数据基础设施中的工程师,这些基础设施将用户的隐私放在首位,同时使数据工程师和科学家能够生产出世界一流的ML数据产品。
关键资格
• 3年以上扩展和操作分布式系统的经验,例如大数据处理引擎(如Apache Hadoop、Apache Spark)、分布式文件系统(如HDFS、CEPH、S3等)、流式处理系统(如Apache Flink、Apache Kafka)、资源管理系统(如Apache Mesos、Kubernetes)或身份和访问管理(如Apache Ranger、Sentry、OPA)
• 3年以上的基础设施即代码和系统自动化经验
• 熟练掌握Java或类似语言
• 能够调试大规模分布式系统中的复杂问题
• 热衷于构建可靠、易于使用和易于维护的基础设施
• 优秀的沟通和协作能力
• 有Spark和ETL处理流水线的经验有帮助,但不是必需的
• 有系统安全、身份协议和加密经验有帮助,但不是必需的
描述
理想的候选人应具备出色的沟通能力、经过验证的数据基础设施设计和实施能力、较强的商业敏锐度以及交付结果的内在动力。他们将是一个自我启动的人,善于应对模糊不清的情况,并喜欢在快节奏的动态环境中工作。
职责包括:
• 通过自动化和基础设施即代码,在大数据环境中扩展和操作隐私和安全系统,利用Spark、Kafka、Presto、Flink、Hadoop等技术,在本地和AWS环境中
• 确保数据基础设施提供可靠的高质量数据,具有一致的SLA,具有良好的监控、警报和事故响应,并持续投资以减少技术债务
• 编写代码、文档,参与代码审查和设计会议