要求
• 计算机科学或相关工程学位,以及4年的专业经验,设计、构建和操作数据密集型机器学习系统,
• 熟练掌握现代Python、Python数据堆栈和SciKit Learn、PyTorch等机器学习框架,并具有相关行业经验,
• 具有在云上设计和构建端到端MLOps解决方案的丰富经验,包括数据收集、特征管理、模型训练、验证、部署和监控等方面,
• 在AWS云中构建和设计数据应用的行业经验,特别是使用无服务器、数据和机器学习功能,如Lambda、RDS、DynamoDB、Kinesis和SageMaker,
• 使用terraform进行基础设施管理的经验,
• 擅长在大规模SQL和NoSQL数据库以及Databricks等大数据技术中查询、建模和优化数据,
• 具有将数据科学原型转化为生产就绪解决方案的经验,并致力于软件工程最佳实践,
• 在跨职能软件开发团队中具有良好的团队合作能力和出色的表现,
• 具有将技术卓越与用户影响力结合的积极进取态度,
• (有利条件)具有构建准实时和实时数据流水线的经验,
• (有利条件)具有Apache Spark和Databricks的数据工程经验,
• (有利条件)具有使用Apache Airflow等编排工具的经验,
• (有利条件)具有自然语言处理经验,
• (有利条件)具有构建和优化深度学习模型的经验,
• (有利条件)具有优化深度学习模型用于部署和推理的经验
工作内容
• 您将加入一个由数据科学家、机器学习专家和数据和后端工程师组成的团队,构建由数据和机器学习驱动的新产品个性化功能。您的工作将加深我们对学习者的理解,您的代码将加速我们进入以人工智能为驱动的语言学习领域的旅程,影响全球数百万语言学习者,
• 与数据科学家和工程师合作,设计、构建、部署和维护支持我们个性化解决方案的模型和流水线,
• 通过创建监控和可观测性解决方案,确保我们人工智能/机器学习解决方案的可靠性和可扩展性,
• 在基于云的环境中创建和建立端到端的MLOps技术和标准,缩短实验Al/ML驱动功能的上市时间,
• 创新并将您的想法付诸实践,帮助全球数百万语言学习者实现他们的语言学习目标。