在这个角色中,您将:
• 与设计师、工程师和产品经理组成跨职能团队,以理解业务需求,将其转化为技术要求,构思并实施端到端的数据或技术解决方案。
• 领导机器学习模型的端到端部署,从数据收集和预处理到模型训练、评估和部署。
• 设计并实施可扩展的机器学习算法和系统,能够高效处理大量数据,并具备强大的可靠性。
• 维护和增强现有模型和API服务。
• 研究并保持对机器学习最新发展和趋势的了解。
• 开发和维护数据提取和转换管道。
• 能够处理非结构化和杂乱的数据。
• 为新的数据科学驱动功能开发原型,包括应用的前端和后端。
我们正在寻找:
• 至少4年的数据科学家丰富经验,具备基本的云概念和DevOps工具/实践的理解。
• 在DevOps领域的经验,涵盖基础设施即代码(IAC)、GitOps和CI/CD工具,包括Terraform、Argo CD和Github Actions。
• 出色的沟通和分析能力。
• 在学术界和/或行业中,独立领导数据科学项目的经验。
• 熟悉Python、SQL和/或Node.js。
• 对数据结构和算法、优化技术、缓存和多服务架构有良好的理解。
• 在机器学习、统计建模和/或系统建模方面的实践专业知识。
• 具有自然语言处理的经验或熟悉度。
• 有从SQL和NoSQL数据库(特别是MongoDB)访问数据的经验。
• 对云概念和分析平台(GCP、AWS、Azure等)有经验和知识。
• 熟练使用Kubernetes和容器编排。
• 在大规模部署机器学习模型和运行机器学习管道方面的经验。
• 遵循软件工程最佳实践和编写干净代码的经验。
• 在处理杂乱和非结构化数据的ETL方面的经验。
我们致力于为我们强大而多元化的团队创造一个包容的环境。我们重视多样性,培养一个每个人都可以做自己真实自我的社区。