我们正在寻找一位数据工程师,他是一位多才多艺的专业人士,运用分析、统计和编程技能来收集、分析和解读大型数据集,以帮助组织做出基于数据的决策。
工作职责:
• 与科学家和研究人员团队紧密合作,构思和迭代软件开发。
• 开发和部署数据科学原型,重点是将机器学习模型投入生产。
• 使用大数据工具:使用Hadoop、Spark和分布式数据库等技术处理大规模数据集。
• 使用基于云的数据平台,如AWS、Google Cloud或Azure进行存储、计算和分析。
• 设计和实施可扩展的高性能机器学习模型,重点是故障排除性能和准确性问题。
• 从各种来源(如数据库、网络服务、API和数据流)收集结构化和非结构化数据。
• 为基于机器学习和深度学习模型的项目构建数据清理和增强管道。
• 通过脚本和开源工具自动化流程和工作流,以高效交付数据科学产品。
职位要求:
• 计算机科学、计算机工程或相关专业学位。
• 0-2年相关工作经验。
• 具备真实世界数据科学项目、实习、黑客马拉松和个人项目的经验。
• 精通Python编程,并使用数据处理、可视化和模型开发的库,包括pandas、numpy、scikit-learn、matplotlib和seaborn。
• 熟悉API概念和库,并在测试和部署中利用它们,使用Flask、Django或FastAPI等框架。
• 熟悉数据库(如NoSQL、PostgreSQL、MongoDB)和SQL,用于数据存储和检索。