我们正在寻找一位 **数据工程师**,他是一位多才多艺的专业人士,利用分析、统计和编程技能来收集、分析和解读大型数据集,以帮助组织做出数据驱动的决策。
• *职责**:
- 与科学家和研究人员团队紧密合作,构思和迭代软件开发
- 开发和部署数据科学原型,重点是将机器学习模型投入生产。
- 使用大数据工具:利用 Hadoop、Spark 和分布式数据库等技术处理大规模数据集。
- 使用 AWS、Google Cloud 或 Azure 等云数据平台进行存储、计算和分析。
- 设计和实施可扩展的高性能机器学习模型,重点解决性能和准确性问题。
- 从数据库、网络服务、API 和数据流等各种来源收集结构化和非结构化数据。
- 为基于机器学习和深度学习模型的项目构建数据清理和增强管道。
- 通过脚本和开源工具自动化流程和工作流,以高效交付数据科学产品。
• *职位要求**:
- 计算机科学、计算机工程或相关领域的学位
- 0-2 年相关工作经验
- 参与真实世界数据科学项目、实习、黑客马拉松和个人项目的经验
- 精通 Python 编程,使用数据处理、可视化和模型开发库,包括 pandas、numpy、scikit-learn、matplotlib 和 seaborn
- 了解 API 概念和库,并在测试和部署中利用它们,使用 Flask、Django 或 FastAPI 等框架
- 熟悉数据库(例如 NoSQL、PostgreSQL、MongoDB)和 SQL 进行数据存储和检索