我们正在寻找一位数据工程师,他是一位多才多艺的专业人士,运用分析、统计和编程技能来收集、分析和解释大型数据集,以帮助组织做出基于数据的决策。
工作职责:
• 与科学家和研究人员团队密切合作,构思和迭代软件开发。
• 开发和部署数据科学原型,重点是将机器学习模型投入生产。
• 使用大数据工具:使用Hadoop、Spark和分布式数据库等技术处理大规模数据集。
• 使用云数据平台,如AWS、Google Cloud或Azure进行存储、计算和分析。
• 设计和实施可扩展的高性能机器学习模型,重点解决性能和准确性问题。
• 从数据库、网络服务、API和数据流等各种来源收集结构化和非结构化数据。
• 为基于机器学习和深度学习模型的项目构建数据清理和增强管道。
• 通过脚本和开源工具自动化流程和工作流,以高效交付数据科学产品。
职位要求:
• 计算机科学、计算机工程或相关专业的学位。
• 0-2年的相关工作经验。
• 具有实际数据科学项目、实习、黑客马拉松和个人项目的经验。
• 精通Python编程,能够使用数据处理、可视化和模型开发的库,包括pandas、numpy、scikit-learn、matplotlib和seaborn。
• 了解API概念和库,并在测试和部署中利用Flask、Django或FastAPI等框架。
• 熟悉数据库(如NoSQL、PostgreSQL、MongoDB)和SQL,用于数据存储和检索。