职位名称:ML + GCP数据工程师
工作地点:德克萨斯州达拉斯或加利福尼亚州洛杉矶
技能要求
职位描述:
数据科学和数据工程。
Python,
机器学习,
GCP套件,
Apache Airflow,
BigQuery,
SQL Server,
GitHub.
职责
使用Google云技术(如BigQuery,DataFlow等)开发和实施稳健、可扩展和高效的数据管道,用于收集、处理和分析大量结构化和非结构化数据。
设计、开发和部署机器学习模型。
执行数据清洗、特征工程和数据转换任务,为分析和建模准备数据。
实施和维护数据工程最佳实践,确保数据质量、可靠性和性能。
进行代码审查,提供建设性反馈,并指导初级团队成员提升其技术能力。
及时了解机器学习、数据工程和相关技术的最新进展,并评估其对我们的产品和解决方案的潜在影响。
技能要求
计算机科学、数据科学、统计学或相关领域的学士或硕士学位,具有5年以上经验。
在开发和部署机器学习模型和数据管道方面具有扎实的经验。
在数据工程方面具有较强的背景,包括数据预处理、特征工程和ETL管道。
精通Python编程(也希望有Java经验)。
对机器学习算法、统计建模和数据挖掘技术有深入的了解。
熟悉Pandas、Numpy、Tensorflow/Keras等Python中的其他机器学习库。
熟悉Apache Airflow工作流管理工具。
了解Google云平台和BigQuery、DataFlow等服务。
熟悉关系型和NoSQL数据库、SQL和数据仓库概念。
我们正在寻找一位技术熟练、积极主动的机器学习/数据工程师加入数据技术团队。作为一名高级机器学习/数据工程师,您将在设计、开发和部署大规模数据集的可扩展和稳健的机器学习模型和数据管道方面发挥关键作用。您将负责领导一支离岸顾问团队,提供技术指导,并监督他们的交付成果。