描述
职责
设计和开发机器学习系统,实施适当的机器学习算法,进行实验,并及时了解该领域的最新发展。
创建数据模型,进行统计分析,训练和重新训练系统以优化性能。
构建高效的自学习应用程序,并为人工智能的进步做出贡献。
运行机器学习测试和实验。
实施适当的机器学习算法。
通过使用库调用、REST API队列/消息系统和数据库查询,理解组件和流程如何协同工作并相互通信。
提供系统设计以避免瓶颈,使算法能够随着数据量的增加而良好扩展。
基本要求:
5年以上以下经验:
PyTorch、NLTK、SciPy、Scikit-Learn、Numpy、OpenCV或等效图像预处理工具
SQL/NoSQL数据库和查询
一个或多个机器学习工具包或Python框架
深度学习概念
通过选择适当的模型(如决策树、knn、神经网络或多个模型的集成)有效地应用机器学习算法的标准实现
最好有:
理解概率和统计以及机器学习概念,如精确度、召回率、优化、超参数调整、过拟合和可解释性
编码最佳实践,OOD/OOP,模块化设计,SOA和系统架构
技术技能:
Python、pyspark或R编程语言进行编码
Kubernetes和Docker进行部署
AWS Sagemaker或EC2实例用于云计算
MYSQL、Oracle、MongoDB或Redshift数据库
Cloudera分布式平台用于计算和部署深度学习/神经网络包,如Python中的PyTorch、TensorFlow,并使用GPU进行训练
使用Python中的pyspark进行分布式计算和并行计算库
教育背景:学士学位
其他客户信息:
最近更新:2023-12-12