我们正在寻找一名数据科学家,在不同领域设计和开发机器学习(ML)模型,以从各种类型和大量数据集中发现模式。您将主要使用深度学习技术(以及其他ML技术)来解决推荐引擎、聊天机器人、自然语言处理(NLP)和其他领域的不同问题。我们将依赖您构建数据产品以提取有价值的业务见解。在这个角色中,您应该具有很强的分析能力,擅长分析、数学和统计。批判性思维和解决问题的能力对于解释数据至关重要。我们也希望看到您对机器学习和研究的热情。您的目标是帮助我们的公司分析趋势以做出更好的决策。
职责
• 分析原始数据:评估质量、清理、预处理、为下游处理结构化数据。
• 开展研究和开发活动,使用数据科学和机器学习(ML)实践进行数据探索和发现。
• 开发、应用、测试和实施数据科学和ML模型,用于从不同数据源(如在线市场、电商平台、社交媒体和网络来源)收集的各种数据集。
• 在不同领域和应用中设计和开发准确且可扩展的ML模型,包括但不限于推荐引擎、聊天机器人、NLP、文本挖掘、基于文本的特征选择/表示、优化和预测建模。
• 利用多种工具和方法解决复杂的业务目标,包括推荐引擎、聊天机器人、自然语言处理(NLP)、机器学习/深度学习、图像处理、语音处理、基于规则的学习和知识图谱。
• 在电子商务和不同领域设计新的服务产品和解决方案。
• 跟上数据科学和ML领域的最新趋势和技术。
• 与数据工程师密切合作处理与数据相关的请求,与数据质量保证人员密切合作处理数据完整性问题。
• 与业务分析师和产品开发团队密切合作,理解并实施他们的需求。
• 与大数据和软件开发人员合作,将想法、模型和原型转化为成熟的解决方案。
• 与跨职能团队密切合作,识别挑战和问题,并提出潜在的AI解决方案。
要求
• 定量领域的学士学位(统计学、数学、计算机科学、工程等);数据科学或其他定量领域的研究生学位优先。
• 至少4-5年的数据科学家(定量分析和数据建模)经验。
• 深刻理解预测建模、机器学习、聚类和分类技术及算法。
• 在ML应用和领域(推荐引擎、NLP、语言模型和聊天机器人经验优先)方面的经验。
• 对大型语言模型(LLMs)有深入了解,包括模型选择、微调、部署和实际应用中的提示工程。
• 深度学习算法和技术的经验。
• 精通Python(其他语言如Shell脚本、C++、.Net、Java、Matlab、R等优先)。
• Python库(Tensorflow、Keras、Pandas、Sklearn)经验。
• 精通算法和面向对象编程。
• 熟悉数据库技术(设计和实现)和查询语言。
• 熟悉大数据框架和可视化工具(ElasticSearch、Cassandra、Hadoop、Spark)优先。
• 较强的组织和项目管理能力。
• 良好的问题解决能力。
• 优秀的沟通和演示能力。
福利
• 医疗健康保险
• 绩效奖金
• 其他福利