我们正在寻找一位经验丰富的高级数据科学家加入我们的团队,该团队在石油和天然气行业运营,特别是在上游优化方面。作为高级数据科学家,您将在从复杂数据集中提取见解、开发数据驱动算法以及实施AI解决方案以优化石油生产运营中发挥关键作用。您在机器学习、深度学习和优化技术方面的专业知识对于解决行业特定挑战和推动石油生产过程中的效率提升至关重要。您将与跨职能团队密切合作,分析数据,实施、部署和维护解决方案,并提供可操作的建议以改善生产管理并最大化运营绩效。
职责:
实验和原型开发:设计、开发和评估用于各种任务(回归、分类、分割等)的数据驱动算法,使用尖端的AI技术。为文档理解、知识提取和工作流程自动化等任务设计和评估基于LLM的系统和多模态模型。
端到端实施:从数据准备和清理到模型部署和生产中的维护,动手实施AI模型。
管道集成:参与解决方案设计,并与团队合作,为石油和天然气行业集成AI驱动的软件产品。
模型性能监控:评估和监控AI解决方案,确保其符合项目目标,解决数据质量问题并不断改进现有解决方案。
经验要求:
至少4年在计算机视觉项目(分类、检测、分割)中展示深度和广度的经验。
在最先进的机器学习和/或深度学习技术方面有丰富经验。
在工业环境中开发、部署和扩展端到端ML管道的经验。
有构建和部署LLM应用程序(如GPT、Llama、Falcon、Claude)的实际经验,包括微调、RAG系统、领域适应或多模态扩展。
有设计和实施代理AI系统的经验,如任务导向代理、工作流程协调器、工具使用代理或自主推理框架。
在地球科学应用于石油和天然气行业方面的经验是一个加分项。
关键技能要求:
在应用数学和统计学方面有扎实的基础。
精通机器学习和深度学习技术。
具备高级Python编程技能用于AI开发。
在经典CV工具(OpenCV)、深度学习框架(PyTorch、TensorFlow)和流行的ML库(Scikit-learn)方面有丰富经验。
对各种ML算法和DL架构有全面的知识和实际应用。
熟练使用基本开发工具,如PyCharm、Jupyter、ClearML、Git和Docker。
对LLM框架和工具(LangChain、LlamaIndex、Hugging Face、OpenAI/Anthropic APIs)有深入了解。
熟练掌握提示工程、评估框架和结构化提示设计。
熟悉代理框架(LangGraph、AutoGen、CrewAI或自定义代理架构)。
在解决问题和项目执行方面具有自主性,能够独立工作和在团队框架中工作。
具备优秀的沟通技巧,能够有效传达技术概念。
教育要求:
计算机科学、应用数学、统计学或任何与AI相关领域的硕士学位或博士学位。