高级数据科学家 - 数值天气预报

温哥华 1个月前全职 网络
面议
该职位已过期,不再接受申请。
我们的愿景 在EarthDaily Analytics(EDA),我们致力于通过创新解决方案建设一个更可持续的地球,这些解决方案结合了地球的卫星影像、现代软件工程、机器学习和云计算,以解决农业、能源和采矿、保险和风险缓解、野火和森林情报、碳捕获验证等领域的最艰难挑战。 EDA的标志性地球观测任务——EarthDaily星座(EDC)目前正在建设中。EDC将成为有史以来最强大的全球变化检测和变化监测系统,能够生成前所未有的预测分析和洞察力。它将与EarthPipeline数据处理系统结合,每天提供前所未有的科学级全球数据,使EDA能够满足不同行业日益增长的需求。 我们的团队 我们的全球企业团队代表着各种业务线,由业务发展、销售、市场营销和支持专业人员、数据科学家、软件工程师、项目经理以及财务、人力资源和IT专业人员组成。我们的Earth Insights团队灵活且协作,为了推出EDC的前沿和颠覆性产品,我们目前正在寻找一位经验丰富的高级数据科学家——数值天气预报,加入我们的团队,担任天气和气候建模的技术专家和思想领袖,弥合尖端大气科学与商业应用之间的差距! 准备好发射了吗? 您是否想为一家在全球变化检测/变化监测前沿以及大气科学、数据科学和机器学习交汇处的最令人兴奋的太空公司工作?理想的候选人将具备深厚的操作性天气模型专业知识,使他们能够评估预测准确性,开发复杂的验证框架,并从大量气象数据集中提取可操作的见解。此角色需要深厚的技术理解和敏锐的商业头脑,使您能够构建生产级AI预测模型,并向客户传达复杂的气象概念,协助销售过程。 职责 天气模型分析与验证 • 对包括BRIB2、NetCDF和NEMSIO格式在内的大规模天气数据集进行复杂的统计和比较分析 • 开发综合验证框架,以评估天气预报模型相对于公开可用的操作模型和观测数据的准确性和技能 • 使用标准气象指标(RMSE、ACC、偏差、技能评分)对多个大气变量和预测提前时间进行预测验证研究 • 分析和记录主要操作性天气模型(GFS、GEFS、CFS、ECMWF IFS、ERA5)的优点、局限性和性能特征 • 确定天气预测系统中的预测偏差、系统误差和改进领域 • 评估不同初始化时间、分辨率和参数化对预测质量的影响 生产级开发与MLOps • 编写稳健的生产质量Python代码,遵循软件工程最佳实践进行天气数据处理、分析和模型评估 • 开发和维护可扩展的数据管道,以从多个来源以各种格式(GRIB2、NetCDF、NEMSIO)摄取、处理和分析气象数据 • 使用现代开发工作流程将分析脚本和机器学习模型集成到现有的生产代码库中 • 使用AWS CDK(云开发工具包)和基础设施即代码原则将基于云的解决方案部署到AWS • 实施MLOps最佳实践,包括模型版本控制、实验跟踪、监控和自动化再培训管道 • 构建CI/CD管道,以实现预测模型和数据处理工作流程的持续集成和部署 • 优化代码性能,以高效处理大规模气象数据集 AI天气预报与机器学习 • 设计、开发和部署基于AI的天气预报模型,使用机器学习和深度学习技术 • 研究和实施AI天气预测的最先进方法,包括神经网络、图神经网络、变压器和生成模型 • 评估新兴的AI天气模型(例如ECMWF AIFS),并评估其在商业用例中的适用性 • 开发结合基于物理的数值天气预报和数据驱动的机器学习方法的混合预测方法 • 使用分布式计算资源在大型历史天气数据集(ERA5、HRRR、GFS档案)上训练模型 • 使用机器学习实施概率和集合预测技术,以量化预测不确定性 • 优化模型架构,以提高计算效率和预测技能 特征工程与领域专长 • 从原始天气数据中开发派生的气象特征和指数,为特定行业应用提供价值 • 创建针对能源市场、农业、保险、物流和其他天气敏感行业量身定制的领域特定天气变量和聚合 • 将复杂的大气数据转化为可操作的见解和商业应用的决策支持产品 • 设计与业务结果和市场动态相关的天气指数和复合变量 • 为机器学习模型设计特征,以捕捉相关的气象模式和关系 主题专家与沟通 • 向技术和非技术受众传达关于公开可用天气模型、再分析数据集和预测系统的深厚技术知识 • 阐明不同天气模型如何在各个行业中用于市场情报、风险管理和操作决策 • 提供关于不同天气数据产品和预测系统的能力、局限性和适用用例的专家指导 • 在销售演示和发现电话中回答客户和潜在客户提出的具体和具有挑战性的技术问题 • 创建技术文档、演示和可视化,清晰传达复杂的气象概念 • 与销售和产品团队合作,将客户的天气数据需求转化为技术解决方案 数据处理与分析 • 使用专业库(xarray、cfgrib、pygrib、wgrib2)以编程方式操作和分析气象数据格式 • 高效地在规模上处理具有时间和空间组件的多维天气数据集 • 对大型天气档案进行探索性数据分析(EDA),以识别模式、趋势和异常 • 对网格天气数据进行空间和时间聚合、插值和重新网格化操作 • 进行气象数据集的质量控制和验证,以确保数据的完整性和准确性 • 为常规分析和监控任务开发自动化数据处理工作流程 研究与创新 • 了解数值天气预报、AI天气预报和大气科学研究的最新发展 • 评估新的数据源、天气模型和预测技术,以便潜在集成到产品和服务中 • 进行应用研究,以提高天气预测能力并开发专有方法 • 为天气和气候科学的技术出版物、白皮书和思想领导内容做出贡献 其他职责按需分配 您的过往任务 • 大气科学、气象学、气候科学、计算科学、数据科学、物理学或与天气/气候应用密切相关的定量领域的硕士或博士学位 • 在大气科学、天气预报、气候建模或密切相关领域拥有5-8年的专业经验 • 3年以上使用操作性数值天气预报模型(GFS、GEFS、CFS、ECMWF IFS、ERA5或类似模型)的实际经验 • 3年以上用于科学计算、数据分析和机器学习应用的生产级Python开发经验 • 在GRIB2、NetCDF或NEMSIO格式的大规模气象数据集处理和分析方面有丰富经验 • 在生产环境中开发和部署机器学习模型或数据科学解决方案的成功记录 • 在天气预测系统的预测验证、模型评估和统计分析方面有经验 • 展示了天气数据分析、可视化和建模项目的强大作品集 加分项: • 大气科学、气象学或相关领域的博士学位,研究重点为数值天气预报、数据同化或天气预报 • 在机器学习、统计建模或应用于大气科学的计算方法方面的高级课程或专业化 • 开发或使用基于AI的天气预报模型的经验 • 在天气模型开发、数据同化或大气建模的数值方法方面的背景 • 在能源商品市场(天然气、电力、取暖油)或农业商品方面的经验 • 熟悉天气衍生品、天气风险管理或气候风险分析 • 有向非技术商业受众展示技术天气信息的经验 您的工具包 核心技术技能(必需): • 编程与开发:Python(专家级)、NumPy、Pandas、xarray、Dask、SciPy、scikit-learn • 天气数据处理:GRIB2、NetCDF、NEMSIO格式;包括cfgrib、pygrib、wgrib2、netCDF4、xarray的库 • 机器学习:PyTorch或TensorFlow、深度学习架构、模型训练和评估、MLOps实践 • 统计分析:预测验证方法、技能评分(RMSE、MAE、ACC、偏差)、假设检验、时间序列分析 • 大气科学:对大气动力学、天气预报原理、模型物理和参数化的深刻理解 • 云计算:AWS服务(S3、EC2、Lambda、SageMaker、ECS)、基于云的数据处理和模型部署 • 版本控制与协作:Git、GitHub/GitLab、代码审查实践、协作开发工作流程 • 数据可视化:Matplotlib、Cartopy、Plotly,创建出版质量的图形和地图 天气模型专业知识(必需): • NOAA模型:GFS(全球预报系统)、GEFS(全球集合预报系统)、CFS(气候预报系统) • ECMWF系统:ERA5再分析、IFS(综合预报系统)、AIFS(人工智能预报系统) • 模型架构:了解模型初始化、数据同化、物理参数化和集合方法 • 天气变量:全面了解大气变量(温度、压力、风、湿度、降水、辐射) • 预测产品:熟悉地表场、压力层、派生产品和专业输出 其他技术技能(高度重视): • AI天气模型:具有GraphCast、ECMWF AIFS、Pangu-Weather、FourCastNet或类似神经网络预测系统的实际经验 • 基础设施即代码:AWS CDK、Terraform、CloudFormation用于可重复的部署 • 容器化:Docker、用于模型部署的容器编排 • 大数据技术:Apache Spark、用于大规模数据处理的分布式计算框架 • 高级ML:图神经网络、变压器、生成模型、扩散模型 • HPC经验:与高性能计算系统、作业调度程序(Slurm)、并行计算的工作经验 • 数值方法:具有数值建模、有限差分方法或大气模型开发经验 • 其他语言:用于统计分析的R、用于科学计算的Julia或用于遗留代码集成的Fortran 领域知识与商业头脑: • 理解天气如何影响能源市场、农业、保险、物流和其他天气敏感行业 • 了解天气衍生品、度日(取暖/制冷)和基于天气的指数 • 能够将气象见解转化为商业价值和商业应用 问题解决与分析: • 高级分析思维和解决复杂技术问题的能力 • 对模型性能的批判性评估和识别改进机会 • 能够制定研究问题并设计实验以测试假设 • 创造性地进行特征工程和从天气数据中提取价值 沟通与协作: • 出色地向多元化受众解释复杂的气象和技术概念的能力 • 强大的技术写作技能,用于文档、报告和演示 • 在客户和技术同行面前展示的舒适度 • 与包括工程、产品和销售在内的跨职能团队合作的协作心态 • 积极倾听技能,以了解客户需求并将其转化为技术要求 软技能: • 自我激励,能够在远程环境中独立工作,几乎无需监督 • 强大的组织和时间管理技能,以同时处理多个项目 • 对天气科学和机器学习的持续学习充满好奇心和热情 • 适应快速变化的技术、业务优先事项和客户需求 • 以客户为中心的方法,致力于提供高质量的解决方案 我们的空间(包括旅行) 我们很乐意欢迎您加入EarthInsights团队,这个完全远程的机会对在美国和加拿大工作的人开放。在快节奏的环境中进行敏捷软件开发,每日站会和每周Scrum节奏,需要快速适应时间敏感的交付。 我们的工作环境充满乐趣、快节奏和令人兴奋,我们将环保(可持续生活)、创造力和创新、积极沟通、多样性和责任感作为核心价值观。就像太空探索一样——我们不断发展和突破新的界限。 工作时间通常为周一至周五中部时间上午9:00至下午5:00,期间需要与其他时区的团队成员进行交叉工作,以及偶尔的晚上和周末工作。团队成员需要在此期间每天至少有六(6)小时的可用时间,以促进协作。 您的薪酬 基本工资范围:每年145 - 180K美元 上述范围取决于与工作相关的技能、经验、培训、教育、地点和业务需求。该范围基于明尼阿波利斯为此职位的薪酬。只有当候选人具备推动该职位范围内进步的经验、技能和专业知识时,我们才会考虑在该职位的范围上限支付。 为什么选择EarthDaily Analytics? • 具有竞争力的薪酬和灵活的休假 • 成为北美最具创新性的太空公司之一的有意义使命的一部分,为我们的星球开发可持续解决方案 • 优秀的工作环境和团队,总部位于加拿大温哥华和明尼阿波利斯,MN