人工智能数据工程师 II

洛杉矶 3天前全职 网络
面议
薪资范围:$105,267.00(最低)- $139,478.00(中位)- $173,689.00(最高) L.A. Care Health Plan成立于1997年,是由加利福尼亚州创建的独立公共机构,旨在为洛杉矶县低收入居民提供健康保险。我们是全国最大的公共运营健康计划。服务超过200万名会员,我们确保我们的会员在正确的时间、正确的地点获得正确的护理。 使命:L.A. Care的使命是为洛杉矶县的弱势和低收入社区及居民提供优质医疗服务的机会,并支持实现这一目标所需的安全网。 职位概述 人工智能数据工程师II负责设计、开发和管理可扩展的数据管道和特征存储,以支持企业范围内的AI/机器学习(ML)模型训练和部署。该职位与技术团队成员合作,自动化数据流,整合结构化和非结构化数据源,并优化大规模处理的性能。 AI数据工程师II还负责实施数据质量验证、元数据管理和数据沿袭跟踪,以确保符合医疗法规的AI应用程序的数据交付的可信性。 职责 设计和实施用于AI/ML工作负载的可扩展数据管道。 使用Python、Snowpark或云原生ML服务开发和部署AI/ML解决方案。 构建和管理特征存储以支持模型训练和推理。 整合来自内部和外部系统的结构化和非结构化数据源。 与数据科学家合作,了解数据需求并优化管道。 实施数据质量检查、元数据标记和数据沿袭跟踪。 确保符合健康保险可携性和责任法案(HIPAA)、医疗保险和医疗补助服务中心(CMS)以及企业数据治理标准。 使用AWS Glue、Snowflake和Informatica Data Management Cloud(IDMC)等工具自动化数据摄取和转换。 使用git actions或类似工具实施DevOps/MLOps和持续集成(CI)/持续交付(CD)管道。 监控管道性能并解决生产环境中的问题。 为AI数据计划的待办事项整理和冲刺计划做出贡献。 履行分配的其他职责。 继续职责 所需教育 计算机科学或相关领域的学士学位 在没有学位的情况下,可以考虑同等的教育和/或经验。 优先教育 数据科学或相关领域的硕士学位 经验 必需: 至少5年的数据工程经验。 至少2年专注于AI/ML数据管道的经验。 在GenAI项目(聊天机器人实施、自然语言处理(NLP)、情感分析、推荐系统、异常检测等)方面的实际操作经验。 优先: 在健康计划支付系统和监管数据处理方面的经验。 具有快速医疗互操作性资源(FHIR)、健康水平七(HL7)、HIPAA合规性和医疗数据标准的经验。 技能 必需: 精通Python、SQL、Spark、AWS(Glue、S3、Lambda)、Snowflake(Snowpark容器服务)、IDMC、提示工程、模型推理和微调、RAG以及与MCP、向量数据库的合作。 精通技术和数据工程技能 对监督和无监督机器学习方法、特征工程、模型评估和验证技术有扎实的理解。 能够在生产环境中操作模型,包括基本的MLOps实践(版本控制、CI/CD、可重复性)。 能够有效地向非技术利益相关者传达复杂的AI/ML概念。 优秀的文档编写技能,确保可重复性、假设的清晰性和模型设计的透明性。 强大的协作技能,具有跨职能与关键利益相关者合作的能力。 具有分析性问题解决能力,能够将业务挑战转化为可操作的AI/ML解决方案。 有效的书面和口头沟通能力,包括建模过程、假设和结果的文档编写。 优先: 具有FHIR、HL7、HIPAA合规性和医疗数据标准的经验。 所需执照/认证 优先执照/认证 AWS认证数据工程师 Snowflake SnowPro高级认证 GenAI认证 MLOps平台认证 所需培训 必需: 数据管道开发和云平台培训。 优先: 医疗合规和监管培训。 身体要求 轻度 附加信息 薪资范围免责声明:预期的薪资范围基于地理位置、经验、教育和市场等多种因素。该范围可能会有所变化。 L.A. Care提供广泛的福利,包括 - 带薪休假(PTO) - 学费报销 - 退休计划 - 医疗、牙科和视力保险 - 健康计划 - 志愿者带薪休假(VTO)