DHTS IT分析师

16个月前全职
Duke Health

Duke Health

location 旧金山
unsaved
职位描述 职位名称:IT开发者II(去识别数据工程师) 主要职责:此职位向DHTS-数据合作伙伴数据和分析平台总监汇报。此职位将负责管理和执行应用于杜克大学医疗系统数据资产的去识别流程,以纳入联邦临床应用平台(FCAP),并管理和管理FCAP去识别云环境。 该职位将成为数据合作伙伴数据工程团队的一员,并在将新的数据形式交付到FCAP和杜克数据湖中的数据集成和交付流水线的开发中提供专业知识。这些解决方案将利用技术来提高分析数据的价值,提高信息管控的效果,并简化组织中的数据流动。解决方案将专注于使用最先进的数据和分析工具,包括传统和准实时数据仓库、大数据、关系型和基于文档的数据库,同时使用提取、加载和转换(ELT)工具集以及REST API和FHIR。理想的候选人将熟悉数据科学平台,并具有利用DevOps和自动化/编排工具的经验。 基本任务/职责 • 创建并遵循患者医疗信息去识别的定义程序 • 维护和调整去识别环境,以实现最佳性能并符合DUHS和DHTS的政策和标准 • 与杜克合作伙伴合作改进去识别程序和流程,并与合作伙伴和杜克云团队合作解决问题 • 组装满足业务需求的大型复杂数据集 • 确定、设计和实施内部流程改进:自动化手动流程、优化数据交付、重新设计基础架构以实现更大的可扩展性等 • 推荐改进数据集成、数据质量和数据交付的分析解决方案,关注可重复使用的组件 • 创建和维护最佳的数据流水线架构 • 阐明架构解决方案方法之间的差异、优势和劣势 • 与敏捷团队成员合作,为数据加载和数据验证脚本编写和执行测试计划。通过使用标准的CI/CD流程,支持代码推广过程从开发到生产的要求 • 开发、实施和维护自动ETL处理的时间表/依赖逻辑 • 开发监控、日志记录和错误通知流程,以确保数据按预期更新并报告处理指标 • 参与制定和维护编码、文档、错误处理、错误通知、日志记录等标准 • 负责遵守已建立的架构、开发和运营标准和实践,包括元数据的创建 • 构建利用数据流水线的分析工具,为客户获取、运营效率和其他关键业务绩效指标提供可操作的见解 • 与高管、产品、数据和设计团队合作,协助解决与数据相关的技术问题,并支持他们的数据基础设施需求 教育:相关领域的学士学位,或四年等同的技术经验 所需经验:我们正在寻找具有5年以上数据工程师角色经验的候选人,应该具有以下工作经验: • 关系型SQL和NoSQL数据库 • 在Linux上编写和执行Python程序和shell脚本 • 中级Linux管理 • 在Microsoft Azure上进行数据工程 • 数据流水线和编排工具,如Azure Data Factory和SQL Server Integration Services • 在基于云的分析平台上开发,如Azure Synapse • 对内部和外部数据和流程进行根本原因分析,以回答特定的业务问题并找到改进机会 • 在动态环境中支持和与跨职能团队合作的经验 • 成功处理、处理和从大型断开的数据集中提取价值的历史 所需技能: • Python编程的中级到高级技能 • Azure云数据工程栈的中级到高级技能 • 中级Linux管理和shell脚本编写 • 具有高级工作SQL知识和与关系型和非关系型数据库系统一起工作的经验 • 强大的分析、文档和组织能力 期望技能: • 医疗保健IT的相关经验 • 掌握Azure DevOps和自动化/编排知识 • 开源软件解决方案和开源作为商业模式的知识 • 在应用开发、企业架构或应用集成方面的技术广度 • 理解敏捷方法论 • 掌握API、API集成和API管理的知识 上述信息描述了分配给此职位的一般工作性质和水平。它不旨在详尽列举职位的所有职责和责任。 杜克大学和杜克大学医疗系统的某些工作可能包括需要特定身体和/或精神能力的基本工作职能。每个招聘部门将提供有关合理住宿请求的其他信息和规定。