作为数据影响与治理部门的高级机器学习工程师 - Agentic AI,您将站在设计和运营平台功能的前沿,这些功能使自主和半自主AI系统能够在临床、研究和运营领域可靠地运行。
这个角色提供了一个难得的机会,可以在一个受监管的医疗环境中构建企业级的agentic AI平台,在这里,正确性、安全性、治理和可审计性与创新和规模同等重要。您将影响技术标准、平台架构和操作保障措施,塑造agentic AI在全球领先的癌症中心之一中的采用方式。
您将获得什么?
• 优秀的福利:MD Anderson提供带薪医疗福利、慷慨的带薪休假(PTO)和强大的退休计划,提供稳定性和长期的财务安全。
• 企业级影响力:架构平台功能,支持AI代理在复杂的健康IT系统和企业工作流程中运行。
• 技术领导力:塑造标准、集成模式和指导方针,在组织规模上管理agentic AI。
• 职业成长与可见性:与企业架构师、应用MLEs、数据科学家、IT和治理领导者紧密合作,参与高影响力的AI计划。
• 负责任的AI创新:在一个以使命为驱动的机构中工作,负责任的AI、安全性和信任是技术战略的核心。
• 协作文化:加入一个高度专业的团队,重视智力严谨性、指导和跨学科合作。
• **理想的候选人将具有医疗背景,并在数据科学领域至少有5年的行业经验,以及3年以上作为专注于agentic AI系统的高级ML工程师的经验***
摘要
高级机器学习工程师 - Agentic AI设计、发展和运营企业级的agentic AI平台功能,使自主和半自主AI系统的安全、可扩展和受治理的部署成为可能。该角色专注于平台架构、互操作性、验证框架和操作保障措施,使内部和第三方代理系统能够在生产医疗环境中可靠地运行。
该职位位于自主AI行为、企业系统集成和受监管的医疗操作的交汇处,在这里,微妙的失败可能会产生系统性和高影响的后果。
主要工作活动
核心职责
• 与企业架构师和平台ML工程师合作,领导企业agentic AI平台的设计、发展和运营。
• 构建平台组件,实现第一方和第三方代理之间的互操作性,包括身份、状态、记忆、工具访问、编排、可审计性和政策执行。
• 定义和记录标准化的集成模式,将代理与企业业务系统、数据平台、API和健康IT系统连接。
• 提供可重用的平台服务、参考实现和SDK,以降低风险并加速应用团队的交付。
• 设计和运营验证和去风险框架,包括模拟、沙盒、影子执行、金丝雀发布和持续行为监控。
• 建立并执行代理开发的平台标准,包括接口、执行合同、评估钩子、安全约束和可观察性要求。
• 参与平台治理、发布协调和事件响应,支持代理相关故障的调查和补救。
• 实施平台保障措施,如回退机制、回滚策略、审批门、速率限制、审计跟踪和紧急停止功能。
• 与软件工程、安全、IT和健康IT利益相关者合作,在安全的企业环境中部署agentic AI功能。
• 通过提示、政策、工具、模型、代理行为的可追溯性以及已知故障模式和限制的文档支持负责任的AI实践。
能力
技术专长
• 具有构建服务于多个下游团队和生产工作负载的AI或ML平台的经验。
• 精通Python,并能将现代ML框架(如PyTorch)与大型语言模型和代理系统集成。
• 拥有使用agentic AI框架(如LangGraph、LangChain、AutoGen、CrewAI、Semantic Kernel或同等框架)的实践经验。
• 了解agentic AI协议和互操作性标准(如MCP、代理间通信、结构化工具调用)。
• 具有实现计划-执行循环、分层代理和多代理协调模式的经验。
• 熟悉工作流编排工具(Airflow、Prefect、Temporal)和分布式执行框架(Ray或同等框架)。
• 具有在企业云环境中使用Kubernetes部署容器化AI平台的经验,具备谱系、可审计性和受控的生产推广。
分析专长
• 能够在系统和平台级别进行推理,平衡安全性、性能、灵活性和可用性。
• 具有设计agentic系统的定量评估策略的经验,包括成功率、延迟、成本、恢复行为和安全指标。
• 深刻理解企业数据治理、安全和隐私要求,包括医疗和健康IT方面的考虑。
• 能够识别源于代理自主性、非确定性、工具访问和多代理交互的系统性风险。
• 具有分析由提示漂移、模型更新、工具更改和跨系统依赖性引起的故障模式的经验。
口头和书面沟通
• 与架构师、应用MLEs、数据科学家、软件工程师和IT合作伙伴有效合作。
• 撰写涵盖平台架构、API、集成模式、验证框架和操作手册的清晰文档。
• 向领导和合作团队传达平台功能、风险和限制。
• 为改善agentic AI开发的安全性、可扩展性和一致性贡献内部标准和共享实践。
• 为平台采用者提供实践的技术指导、指导和故障排除支持。
• 在会议和机构论坛中清晰地呈现技术和非技术概念。
所需教育:计算机科学、软件工程、数据科学、物理、数学与统计学或其他相关工程学科的学士学位。
优先教育:具有科学、工程或相关领域集中研究的硕士学位或博士学位。
所需经验:五年机器学习工程、数据科学、数据工程和/或软件工程经验。拥有硕士学位,需三年经验。拥有博士学位,需一年经验。
优先经验:
• 具有设计、部署和维护在分布式环境中自主和协作运行的agentic AI系统的经验。
• 具有在部署后监控和排除自主代理故障的经验,包括性能下降、临床事件、模型更新或纠正措施。
• 具有提高团队成员技术水平的经验,如建立可重复性实践、评审标准或共享模式。
• 具有在临床工作流程中技术评估第三方agentic AI平台的经验。
德克萨斯大学MD Anderson癌症中心提供优厚的福利,包括医疗、牙科、带薪休假、退休、学费福利、教育机会以及个人和团队的认可。
该职位可能负责维护关键基础设施的安全性和完整性,如德克萨斯商业和商业法典第113.001(2)节中定义的,因此可能需要例行审查和筛选。满足并保持所有必要要求以确保此类基础设施的持续安全性和完整性是聘用和继续就业的条件。
德克萨斯大学MD Anderson癌症中心的政策是提供平等就业机会,不论种族、肤色、宗教、年龄、国籍、性别、性别、性取向、性别认同/表达、残疾、受保护的退伍军人身份、遗传信息或任何其他受机构政策或联邦、州或地方法律保护的基础,除非法律要求此类区分。http://www.mdanderson.org/about-us/legal-and-policy/legal-statements/eeo-affirmative-action.html
附加信息
• 申请ID:178303
• 就业状态:全职
• 员工状态:常规
• 工作周:日班
• 最低工资:美元(USD)146,500
• 中点工资:美元(USD)183,000
• 最高工资:美元(USD)219,500
• FLSA:豁免,不符合加班工资资格
• 资金类型:硬性
• 工作地点:远程(仅限德克萨斯州内)
• 关键职位:是
• 推荐奖金可用?:是
• 搬迁援助可用?:否
#LI-Remote