经验要求 - 12年以上相关经验
地点 - 休斯顿, 德克萨斯州(每周至少两天现场办公)
招聘模式 - C2C
对你有什么好处?
作为一名数据科学家(NLP和AI),您将加入一个致力于构建智能医疗解决方案的敏捷团队。您将设计先进的NLP功能,整合大型语言模型(LLMs)和基于代理的AI工作流程,并利用AWS大数据技术来改善临床数据处理、可访问性和可用性。
主要职责
- 使用AI驱动的NLP技术和先进的机器学习模型分析和处理临床文本数据。
- 通过整合现代机器学习和深度学习方法(包括LLMs和LangGraph等代理工作流框架)来增强和优化现有工作流程。
- 作为NLP工程团队的一部分,使用Python和其他脚本语言设计和开发NLP模块。
- 执行数据预处理、质量评估和NLP模型输出的验证。
- 为NLP解决方案开发结构化测试方法、错误检测机制和用户文档。
- 构建和维护数据基础设施,以实现从多种数据源(包括MCP服务器)高效提取、转换和加载(ETL),使用SQL和AWS大数据工具如EMR和Spark/pySpark。
- 与工程团队合作,确保利用SQL和AWS技术的可扩展、高性能数据工作流程。
- 应用AWS服务的实际知识,特别是AWS Bedrock,以构建生成性AI解决方案。
- 使用关系数据库如PostgreSQL和MySQL支持NLP和AI管道。
教育背景
- 工程学位:BE / ME / BTech / MTech / BSc / MSc
- 多种技术的技术认证是加分项
必备技能
- 精通Python和脚本编写,用于NLP和机器学习开发
- 具有扎实的临床NLP技术和ML/DL模型经验
- 拥有LLMs和LangGraph等代理工作流工具的实际操作经验
- 精通SQL和大数据技术,包括AWS EMR和Spark/pySpark
- 具有AWS服务的实际经验,特别是AWS Bedrock
- 有使用关系数据库如PostgreSQL或MySQL的经验
加分技能
- 在医疗保健用例中接触过生成性AI解决方案
- 了解医疗数据标准和术语(HL7, FHIR, CCDA)
- 具有撰写技术文档、用户指南和规格说明的经验
- 具有NLP系统的自动化测试和验证框架背景
- 具备跨工程和产品团队的强大协作能力
- 熟悉LangChain或类似的基于代理的AI框架