数据科学家 NLP & AI
经验要求 - 12年以上相关经验 地点 - 休斯顿,德克萨斯州(每周至少两天现场办公)招聘模式 - C2C 你能获得什么?
作为数据科学家 NLP & AI,您将加入一个致力于构建智能医疗解决方案的敏捷团队。您将设计先进的NLP功能,集成大型语言模型(LLM)和基于代理的AI工作流程,并利用AWS大数据技术来改善临床数据处理、可访问性和可用性。
主要职责
• 使用AI驱动的NLP技术和先进的机器学习模型分析和处理临床文本数据。
• 通过集成现代机器学习和深度学习方法(包括LLM和LangGraph等代理工作流框架)来增强和优化现有工作流程。
• 作为NLP工程团队的一部分,使用Python和其他脚本语言设计和开发NLP模块。
• 执行数据预处理、质量评估和NLP模型输出的验证。
• 为NLP解决方案开发结构化测试方法、错误检测机制和用户文档。
• 构建和维护数据基础设施,以便从包括MCP服务器在内的多种数据源高效提取、转换和加载(ETL),使用SQL和AWS大数据工具如EMR和Spark/pySpark。
• 与工程团队合作,确保利用SQL和AWS技术的可扩展、高性能数据工作流程。
• 应用AWS服务的实践知识,特别是AWS Bedrock,构建生成式AI解决方案。
• 利用关系数据库如PostgreSQL和MySQL支持NLP和AI管道。
教育背景
• 工程学位:BE / ME / BTech / MTech / BSc / MSc
• 多种技术的技术认证是加分项
必备技能
• 精通Python和脚本编写,用于NLP和机器学习开发
• 具有临床NLP技术和ML/DL模型的丰富经验
• 拥有LLM和LangGraph等代理工作流工具的实践经验
• 精通SQL和包括AWS EMR和Spark/pySpark在内的大数据技术
• 具有AWS服务的实际经验,尤其是AWS Bedrock
• 有使用PostgreSQL或MySQL等关系数据库的经验
优先技能
• 在医疗保健用例中接触过生成式AI解决方案
• 了解医疗数据标准和术语(HL7、FHIR、CCDA)
• 有撰写技术文档、用户指南和规格说明的经验
• 在NLP系统的自动化测试和验证框架方面有背景
• 具有跨工程和产品团队的强大协作能力
• 熟悉LangChain或类似的基于代理的AI框架