数据科学家 自然语言处理与人工智能

休斯顿 3天前全职 网络
面议
数据科学家 NLP & AI 经验要求 - 12年以上相关经验 地点 - 休斯顿,德克萨斯州(每周至少两天现场办公)招聘模式 - C2C 你能获得什么? 作为数据科学家 NLP & AI,您将加入一个致力于构建智能医疗解决方案的敏捷团队。您将设计先进的NLP功能,集成大型语言模型(LLM)和基于代理的AI工作流程,并利用AWS大数据技术来改善临床数据处理、可访问性和可用性。 主要职责 • 使用AI驱动的NLP技术和先进的机器学习模型分析和处理临床文本数据。 • 通过集成现代机器学习和深度学习方法(包括LLM和LangGraph等代理工作流框架)来增强和优化现有工作流程。 • 作为NLP工程团队的一部分,使用Python和其他脚本语言设计和开发NLP模块。 • 执行数据预处理、质量评估和NLP模型输出的验证。 • 为NLP解决方案开发结构化测试方法、错误检测机制和用户文档。 • 构建和维护数据基础设施,以便从包括MCP服务器在内的多种数据源高效提取、转换和加载(ETL),使用SQL和AWS大数据工具如EMR和Spark/pySpark。 • 与工程团队合作,确保利用SQL和AWS技术的可扩展、高性能数据工作流程。 • 应用AWS服务的实践知识,特别是AWS Bedrock,构建生成式AI解决方案。 • 利用关系数据库如PostgreSQL和MySQL支持NLP和AI管道。 教育背景 • 工程学位:BE / ME / BTech / MTech / BSc / MSc • 多种技术的技术认证是加分项 必备技能 • 精通Python和脚本编写,用于NLP和机器学习开发 • 具有临床NLP技术和ML/DL模型的丰富经验 • 拥有LLM和LangGraph等代理工作流工具的实践经验 • 精通SQL和包括AWS EMR和Spark/pySpark在内的大数据技术 • 具有AWS服务的实际经验,尤其是AWS Bedrock • 有使用PostgreSQL或MySQL等关系数据库的经验 优先技能 • 在医疗保健用例中接触过生成式AI解决方案 • 了解医疗数据标准和术语(HL7、FHIR、CCDA) • 有撰写技术文档、用户指南和规格说明的经验 • 在NLP系统的自动化测试和验证框架方面有背景 • 具有跨工程和产品团队的强大协作能力 • 熟悉LangChain或类似的基于代理的AI框架