数据科学家 自然语言处理与人工智能

休斯顿 3天前全职 网络
面议
经验要求 - 12年以上相关经验 地点 - 休斯顿, 德克萨斯州(每周至少两天现场办公) 招聘模式 - C2C 对你有什么好处? 作为一名数据科学家(NLP和AI),您将加入一个致力于构建智能医疗解决方案的敏捷团队。您将设计先进的NLP功能,整合大型语言模型(LLMs)和基于代理的AI工作流程,并利用AWS大数据技术来改善临床数据处理、可访问性和可用性。 主要职责 - 使用AI驱动的NLP技术和先进的机器学习模型分析和处理临床文本数据。 - 通过整合现代机器学习和深度学习方法(包括LLMs和LangGraph等代理工作流框架)来增强和优化现有工作流程。 - 作为NLP工程团队的一部分,使用Python和其他脚本语言设计和开发NLP模块。 - 执行数据预处理、质量评估和NLP模型输出的验证。 - 为NLP解决方案开发结构化测试方法、错误检测机制和用户文档。 - 构建和维护数据基础设施,以实现从多种数据源(包括MCP服务器)高效提取、转换和加载(ETL),使用SQL和AWS大数据工具如EMR和Spark/pySpark。 - 与工程团队合作,确保利用SQL和AWS技术的可扩展、高性能数据工作流程。 - 应用AWS服务的实际知识,特别是AWS Bedrock,以构建生成性AI解决方案。 - 使用关系数据库如PostgreSQL和MySQL支持NLP和AI管道。 教育背景 - 工程学位:BE / ME / BTech / MTech / BSc / MSc - 多种技术的技术认证是加分项 必备技能 - 精通Python和脚本编写,用于NLP和机器学习开发 - 具有扎实的临床NLP技术和ML/DL模型经验 - 拥有LLMs和LangGraph等代理工作流工具的实际操作经验 - 精通SQL和大数据技术,包括AWS EMR和Spark/pySpark - 具有AWS服务的实际经验,特别是AWS Bedrock - 有使用关系数据库如PostgreSQL或MySQL的经验 加分技能 - 在医疗保健用例中接触过生成性AI解决方案 - 了解医疗数据标准和术语(HL7, FHIR, CCDA) - 具有撰写技术文档、用户指南和规格说明的经验 - 具有NLP系统的自动化测试和验证框架背景 - 具备跨工程和产品团队的强大协作能力 - 熟悉LangChain或类似的基于代理的AI框架