具备自然语言处理技能的数据科学家

休斯顿 28天前全职 网络
面议
职位描述 职位名称: - 数据科学家 工作地点: - 休斯顿,德克萨斯州(每周5天现场办公) 雇佣类型: - 合同 期限: - 长期 必须具备: - NLP、AWS Bedrock和医疗保健 必备技能 精通使用AWS Nova进行微调 熟练掌握Python和用于NLP和机器学习开发的脚本语言。 具有大型语言模型和代理工作流工具(如LangGraph)的实际经验。 对临床NLP技术有深刻理解,并具备机器学习和深度学习模型的经验。 精通SQL和大数据技术,包括AWS EMR和Spark/pySpark。 具备AWS服务的实际知识,尤其是用于生成AI应用程序的AWS Bedrock。 有使用关系型数据库(如PostgreSQL或MySQL)的经验。 优先技能: - 熟悉医疗保健领域的生成AI应用程序及相关用例。 了解医疗保健数据标准和术语,如HL7、FHIR和CCDA。 具备创建详细文档、用户手册和技术规格的经验。 有NLP输出的自动化测试和验证框架背景。 能够与包括工程和产品在内的跨职能团队有效合作。 接触过LangChain或类似框架,用于构建智能代理工作流。 职责: - 使用AI驱动的NLP技术和高级机器学习模型分析和处理临床文本数据。 通过结合尖端的机器学习和深度学习算法(包括利用大型语言模型(LLMs)和工具如LangGraph在医疗保健环境中进行复杂AI代理工作流)来修改和改进当前工作流。 在NLP开发团队中使用编程或脚本语言(如Python)开发NLP模块。 对文本数据输入进行预处理和质量分析,并验证NLP输出的性能。 为NLP模块创建系统化的测试程序、错误检查机制和用户手册。 构建基础设施,以便从包括MCP服务器在内的多种来源中优化数据的提取、转换和加载,使用SQL和AWS大数据框架如EMR和Spark/pySpark。 与工程团队合作,确保使用SQL和AWS大数据技术实现可扩展和高效的数据工作流。 应用AWS服务的工作知识,特别是AWS Bedrock,开发生成AI应用程序。 利用关系型数据库(如PostgreSQL或MySQL)进行NLP和AI工作流中的数据存储和检索。