职位描述职位名称： - 数据科学家工作地点： - 休斯顿，德克萨斯州（每周5天现场办公）雇佣类型： - 合同期限： - 长期必须具备： - NLP、AWS Bedrock和医疗保健必备技能精通使用AWS Nova进行微调熟练掌握Python和用于NLP和机器学习开发的脚本语言。具有大型语言模型和代理工作流工具（如LangGraph）的实际经验。对临床NLP技术有深刻理解，并具备机器学习和深度学习模型的经验。精通SQL和大数据技术，包括AWS EMR和Spark/pySpark。具备AWS服务的实际知识，尤其是用于生成AI应用程序的AWS Bedrock。有使用关系型数据库（如PostgreSQL或MySQL）的经验。优先技能： - 熟悉医疗保健领域的生成AI应用程序及相关用例。了解医疗保健数据标准和术语，如HL7、FHIR和CCDA。具备创建详细文档、用户手册和技术规格的经验。有NLP输出的自动化测试和验证框架背景。能够与包括工程和产品在内的跨职能团队有效合作。接触过LangChain或类似框架，用于构建智能代理工作流。职责： - 使用AI驱动的NLP技术和高级机器学习模型分析和处理临床文本数据。通过结合尖端的机器学习和深度学习算法（包括利用大型语言模型（LLMs）和工具如LangGraph在医疗保健环境中进行复杂AI代理工作流）来修改和改进当前工作流。在NLP开发团队中使用编程或脚本语言（如Python）开发NLP模块。对文本数据输入进行预处理和质量分析，并验证NLP输出的性能。为NLP模块创建系统化的测试程序、错误检查机制和用户手册。构建基础设施，以便从包括MCP服务器在内的多种来源中优化数据的提取、转换和加载，使用SQL和AWS大数据框架如EMR和Spark/pySpark。与工程团队合作，确保使用SQL和AWS大数据技术实现可扩展和高效的数据工作流。应用AWS服务的工作知识，特别是AWS Bedrock，开发生成AI应用程序。利用关系型数据库（如PostgreSQL或MySQL）进行NLP和AI工作流中的数据存储和检索。

具备自然语言处理技能的数据科学家

VBeyond Corporation