职位描述
职位名称:
- 数据科学家
工作地点:
- 休斯顿,德克萨斯州(每周5天现场办公)
雇佣类型:
- 合同
期限:
- 长期
必须具备:
- NLP、AWS Bedrock和医疗保健
必备技能
精通使用AWS Nova进行微调
熟练掌握Python和用于NLP和机器学习开发的脚本语言。
具有大型语言模型和代理工作流工具(如LangGraph)的实际经验。
对临床NLP技术有深刻理解,并具备机器学习和深度学习模型的经验。
精通SQL和大数据技术,包括AWS EMR和Spark/pySpark。
具备AWS服务的实际知识,尤其是用于生成AI应用程序的AWS Bedrock。
有使用关系型数据库(如PostgreSQL或MySQL)的经验。
优先技能:
- 熟悉医疗保健领域的生成AI应用程序及相关用例。
了解医疗保健数据标准和术语,如HL7、FHIR和CCDA。
具备创建详细文档、用户手册和技术规格的经验。
有NLP输出的自动化测试和验证框架背景。
能够与包括工程和产品在内的跨职能团队有效合作。
接触过LangChain或类似框架,用于构建智能代理工作流。
职责:
- 使用AI驱动的NLP技术和高级机器学习模型分析和处理临床文本数据。
通过结合尖端的机器学习和深度学习算法(包括利用大型语言模型(LLMs)和工具如LangGraph在医疗保健环境中进行复杂AI代理工作流)来修改和改进当前工作流。
在NLP开发团队中使用编程或脚本语言(如Python)开发NLP模块。
对文本数据输入进行预处理和质量分析,并验证NLP输出的性能。
为NLP模块创建系统化的测试程序、错误检查机制和用户手册。
构建基础设施,以便从包括MCP服务器在内的多种来源中优化数据的提取、转换和加载,使用SQL和AWS大数据框架如EMR和Spark/pySpark。
与工程团队合作,确保使用SQL和AWS大数据技术实现可扩展和高效的数据工作流。
应用AWS服务的工作知识,特别是AWS Bedrock,开发生成AI应用程序。
利用关系型数据库(如PostgreSQL或MySQL)进行NLP和AI工作流中的数据存储和检索。