数据科学家 – NLP与AI 经验：7年以上地点：休斯顿，德克萨斯州 – 每周至少两天在办公室工作职位亮点：作为数据科学家 – NLP与AI，您将成为一个敏捷团队的一员，专注于通过开发高级NLP模块、整合大型语言模型（LLM）和代理工作流，以及利用AWS大数据技术来构建智能医疗解决方案，以增强临床数据处理和可用性。职责： - 使用AI驱动的NLP技术和高级机器学习模型分析和处理临床文本数据。 - 通过整合尖端的机器学习和深度学习算法（包括利用大型语言模型和LangGraph等工具）来修改和改进当前工作流，以适应医疗环境中的复杂AI代理工作流。 - 使用Python等编程或脚本语言在NLP开发团队中开发NLP模块。 - 对文本数据输入进行预处理和质量分析，并验证NLP输出的性能。 - 创建系统化的测试程序、错误检查机制和NLP模块的用户手册。 - 构建基础设施，以便从包括MCP服务器在内的多样化来源中优化数据的提取、转换和加载，使用SQL和AWS大数据框架如EMR和Spark/pySpark。 - 与工程团队合作，确保使用SQL和AWS大数据技术实现可扩展和高效的数据工作流。 - 应用AWS服务的工作知识，特别是AWS Bedrock，来开发生成式AI应用。 - 利用关系数据库如PostgreSQL或MySQL进行NLP和AI工作流中的数据存储和检索。技能：必备技能 - 精通Python和脚本语言，用于NLP和机器学习开发。 - 对临床NLP技术有深刻理解，并具有机器学习和深度学习模型的经验。 - 拥有大型语言模型和代理工作流工具如LangGraph的实际操作经验。 - 精通SQL和大数据技术，包括AWS EMR和Spark/pySpark。 - 具备AWS服务的实际知识，特别是用于生成式AI应用的AWS Bedrock。 - 具有使用关系数据库如PostgreSQL或MySQL的经验。加分技能 - 熟悉医疗保健中的生成式AI应用及相关用例。 - 了解医疗数据标准和术语，如HL7、FHIR和CCDA。 - 具有创建详细文档、用户手册和技术规范的经验。 - 拥有NLP输出的自动化测试和验证框架背景。 - 能够与包括工程和产品在内的跨职能团队有效合作。 - 接触过LangChain或类似框架，用于构建智能代理工作流。教育资格： - 工程学位 – BE/ME/BTech/MTech/BSc/MSc。 - 拥有多种技术的技术认证者优先。

数据科学家 - 自然语言处理与人工智能

VeeRteq Solutions Inc.