NLP生成型人工智能-使用LLMs进行数据提取和生成

无个税15个月前实习
800 - 1K USD / 月 XA Group

XA Group

location 迪拜
unsaved
关于XA集团: 在XA集团,我们致力于推动汽车和保险行业的重大技术进步。我们的使命是为企业提供智能解决方案,使其更加智能、安全和高效。 我们正在寻找一名实习生,能够研究、实施、展示以下与数据提取和生成相关的任务,并使用Transformer和大型语言模型(LLMs)进行度量: 主要职责: 1. 文档(文本和表格)的指令微调: a. 为文档特定的指令理解,包括文本和表格,进行LLMs的微调。 b. 处理表格检测(有边框和无边框)、表格结构检测,并将表格与文本进行映射。 c. 实施表格RAG系统。 2. 使用LLM方法创建指令数据集: a. 专注于使用LLM方法创建具有长篇文本和表格的指导性数据集。 b. 在生成特定于领域的专门数据集方面具备专业知识,重点关注特定指令的理解。 3. 为领域特定上下文中的问答任务微调LLM模型: a. 实施LLMs的微调策略,以提取特定于领域的信息,用于问答任务。 b. 展示模型在指定领域上下文中理解和回答查询的能力。 4. 模型量化以提高推理速度和准确性: a. 研究模型量化方法,优化LLMs在推理速度和准确性方面的性能,尤其是在GPU上。 b. 提供不同量化方法的基准和度量,强调速度和准确性之间的权衡。 5. 模型评估和度量: a. 为LLMs在数据提取和生成任务中的性能开发全面的评估度量。 b. 通过清晰简洁的报告,包括可视化和比较,展示研究结果。 要求: • 具备生成式人工智能、自然语言处理(NLP)和机器学习的背景。 • 熟练掌握Python等编程语言,并熟悉相关库(如TensorFlow、PyTorch)。有使用LLMs和hugging face transformers的经验。 • 较强的分析和研究能力。 • 有效的沟通能力,包括向利益相关者展示研究结果的能力。 • 能够独立工作和团队合作能力。 福利: • 在计算机视觉领域的行业专家指导下进行实习。 • 亲身体验尖端技术和实际应用。 • 有机会为具有意义影响力的项目做出贡献。 • 具有合作创新的工作环境。 每月800美元至1,000美元。