NLP生成型人工智能-使用LLMs进行数据提取和生成 - XA Group招聘

关于XA集团：在XA集团，我们致力于推动汽车和保险行业的重大技术进步。我们的使命是为企业提供智能解决方案，使其更加智能、安全和高效。我们正在寻找一名实习生，能够研究、实施、展示以下与数据提取和生成相关的任务，并使用Transformer和大型语言模型（LLMs）进行度量：主要职责： 1. 文档（文本和表格）的指令微调： a. 为文档特定的指令理解，包括文本和表格，进行LLMs的微调。 b. 处理表格检测（有边框和无边框）、表格结构检测，并将表格与文本进行映射。 c. 实施表格RAG系统。 2. 使用LLM方法创建指令数据集： a. 专注于使用LLM方法创建具有长篇文本和表格的指导性数据集。 b. 在生成特定于领域的专门数据集方面具备专业知识，重点关注特定指令的理解。 3. 为领域特定上下文中的问答任务微调LLM模型： a. 实施LLMs的微调策略，以提取特定于领域的信息，用于问答任务。 b. 展示模型在指定领域上下文中理解和回答查询的能力。 4. 模型量化以提高推理速度和准确性： a. 研究模型量化方法，优化LLMs在推理速度和准确性方面的性能，尤其是在GPU上。 b. 提供不同量化方法的基准和度量，强调速度和准确性之间的权衡。 5. 模型评估和度量： a. 为LLMs在数据提取和生成任务中的性能开发全面的评估度量。 b. 通过清晰简洁的报告，包括可视化和比较，展示研究结果。要求： • 具备生成式人工智能、自然语言处理（NLP）和机器学习的背景。 • 熟练掌握Python等编程语言，并熟悉相关库（如TensorFlow、PyTorch）。有使用LLMs和hugging face transformers的经验。 • 较强的分析和研究能力。 • 有效的沟通能力，包括向利益相关者展示研究结果的能力。 • 能够独立工作和团队合作能力。福利： • 在计算机视觉领域的行业专家指导下进行实习。 • 亲身体验尖端技术和实际应用。 • 有机会为具有意义影响力的项目做出贡献。 • 具有合作创新的工作环境。每月800美元至1,000美元。