关于XA集团:
在XA集团,我们致力于推动汽车和保险行业的重大技术进步。我们的使命是为企业提供智能解决方案,使其更加智能、安全和高效。
我们正在寻找一名实习生,能够研究、实施、展示以下与数据提取和生成相关的任务,并使用Transformer和大型语言模型(LLMs)进行度量:
主要职责:
1. 文档(文本和表格)的指令微调:
a. 为文档特定的指令理解,包括文本和表格,进行LLMs的微调。
b. 处理表格检测(有边框和无边框)、表格结构检测,并将表格与文本进行映射。
c. 实施表格RAG系统。
2. 使用LLM方法创建指令数据集:
a. 专注于使用LLM方法创建具有长篇文本和表格的指导性数据集。
b. 在生成特定于领域的专门数据集方面具备专业知识,重点关注特定指令的理解。
3. 为领域特定上下文中的问答任务微调LLM模型:
a. 实施LLMs的微调策略,以提取特定于领域的信息,用于问答任务。
b. 展示模型在指定领域上下文中理解和回答查询的能力。
4. 模型量化以提高推理速度和准确性:
a. 研究模型量化方法,优化LLMs在推理速度和准确性方面的性能,尤其是在GPU上。
b. 提供不同量化方法的基准和度量,强调速度和准确性之间的权衡。
5. 模型评估和度量:
a. 为LLMs在数据提取和生成任务中的性能开发全面的评估度量。
b. 通过清晰简洁的报告,包括可视化和比较,展示研究结果。
要求:
• 具备生成式人工智能、自然语言处理(NLP)和机器学习的背景。
• 熟练掌握Python等编程语言,并熟悉相关库(如TensorFlow、PyTorch)。有使用LLMs和hugging face transformers的经验。
• 较强的分析和研究能力。
• 有效的沟通能力,包括向利益相关者展示研究结果的能力。
• 能够独立工作和团队合作能力。
福利:
• 在计算机视觉领域的行业专家指导下进行实习。
• 亲身体验尖端技术和实际应用。
• 有机会为具有意义影响力的项目做出贡献。
• 具有合作创新的工作环境。
每月800美元至1,000美元。