职位描述我们的客户正在寻找一名LLM工程师/研究员。他们拥有一个配备8个H100的DGX集群，正在积极寻找微调，并最终开发我们自己的LLM模型。职责 ● 训练和微调基础LLM模型（例如使用PEFT、Lora、QLora）以满足业务需求 ● 构建和维护LLM应用程序和基础设施以满足业务需求 ● 设计LLM推理基础设施，以在基础设施限制内可扩展地部署LLM ● 研究和利用LLM生态系统中的一流工具（例如矢量数据库、LlamaIndex等） ● 跟踪LLM的最新研究（例如稀疏模型、硬件特定的LLM） ● 研究并跟踪LLM的最新用例（例如RAG、代理等） ● 与LLM研究团队密切合作，参与基础模型研究，特别是用于训练与生产力相关的LLM 要求 ● 具有LLM经验，包括流行的基础模型如Llama2、MPT ● 具有训练和微调基础LLM模型的经验 ● 具有量化技术经验，包括llama.cpp、GPTQ等 ● 具有与LLM相关的开发经验，例如Llamaindex、Langchain、矢量数据库、提示工程等 ● [加分项但非必需] 具有在生产环境中运行LLM的经验（例如Triton推理服务器等）福利 ● 我们提供“全包”薪酬，你将从中支付自己的保险/医疗费用 ● 14天假期（以及不限病假） ● 年度设备预算（完成2个月试用期后）

LLM工程师/研究员

Helius