职位描述我们的客户正在寻找一名 LLM 工程师 / 研究员。他们拥有一个配备 8 个 H100 的 DGX 集群，并积极寻求微调并最终开发自己的 LLM 模型。职责 ● 训练和微调基础 LLM 模型（例如，使用 PEFT、Lora、QLora）以满足业务需求 ● 构建和维护 LLM 应用程序和基础设施以满足业务需求 ● 设计 LLM 推理基础设施，以在基础设施约束内可扩展地部署 LLM ● 在 LLM 生态系统中研究和利用最佳工具（例如，向量数据库、LlamaIndex 等） ● 跟进 LLM 领域的最新研究（例如，稀疏模型、硬件特定的 LLM） ● 研究并跟进 LLM 的最新用例（例如，RAG、代理等） ● 与 LLM 研究团队密切合作，参与基础模型研究，特别是针对培训生产力相关的 LLM 要求 ● 具有 LLM 相关经验，包括流行的基础模型，如 Llama2、MPT ● 具有训练和微调基础 LLM 模型的经验 ● 具有量化技术的经验，包括 llama.cpp、GPTQ 等 ● 具有 LLM 相关开发的经验，例如 Llamaindex、Langchain、向量数据库、提示工程等 ● [加分项但非必需] 具有在生产环境中运行 LLM 的经验（例如，Triton 推理服务器等）福利 ● 我们提供“全包”薪资，您将从中支付自己的保险/医疗费用 ● 14 天假期（无限制病假） ● 年度设备预算（在完成两个月的试用期后）

LLM 工程师 / 研究员

Helius