职位描述
我们的客户正在寻找一名 LLM 工程师 / 研究员。他们拥有一个配备 8 个 H100 的 DGX 集群,并积极寻求微调并最终开发自己的 LLM 模型。
职责
● 训练和微调基础 LLM 模型(例如,使用 PEFT、Lora、QLora)以满足业务需求
● 构建和维护 LLM 应用程序和基础设施以满足业务需求
● 设计 LLM 推理基础设施,以在基础设施约束内可扩展地部署 LLM
● 在 LLM 生态系统中研究和利用最佳工具(例如,向量数据库、LlamaIndex 等)
● 跟进 LLM 领域的最新研究(例如,稀疏模型、硬件特定的 LLM)
● 研究并跟进 LLM 的最新用例(例如,RAG、代理等)
● 与 LLM 研究团队密切合作,参与基础模型研究,特别是针对培训生产力相关的 LLM
要求
● 具有 LLM 相关经验,包括流行的基础模型,如 Llama2、MPT
● 具有训练和微调基础 LLM 模型的经验
● 具有量化技术的经验,包括 llama.cpp、GPTQ 等
● 具有 LLM 相关开发的经验,例如 Llamaindex、Langchain、向量数据库、提示工程等
● [加分项但非必需] 具有在生产环境中运行 LLM 的经验(例如,Triton 推理服务器等)
福利
● 我们提供“全包”薪资,您将从中支付自己的保险/医疗费用
● 14 天假期(无限制病假)
● 年度设备预算(在完成两个月的试用期后)