职位描述
我们的客户正在寻找一名LLM工程师/研究员。他们拥有一个配备8个H100的DGX集群,正在积极寻找微调,并最终开发我们自己的LLM模型。
职责
● 训练和微调基础LLM模型(例如使用PEFT、Lora、QLora)以满足业务需求
● 构建和维护LLM应用程序和基础设施以满足业务需求
● 设计LLM推理基础设施,以在基础设施限制内可扩展地部署LLM
● 研究和利用LLM生态系统中的一流工具(例如矢量数据库、LlamaIndex等)
● 跟踪LLM的最新研究(例如稀疏模型、硬件特定的LLM)
● 研究并跟踪LLM的最新用例(例如RAG、代理等)
● 与LLM研究团队密切合作,参与基础模型研究,特别是用于训练与生产力相关的LLM
要求
● 具有LLM经验,包括流行的基础模型如Llama2、MPT
● 具有训练和微调基础LLM模型的经验
● 具有量化技术经验,包括llama.cpp、GPTQ等
● 具有与LLM相关的开发经验,例如Llamaindex、Langchain、矢量数据库、提示工程等
● [加分项但非必需] 具有在生产环境中运行LLM的经验(例如Triton推理服务器等)
福利
● 我们提供“全包”薪酬,你将从中支付自己的保险/医疗费用
● 14天假期(以及不限病假)
● 年度设备预算(完成2个月试用期后)