LLM工程师/研究员

新加坡 3天前全职 网络
面议
职位描述 我们的客户正在寻找一名LLM工程师/研究员。他们拥有一个配备8个H100的DGX集群,正在积极寻找微调,并最终开发我们自己的LLM模型。 职责 ● 训练和微调基础LLM模型(例如使用PEFT、Lora、QLora)以满足业务需求 ● 构建和维护LLM应用程序和基础设施以满足业务需求 ● 设计LLM推理基础设施,以在基础设施限制内可扩展地部署LLM ● 研究和利用LLM生态系统中的一流工具(例如矢量数据库、LlamaIndex等) ● 跟踪LLM的最新研究(例如稀疏模型、硬件特定的LLM) ● 研究并跟踪LLM的最新用例(例如RAG、代理等) ● 与LLM研究团队密切合作,参与基础模型研究,特别是用于训练与生产力相关的LLM 要求 ● 具有LLM经验,包括流行的基础模型如Llama2、MPT ● 具有训练和微调基础LLM模型的经验 ● 具有量化技术经验,包括llama.cpp、GPTQ等 ● 具有与LLM相关的开发经验,例如Llamaindex、Langchain、矢量数据库、提示工程等 ● [加分项但非必需] 具有在生产环境中运行LLM的经验(例如Triton推理服务器等) 福利 ● 我们提供“全包”薪酬,你将从中支付自己的保险/医疗费用 ● 14天假期(以及不限病假) ● 年度设备预算(完成2个月试用期后)