LLM工程师(数据与优化)

香港 3天前全职 网络
面议
作为大型模型算法工程师,您将专注于大型语言模型(LLM)和多模态大型模型的技术研发,推动其在工业垂直领域的应用。您将参与模型训练、优化和推理部署等核心流程,同时与顶尖大学研究团队合作,探索前沿技术,提高模型性能和效率。 主要职责 • 负责垂直领域大型模型的训练、微调(SFT)和系统部署,促进大型模型在工业环境中的高效应用。 • 研究并实施大型模型的压缩和优化技术,包括剪枝、量化和知识蒸馏,以提高推理效率和部署性能。 • 参与RAG(检索增强生成)和Agent模块的算法设计与开发,以增强动态和复杂环境中的推理能力。 • 研究并应用多模态理解技术,以优化大型视觉模型(LVM)在工业视觉及其他领域的应用。 • 将业务规则转化为高效的工作流代码,并参与Agentic Workflow的设计与实施,以增强工作流智能。 • 构建行业数据集以支持大型模型的训练和应用,包括数据预处理、预训练数据构建和训练/应用/评估数据集设置。 • 研究并实施大型模型合并技术,探索多模型的协同优化解决方案。 • 开发和维护大型模型的验证、评估和性能监控流程,以确保系统的稳定性和可用性。 • 参与大型模型应用平台(微服务)的开发和优化,以增强系统的模块化和可用性。 资格要求 • 数学、电气工程、计算机科学、数据科学或相关领域的硕士或更高学位优先。 • 精通机器学习、深度学习和Transformer架构,具有大型模型端到端训练和开发的实际经验。 • 熟悉大型模型压缩和优化方法,如剪枝、量化和知识蒸馏。 • 具备大规模数据处理能力,熟悉大数据工具(如Hadoop、Spark),具有数据预处理、清洗和构建训练数据集的经验。 • 熟练掌握Python、C/C++和Linux编程,具备扎实的算法和数据结构基础。 • 熟悉主流大型模型训练和推理框架,如PyTorch、Hugging Face(HF)、DeepSpeed、PEFT、vLLM、TRL等。 • 了解Triton或其他高性能推理工具,具有将模型优化应用于实际部署的经验。 • 精通Docker和Linux shell脚本;有FastAPI开发经验者优先。 • 有企业级大型模型开发、优化、部署和工具开发经验者优先。 • 具备较强的团队合作和沟通能力,能够与跨领域团队合作。 • 对前沿大型模型技术及其在工业垂直领域的应用充满热情。 加分项 • 具有RAG系统和Agent模块开发与优化经验。 • 熟悉CUDA编程、分布式计算或相关高性能计算技术。 • 在顶级会议(如NeurIPS、ICLR、CVPR)上发表过论文。 • 了解硬件加速技术(如GPU、TPU)及其在模型优化中的应用。