职位描述: • 设计、部署和运营模型上下文协议 (MCP) 服务器,处理检查点路由,管理上下文窗口,并实施安全门 • 构建离线和实时评估管道,以进行对齐、事实验证、基础支持和幻觉检测 该职位要求具备使用 DeepSpeed/FSDP、LoRA/QLoRA 进行分布式训练和推理的经验,以及在 vLLM 或 Triton 集群上的混合精度和性能调优经验。 还需熟悉模型对齐、JSON-schema 函数调用和外部工具集成。