首席AI工程师(LLM代理与编排)

新加坡 15天前全职 网络
面议
首席AI工程师(LLM代理与编排) 职位名称:首席AI工程师(LLM代理与编排) 团队:Chatly工程 重点:构建自主“超级代理” 我们是谁 Vyro正在重新定义数字创意的未来。我们构建由人工智能和机器学习驱动的尖端内容创作工具,帮助数百万创作者、设计师和讲故事者轻松实现他们的想象力。 Vyro每月拥有超过500万活跃创作者的全球用户群,其20多个AI驱动的应用正在改变人们在图像、视频及其他领域的设计、编辑和表达方式。 从直观的AI照片编辑器到下一代视频创作平台,我们的产品旨在让创意变得可访问、快速且无限制。 在Vyro,我们是一支由创新者、建设者和梦想家组成的团队——被称为Vyronauts——由激情、目标和技术应激发创意而非复杂化的信念驱动。 如果您对塑造下一波AI驱动的创意感到兴奋,Vyro就是您的理想之地。 关于该职位 我们正在寻找大型语言模型(LLM)方面的深度专家,以领导我们在Chatly中“超级代理”的架构开发。您将超越简单的聊天界面,构建能够进行复杂推理、工具使用和与外部工作流无缝集成的自主代理。 主要职责 代理架构:设计和实施有状态的代理工作流(使用LangGraph框架或自定义Python/TypeScript解决方案),能够进行计划、执行和自我纠正。 集成生态系统:构建代理的“手”。开发强大的集成层,使LLM能够可靠地与我们的内部API、数据库和第三方工具进行交互。 延迟与可靠性:优化推理管道的速度(流媒体、令牌优化)和可靠性(处理幻觉、结构化输出验证)。 记忆系统:架构先进的RAG(检索增强生成)系统,使超级代理在会话中具有持久的记忆和上下文意识。 评估与可观察性:建立严格的测试框架,以确保代理在生产中按预期行为输出非确定性模型。 技术要求 核心技术栈:精通Python(或TypeScript)和现代AI技术栈(LangChain, LlamaIndex, DSPy)。 模型内部:深入理解如何利用特定模型的优势(例如,GPT-4o用于推理,Haiku/Flash用于速度)以及函数调用/工具使用经验。 向量搜索:具有向量数据库(Pinecone, Milvus, Weaviate)和嵌入策略的实际经验。 系统设计:具有设计事件驱动架构的经验,其中代理响应触发器,而不仅仅是用户提示。 为什么加入我们? 有机会参与Chatly和Imagine等创新AI产品的开发,塑造创意和用户互动的未来。 成为重视创新和数据驱动决策的充满激情、快速发展的团队的一员。 具有竞争力的薪酬和福利。 在鼓励学习、成长和尝试新想法的文化中工作。