我正在寻找能够构建一个稳固且可靠的提示框架的人,该框架能为商业用例提供可衡量的投资回报,而不仅仅是令人印象深刻的演示。我们需要一位像系统架构师一样思考的提示工程师,而不仅仅是能编写巧妙提示的人。您将负责设计、测试和优化用于生产级AI工作流程的提示。这不仅仅是让ChatGPT写诗,而是构建可靠、可扩展的提示链来解决实际的商业问题。
交付内容
您的工作内容:
为基于LLM的自动化工作流程(GPT-4、Claude、开源模型)设计和优化提示
构建评估框架以衡量提示在商业KPI上的表现
开发用于多步骤推理任务的提示模板和链
记录提示工程模式并创建可重用的库
使用LangChain等框架协作开发代理AI系统
在模型输出不符合规格时调试和迭代提示
所需技能和经验:
2年以上动手提示工程经验(如果有详细记录的个人项目也算)
对提示模式有深刻理解:思维链、少样本学习、系统提示架构、检索增强生成(RAG)
具有提示评估和A/B测试方法的经验
熟悉标记化、上下文窗口管理和模型特定的怪癖
强大的技术写作能力——能够清晰解释复杂的提示逻辑
熟练使用Python进行提示测试和自动化集成
优先(非必需):
具备ML/AI基础知识背景(对transformers、嵌入、微调概念的理解),至少具备基础的AI/ML理解,不需要训练模型,但理解温度、上下文窗口和模型限制等概念
有使用n8n、Make或类似自动化平台的经验
接触过代理框架(LangChain、AutoGPT模式、函数调用)
在您的申请中,请以“CONTEXT:”开头,并用一句话总结根据此职位描述我们的AI工程方法有什么不同。没有此内容的申请将不予审阅。
评估任务(申请时必需)
与其进行多轮面试,不如完成此实际评估:
场景:客户希望自动化客户支持票据分类。票据应分类为:账单、技术、功能请求或升级。模型有时会将紧急技术问题误分类为“功能请求”。
您的任务:
编写您将使用的系统提示
提供3-5个您将包含的少样本示例
解释您在结构选择上的理由
描述您将如何评估和迭代此提示
时间估计:30-45分钟。我们重视深思熟虑的推理而非速度。
此任务揭示:他们是否理解边缘情况?他们能否系统地构建提示?他们是否考虑评估?AI生成的响应通常会错过选择背后的细微“原因”。
成功的表现
在规模上可靠工作的提示,而不仅仅是在演示中
清晰的文档,另一个工程师可以接手
基于数据的迭代,而不仅仅是“尝试直到成功”。
申请方式:提交您的评估响应和关于您解决的提示工程挑战的简短说明。泛泛的申请将不予审阅。