我正在寻找能够建立一个稳固且可靠的提示框架的人,该框架可以为商业用例提供可衡量的投资回报,而不仅仅是令人印象深刻的演示。我们需要一位像系统架构师一样思考的提示工程师,而不仅仅是能写出巧妙提示的人。您将负责设计、测试和优化用于生产级AI工作流程的提示。这不是让ChatGPT写诗,而是构建可靠、可扩展的提示链来解决实际的商业问题。
交付成果
您的工作内容:
设计和优化用于LLM驱动的自动化工作流程的提示(GPT-4、Claude、开源模型)
构建评估框架,以衡量提示性能与业务关键绩效指标的对比
开发用于多步骤推理任务的提示模板和链
记录提示工程模式并创建可重用的库
使用LangChain等框架协作开发代理AI系统
在模型输出不符合规范时调试和迭代提示
所需技能和经验:
2年以上实际提示工程经验(如果有良好记录的个人项目也算)
对提示模式有深刻理解:思维链、少样本学习、系统提示架构、检索增强生成(RAG)
具有提示评估和A/B测试方法的经验
熟悉标记化、上下文窗口管理和特定模型的特点
优秀的技术写作能力——能够清晰解释复杂的提示逻辑
Python熟练,用于提示测试和自动化集成
优先(非必需):
具备ML/AI基础知识背景(理解transformers、嵌入、微调概念),至少具备基础的AI/ML理解,不需要训练模型,但理解温度、上下文窗口和模型限制等概念。
有n8n、Make或类似自动化平台的经验
接触过代理框架(LangChain、AutoGPT模式、函数调用)
在您的申请中,请以“CONTEXT:”开头,并用一句话总结根据此职位描述我们的AI工程方法有何不同。没有此内容的申请将不予审核。
评估任务(申请时必需)
代替多轮面试,完成此实际评估:
场景:客户希望自动化客户支持票据分类。票据应分类为:账单、技术、功能请求或升级。模型有时会将紧急技术问题误分类为“功能请求”。
您的任务:
编写您将使用的系统提示
提供3-5个您将包含的少样本示例
解释您在结构选择上的理由
描述您将如何评估和迭代此提示
时间估计:30-45分钟。我们重视深思熟虑的推理而非速度。
此任务揭示:他们是否理解边缘案例?他们能否系统地构建提示?他们是否考虑评估?AI生成的响应通常会遗漏选择背后的细微“原因”。
成功的表现
在大规模上可靠工作的提示,而不仅仅是在演示中
清晰的文档,其他工程师可以接手
数据驱动的迭代,而不仅仅是“尝试直到成功”。
申请方式:提交您的评估响应和关于您解决过的提示工程挑战的简短说明。通用申请将不予审核。