软件工程师,人工智能(Python)

渥太华 2天前全职 网络
面议
软件工程师,AI — 代码评估与培训(远程) 接受的国家和地区列表 帮助训练大型语言模型(LLM)以编写生产级代码,涵盖广泛的编程语言: - 比较和排名多个代码片段,解释哪个最好以及原因。 - 修复和重构AI生成的代码,以确保正确性、效率和风格。 - 将反馈(评分、编辑、测试结果)注入RLHF管道,并保持其顺畅运行。 最终结果:模型学习像你一样提出、批评和改进代码。 RLHF一句话概括 生成代码 ➜ 专家工程师排名、编辑和解释 ➜ 将反馈转换为奖励信号 ➜ 强化学习调整模型以生成你实际会发布的代码。 你需要具备的条件 - 3年以上Python专业软件工程经验 (有约束编程经验者优先,但不是必须) - 强烈的代码审查直觉——你能快速发现逻辑错误、性能陷阱和安全问题。 - 极高的细节关注度和优秀的书面沟通能力。 该角色的大部分工作涉及解释为什么一种方法优于另一种。这一点不能被过分强调。 - 你喜欢阅读文档和语言规范,并在异步、低监督的环境中茁壮成长。 你不需要具备的条件 - 无需事先的RLHF(人类反馈的强化学习)或AI培训经验。 - 无需深厚的机器学习知识。如果你能清晰地审查和批评代码,我们会教你其余的。 技术栈 我们正在寻找对Python有强大掌握能力的工程师。 后勤 - 地点:完全远程——可在任何地方工作 - 薪酬:每小时$30至$70,视地点和资历而定 - 工作时间:每周至少15小时,最多40小时 - 合同形式:1099合同 直接的影响,无冗余。如果这听起来合适,请在此申请!