软件工程师，AI — 代码评估与培训（远程）接受的国家和地区列表帮助训练大型语言模型（LLMs）编写生产级代码，涵盖多种编程语言： - 比较和排名多个代码片段，解释哪个最好以及原因。 - 修复和重构AI生成的代码，以确保正确性、效率和风格。 - 将反馈（评分、编辑、测试结果）注入RLHF管道，并保持其顺畅运行。最终结果：模型学会像你一样提出、批评和改进代码。 RLHF一句话概括生成代码 ➜ 专家工程师排名、编辑并解释 ➜ 将反馈转换为奖励信号 ➜ 强化学习调整模型以生成你愿意发布的代码。你需要具备的条件 - 3年以上Python专业软件工程经验（有约束编程经验者优先，但不是必需） - 强烈的代码审查直觉——你能快速发现逻辑错误、性能陷阱和安全问题。 - 极其注重细节和优秀的书面沟通能力。这个角色很大一部分涉及解释为什么一种方法优于另一种。这一点不能被过分强调。 - 你喜欢阅读文档和语言规范，并在异步、低监督的环境中茁壮成长。你不需要具备的条件 - 无需先前的RLHF（人类反馈强化学习）或AI培训经验。 - 无需深厚的机器学习知识。如果你能清晰地审查和批评代码，我们会教你其他的。技术栈我们正在寻找对Python有强大掌握能力的工程师。后勤 - 地点：完全远程——可在任何地方工作 - 薪酬：根据地点和资历，从每小时30美元到70美元不等 - 工作时间：每周至少15小时，最多可达40小时 - 合作形式：1099合同直接的影响，没有多余的内容。如果这听起来合适，请在此申请！

人工智能软件工程师（Python）

G2i Inc.