该职位已过期，不再接受申请。

主要职责测试套件和指标 - 设计、实施并维护一个模块化、可重用的测试框架，用于多种AI输出。 - 定义和跟踪关键绩效指标：准确性、延迟、每个标记的成本、失败率。模型研究与优化 - 根据需要对OpenAI、Anthropic、Google和HuggingFace的LLM进行基准测试、A/B测试和升级。 - 优化模型选择和提示模板，以在最大化质量的同时最小化成本和延迟。数据标注与质量 - 领导多语言数据标注项目（西班牙语、法语、葡萄牙语、意大利语、德语、俄语、韩语、中文——至少精通两种）。 - 建立标注指南和质量保证流程，以确保一致性和可靠性。跨职能合作 - 与QA测试人员、后端工程师（Django）、机器学习工程师和产品经理密切合作，收集需求并推出改进。 - 将业务需求转化为技术规格和可交付成果。 - 追踪下游错误（日志、用户投诉、异常AI输出），并在源头（模型级别）进行修复。系统优化 - 了解AI/LLM趋势、多语言模型、云服务器成本和主要供应商路线图，以降低系统成本，提高可靠性、速度和输出质量。必备资格 - 2年以上数据科学或机器学习经验，具有可证明的LLM实际操作经验。 - 精通Python，并具有使用OpenAI、Anthropic、Google和HuggingFace API的经验。 - 实际操作微调LLM并评估模型性能（准确性、成本、速度）。 - 多语言能力：至少精通或非常熟悉两种语言的标注（西班牙语、法语、葡萄牙语、意大利语、德语、俄语、韩语、中文）。 - 对语言学习充满热情，并欣赏语言的细微差别。我们重视的属性 - 注重细节：在问题进入生产前发现边缘情况。 - 善于沟通：明确需求，分享进展，跨职能征求反馈。 - 创造性问题解决者：超越标准方法，解决系统问题并在必要时创新新解决方案。 - AI爱好者：主动探索和试验新的AI/LLM创新，以改进我们的AI系统，并随时了解AI的变化。加分项 - 熟悉Django或类似的后端框架。 - 有构建ML部署CI/CD管道的经验。 - 了解云基础设施（AWS，GCP）和容器化（Docker，Kubernetes）。我们提供 - 具有竞争力的薪资。 - 完全远程团队，工作时间灵活。 - 有机会塑造大规模AI驱动的语言学习的未来。如何申请：请将您的简历和求职信发送至jobs[at]lingq[dot]com，说明为什么您是加入我们团队的合适人选。有兴趣加入我们的团队吗？ LingQ正在打破数十亿美元的语言学习行业的新局面，迎合探索其他语言和文化的普遍愿望。成为一个激动人心且有回报的项目的一部分。帮助我们继续将LingQ打造成首屈一指的语言学习应用程序。请将您的求职信（说明您为什么适合LingQ）和简历发送至jobs[at]lingq[dot]com。 LingQ提供有竞争力的薪资和全额福利。我们总部位于加拿大温哥华，但我们的大多数团队成员远程工作。我们正在寻找这些职位的最佳人选。即使您没有看到适合您技能的职位，我们也始终在寻找热情、技术娴熟的人才来帮助我们实现使命。感谢所有申请者的关注。不幸的是，由于时间限制，我们只能联系入围的候选人。期待您的来信！

数据科学家，LLM系统

Linguist Institute Inc., The