主要职责
测试套件和指标
- 设计、实施并维护一个模块化、可重用的测试框架,用于多种AI输出。
- 定义和跟踪关键绩效指标:准确性、延迟、每个标记的成本、失败率。
模型研究与优化
- 根据需要对OpenAI、Anthropic、Google和HuggingFace的LLM进行基准测试、A/B测试和升级。
- 优化模型选择和提示模板,以在最大化质量的同时最小化成本和延迟。
数据标注与质量
- 领导多语言数据标注项目(西班牙语、法语、葡萄牙语、意大利语、德语、俄语、韩语、中文——至少精通两种)。
- 建立标注指南和质量保证流程,以确保一致性和可靠性。
跨职能合作
- 与QA测试人员、后端工程师(Django)、机器学习工程师和产品经理密切合作,收集需求并推出改进。
- 将业务需求转化为技术规格和可交付成果。
- 追踪下游错误(日志、用户投诉、异常AI输出),并在源头(模型级别)进行修复。
系统优化
- 了解AI/LLM趋势、多语言模型、云服务器成本和主要供应商路线图,以降低系统成本,提高可靠性、速度和输出质量。
必备资格
- 2年以上数据科学或机器学习经验,具有可证明的LLM实际操作经验。
- 精通Python,并具有使用OpenAI、Anthropic、Google和HuggingFace API的经验。
- 实际操作微调LLM并评估模型性能(准确性、成本、速度)。
- 多语言能力:至少精通或非常熟悉两种语言的标注(西班牙语、法语、葡萄牙语、意大利语、德语、俄语、韩语、中文)。
- 对语言学习充满热情,并欣赏语言的细微差别。
我们重视的属性
- 注重细节:在问题进入生产前发现边缘情况。
- 善于沟通:明确需求,分享进展,跨职能征求反馈。
- 创造性问题解决者:超越标准方法,解决系统问题并在必要时创新新解决方案。
- AI爱好者:主动探索和试验新的AI/LLM创新,以改进我们的AI系统,并随时了解AI的变化。
加分项
- 熟悉Django或类似的后端框架。
- 有构建ML部署CI/CD管道的经验。
- 了解云基础设施(AWS,GCP)和容器化(Docker,Kubernetes)。
我们提供
- 具有竞争力的薪资。
- 完全远程团队,工作时间灵活。
- 有机会塑造大规模AI驱动的语言学习的未来。
如何申请:
请将您的简历和求职信发送至jobs[at]lingq[dot]com,说明为什么您是加入我们团队的合适人选。
有兴趣加入我们的团队吗?
LingQ正在打破数十亿美元的语言学习行业的新局面,迎合探索其他语言和文化的普遍愿望。成为一个激动人心且有回报的项目的一部分。帮助我们继续将LingQ打造成首屈一指的语言学习应用程序。
请将您的求职信(说明您为什么适合LingQ)和简历发送至jobs[at]lingq[dot]com。
LingQ提供有竞争力的薪资和全额福利。我们总部位于加拿大温哥华,但我们的大多数团队成员远程工作。我们正在寻找这些职位的最佳人选。
即使您没有看到适合您技能的职位,我们也始终在寻找热情、技术娴熟的人才来帮助我们实现使命。
感谢所有申请者的关注。不幸的是,由于时间限制,我们只能联系入围的候选人。
期待您的来信!