数据科学家,LLM系统

温哥华 30天前全职 网络
面议
该职位已过期,不再接受申请。
主要职责 测试套件和指标 - 设计、实施并维护一个模块化、可重用的测试框架,用于多种AI输出。 - 定义和跟踪关键绩效指标:准确性、延迟、每个标记的成本、失败率。 模型研究与优化 - 根据需要对OpenAI、Anthropic、Google和HuggingFace的LLM进行基准测试、A/B测试和升级。 - 优化模型选择和提示模板,以在最大化质量的同时最小化成本和延迟。 数据标注与质量 - 领导多语言数据标注项目(西班牙语、法语、葡萄牙语、意大利语、德语、俄语、韩语、中文——至少精通两种)。 - 建立标注指南和质量保证流程,以确保一致性和可靠性。 跨职能合作 - 与QA测试人员、后端工程师(Django)、机器学习工程师和产品经理密切合作,收集需求并推出改进。 - 将业务需求转化为技术规格和可交付成果。 - 追踪下游错误(日志、用户投诉、异常AI输出),并在源头(模型级别)进行修复。 系统优化 - 了解AI/LLM趋势、多语言模型、云服务器成本和主要供应商路线图,以降低系统成本,提高可靠性、速度和输出质量。 必备资格 - 2年以上数据科学或机器学习经验,具有可证明的LLM实际操作经验。 - 精通Python,并具有使用OpenAI、Anthropic、Google和HuggingFace API的经验。 - 实际操作微调LLM并评估模型性能(准确性、成本、速度)。 - 多语言能力:至少精通或非常熟悉两种语言的标注(西班牙语、法语、葡萄牙语、意大利语、德语、俄语、韩语、中文)。 - 对语言学习充满热情,并欣赏语言的细微差别。 我们重视的属性 - 注重细节:在问题进入生产前发现边缘情况。 - 善于沟通:明确需求,分享进展,跨职能征求反馈。 - 创造性问题解决者:超越标准方法,解决系统问题并在必要时创新新解决方案。 - AI爱好者:主动探索和试验新的AI/LLM创新,以改进我们的AI系统,并随时了解AI的变化。 加分项 - 熟悉Django或类似的后端框架。 - 有构建ML部署CI/CD管道的经验。 - 了解云基础设施(AWS,GCP)和容器化(Docker,Kubernetes)。 我们提供 - 具有竞争力的薪资。 - 完全远程团队,工作时间灵活。 - 有机会塑造大规模AI驱动的语言学习的未来。 如何申请: 请将您的简历和求职信发送至jobs[at]lingq[dot]com,说明为什么您是加入我们团队的合适人选。 有兴趣加入我们的团队吗? LingQ正在打破数十亿美元的语言学习行业的新局面,迎合探索其他语言和文化的普遍愿望。成为一个激动人心且有回报的项目的一部分。帮助我们继续将LingQ打造成首屈一指的语言学习应用程序。 请将您的求职信(说明您为什么适合LingQ)和简历发送至jobs[at]lingq[dot]com。 LingQ提供有竞争力的薪资和全额福利。我们总部位于加拿大温哥华,但我们的大多数团队成员远程工作。我们正在寻找这些职位的最佳人选。 即使您没有看到适合您技能的职位,我们也始终在寻找热情、技术娴熟的人才来帮助我们实现使命。 感谢所有申请者的关注。不幸的是,由于时间限制,我们只能联系入围的候选人。 期待您的来信!