人工智能质量保证 - 工程师/技术人员

芝加哥 7天前全职 网络
76.5万 - 104.3万 / 年
职位:AI QA - 工程师/技术人员 获取由AI驱动的关于这份工作的建议和更多独家功能。 我们是联想。我们言出必行。我们对自己的行为负责。我们让客户惊叹。 联想是一家年收入690亿美元的全球科技巨头,在《财富》全球500强中排名第196位,每天在180个市场为数百万客户服务。联想专注于为所有人提供更智能技术的大胆愿景,基于其作为全球最大PC公司的成功,构建了一个完整的AI支持、AI就绪和AI优化设备(PC、工作站、智能手机、平板电脑)、基础设施、软件、解决方案和服务的全栈产品组合。 联想持续投资于改变世界的创新,正在为每个人、每个地方构建一个更加公平、值得信赖和智能的未来。联想在香港证券交易所上市,属于联想集团有限公司(HKSE: 992)(ADR: LNVGY)。 欲了解更多信息,请访问,并通过我们的故事中心阅读最新新闻。 关于我们的团队 我们正在构建下一代AI驱动的体验,质量是我们交付一切的核心。作为一名AI QA工程师,您将加入一个协作的创新者团队,专注于确保我们的AI系统准确、安全和可靠。从大型语言模型到视觉系统和代理工作流,我们正在突破可能性的界限——我们需要您的专业知识来确保每个产品都达到最高标准。 地点 芝加哥,伊利诺伊州 – 混合模式(3天现场,2天远程) 您的工作内容 • 为AI/ML系统设计和实施全面的测试框架:LLM、视觉模型、RAG管道、代理工作流。 • 为模型输出构建自动化评估系统——准确性、相关性、偏见检测、幻觉监控。 • 为生成式AI创建质量基准和持续测试管道(内容质量、安全性、品牌一致性)。 • 开发性能监控基础设施:模型漂移检测、数据质量验证、推理延迟跟踪。 • 建立AI特定的质量门槛,并与产品/工程团队在敏捷冲刺中定义验收标准。 • 走在AI测试趋势的前沿:对抗性测试、红队测试、AI安全评估。 基本资格 • 3年以上QA/测试工程经验,专注于AI/ML系统。 • 深刻理解ML模型评估:分类指标、NLP评估(BLEU、ROUGE、人类评估)、视觉模型测试。 • 有构建测试自动化框架的经验(Python、pytest、CI/CD管道)。 优先资格 • 了解AI风险:偏见、公平性、安全性、幻觉、对抗性攻击。 • 强大的协作技能——能够与数据科学家、ML工程师和产品经理合作。 • 对AI质量充满热情,并保持对生成式AI测试方法的最新了解。 该职位的基本工资预算范围为110K-150K美元。个人也可能被考虑获得奖金和/或佣金。 联想的各种福利可以在上找到 我们是一个机会均等的雇主,不会因为种族、肤色、性别、年龄、宗教、性取向、性别认同、国籍、退伍军人身份、残疾或任何联邦、州或地方受保护的类别而歧视任何员工或求职者。 #J-18808-Ljbffr