关于公司
QARL是一家初创阶段的公司,致力于打造下一代互动式AI驱动的数字人。我们的使命是通过有趣的互动视频代理重新定义人们与AI的互动方式。公司成立于2024年,我们是一个由连续创业者和三次成功退出的创始人Paul Kruszewski领导的小而强大的团队。在包括谷歌和AWS在内的领先合作伙伴的支持下,我们正在快速发展,突破界限,定义人机互动的未来。
机会
在这个为期一个月的合同职位中,您将深入研究、评估和对比最先进的语音转文字(STT)解决方案,以优化我们的基于AI的语音代理流程。这是一个难得的机会,可以与经验丰富的领导团队和一流的技术团队一起工作在尖端技术上。对于合适的候选人,此职位有可能延长为全职职位。
职位描述
主要职责:
- 领导一个为期一个月的项目,研究和评估开源和商业友好的STT算法,作为我们当前实现的替代方案。
- 设计和实施独立的测试工具和候选STT系统的基准测试流程。
- 根据关键标准评估候选者:转录准确性(词错误率)、延迟、流媒体支持、幻觉鲁棒性、噪声鲁棒性和多语言支持。
- 记录研究结果并提交全面的推荐报告,以便于决策。
- 为开发团队成员提供技术支持,以整合所选解决方案。
教育水平:
- 计算机科学或相关领域的博士学位(Ph.D.),最好有语音处理和生成AI研究的经验。
理想的候选人将具备以下实践经验:
- 语音转文字系统和评估方法(WER、延迟基准测试)。
- Python和机器学习框架(PyTorch、TensorFlow)。
- 虚拟化和容器化(Docker、Kubernetes等)。
- 云计算(AWS、GCP、Azure)。
福利
- 具有竞争力的薪酬方案,并有可能转为全职员工,享受股票期权、健康福利等。
- 完全面对面的工作文化(不支持远程工作),办公室位于蒙特利尔市中心,周二提供午餐。
- 提供用于持续学习和Anthropic Claude AI订阅的津贴。
- 与世界上最优秀的人工情感智能和数字人团队之一合作。