关于公司
QARL是一家初创阶段的公司,致力于打造下一代互动AI驱动的数字人。我们的使命是通过有趣的互动视频代理重新定义人们与AI的互动方式。公司成立于2024年,我们是一个由连续创业者和三次成功退出的创始人Paul Kruszewski领导的小而强大的团队。在包括谷歌和AWS在内的领先合作伙伴的支持下,我们正在快速发展,推动边界,以定义人机交互的未来。
机会
在这个为期1个月的合同职位中,您将深入研究、评估和对比最先进的语音转文本(STT)解决方案,以用于我们的AI语音代理管道。这是一个与经验丰富的领导团队和顶尖技术团队一起工作在尖端技术上的难得机会。对于合适的候选人,此职位有可能转为全职职位。
职位描述
主要职责:
- 领导一个为期1个月的项目,研究和评估开源和商业友好的STT算法,以替代我们当前的实现。
- 设计和实施独立的测试工具和候选STT系统的基准测试管道。
- 根据关键标准评估候选者:转录准确性(词错误率)、延迟、流媒体支持、幻觉鲁棒性、噪声鲁棒性和多语言支持。
- 记录研究结果并提供综合建议报告以促进决策。
- 为开发团队成员提供技术支持,以整合所选解决方案。
教育水平:
- 计算机科学或相关领域的博士学位(Ph.D.),最好在语音处理和生成AI方面有研究经验。
理想的候选人将具备以下实际经验:
- 语音转文本系统和评估方法(WER,延迟基准测试)。
- Python和ML框架(PyTorch,TensorFlow)。
- 虚拟化和容器化(Docker,Kubernetes等)。
- 云计算(AWS,GCP,Azure)。
福利
- 具有竞争力的薪酬包,可能转为全职员工,并享有股票期权、健康福利等。
- 完全现场工作文化(无远程工作),办公室位于蒙特利尔市中心,周二提供午餐。
- 可用于持续学习和Anthropic Claude AI订阅的津贴。
- 与世界上最优秀的人工情感智能和数字人团队之一合作。