深度学习工程师(语音合成/TTS)

1个月前全职
85.9万 - 214.8万 / 年 42dot

42dot

location 旧金山
unsaved
关于我们 42dot 是一家致力于通过软件和人工智能解决出行挑战的出行 AI 公司。作为现代汽车集团的全球软件中心,42dot 通过推进软件定义车辆的开发,引领出行的未来。 我们开发以安全为首、以用户为中心的软件定义车辆技术,通过持续更新提供最新性能,类似于智能手机。通过推进软件和 AI 技术,42dot 设想一个万物互联、通过自我管理的城市交通操作系统实现自主移动的世界。 关于这个角色 42dot 音频生成团队正在开发尖端的文本转语音(TTS)技术,以实现用户与车辆之间更舒适、更可靠的互动。我们的目标是产生高度自然的语音,覆盖广泛的全球语言,特别关注北美英语、墨西哥西班牙语和加拿大法语,以用于车载 AI 代理。 我们正在寻找杰出的人才,帮助我们构建未来出行的多语言语音。 职责 • 设计和构建针对北美语言(包括北美英语、墨西哥西班牙语和加拿大法语)优化的 TTS 系统。 • 收集、注释和优化专注于北美语言变体和地区口音的语音数据集。 资格 • 2-3 年行业经验或在 TTS 相关领域的硕士学位(或预期毕业) • 扎实的语音信号处理知识 • 深度学习技术的坚实基础 • 精通 Python 和 PyTorch 优先资格 • 流利或工作熟练掌握以下任一语言者优先:北美英语、墨西哥西班牙语、加拿大法语。 • 有在生产级服务中开发和部署 Us 模型的经验。 • 有处理混合代码或多语言 TTS 系统的经验。 基本薪资 $120,000 至 $300,000