创始人工智能工程师 - 亚太地区语音识别

新加坡 9天前全职 网络
面议
在Toku,我们创造定制的云通信和客户互动解决方案,为企业重新构想客户体验。我们提供端到端的方法,帮助企业克服数字化转型的复杂性,并通过云通信解决方案提供关键任务的客户体验。Toku结合了本地战略咨询专长、定制技术、区域内基础设施、连接性和全球覆盖,以满足大规模运营企业的多样化需求。Toku总部位于新加坡,支持亚太地区及其他地区的客户,并在全球市场不断扩展。 作为创始AI工程师,您将领导我们的语音识别能力开发,包括为亚太地区语言和电话环境优化的开源模型做出贡献。您将负责从模型架构到部署的整个机器学习流程,并在Hugging Face和GitHub上发布。这是一个独特的机会,可以构建服务于亚太地区乃至全球数十亿人的技术。 要求 您的工作内容 模型开发与训练 - 设计和实现针对亚太地区语言(英语变体、普通话、泰语、越南语、印尼语等)的电话优化语音识别模型 - 使用PyTorch在本地和云GPU基础设施上开发全面的AI模型训练框架 - 创建和优化数据增强管道,解决电话特定挑战(8kHz音频、编解码器伪影、背景噪音、信噪比优化) - 构建能够处理亚太地区常见代码切换的模型(Singlish、Hinglish、Taglish) 亚太地区特定优化 - 解决普通话、泰语、越南语和其他声调语言的挑战 - 针对目标市场的区域口音变化进行优化 - 开发针对亚太地区电话环境的评估基准,包括信噪比和音频质量指标 - 实施低资源语言支持技术 基础设施与部署 - 构建可扩展的实时和批处理推理系统 - 创建用于模型演示和测试的容器化应用程序 - 开发与电话系统集成的API - 在本地和云GPU基础设施上部署模型 - 与Toku现有的Llama 8B部署集成以实现语言模型功能 开源贡献(未来) - 参与开源发布的准备工作 - 撰写全面的技术文档和用户指南 - 进行性能基准测试和验证研究 - 通过出版物和演讲为更广泛的语音识别社区做出贡献 如果您具备以下条件,我们希望听到您的声音 必备资格 - 计算机科学、工程或相关技术领域的学士或硕士学位,具有扎实的机器学习基础 - 1-3年机器学习项目的实际经验 - 优秀的Python编程技能 - 具备PyTorch和深度学习模型训练经验 - 熟练处理大型数据集和数据预处理 - 理解语音处理概念和技术 - 具备云平台和GPU计算经验 - 熟悉容器化(Docker)和部署实践 优先资格 - 拥有AI项目作品集(高度重视开源贡献) - 熟悉OpenAI Whisper和基于Transformer的架构 - 具有语音转文本或音频处理项目经验 - 具有开源项目开发和协作经验 - 具备强大的技术写作和文档编写技能 - 熟悉至少一种亚太地区语言的语音特征 - 理解电话音频特性(8kHz采样、编解码器伪影、信噪比考虑) - 在语音识别或相关领域有发表历史 个人属性 - 独立且具备责任心:能够将项目从构思到完成 - 成长导向:热衷于学习新技术 - 质量导向:致力于编写健壮且文档齐全的代码 - 具备良好的沟通和演讲能力 地点: - 这是一个远程/混合角色,需在新加坡、香港或荷兰(首选鹿特丹)工作 为什么加入Toku? 使命驱动的影响:为亚太地区多样化语言环境的语音AI民主化做出贡献 开源领导力:通过对定制模型开发的贡献建立您的声誉 技术成长:与经验丰富的工程师合作,开发最先进的语音AI技术 区域专长:成为一个服务不足但庞大市场的专家 自主权:在支持下承担重大技术挑战 福利和津贴:培训和发展、年度奖金和薪资评估、基于地点的医疗保险、20天带薪年假及其他休假津贴等 Toku被LinkedIn评为顶级创业公司,并被《金融时报》评为亚太地区增长最快的500家公司之一。如果您希望成为一家在强劲增长轨迹上的公司的一员,同时解决有意义的现实世界挑战,我们很乐意听到您的声音。