职位:数据科学家(生成式AI)
我们正在寻找一位具有4-10年经验的高技能、执行导向的数据科学家加入我们的团队。此职位要求在图像、视频和音频领域的生成式AI模型的微调和部署方面具有实践经验,特别关注唇同步、角色一致性和自动化质量评估框架。您需要在高速度的研发环境中快速进行实验、测试架构变体,并快速交付可用的模型迭代。
职责
• 在最先进的模型(Flux家族、LoRA、基于扩散的架构、基于上下文的合成)上运行端到端的微调实验。
• 开发和优化用于音频生成和唇同步的生成式AI模型,确保高保真和自然传递。
• 扩展当前语言模型以支持除美英英语以外的印度地区语言的音频和内容生成。
• 在生成的音频中实现情感传递(喊叫、哭泣、耳语)以增强现实感。
• 将背景音乐与生成的视频内容无缝集成和同步。
• 努力实现可与Veo3/Sora相媲美的视频质量标准。
• 确保多个输出之间的场景和角色生成的一致性。
• 设计并实施自动化的客观评估框架,以替代主观的人为审核——用于封面图像、视频帧和音频片段。实施标准化质量检查的评分系统,以便在编辑批准前进行。
• 在多个模型架构上运行比较测试,以评估质量、速度和效率的权衡。
• 独立推动项目,展示高度的主动性和责任感。利用强大的第一性原理思维来解决复杂挑战。
• 在快速发展的生成式AI领域应用研究优先的方法进行快速实验。
• 4-10年数据科学经验,重点关注生成式AI。
• 熟悉生成式AI中的最先进模型(如Flux、扩散模型、GANs)。
• 在开发和部署音频和视频生成模型方面有成熟的专业知识。
• 在自然语言处理(NLP)方面有丰富经验,特别是区域语言适配。
• 具有模型微调和优化技术的经验。
• 实践过ML部署管道(FastAPI或同等工具)。
• 具备Python和相关深度学习框架(如TensorFlow、PyTorch)的强大编程技能。
• 在设计和实施生成内容的自动化评估指标方面有经验。
• 拥有与内容生成、唇同步或情感AI相关项目的作品集或可展示的经验是加分项。
• 具备卓越的问题解决能力和积极的研究与实验态度。
您将获得
• 顶级薪资:
我们只聘用最优秀的人才,并给予相应的报酬。
• Proximity Talks:
与其他设计师、工程师和产品极客会面,并向领域专家学习。
• 与世界级团队一起不断学习:
与领域内的顶尖人士合作,不断挑战自己,每天学习新东西。
关于我们
Proximity是全球一些最大的体育、媒体和娱乐公司的值得信赖的技术、设计和咨询合作伙伴!我们总部位于旧金山,在帕洛阿尔托、迪拜、孟买和班加罗尔设有办事处。自2019年以来,Proximity已创建并发展了高影响力、可扩展的产品,这些产品被3.7亿日活用户使用,我们的客户公司总净值为457亿美元。
今天,我们是一个由编码员、设计师、产品经理、极客和专家组成的全球团队。我们解决复杂问题并构建尖端技术,Proxonauts团队正在快速增长,这意味着您对公司成功的影响将是巨大的。您将有机会与曾构建和领导多个技术、产品和设计团队的经验丰富的领导者合作。以下是快速了解我们的指南:
快速了解Proximity及成为Proxonaut的体验:
• 访问此YouTube链接,听听我们的CEO Hardik Jagda对Proximity的看法。
• 在这里认识一些我们的Proxonauts:
更好地了解你的Proxonauts
• 这里是一些快速链接到招聘页面、博客和Studio Proximity(我们的设计部门)。
在我们的Instagram频道上关注我们团队的#BTS(幕后)更新 —
- @Prox Wrks(使用下面的“申请此职位”框)。
#J-18808-Ljbffr