Research Scientist/Engineer, Multimodal Interaction & World Model

14 days agoFull-time
24.9K - 49.8K SGD / 月 BYTEDANCE PTE. LTD.

BYTEDANCE PTE. LTD.

location Singapore
unsaved
责任 成立于2023年,字节跳动的Doubao(种子)团队致力于构建行业领先的AI基础模型。我们的目标是进行世界领先的研究,并促进技术和社会的进步。 团队拥有长期愿景,并对AI领域有着强烈的承诺,开展自然语言处理(NLP)、计算机视觉(CV)和语音识别与生成等多个领域的研究。我们在中国、新加坡和美国设有实验室和研究人员职位。 凭借大量的数据和计算资源,并通过对这些领域的持续投资,我们的团队构建了一个具备多模态能力的专有通用模型。在市场上,Doubao模型为超过50个字节跳动的应用和业务线提供支持,包括Doubao、Coze和Dreamina,并通过火山引擎向外部企业客户推出。Doubao应用是中国使用最广泛的AIGC应用。 为什么加入我们 创造是字节跳动的核心使命。我们的产品旨在帮助想象力蓬勃发展。这对实现我们创新的团队来说尤其重要。我们共同激发创造力,丰富生活——这是我们每天努力实现的使命。对我们来说,每一个挑战,无论多么模糊,都是一个机会;去学习、去创新、去作为一个团队成长。现状?从不。勇气?永远。在字节跳动,我们共同创造,共同成长。这就是我们推动影响力的方式——为我们自己、我们的公司和我们服务的用户。加入我们。 关于团队 欢迎来到多模态交互与世界模型团队。我们的使命是解决AI中多模态智能和虚拟现实世界交互的挑战。我们在多模态理解模型的基础和应用、多模态代理和推理、生成和理解的统一模型、世界模型等领域进行前沿研究。我们的团队由经验丰富的研究科学家和工程师组成,致力于开发具有人类水平的多模态理解和交互能力的模型。团队还希望推动多模态助手产品的探索和开发。我们营造一个以反馈为驱动的环境,不断提升我们的基础技术。来加入我们,共同塑造AI的未来,改变全球用户的产品体验。 职责 - 探索和研究多模态理解、生成、机器学习、强化学习、AIGC、计算机视觉、人工智能等前沿技术。 - 探索大规模/超大规模多模态理解和生成交织的基本模型,并进行极限系统优化;数据构建、指令微调、偏好对齐、模型优化;提升数据合成、可扩展监督、模型推理和规划的能力,建立全面、客观和准确的评估系统,探索和提升大模型的能力。 - 探索并突破多模态模型和世界模型的高级能力,包括但不限于多模态RAG、视觉COT和代理,构建用于GUI/游戏等虚拟世界的通用多模态代理。 - 使用预训练、模拟等技术对虚拟/现实世界中的各种环境进行建模,提供多模态交互探索的基本能力,促进应用落地,开发以人工智能技术为核心的新技术和新产品。 资格 最低资格: - 本科及以上学历,计算机、电子、数学等相关专业。 - 在计算机视觉、多模态、AIGC、机器学习、渲染生成等一个或多个领域有深入研究。 - 优秀的分析和解决问题能力;能够解决大模型训练和应用问题;具备独立探索解决方案的能力。 - 具备良好的沟通和协作能力,积极主动,能够与团队和谐合作,探索新技术,推动技术进步。 优先资格: - 具备优秀的基础算法,扎实的机器学习基础,熟悉CV、AIGC、NLP、RL、ML等技术领域,曾在CVPR、ECCV、ICCV、NeurIPS、ICLR、SIGGRAPH或SIGGRAPH Asia等顶级会议/期刊发表论文者优先。 - 具备优秀的编码能力,熟练掌握C/C++或Python编程语言,ACM/ICPC、NOI/IOI、Top Coder、Kaggle等竞赛获奖者优先。 - 在多模态、大模型、基础模型、世界模型、RL、渲染生成等领域主导过影响力较大的项目者优先。 字节跳动致力于创造一个包容的空间,让员工因其技能、经验和独特视角而受到重视。我们的平台连接来自全球的人们,我们的工作场所也是如此。在字节跳动,我们的使命是激发创造力,丰富生活。为了实现这一目标,我们致力于庆祝多样化的声音,并创造一个反映我们所接触的众多社区的环境。我们对此充满热情,也希望您也是。