研究科学家/工程师，多模态交互与世界模型 - BYTEDANCE PTE. LTD.招聘

责任成立于2023年，字节跳动的Doubao（种子）团队致力于构建行业领先的AI基础模型。我们的目标是进行世界领先的研究，并促进技术和社会的进步。团队拥有长期愿景，并对AI领域有着强烈的承诺，开展自然语言处理（NLP）、计算机视觉（CV）和语音识别与生成等多个领域的研究。我们在中国、新加坡和美国设有实验室和研究人员职位。凭借大量的数据和计算资源，并通过对这些领域的持续投资，我们的团队构建了一个具备多模态能力的专有通用模型。在市场上，Doubao模型为超过50个字节跳动的应用和业务线提供支持，包括Doubao、Coze和Dreamina，并通过火山引擎向外部企业客户推出。Doubao应用是中国使用最广泛的AIGC应用。为什么加入我们创造是字节跳动的核心使命。我们的产品旨在帮助想象力蓬勃发展。这对实现我们创新的团队来说尤其重要。我们共同激发创造力，丰富生活——这是我们每天努力实现的使命。对我们来说，每一个挑战，无论多么模糊，都是一个机会；去学习、去创新、去作为一个团队成长。现状？从不。勇气？永远。在字节跳动，我们共同创造，共同成长。这就是我们推动影响力的方式——为我们自己、我们的公司和我们服务的用户。加入我们。关于团队欢迎来到多模态交互与世界模型团队。我们的使命是解决AI中多模态智能和虚拟现实世界交互的挑战。我们在多模态理解模型的基础和应用、多模态代理和推理、生成和理解的统一模型、世界模型等领域进行前沿研究。我们的团队由经验丰富的研究科学家和工程师组成，致力于开发具有人类水平的多模态理解和交互能力的模型。团队还希望推动多模态助手产品的探索和开发。我们营造一个以反馈为驱动的环境，不断提升我们的基础技术。来加入我们，共同塑造AI的未来，改变全球用户的产品体验。职责 - 探索和研究多模态理解、生成、机器学习、强化学习、AIGC、计算机视觉、人工智能等前沿技术。 - 探索大规模/超大规模多模态理解和生成交织的基本模型，并进行极限系统优化；数据构建、指令微调、偏好对齐、模型优化；提升数据合成、可扩展监督、模型推理和规划的能力，建立全面、客观和准确的评估系统，探索和提升大模型的能力。 - 探索并突破多模态模型和世界模型的高级能力，包括但不限于多模态RAG、视觉COT和代理，构建用于GUI/游戏等虚拟世界的通用多模态代理。 - 使用预训练、模拟等技术对虚拟/现实世界中的各种环境进行建模，提供多模态交互探索的基本能力，促进应用落地，开发以人工智能技术为核心的新技术和新产品。资格最低资格： - 本科及以上学历，计算机、电子、数学等相关专业。 - 在计算机视觉、多模态、AIGC、机器学习、渲染生成等一个或多个领域有深入研究。 - 优秀的分析和解决问题能力；能够解决大模型训练和应用问题；具备独立探索解决方案的能力。 - 具备良好的沟通和协作能力，积极主动，能够与团队和谐合作，探索新技术，推动技术进步。优先资格： - 具备优秀的基础算法，扎实的机器学习基础，熟悉CV、AIGC、NLP、RL、ML等技术领域，曾在CVPR、ECCV、ICCV、NeurIPS、ICLR、SIGGRAPH或SIGGRAPH Asia等顶级会议/期刊发表论文者优先。 - 具备优秀的编码能力，熟练掌握C/C++或Python编程语言，ACM/ICPC、NOI/IOI、Top Coder、Kaggle等竞赛获奖者优先。 - 在多模态、大模型、基础模型、世界模型、RL、渲染生成等领域主导过影响力较大的项目者优先。字节跳动致力于创造一个包容的空间，让员工因其技能、经验和独特视角而受到重视。我们的平台连接来自全球的人们，我们的工作场所也是如此。在字节跳动，我们的使命是激发创造力，丰富生活。为了实现这一目标，我们致力于庆祝多样化的声音，并创造一个反映我们所接触的众多社区的环境。我们对此充满热情，也希望您也是。

Research Scientist/Engineer, Multimodal Interaction & World Model

BYTEDANCE PTE. LTD.