腾讯近日推出了一款名为GameGen-O的创新型视频模型,这是业界首个专为开放世界视频游戏设计的扩散变换模型。与传统视频模型不同,GameGen-O不仅能生成高质量的游戏内容,还允许用户像操控游戏角色一样实时控制视频中的角色行动,开创了人工智能与游戏交互的新纪元。
官方演示视频
GameGen-O的核心优势在于其多样化的内容生成能力和前所未有的交互控制。用户可以根据需求创造各种角色,如"利维亚的杰拉尔德"或"亚瑟・摩根",并将他们置于四季变换的环境中,展现"摩托骑行"或"下雨"等多样化场景。更令人兴奋的是,GameGen-O支持开放域生成,用户可以通过结构化指令和操作信号,实时指挥模型生成相应的视频片段,仿佛在导演自己的虚拟世界。
为了实现这一突破性技术,腾讯团队付出了巨大努力。他们构建了首个开放世界视频游戏数据集(OGameData),从上百款次世代开放世界游戏中收集数据。经过严格的筛选和处理,最终从32,000个原始视频中精选出约15,000个高质量视频。这些视频经过场景检测、美学评估、光流分析和语义内容筛选等多重处理,最后通过专家模型和多模态大模型进行结构化注释,为模型训练提供了精细化和互动性的数据基础。
GameGen-O的训练过程也独具特色,分为基础模型预训练和指令微调两个阶段。在预训练阶段,模型通过文本到视频和视频延续任务学习开放域视频游戏生成能力。而在指令微调阶段,研发团队冻结了预训练模型,引入可训练的InstructNet进行微调,使模型能够根据多模态结构指令生成后续帧,从而实现了基于指令的视频生成和交互控制。
尽管GameGen-O在某些方面的效果还有提升空间,但它无疑是AI驱动游戏内容创作的重要里程碑。这项技术不仅为游戏开发者提供了强大的工具,也为普通用户开启了一个可以自由创造和探索虚拟世界的新时代。随着技术的不断完善,我们可以期待在不久的将来,每个人都能轻松打造属于自己的沉浸式游戏体验。
GameGen-O的出现标志着游戏产业和人工智能领域的又一次深度融合,它不仅展示了腾讯在AI技术方面的实力,也为整个行业指明了未来发展的方向。我们拭目以待,看这项技术将如何改变游戏创作的格局,为玩家带来更多惊喜和可能性。
项目地址
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则