关于AIGC的十问十答

1、什么是AIGC?

AIGC(Artificial Inteligence Generated Content),是指通过人工智能技术自动生成内容的生产模式。

2、AIGC能产生什么?

AIGC目前的范围包括绘画、文本、音频和视频。主要的创作内容形式可以由人工智能生成。从长远来看,数字世界的大部分内容,包括虚拟人类行为和思维、游戏情节和NPC交互,都可以由人工智能生成。我们认为AIGC是Web3时代的生产力工具。

3、如何实现AIGC?

AIGC领域的技术包括:生成对抗网络(GAN)、变微分为自动编码器(VAE)、标准化流模型(NFs)、自回归模型(AR)、能量模型和扩散模型(Diffusion Model)。总体而言,大模型大数据、大计算能力是未来的发展方向。

目前常用的两种模式是[生成对抗网络GAN]和[扩散模式Diffusion] Model】,算法模型的突破是近年来AIGC快速突破的催化剂。这两种模型的实现原理如下:

1)对抗生成网络GAN

GAN,它是一种由一个生成网络和一个识别网络组成的深度神经网络架构。生成网络生成“假”数据,并试图欺骗识别网络;识别生成数据的真实性,并试图正确识别所有“假”数据。在训练迭代过程中,两个网络不断进化和对抗,直到达到平衡状态,判断网络不能再识别“假”数据,训练结束。

GAN模型的生成是基于生成期和判别期的,这将导致这种创建,但创建后的不确定性非常强,可能会生成一张图片,但很难说你不想要什么。此外,它更多的是在生成中,一个判断,是模仿原始图片,这将导致生成的图像质量分离率相对较差。因此,它主要用于人工智能实验室,而扩散模型在商业应用中更为常见。

2)Diffusion扩散模型 Model

与其他模型相比,扩散模型的生成逻辑更接近人们的思维模式,这也是为什么在不久的将来 AIGC具有开放的创造力。本质上,扩散模型的工作原理是通过连续添加高斯噪声来破坏训练数据,然后通过反转噪声过程来学习恢复数据。训练结束后,我们可以通过简单地将随机采样的噪声传递给学习的噪声去除过程来生成数据。

从更技术的角度来看,扩散模型是一种潜在的变量(latentvariable)通过马尔科夫链映射到潜在空间的模型。马尔可夫链是从一个状态到另一个状态的随机过程,下一个状态的概率分布仅由当前状态决定。在此过程中,逐渐添加高斯噪声以获得类似的后验概率q( ! |?!”#),其中? # ……? ! 都是潜在变量,而且它们的维度和原图?$ 一致。

科普:关于AIGC的十问十答

在扩散模型中添加的高斯噪声是一种符合正态分布的概率密度函数 AIGC 当使用扩散模型来生成内容时,最终的目标画是通过在一对纯白色画布(随机白噪声)上逐渐去除噪音来生成的。也就是说,用户给出的文本描述形容词从模糊的概念逐渐具体。可简化为多个正态分布函数的叠加,模型选择重叠区间输出,这也是一个逐渐缩小范围的过程。这与人类的思维方式非常相似。

简言之,在 AI 在培训阶段,我们集中数亿组图形进行培训,提取特征值;在生产过程中,通过添加文本描述,引入不同的特征值进行噪声去除,从而生产一对 AI 理解下面的内容 作品。例如,当我们在脑海中想象一幅画面时,例如:柯基通过一个小号玩火焰。我们的思维模式是先有柯基,然后想象小号和火焰,最后把这些元素叠加在柯基身上。

科普:关于AIGC的十问十答

4、AIGC目前的效果如何?

我们亲身体验AIGC项目的截图如下。

无界版图(https://www.wujiebantu.com/ai)

输入:一位女分析师坐在办公室里写关于AIGC的报告,透过窗户可以看到外滩的夜景

输出:

科普:关于AIGC的十问十答

Mid-journey(https://www.Midjourney.com/)

输入:a female analyst is sitting in the office and writing a report about AI generated content, through the office Windows there is a night view of the Bund in Shanghai

输出:

科普:关于AIGC的十问十答

Jasper生成的报告(https://www.jasper.ai/)

输入:write a article about AI generated content, should include the definition, history, usages, current development and opinions about future, with details and example。(大意:写AIGC文章,必须包括定义、历史、用途、当前发展和未来观点,需要细节和案例)

输出:

科普:关于AIGC的十问十答

5、AIGC的效果取决于什么?

模型、数据、计算能力

算法模型:

首先取决于算法模型,与其他模型相比,扩散模型的优点是生成的图像质量更高,不需要对抗训练,这提高了其训练效率。同时,扩散模型也具有可扩展性和并行性。目前,大多数公司都采用开源生成模型,如stable diffusion、disco,但也有一些平台根据自己的整体模型实现AIGC,如mid journey。开源模型类似于Android等开源系统,不同的公司也可以实现定制开发,以适应不同的风格和需求。

AIGC通过相同的扩散模型实现,其效果取决于数据集和模型训练。前者需要大数据,后者需要计算能力。

数据集:训练中使用的图片和文本的数量和质量会影响生成效果。目前,主流的文本编码器是来自OpenAICLIP模型,它通过4亿组文本-图片进行训练,但由于图片和文本对大多数英语内容的支持较弱。因此,高质量的图片和文本也是AIGC的核心竞争力。

模型训练:在实现模型训练的过程中,需要巨大的计算能力支持,计算能力决定了训练的数据量,从而决定了训练效果。

6、AIGC有哪些应用场景?

目前,AIGC已经存在于内容行业的许多内容生成中。

媒体配图

巴比特完全拥抱AIGC,使用AI生成图片作为标题文章的图片

科普:关于AIGC的十问十答

文案编写

Jasper已经开始为谷歌、脸书等知名公司提供文案AIGC的商业服务。

科普:关于AIGC的十问十答

代码生成

GitHub Copilot是GitHub和OpenAI合作生成的AI代码生成工具,可以根据命名或编辑的代码上下文为开发者提供代码建议。官方介绍已经接受了 GitHub 支持大多数编程语言的数十亿行代码的培训。

科普:关于AIGC的十问十答

音频剪辑

AIGC生成音频早已应用于我们的日常生活。我们常用的手机导航可以切换不同明星甚至卡通人物的语音提示。这是一个语音库,通过提前邀请明星或卡通人物进行配音和阅读,然后通过反复的训练和学习,你可以用指定的声音说任何话。我们也可以通过高德地图录制自己的语音导航包。更深层次的应用将是虚拟人领域,AIGC不仅可以产生虚拟人的声音,还可以创造内容。虚拟人有望在未来像我们一样表达自己的想法,灵魂逐渐出现。

7、谁拥有AIGC的版权?

AIGC属于前沿领域,目前正处于公众使用的早期阶段,版权所有权行业尚无定论。主要有两种观点。一是内容由素材库培训生成,来自素材库,需要向相关素材作者提供版权支付。另一方面,AIGC生成内容的整个过程是一个完全随机和创新的过程,没有版权问题,版权属于AIGC用户或平台(取决于平台的具体规定)。在目前的实践中,第二种是主流情况,但清洁合规的培训数据集仍然有助于长期的商业合规。

8、AIGC商业化落地?

AIGC的商业模式类似于Saas服务,对B端和C端收取订阅费。以jasper为例,成立不到两年的独角兽公司Jasper在最新一轮融资中获得了1.25亿美元,目前估值为15亿美元。用户可以让Jasper通过文字描述帮助完成文章的创作和广告技巧,而不怀疑剽窃。目前,Jasper拥有7万多名客户,包括Airbnb、Ibm等企业。仅2021年就创造了4000万美元的收入,今年预计收入为9000万美元。

这个领域很新,探索商业模式潜力很大。例如,AIGC图片平台将积累大量无版权问题的原创图片,与图库搜索相当,可与现有图库服务相媲美。AIGC社交网络的结合也是一个值得关注的方向。与现有的UGC平台相比,AIGC进一步降低了创建阈值,允许更多的用户参与内容的创建和共享。工具收费可能是未来一两三年的主流,但从长远来看,会有各种各样的应用,就像今天的互联网一样。

AIGC的成本主要在于需要巨大的计算能力,以无限版图为例,目前采用高端A40,整个训练长度由100多张高端显卡制成。另一个V100,我们在整个C端绘画时基本上使用、A100,以及刚才提到的相对高端的卡片,目前云计算的整体计算能力支持相对普遍。当每天创建数十万张卡片时,数百张卡片可以同时支持如此大的创建量。

9、如何看待AIGC和元宇宙的未来发展?

从主题投资的角度来看,区块链、元宇宙和Web3都描述了数字经济时代的巨大应用场景,而虚拟人和NFT只是去年资本市场关注的具体应用之一。我们认为,AIGC将是推动数字经济从Web2升级到Web3的重要生产力工具:一方面,它对现有的杀手级应用程序——短视频和游戏有颠覆性的影响,或者进一步扩大内容量,提高成瘾,为社交网络和广告提供新的工具;另一方面,在Web3开放和共同建设的价值观下,UGC、AIGC的内容会更有吸引力,二次创造、开放想象的浪潮即将到来。目前,AIGC已成为硅谷最新的热门方向,国内一级市场和互联网制造商对AIGC应用的关注度也在迅速提高。

科普:关于AIGC的十问十答

10、AIGC的投资目标是什么?

科普:关于AIGC的十问十答

本文摘自国盛证券研究所2022年11月13日发布的报告 | AIGC__web3时代的生产力工具,详见相关报告。