2022年是AIGC,或生成式AI“Generative AI”爆发的一年。以OpenAI、Stability AI、Midjourney、NovaAI等为代表的企业和工具,在全球范围内掀起了一场从消费者到资本市场的狂热浪潮。虽然来到2022年年底、2023年年初,AIGC领域也并不太平,爆发了比如Art Station上“AI vs人类”的战争、三位海外艺术家起诉了Stability AI、Midjourney公司等事件,以及面临着第一批AIGC公司,比如StockAI,因为数据、算力的庞大支出等正式关停的现状,但这些挫折和争议并非不可解决。Point-E当下AI已经在绘画、音乐甚至是游戏资产的生成方面,展现出了相当的潜力,OpenAI、谷歌、英伟达等公司也推出了文字生成3D模型实验技术Point-E等工具,未来随着各国法律的完善、行业的竞争、自律和规范,AI作为全新的生产力工具、AIGC作为全新的内容创作阶段,在2023年及以后在各行各业继续发展的大趋势,依旧值得关注。近日,腾讯研究院也就AIGC的相关技术和应用前景,从生态、趋势、挑战等多个维度思考,发布了《AIGC发展趋势报告2023:迎接人工智能的下一个时代》(以下简称为《AIGC报告》)。
以下图片均来自报告中截取的内容 消费端:AIGC成未来互联网基础设施首先是消费市场,伴随着现如今全球数字内容消费市场的持续扩张、升级和转型,数字内容进入强需求、视频化、拼创意的螺旋式升级周期,《AIGC报告》认为,“AIGC有望塑造数字内容生产与交互新范式,成为未来互联网的内容生产基础设施”。
得益于过去多年来,大型预训练语言模型和人类反馈强化学习(RLHF)技术等技术出现和发展,当下的AIGC技术已经在文字、音乐、图片、视频、3D多种媒介形态的生产中,担任了多样化的助手工作,也已经有不少消费者体验到了AIGC的优势,就比如米哈游在《未定事件簿》实装的AI配音。“根据6pen预测,未来五年,互联网上10%—30%的图片内容将由AI参与生成,有望创造超过600亿的市场空间,若考虑到下一代互联网对内容需求的迅速提升,国外商业咨询机构Acumen Research and Consulting预测,2030年AIGC市场规模将达到1100亿美元。”
而ChatGPT这种级别的AI问答系统的出现,也为数字人这种元宇宙相关的领域,提供了全新的可能。《AIGC报告》中称,AIGC工具将在制作效能、交互体验等多方面升级当前的数字人。“基于AIGC的3D数字人建模已经初步实现产品化,目前精度可以达到次世代游戏人物级别,通过便捷化地上传图片即可生成3D数字人面部模型。”
除了数字人,《AIGC报告》还从技术、个性化、创作自由等方面,论证了未来“AIGC推动元宇宙发展”的重要性。“在元宇宙发展的过程中,游戏是虚拟世界重要的载体,AIGC可以极大提高数字原生内容的幵发效率,降低游戏幵发成本。具体来说,剧情、角色、头像、道具、场景、配音、动作、特效、主程序未来都可以通过AIGC生成。”“同时,AIGC将赋予用户更多的创作权力和自由,促进创新并提升元宇宙的用户体验。AIGC将作为生产力工具为元宇宙用户提供个性化内容体验。” 产业端:合成数据牵引人工智能的未来而在产业端,合成数据(synthetic data)领域可以说是当下AIGC技术持续创新发展的重点,也是全新的发展契机所在。所谓合成数据,是值得“计算机模拟(computer simulation)技术或算法创建、生成的自标注(annotated)信息,可以在数学上或统计学上反映真实世界数据的属性,因此可以作为真实世界数据的替代品,来训练、测试、验证AI模型。”《AIGC报告》中指出,数据是当前制约AI技术发展的最大原因,根据合成数据服务商AI.Reverie的信息,人工标注一张图片可能需要6美元,但人工合成的话只需要6美分。
除了成本和获取难度上相较于真实世界数据存在优势,合成数据还在隐私、算法偏见、稀有数据场景的生成、AI模型训练速度方面,相较于真实世界数据存在优势。特别是在金融、医疗等数据较为敏感的行业,合成数据由于是用程序生成,与真实世界无关,能够更好地在相关领域规避风险,发力研究,持续拓展AIGC的应用空间。当然对于市场而言,更大的机遇在于,当前合成数据领域还处于互联网大厂加大投资布局,创业公司方兴未艾、不断涌现的状态。“在过去的18个月,公众视野中已知的合成数据公司融资总额达到3.28亿美元,比2020年高出2.75亿美元。”“根据Cognilytica的数据,合成数据市场规模在2021年大概是1.1亿美元,到2027年将达到11.5亿美元。Grand View Research预测,AI训练数据市场规模到2030年将超过86亿美元。Gartner预测,到2024年用于训练AI的数据中有60%将是合成数据,到2030年AI模型使用的绝大部分数据将是人工智能合成的。”《AIGC报告》表示“合成数据有望推动人工智能迈向2.0阶段(AI2.0)。”
社会价值和风险正所谓技术的革新一定会对社会产生影响,《AIGC报告》认为“AIGC的社会价值体现为革新数字内容与艺术创造领域,并将辐射到其他领域和行业,孕育新的技术形态与价值模式,甚至会成为通用人工智能的可能性路径”。就比如在过去一年AIGC中最热闹的AI绘画,以及其代表的AI艺术领域,AI可以解放人类的创造力,革新艺术领域。通过对现有艺术的模仿,在取代大量基础性的艺术创作工作的同时,AIGC还可以利用不同于人类思维的模式,为艺术家的创作提供新的灵感,甚至是新的艺术风格。“AI虽然不拥有真正的创造力,但是它让使用者拥有了新的创造力。”但随着AIGC带来的社会文化、生产变革而来的,还有已经正在发生,甚至迫在眉睫的一系列问题。《AIGC报告》中,主要囊括了“知识产权挑战”“信息安全挑战”“伦理挑战”“环境挑战”四大AIGC领域目前面临的问题。知识产权挑战是在AI绘画等领域,目前被各界讨论最多的主题之一。对于AI生成内容的版权风险,《AIGC报告》表示“目前国内国外的通行做法也都是会考虑除了AI之外,是否有人的智力或创造性劳动”
其次安全挑战,主要指的是AI生成的内容的安全,以及隐私数据的安全。前者最直接的例子就是AI换脸,借助深度伪造的音视频内容以及欺诈勒索等手段,全球各地的不法分子已经造成了不小的经济损失。而后者在此之前也有过经典案例,在GPT-2模型里,只用一段特殊的前缀,AI生成的内容就会包括特定个人的姓名、电话等信息。第三点伦理挑战则主要体现在AI存在明显的歧视现象,以及AIGC是否具有自我意识(去年谷歌的工程师曾声称旗下的AI已经有了自我意识)。“OpenAI在对DALL-E 2的生成结果进行公平性测试时发现,其表现出显著的性别和种族歧视。即倾向于更高频地生成男性和白色人种的人类图像。”
至于最后的环境挑战。作为一个需要强大算力支撑的新兴技术领域,“有研究人员对Transformer、ELMo、BERT、GPT-2、GPT-3等进行了碳排放研究。在一天的训练时长里,GPT-3模型训练的二氧化碳排放量为552吨。”Midjourney的创始人大卫•霍尔兹也将算力支持而非用户量,视作AIGC大规模的商业扩展的阻力,“如果(Midjourney)用户量达到1000万人,那么世界上将没有足够的算力来支持。”
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则