2022年底,ChatGPT的诞生再次引发了市场对人工智能的热烈讨论。上一次,由于Alpha,人工智能在全球范围内受到了广泛关注 Go的出现。Alpha Go不同的是,ChatGPT的出现将公众的视线带到了人工智能的细分领域AIGC(人工智能生成内容),让市场看到了人工智能进入生产和生活的可行性。AIGC是继PGC(Professional Generated Content,专业生产内容)和UGCC(User Generated Content,在用户制作内容之后,是一个新时代。在这个时代,“自然语言”和人工智能开始整合,通过人工智能技术实现内容生成,注入“创造”,意味着自然智能“独特”和“垄断”写作、绘画、音乐、教育等创造性工作的历史结束,创造了“模型”主导内容生成的时代。中国社会科学院技术经济学博士、科技加速器QAQ创始人杜宇认为,AIGC不仅是全民的风口,也是资本的风口。它将带来深刻的生产力变化,也将影响人们工作和生活的各个方面。他最近出版的《AIGC:在《智能创作时代》一书中,从行业背景、技术理念、功能应用、行业应用、产业地图和未来趋势六个角度深入解读了当前人工智能集成电路产业的发展和全景。在最新的采访中,他还回答了公众关注的热点话题,比如中国是否有能力制作类似ChatGPT的产品。人们普遍认为,中国在AIGC领域面临着资金和高质量培训数据不足的双重问题,但杜宇并不认为这两个问题真的存在。杜宇也对数据安全和隐私、新技术的伦理道德以及给监管带来的挑战发表了看法。以下是采访全文:问:你认为ChatGPT的出现是行业里程碑吗?是的,会给行业带来什么变化?杜雨: 在人工智能领域,ChatGPT无疑是一个颠覆性的里程碑。它不仅在聊天能力上有飞跃,而且在文本处理领域也有一定的通用性,可以完成各种任务,如回答问题、翻译和编写代码。 另外,ChatGPT还表现出一些人的特点,比如承认自己的错误,按照设定的道德准则拒绝不怀好意的要求等等。正是因为它具有与人类相似的语言能力、强大的功能和工程领域的进步,才有了广阔的商业落地场景。它可以与信息、影视、游戏、教育、电子商务等行业相结合,带来许多创新的机遇和应用。问:目前你认为ChatGPT的积极意义是什么?杜雨: ChatGPT的积极影响体现在很多方面:(1)提高生产效率。创作者可以从ChatGPT和内容组织建议中获得灵感,从而更有效地组织内容制作,提高内容制作效率。(2)当前信息获取来源可能会发生变化。过去,人们主要依靠搜索引擎在互联网上查询信息。现在,在很多领域,ChatGPT可以取代搜索引擎的功能,或者提高搜索引擎本身的效果。例如,微软发布了集成ChatGPT的搜索引擎。此外,与搜索引擎相比,chatGPT有许多优点:它是信息检索-组织集成,搜索可以使chatGPT组织信息成所需的形式;它还可以让用户享受更好的搜索体验,用户可以以多轮聊天对话的形式进行搜索,而不需要仔细选择搜索词的组合,并与搜索类型相匹配,这也大大优化了用户的搜索体验。(3)它还可以降低互联网内容的生产门槛。ChatGPT可以让不擅长信息检索、内容组织和语言表达的创作者充分发挥自己的创作能力,降低各种内容的制作门槛。问:根据你对行业的了解,中国有能力做出类似ChatGPT的产品吗?这个过程有什么困难吗?杜雨: 百度的“文心一言”大模型是与ChatGPT对标的典型代表。此外,阿里巴巴、腾讯和字节跳动也表示正在推广中国版“ChatGPT”相关的研究与研发工作,非常值得期待。中国版ChatGPT的难点不仅集中在技术实力上,还集中在财务实力上。培训是一件非常昂贵的事情,所以大多数大工厂都宣布了这种布局。问:360集团创始人兼董事长周鸿祎此前曾表示,如果中国想做一个ChatGPT,除了资金,它还将面临缺乏高质量培训数据的问题。你觉得这个问题怎么样杜雨: 我不认为中国面临“缺乏高质量的培训数据”的问题,因为:首先,我们拥有最多的中国互联网用户和最繁荣的移动互联网生态系统,我们在移动互联网场景中积累了足够的中国用户数据;其次,腾讯微信和字节跳动抖音是用户使用时间最长的应用程序,沉淀了每个网民每天最多的用户数据,因此,图形(微信)和短视频(抖音、快手)都有足够的高质量培训数据,而且是独家的。据我所知,腾讯不仅在公司层面有多个人工智能团队,比如 Lab,微信业务群内有独立的AI团队;字节也有AI实验室;第三,与图文相比,短视频已经成为越来越主流的内容形式,因此,短视频形式下的ChatGPT比我们目前使用的文字版的ChatGPT更具想象力。在短视频形式下,字节跳动不仅在中国的市场份额中排名第一,而且在海外短视频软件市场上也占据了最大的用户份额,这意味着它比海外公司拥有更多的培训语料。在短视频形式下,字节跳动不仅在中国的市场份额中排名第一,而且在海外短视频软件市场上也占据了最大的用户份额,这意味着它比海外公司拥有更多的培训语料。问:目前,一些企业和个人已经开始使用ChatGPT进行商业活动和盈利。如果ChatGPT想要进入大规模的商业运营,可能的场景和商业机会是什么?杜雨: 目前,AIGC已经活跃在多个垂直领域,贯穿电子商务、教育、广告、游戏等行业。具体来说,ChatGPT可以作为运营商和产品营销中的智能人工智能客户服务;在课程社区管理中,它可以作为集团运营助手;在广告行业,它可以帮助员工生成口号;在游戏行业,它可以满足游戏中生成NPC对话的需要。问:你之前提到过,ChatGPT的出现可能会改变当前的信息获取来源,那么AIGC行业的发展会对当前搜索行业的格局产生什么影响呢?杜雨: 搜索引擎技术诞生多年,是时候更新了。集成ChatGPT等AIGC工具可能会产生一些全新的搜索产品。比如微软集成ChatGPT的新搜索引擎Bing就引起了人们的关注,很多媒体报道谷歌看到ChatGPT走红后有危机感。这种危机感来自于ChatGPT作为搜索服务提供的诸多优势: 它不仅可以搜索信息,还可以将信息组织成所需的形式,用户可以通过自然对话找到所需的信息,而无需学习复杂的搜索词搜索模式,大大优化了用户体验。问: 现在很多人认为人工智能将成为一个新的经济增长引擎。你有没有预测过人工智能产业的发展会给经济发展带来多大的增长,或者会带来多少经济效益?杜雨: 目前,AIGC产业的发展刚刚进入大规模应用的初始阶段,各领域的应用开始涌现,从诞生初期到实现可观的经济效益将有一个过程。在这个阶段很难做出更可靠的估计,但AIGC 从生产力的角度来看,未来能给经济发展带来很大的想象力。问:事实上,就目前AIGC的应用而言,AIGC可能还没有达到非常成熟的商业化状态。一些人认为,如果AIGC想要实现真正意义上的大规模商业用途,它必须在技术上取得更多的进步。您如何看待当前AIGC领域的技术路径?未来是否会有更合适、更先进的技术路径?还是目前的基层结构已基本固化确定?杜宇:最初的AIGC通常是基于小型模型,其中一半需要特殊的标记数据培训来解决特定的场景任务,通用性差,难以迁移,高度依赖人工参考。后来,这种形式的AIGC逐渐被基于大数据量、大参数量和强算法的大模型所取代。这种形式的AIGC可以迁移到各种生成人物,而无需调整或少量微调。这波浪潮主要是基于大模型的技术路径。但也许未来可能会有其他方向。当我们从GPT-1到3时,主要的迭代方法是扩大规模,增加训练数据量,所以很多媒体猜测GPT-4在规模和训练数据量上是否会有惊人的飞跃。但从目前媒体报道的信息来看,未来的技术发展方向很可能是多模式。问:通过对当前产品的分析,我们可以知道AIGC模型需要大量的数据培训。它会涉及数据安全吗?杜雨: 数据一直是机器学习模型的一个重要瓶颈,因为对于特定的任务场景,机器需要手动标记大量的数据来完成学习。许多行业专家开玩笑说,这种现象被称为“人工智能是大量工作的智能”。 但数据安全问题不在于模型本身,而在于选择培训数据集的人或公司。应建立完善的模型培训数据审查机制,禁止通过非法渠道获取的数据进行培训。考虑如何从监管的角度解决可能设计的数据安全问题。问: 当新技术出现时,通常会面临一些技术道德问题,那么AIGC行业会有道德困境吗?杜雨: AIGC技术的发展无疑是革命性的。它可以改善我们的日常生活和生产力,但也面临着许多技术伦理挑战:(1)版权问题:AIGC 本质上是机器学习的应用,在模型学习阶段,不可避免地使用大量的数据集进行培训,但培训后生成物的版权定义相关法律体系仍不完善。在伦理上,一些AIGC工具可能会导致一些侵权但无法清理的定义。(2)欺诈风险:AIGC生成的内容是假的。该技术不仅可以用来篡改图像、视频等信息,还可以用来制作从未存在过的图像和视频内容。与此同时,该技术的使用门槛也在下降。例如,常用的社交媒体具有一键“换脸”、“变声”等功能,广义上是AIGC的产物。由于符合人们“眼见为实”的认知共性,这种技术滥用后,很可能会以高度可信的方式通过互联网立即接触到公众,削弱公众对虚假信息的判断力,使公众难以识别真实和虚假信息。(3)生成违禁内容:AI 在安全措施不完善的前提下,生成的内容完全取决于用户的指导,AI 恶意诱导行为可能无法独立思考和判断,只能根据训练材料中学到的信息进行输出。基于 AIGC 用户可能会故意引导技术的这一特点 AI 输出一些违禁内容,如暴力、极端仇恨言论、色情图片等。科学家们正试图利用一些技术手段来避免这些潜在的风险事件。通过改进数据集,增加更多的限制性条件,微调模型,人工智能可以减少对有害内容的学习,从而降低人工智能本身的风险。除了从训练的角度预防AIGC潜在的技术伦理问题外,还需要及时报警和停止使用。问:你如何看待AIGC领域的风险和监管?杜雨: 我们前面提到的伦理和道德困境是一些主要风险,然后从监管的角度来思考:(1)权利的角度:版权属于谁?训练数据集的创作者如何主张自己的权利?(2)责任角度:如何防止AIGC作恶?(伪造内容、恶意内容、欺诈内容)作恶后追谁的责任?是用户、平台、直接监管负责人还是内容传播方?(3)监管态度:鼓励AIGC领域创新,但要严格监管一些容易作恶的领域。(比如发布深度合成业务需要严格的授权审计机制,明确平台方的责任)问:如何评价我国AIGC产业目前的发展进程?杜雨: 可以说,国内AIGC已经到了大规模应用的前夕。一方面,我们看到像上面提到的百度这样的互联网制造商推出了“文心一格”、另一方面,我们也可以观察到,近几个月来,市场上出现了许多优秀的AIGC初创企业。我相信在不久的将来,我们将在世界AIGC的舞台上看到许多中国企业活跃。问:你认为AIGC是全民风口还是资本风口?杜雨: 既是全民的风口,也是资本的风口。因为AIGC的技术可以涉及到每个人的生活和工作,每个人都可以享受到这项技术的好处,所以它是全民的风口。我们还可以看到,中国许多早期投资机构已经开始关注人工智能集成电路领域,现在人工智能集成电路的一些投资案例已经逐渐出现,因此它也是资本的风口。

中国AIGC已来到大规模应用前夜-《AIGC:智能创作时代》杜雨