“如果一个大模型足够有创意,我们不应该让人们直接指挥它。如果它是一把枪,你不应该让人们直接使用它,而应该让一个训练有素的士兵拿着枪,然后人们指挥它,这个士兵有基本的善恶判断能力。”
“也许在漫长的发展过程中,一些关键技术取得了突破,所以我们充分关注它,但事实上,它背后有更大的困难。这些因素导致一些技术和概念在短时间内失败,并被公众遗忘。但事实上,那些应该努力工作的人仍然在努力工作。”
“如果有一天我的数字人会聊天,它会说不该说的话,谁有责任?”
2月25日,全球人工智能开发者先锋大会(GAIDC)Unity中国技术总监孙志鹏间歇接受了澎湃科技(www.thepaper.cn)采访谈到了AIGC(生成式人工智能)和元宇宙未来的趋势。
孙志鹏认为,作为一种“能力”,ChatGPT的释放可能会给公众带来一些问题,创建平台有审计责任,但如何审查,“我认为它也可以通过一些技术手段实现。”
Unity中国是一个为开发人员提供3D引擎的平台,也是元宇宙底层技术的开发人员。孙志鹏说,专业开发人员最初是通过专业工具创建元宇宙的内容,而AIGC赋予了每个人创建内容的能力。
Unity中国参加了2023年全球人工智能开发者先锋大会。枪只能放在训练有素的士兵手中。澎湃科技:2022年DALL-E、人工智能工具,如ChatGPT,使AIGC成为科技界最热门的术语,国内也有不少企业追赶浪潮,你认为2023年这一领域的发展趋势是什么?
孙志鹏:有两个方面:一是人工智能模型将越来越大,二是人工智能在多模态方向(包括文本、图片、视频等)的工作将继续。以上两个方向最近在大模型的指挥下做了一些“出圈”的事情,引起了很大的反响。随着模型越来越大,模型可以生成越来越多的模型。现在我们看到的最多的是文字和图片两种模式,未来的3D内容也会加入,包括3D数字人。
目前,语言大模型本身需要“掌握”两部分知识、语言知识和世界认知知识。语言知识只需要少量的数据来训练,而世界认知知识可以用来驱动多模态领域的研究。例如,我可以用文字、图片和视频来描述我在上海的事情。但无论什么样的模式,都表达了我和上海的关系。也就是说,知识之间的关系是跨模式的,知识的表达可以根据每个模式的需要进行分配,就像多模式工作中发现的经验一样,BeiT v3模型结构也反映了这一结论。大语言模型,通过语言模式越来越大,再加上更多的模式,未来可以驱动3D内容、脚本的制作。不仅是语言模型的开发者,未来还会有更多领域的人加入,而不仅仅是语言模型的开发者,这是2023年的趋势。
澎湃科技:Unity也是一个内容平台。目前各平台对UGC(用户生成内容)的监管已经“分离”。你认为人工智能生成内容对AIGC时代的平台会有什么影响?
孙志鹏:一个大模型能产生的模型越多,对人的影响就越大。只能产生文本的时期,传播效率可能仍然有限。然而,在未来,各种模式的内容、图片、视频、3D内容等将不可避免地产生,其影响和传播将远远超过文本。因此,监督是必要的,但手动监督的成本确实太高了。
目前,我们正在进行数字人的生产过程,我们会考虑,如果有一天我的数字人会聊天,谁负责它不该说的话?因此,ChatGPT作为一种“能力”向公众释放可能存在问题。创建平台有审计责任,但我认为如何审查也可以通过一些技术手段来实现。
例如,为什么chatGPT能够理解令人满意?根据InstructGPT(chatGPT的前身,基于GPT-3)的描述,首先有成千上万的人工数据(问答数据)加入培训,然后用大量的人工筛选结果,最后是reward model强化学习,只有这样,ChatGPT才能具备GPT-3.5(与GPT-3相比,GIThub上添加了大量代码的“语料”)带来的语言能力,以及人工智能的强化训练和人们对人工智能的偏好。无数人可能会问数万次ChatGPT问题。在这个过程中,ChatGPT的能力会不断增强,这些人的意志也会带入人工智能。
因此,开发和培训人工智能的人是关键。如果培训师添加更多关于表达善意的数据,这些人的善意偏好将添加到大型模型中。如果问题的来源是一个善良的目的,那么很可能会得到一个好的结果。
最近,另一个趋势是问大模型的问题,而不是直接问,而是人类告诉另一个语言模型的需求,这个语言模型首先理解你的需求,然后生成一个“没有问题”。一个“没有问题的问题”会得到一个“没有问题的答案”。假如一个大模型足够有创意,我们就不应该让人直接指挥它。如果是枪,你不应该让人们直接使用它,而应该让一个训练有素的士兵拿着枪,然后人们指挥士兵,这个士兵有基本的善恶判断能力。例如,杭州有人用ChatGPT编写了车辆不限行的文件。因此,人工智能从一开始就需要判断,作为一个合法的公民,编写不存在的政府文件是否合理。
AIGC将为元宇宙带来生产过程的进化
澎湃科技:AIGC的普及可能会在一定程度上降低元宇宙的声量。你觉得两者的关系怎么样?
孙志鹏:起起落落是正常的。当我们第一次取得一些成就时,我们可能会过于乐观。我们认为ChatGPT是如此强大。我们已经迎来了通用人工智能的曙光,但它仍然很遥远。例如,人工智能的推理能力实际上非常差。
但这些乐观实际上涵盖了我们对技术的期望,描述了一个更好的未来,并给了开发者一个目标。如何实现这个目标是一个手段的问题,人工智能通信可能就是这个手段,两个概念一个接一个地出现。
也许在漫长的发展过程中,一些关键技术取得了突破,我们充分关注它,但事实上,背后是更大的困难。这些因素导致一些技术和概念在短时间内失败,并被公众遗忘。但事实上,那些应该努力工作的人仍然在努力工作。虽然你可能没有太多的耐心和乐观,但一个行业的人可以坚持做他们认为正确的事情。
AIGC给元宇宙带来了生产过程的进化。元宇宙描述的形式太大,以至于传统的生产过程不适应。AIGC可以赋能创作者。人工智能本质上是给人们更大的计算能力支配,进而激发人们的创造力。过去,专业开发人员需要花时间和精力去做的事情现在很容易实现。只要你说话,你就可以完成绘画和建模。而这件事本身就使用了更多的计算能力,消耗了更多的资源。与此同时,随着AIGC的使用越来越多,计算能力也会变得更便宜,元宇宙的发展也会受益。
澎湃科技:元宇宙核心技术的引擎技术未来会发展什么?2023年元宇宙产业的机遇和挑战是什么?
孙志鹏:关于元宇宙,我们一直在讨论生产过程。这实际上是过去专业引擎的工作。例如,如何开发Unity引擎本身曾经是一个利基问题。毕竟,很少有人做工具,更多的人在创造生态学中使用工具来做内容。更有效的数字内容生产过程可以在元宇宙中诞生。
例如,一个平台,在自己的元宇宙中定义一种新的内容制作方法,在这个宇宙中制作内容,在这个宇宙中消费。像Unity这样的引擎要做的就是适配。例如,一家公司购买了Unity Pro,只有20%的功能,却花了100%的钱,多余的功能实际上可能会干扰个人的生产效率。因此,未来发展的重点是通过解耦和模块化的能力为元宇宙提供特定场景下的生产过程,使其在特定领域足够高效。另外,在升级发动机的同时,发动机支撑的内容也会更加精致。
一般来说,发动机应该是一套完整的乐高积木,用户可以根据自己的想法制作工具和场景,而积木更精致,质量更好,所以事情会变得更好。如果我们合理地分散发动机的功能,元宇宙开发人员将与自己的需求有机地结合起来,创造一个更有效的生产过程。
(本文来自澎湃新闻,请下载更多原创信息“澎湃新闻”APP)
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则