2024北京智源大会在海淀区展示中心开幕,展现了具身智能机器人Galbot等大模型技术;智谱AI、百度等公司展示各自的成果,探讨海淀区的科技创新和文化魅力;快手展示了快意大模型视频生成技术。

海淀融媒记者实地探访2024智源大会AI创新展海淀融媒记者实地探访2024智源大会AI创新展海淀融媒记者实地探访2024智源大会AI创新展

人工智能漫长的征程中,大模型的出现无疑是一座闪耀的里程碑。6月14日上午,2024北京智源大会在中关村国家自主创新示范区展示中心开幕。大会现场,具身智能机器人Galbot和国内主流大模型展览区备受关注。

Galbot“身手不凡”

“Galbot帮我拿一盒奥利奥”“Galbot我想要一瓶水”……

在展览区,记者看到银河通用首代具身智能机器人Galbot正忙着为嘉宾“送吃送喝”。收到指令后,Galbot自主导航到货架,通过“视觉”锁定货架上的目标,用右手的吸盘准确抓取商品并放置到指定位置,整套动作一气呵成。

另一边,Galbot正在进行家居收纳展示。桌子上摆放着橙子、香蕉,可乐、口红、玩具等物品,在收到指令后,Galbot会根据物品的不同形状、材质,自主判断抓取角度,抓取物品后自动收纳到指定位置。

Galbot采用了由北京智源研究院和银河通用共同研发的Galbot的大脑大模型,通过大小脑配合,大脑层进行通用指令理解和场景感知,完成规划后调用小脑能力驱动身体完成取货、放置、收纳等任务。

“我们带来了三台机器人,一台在现场进行展示,另外两台机器人分别演示在日常生活场景中拿取收纳物品和在商业环境下帮助人完成从接单到找食品,抓食品,送食品等一系列流程的演示。”现场工作人员告诉记者,“在日复一日大数据加持的交互学习中,具身大模型机器人训练出决策的‘大脑’和执行的‘小脑’,指挥日渐灵巧的‘手’,能够独立完成越来越多的工作。在未来,Galbot将走进商超、零售、工业、物流、社区家庭等场景落地应用。”

大模型眼中的海淀

AI大模型眼中的海淀是什么样的?带着这个问题,记者来到了国内主流大模型展览区。

“在我眼中,海淀区是北京市的一个重要区域,它不仅具有丰富的历史文化底蕴,还是科技创新和人才聚集的高地……”智谱AI大模型回答记者。

智谱AI是由清华大学计算机系技术成果转化而来的公司,致力于打造新一代认知智能通用模型。公司合作研发了双语千亿级超大规模预训练模型GLM-130B,并构建了高精度通用知识图谱,形成数据与知识双轮驱动的认知引擎,基于此模型打造了ChatGLM。

同样的问题,百度文心一言大模型带来了更加详尽的回答:“首先,海淀是科技创新的摇篮。其次,海淀是教育资源的聚集地。此外,海淀还是文化的繁荣之地。最后,海淀还是一个宜居的城区……综上所述,海淀在我眼中是一个充满活力和魅力的城区,它不仅在科技创新、教育资源和文化繁荣方面取得了显著成就,还为市民提供了宜居的生活环境。我相信在未来的发展中,海淀将继续保持其独特的魅力和优势,为北京乃至全国的发展作出更大贡献。”

文心一言是百度全新一代知识增强大语言模型,文心大模型家族的新成员能够与人对话互动、回答问题、协助创作,高效便捷地帮助人们获取信息、知识和灵感。文心一言从数万亿数据和数千亿知识中融合学习,得到预训练大模型,在此基础上采用有监督精调、人类反馈强化学习、提示等技术,具备知识增强、检索增强和对话增强的技术优势。

来到快手展区,工作人员向记者介绍了快手“快意”大模型。快意大模型是由快手自研的文生文大语言模型,设计有13B、66B、175B三种参数规模,在每个参数规模下包含预训练模型和对话模型两个版本。

在今年智源大会的分论坛上,快手还为大家带来了首个效果对标Sora且已面向用户开放的文生视频大模型“可灵”,已经在6月6日正式开放内测。

据介绍,“可灵”具备强大的概念组合能力和想象力,通过文字描述生成的视频符合物理运动规律,能够模拟物理世界的特性。同时,生成的视频分辨率高达1080p,最长可达2分钟(帧率30fps),且支持自由的宽高比。

“快手在短视频技术方面有着多年的深入积累,公司从2023年开始启动新的AI战略,目前公司已全面布局大模型能力矩阵,涵盖了包括大语言模型、视觉生成模型、音频大模型、多模态大模型等核心技术方向,并基于快手丰富的业务场景,将生成式AI与多模态内容理解、短视频/直播创作、社交互动、商业化AIGC、创新应用等业务形态深度结合。”工作人员向记者介绍。

大模型技术的应用和发展将给海淀区和科技产业带来新的机遇与挑战,展示中心上演的AI技术秀展示了大模型在不同领域的应用前景和潜力,各家公司大模型技术的展示引发了与会者对AI技术的探讨和思考。