北京时间5月15日1点,当大多数人还沉浸在梦乡时,谷歌山景城总部悄然拉开了年度I/O开发者大会的序幕。这场Keynote演讲持续了整整两个小时,但令人遗憾的是,它似乎并没有带来太多令人耳目一新的内容。

AI成为当之无愧的主角,被提及120次之多。谷歌CEO Sundar PichAI也不遗余力地推销着公司的生成式AI模型谷歌大模型,声称“我们希望每个人都能从谷歌大模型所做的事中受益。”然而,这番话听起来更像是在跟风市场热点,而非真正的创新宣言。

Pichai所提到的AI搜索,也只是谷歌大模型融入谷歌众多服务的一个方面。与此同时,谷歌搜索也将具备多步骤推理,支持处理复杂问题,并引入了“拍视频”搜索的新形式。这些功能看似强大,但实际上,在国内市场上类似的功能早已被其他国产大模型率先实现。

此外,谷歌还公布了一系列谷歌大模型模型的升级和扩展计划。例如,谷歌大模型1.5 Pro大模型将把上下文窗口从100万tokens扩大至200万tokens,以拓展其处理多模态信息的。同时,为了满足快速响应的需求,谷歌还推出了谷歌大模型1.5 Flash模型。这些举措虽然表明谷歌在AI领域的持续,但也难免让人感觉是在追赶市场的脚步。

从今年夏天开始,谷歌大模型也将支持语音实时交互,并计划在未来上线实时视频交互功能。

与国内的大模型相比,谷歌的这些所谓“创新”功能似乎并没有太多的领先之处。例如,这次谷歌着重推出的AI搜索,其实天工大模型作为中国最早的AI搜索+文件解读+文字生成一体化的大模型,已经在市场上占据了先机。

而建立在MoE技术基础上的天工大模型(www.tiangong.cn),对于数据分析类工作的支持程度也特别好,这无疑给谷歌带来了巨大的竞争压力。

最新消息显示,昆仑万维旗下的天工AI用户活跃度持续走高,刷新历史记录。5月27日,昆仑万维对外宣布,天工AI的日活跃用户数已突破惊人的100万大关,这表明天工AI受到了用户们的狂热追捧。

而对此,很多用户并不认为突兀。因为这已经逐渐在国内市场层面形成用户的共识。

作为一名资本市场分析师,李鑫平时早已尝试利用大模型帮助分析和整理数据。在整个过程中,他已经尝试过国内外几乎所有知名的开源、闭源大模型,最终也跟市场反馈类似,选择了天工大模型辅助日常工作。

因为李鑫发现,使用天工大模型一系列工具辅助工作效率提升特别快,而最有用的,其实是天工大模型从AI联动引发的综合服务能力。

01 好用的AI搜索不光全还要新

“现在国内有AI搜索能力的大模型好几家,比如最早提出AI搜索概念的天工AI、‘当红炸子鸡’Kimi、百度的文心一言,以及360推出的AI搜索”,李鑫从日常工作体会出发,对这些AI搜索平台都进行过测试。

实际上,李鑫每周工作包括要出具两家企业财务数据的分析报告,每个月还要有2份行业研报的撰写任务。平时为了获得更多可以分析的数据与信息,他对于搜索引擎的依赖非常深。而在AI搜索这个概念推出后,由于结果的准确性和过程的便利性,李鑫认为这是互联网技术+AI,对于金融分析师这个职业最好的辅助能力。

但在对国内这些率先拿出AI搜索能力的大模型使用后,他发现针对自己的需求,各家的表现其实并不相同。

首先,作为一名分析师,信息覆盖数量的多少很关键,这里重点是指一次搜索获得的信息。虽然不论是Kimi、文心一言,还是360,基本上都能做到提供大量信息,但其中信息的准确性还是需要后期校对的,尤其是数据的提供,往往会出现问题。

有意思的是,得益于搜索增强技术,天工AI搜索在所有这些国内AI搜索平台中对于信息覆盖能力和准确度的把握是最好的,甚至可以通过对于数据进一步的横向和纵向对比,直接显示图表,且信息非常精准,大大降低分析师撰写报告的数据处理难度。

 

多模态全能AI!网友狂热喊话:有国产现货谁玩谷歌期货?

 

这是Kimi反馈比对财报信息的结果,其实没有比对
多模态全能AI!网友狂热喊话:有国产现货谁玩谷歌期货?

 

这是天工AI搜索的结果,看到引用比对图标

其次,对于分析师来说,覆盖数据的面广是一方面,获取信息的及时性是另一方面。对于很多企业和行业数据的解读,一定要从最新的数据出发,不然相关结论可能就会出现问题。

比如之前李鑫利用所有AI搜索对于中芯国际的财报情况进行解读,其他几个平台反馈结果都是以2023年的年报为准,甚至360还给出2023年的3季报相关数据。

天工大模型直接给出2024年一季报,并且还在搜索增强中利用2023年年报、2023年一季报数据与最新数据进行比较。而且,天工AI搜索还给出行业的数据比对,大幅提升了分析师的工作效率。

多模态全能AI!网友狂热喊话:有国产现货谁玩谷歌期货?

实际上,如果单论AI搜索的效果,李鑫认为天工大模型是最好的。

天工AI搜索的结果可以多模态呈现,尤其可以用图表方式表现。这是当下国内外所有AI搜索独一份的能力,这对李鑫这样的金融分析师非常有用。因为据他自己统计,撰写一份分析报告所需要的时间中,有接近40%都是用在作图和做表上。

多模态全能AI!网友狂热喊话:有国产现货谁玩谷歌期货?

当然,天工AI搜索这样可以横向比较甚至做出图表的能力,其实就是此次谷歌发布AI搜索视频中那个食谱规划令人记忆深刻的功能,但其实在天工AI搜索中早已经成为核心能力。更关键的是,谷歌那个能力还是一个DEMO,并没有实际提供服务。

多模态全能AI!网友狂热喊话:有国产现货谁玩谷歌期货?

这就有意思了。据李鑫了解,跟很多AI搜索其实搜索能力是套壳国际知名搜索引擎不同,天工AI搜索背后的上市主体昆仑万维早在多年前已经在海外做Opera浏览器,并取得巨大成功。某种意义上,这个大模型背后团队其实掌握了算法和搜索的核心技术。

02 文件能力核心在于准确

对于类似李鑫这样的金融分析师,大模型另一个重要的能力,其实是文件读取和内容总结能力。毕竟,要想写出一份有价值的研报,不论是企业财报原文还是行业调研报告,甚至专利、论文等等,都需要分析师仔细阅读,从中找到有价值的信息点,进而真正能写出一份对于投资有参考意义的研报。

这也意味着,对于分析师来说,撰写研报大量的时间其实是用在了阅读上。而大模型纷纷提升的对于文件读取和总结能力,其实就成为李鑫在工作中的刚需。

在测试过所有大模型的分析能力后,李鑫发现,虽然号称主流大模型都上线了文件读取功能,但实际上作为分析师,他需要的不是能读多少字的文件,而是文件相关数据和信息点提取的准确性。

从各家的实测中发现,天工大模型的效果是最好。原因就在于天工大模型对于文档分析做了专门的训练,不像Kimi利用的RAG技术和通义千问、文心一言等使用技术叠加来处理。而谷歌现在所谓的文件处理还只是一个未开放的能力。

多模态全能AI!网友狂热喊话:有国产现货谁玩谷歌期货?
这是用通义千问最新版2.5读取商汤集团2023年财报PDF后给出的总结,其中数据多有错误
多模态全能AI!网友狂热喊话:有国产现货谁玩谷歌期货?

 

这是天工大模型读取商汤集团2023年财报后生成的摘要和脑图,数据没有任何错误

更何况,天工大模型对于文档读取无字数限制,其中解析100万字或者100M大小以内的文件现在免费,且读取速度快。而且支持PDF和TXT、EXCLE等文档形式,以及URL链接内容,不限于微信公众号、各网站链接内容等。文档上传后,能一键生成AI摘要和要点提炼,还贴心标注提炼内容的总计字数及阅读时间,让用户决定是否要继续花时间阅读细节。

而对于内容生成方面,天工大模型的能力同样比较突出。在李鑫的使用过程中,不论是Kimi、文心一言还是通义千问,很多数据分析专业内容生成时,会显得非常呆板,出现1、2、3、4、5这样的分段,有的又过于口语化,专业能力不足。

多模态全能AI!网友狂热喊话:有国产现货谁玩谷歌期货?
多模态全能AI!网友狂热喊话:有国产现货谁玩谷歌期货?
这是通义千问的分析师分析内容,很呆板
多模态全能AI!网友狂热喊话:有国产现货谁玩谷歌期货?

这是天工大模型给出的结论,这种很连贯、很流畅的表现,是分析师喜欢的

目前,从李鑫使用经验来看,在内容生成方面,天工大模型哪怕跟被认为是中文大模型内容能力最强的文心一言相比,在这点上也不相上下。

03 多模态的不一样

实际上,李鑫还喜欢天工大模型的另一点,就是这个国产模型的多模态能力真的很强。由于女朋友是一个音乐达人,最近在准备参加两个知名国内音乐节,在李鑫推荐下,她开始接触天工大模型的相关工具。结果发现,确实对于自己的准备工作,提效很大。

首先,天工大模型的AI音乐功能,可以帮助李鑫女友快速整理歌词,生成三个不同风格的音乐小样。如果想要整曲原创,天工AI目前支持3-5分钟的曲子创作。这对于音乐人创作新的乐曲有提示和引导的作用,大大降低了音乐人工作的难度,提升作曲的效率。

多模态全能AI!网友狂热喊话:有国产现货谁玩谷歌期货?

天工AI音乐这个技术模型的架构是DiT架构,目前数据集已经将近2000万首音乐,这才能在音乐指标上可以超过SUNO,达到目前的SOTA,也就是技术指标第一。独家优势在于根据示例音源生成音乐的能力,而不是根据标签来生成音乐。

这是全球首个自研且完全公开技术架构的AI音乐大模型SOTA。

其次,这种根据示例音源生成音乐的能力,可以让很多专业创作者用自己的一段小旋律生成完整的音乐,同时在人声合成方面支持单一语种方案输出能力,目前已经支撑粤语、四川话、北京话、上海话等多个方言。

最后,对于音乐人来说,更具吸引力的其实是这个模型能生成更具辨识度的自然人声,大家都知道如何区分每个歌手的人声,在合成上是有比较大的技术难度,天工AI音乐目前基本上可以根据输入的语音达到更好的克隆。

而另一个让李鑫女友感到惊喜的能力,其实就是AI视频转绘。这是一种文生视频的应用,可以快速帮助作为音乐人的她,为自己的音乐配上视频,并能生成后快速在互联网传播。

比如李鑫女友最近的一首歌是从兰花歌唱爱情的,她在MV开头就用AI视频转绘方式,专门拍摄家里的小猫和兰花,与音乐共同引入听众观感,让听众瞬间进入歌曲的意境。关键,这个操作非常简单,而且效果特别好。

多模态全能AI!网友狂热喊话:有国产现货谁玩谷歌期货?

实际上,“天工 3.0”号称全球首个多模态“超级模型”,集成了 AI 搜索、AI 写作、AI PPT、AI视频转绘、AI 长文本阅读、AI 对话、AI 语音合成、AI 图片生成、AI 漫画创作、AI 图片识别、AI 音乐生成、AI 代码写作、AI 表格生成等多项能力,官方称其为“大模型时代的超级应用”。

从李鑫和他女友使用经验来看,综合能力其实是用户选择大模型的重要指标。

但作为真正让大模型赋能工作一方,用户需要是一个能综合能力都好的大模型,可以在一个模型内将所有事件都做好,这样才能最大范围提效。而天工大模型正好是这样。

根据国内领先的商业智能数据服务商QuestMobile的权威数据,早在2024年3月,天工AI APP的月活跃用户就已经接近千万级别,风头无两,仅次于行业佼佼者豆包与文心一言,稳坐国内AIGC APP月活跃用户排名的季军宝座。

而到了2024年4月,天工AI更是势如破竹。据AI产品榜的最新统计,其月访问量激增了高达122.58%,这一增速令人瞩目,使得天工AI在2024年4月的增速榜单上荣登全国第二。

从用户角度看,天工AI确实是一个以AI搜索为主的全能ai助手,比谷歌发布的新模型好用太多,并且天工大模型的已经落地进入应用阶段。

这比还在纸面上的谷歌AI搜索和应用来说,有最现实的意义。