内容持续更新中
在人工智能的赛道上,中国正以自主创新的姿态稳步前行。11月26日,全球首个千亿参数多模态大模型"紫东太初"3.0在武汉正式亮相,为国产AI技术再添浓墨重彩的一笔。 这不仅仅是一个技…
近日,百度正式推出其最新的文心大模型4.5及文心大模型 X1,用户可在文心一言官网免费体验这两款先进的模型。文心4.5是百度首个原生多模态大模型,专注于多模态理解和逻辑推理,其性能在多项基准测试中超越…
阿里巴巴宣布推出AI旗舰应用——新夸克。新夸克基于阿里通义领先的推理及多模态大模型,全面升级为一个无边界的“AI超级框”。 “新夸克” 不仅具备强大的推理能力,还能够实现多模态的交互,用户在使用过程中…
3月13日,阿里巴巴正式推出其AI旗舰应用——新夸克。这款全新升级的夸克基于阿里通义领先的推理及多模态大模型,打造了一个无边界的“AI超级框”,为用户带来全新的AI体验。 新夸克的创新之处在于将AI对…
谷歌 CEO 桑达尔・皮查伊(Sundar Pichai)在一场发布会上宣布,谷歌开源了最新的多模态大模型 Gemma-3,该模型以低成本、高性能为特点,备受关注。 Gemma-3提供了四种不同参数规…
近日,魔乐社区(Modelers)正式上线了由阶跃星辰研发的 Step-Video 和 Step-Audio 两款开源多模态大模型。这两款模型分别用于视频生成和语音交互,旨在为开发者和企业用户提供更强…
今日,阶跃星辰与吉利汽车集团宣布,联合开源两款阶跃Step系列多模态大模型——Step-Video-T2V视频生成模型和Step-Audio语音模型。 其中,阶跃Step-Video-T2V视频生成模…
近日,当虹科技宣布其 BlackEye 多模态视听大模型成功完成与 DeepSeek-R1和 DeepSeek Janus Pro 的深度融合。这一里程碑式的进展标志着当虹科技在视听传媒、工业与卫星、…
前微软亚洲研究院视觉计算组的首席研究员胡瀚已正式加入腾讯,接替已离职的前腾讯混元大模型技术负责人刘威,承担起多模态大模型的研发任务。这一消息引起了业界的广泛关注。 胡瀚的学术背景十分扎实。2008年,…
12月30日,支付宝推出新一代AI视觉搜索产品“探一下”,基于自研的多模态大模型技术,可“用AI之眼探索万物”,提供更快速、有用、趣味的生成式搜索服务。 用户遇到感兴趣的事物,就能让AI通过摄像头,识…
有“AI教母”之称的斯坦福大学教授李飞飞及其团队近日发布了一项关于多模态大模型“空间智能”的研究,揭示这些模型在记忆和回忆空间方面已经具备初步能力,并展现出形成局部世界模型的潜力。 研究团队开发了用于…
近日,视觉中国宣布与北京生数科技有限公司建立战略合作关系,双方将共同探索并建立“视觉产业大模型平台及应用”。这一合作致力于深化人工智能技术在视觉内容产业的应用,并推动产业智能化升级,旨在为全球视觉内容…
近日,厦门大学信息学院史晓东教授团队的“基于甲骨文多模态大模型的多元信息甲骨文辅助考释模型”入选“探元计划2024”创新探索型项目TOP10榜单,为甲骨文的现代化考释开辟了新路径。 甲骨文作为世界四大…
昆仑万维表示其多模态大模型 “天工” 已进入实验性训练阶段,经过持续的迭代和高负荷的运行。手机端天工 AI 助手已上线内测,用户可进行万字以上的文本对话交互。
北京智源人工智能研究院联合上海交通大学、中国人民大学、北京大学和北京邮电大学等高校推出了一款名为Video-XL的超长视频理解大模型。这款模型是多模态大模型核心能力的重要展示,也是向通用人工智能(AG…
在近日的发布会上,阿里国际 AI 团队揭晓了其最新研发的多模态大模型 Ovis,这一创新的 AI 技术无疑为各行业带来了新的机遇。Ovis 具备强大的图像理解和数据处理能力,让人耳目一新。 Ovis …
据智能涌现消息,人形机器人领域迎来新玩家。成立于2024年6月的「动易科技」近期完成数千万元天使轮融资,由峰瑞资本和Z基金领投,多家知名投资机构跟投。公司由具备丰富足式人形机器人和强化学习开发经验的任…
在这个信息爆炸的时代,我们每天都在用图片和视频记录生活,分享快乐。但你有没有想过,如果有一种技术,能够让机器像人类一样,不仅能看懂这些图片和视频,还能和我们进行深入的交流,那会怎样? 阿里团队最新发布…
近日,摩尔线程与识因智能宣布达成战略合作,共同推进国产全功能GPU在行业大模型解决方案中的应用。双方已完成摩尔线程夸娥智算集群与识因智能“一叶轻舟”多模态大模型的适配工作,整合了各自在人工智能领域的优…
上海人工智能实验室司南 OpenCompass 团队与魔搭 ModelScope 最近宣布,他们的大模型评测平台 Compass Arena 进行了重要更新,推出了全新的多模态大模型竞技版块 Comp…
近期,多模态大模型的研究和应用取得了显著进展。国外公司如OpenAI、Google、Microsoft等推出了一系列先进的模型,国内也有智谱AI、阶跃星辰等机构在该领域取得了突破。这些模型通常依赖视觉…
站长之家(ChinaZ.com)6月21日 消息:今日,在华为HDC2024开发者大会上,华为常务董事、华为云CEO张平安向全球宣布了华为云盘古大模型5.0的正式发布。 盘古大模型5.0,凭借其十亿级…
最近,The Intercept、Raw Story和AlterNet三家新闻机构对OpenAI和微软提起诉讼,指控侵犯版权问题。据称ChatGPT在某些情况下会近乎复制受版权保护的新闻作品。多模态大…
随着 GPT-4 的发布,多模态大模型(MLLM)成为热点。马毅团队提出了 EMT 框架,评估微调后的 MLLM 的灾难性遗忘。实验发现,微调 MLLM 在提升微调数据集性能的同时,也导致其他数据集性…
OpenAI 近期发布了新指令语言模型 InstructGPT-3.5,性能与GPT-3.5 Turbo媲美。此外,他们计划推出多模态大模型GPT-Vision和代号为“Gobi”的更强大多模态模型,…