多模态相关资讯及多模态相关产品 | 第 15 页

首页
标签
多模态
全部文章

多模态

398篇

内容持续更新中

热门

01.AI

1. OCR技术2. PaddleOCR算法模型挑战赛3. 场景文本识别算法SVTRv24. 表格识别算法SLANet-LCNetV2

11x

1200万美元融资

1688

1950

1X 科技

2小时学习模式

3000亿参数大模型

30B参数模型

360

360公司

360创始人

360智脑

360浏览器

阅读量飙升

快手开始研发超千亿规模大模型和多模态大模型

快手首席执行官程一笑表示，今年初，快手启动了新的 AI 战略，并设定了战略目标，希望确保自己在可能到来的新技术突破中保持国内领先地位。快手已开始研发超千亿规模的语言大模型和多模态大模型。此外，快手推出…

七个圈

行业资讯

阅读量飙升

上海AI实验室开源首个图文混合创作大模型“浦语灵笔”

近日,上海人工智能实验室(上海AI实验室)推出首个图文混合创作大模型书生·浦语灵笔(InternLM-XComposer)。浦语灵笔能进行流利的中英文图文对话,准确理解图像内容,更解锁了“一键生成”图…

七个圈

行业资讯

阅读量飙升

OpenAI ChatGPT多模态功能正式上线,支持语音交互和图片识别

9月25日,OpenAI为旗下热门对话AI ChatGPT推出了语音交互和图片识别等多模态功能。新功能支持用户通过语音对话以及上传图片进行交互,可实现语音识别、文本识别、物体检测等功能。多模态版Cha…

七个圈

行业资讯

阅读量飙升

DALL-E 3 推理能力大幅提升,OpenAI 领先多模态能力

OpenAI 最新发布的 DALL-E 3 文图生成模型,与 ChatGPT 实现了深度融合,理解复杂语言指令的能力得到大幅提升。DALL-E 3 在遵循提示生成连贯细节的能力上,明显超过了早期版本甚…

七个圈

行业资讯

阅读量飙升

面壁智能发布千亿多模态大模型 “Luca” 面壁露卡 Luca2.0 开启公测

面壁智能发布了千亿多模态大模型 “Luca”，Luca 具备多项语言模型能力和强大的多模态处理能力。Luca2.0 已开启公测，为用户提供更多智能对话助手功能。

七个圈

行业资讯

阅读量飙升

字节大模型新进展：首次引入视觉定位，实现细粒度多模态联合理解，已开源 & demo 可玩

文章介绍了字节跳动推出的 BuboGPT 模型，该模型支持文本、图像、音频三种模态的多模态联合理解，并首次引入视觉定位技术，能够精确定位图像中的对象。研究人员通过采用多模态指令调整的训练方案，使得 B…

七个圈

行业资讯

贡献榜

贡献文章数

七个圈AIGC破圈俱乐部欢迎您！

8.8万用户在看

3款AI工具让历史名人‘复活’：梵高、莫扎特、奥斯汀等重现当下

7万用户在看

用AI写出最火的玄幻小说，全过程完整指南！附提示词和思路讲解

5.6万用户在看

快速上手！Midjourney 网页版操作指南，生成MJ图片无需Discord！

5.2万用户在看

多模态

398篇

贡献榜

七个圈

创米

AI情报

AI领航员

搜索

近期热门

七个圈AIGC破圈俱乐部欢迎您！

8.8万 用户在看

3款AI工具让历史名人‘复活’：梵高、莫扎特、奥斯汀等重现当下

7万 用户在看

用AI写出最火的玄幻小说，全过程完整指南！附提示词和思路讲解

5.6万 用户在看

快速上手！Midjourney 网页版操作指南，生成MJ图片无需Discord！

5.2万 用户在看

多模态

398篇

贡献榜

七个圈

创米

AI情报

AI领航员

8.8万用户在看

7万用户在看

5.6万用户在看

5.2万用户在看