夕小瑶科技说 | 别再吹 GPT-4V 了!连北京烤鸭都不认识,你敢信??

针对最近备受关注的视觉语言模型 GPT-4V,有研究者构建了一个新基准测试HallusionBench用于检验其图像推理能力。结果发现,GPT-4V等模型在HallusionBench中表现不佳,易受自身参数化记忆的影响产生语言幻觉,答案错误率高达90%。此外,在几何等视觉问题上GPT-4V的表现也不尽如人意,反映出其当前的视觉能力还非常有限。简单的图像操作就可以轻易地误导GPT-4V,暴露出其脆弱性。相比之下,LLaVA-1.5的知识储备则不如GPT-4V丰富,存在一些常识性错误。本研究揭示了当前视觉语言模型在图像推理方面的局限,为未来的改进提供参考。

七个圈AIGC破圈俱乐部欢迎您！

9.2万用户在看

3款AI工具让历史名人‘复活’：梵高、莫扎特、奥斯汀等重现当下

7.6万用户在看

用AI写出最火的玄幻小说，全过程完整指南！附提示词和思路讲解

6.2万用户在看

快速上手！Midjourney 网页版操作指南，生成MJ图片无需Discord！

5.7万用户在看

夕小瑶科技说 | 别再吹 GPT-4V 了!连北京烤鸭都不认识,你敢信??

最近更新

文章目录

夕小瑶科技说 | 别再吹 GPT-4V 了!连北京烤鸭都不认识,你敢信??

发评论，每天都得现金奖励！超多礼品等你来拿

关联网址

关联标签

相关文章

搜索

近期热门

七个圈AIGC破圈俱乐部欢迎您！

9.2万 用户在看

3款AI工具让历史名人‘复活’：梵高、莫扎特、奥斯汀等重现当下

7.6万 用户在看

用AI写出最火的玄幻小说，全过程完整指南！附提示词和思路讲解

6.2万 用户在看

快速上手！Midjourney 网页版操作指南，生成MJ图片无需Discord！

5.7万 用户在看

夕小瑶科技说 | 别再吹 GPT-4V 了!连北京烤鸭都不认识,你敢信??

最近更新

文章目录

夕小瑶科技说 | 别再吹 GPT-4V 了!连北京烤鸭都不认识,你敢信??

发评论，每天都得现金奖励！超多礼品等你来拿

关联网址

关联标签

相关文章

9.2万用户在看

7.6万用户在看

6.2万用户在看

5.7万用户在看