内容持续更新中
浙大竺院的一位校友与微软研究院合作,推出了多模态模型LLaVA,挑战GPT-4V。LLaVA在11个测试数据集上表现出色,获得6k+星标。模型综合能力高,超过GPT-4V水平的85%。LLaVA的开源…
本文介绍了开源社区正在研发的多模态语言模型LLaVA 1.5,它整合了多个生成AI组件,经调优后计算效率很高,可以在多项任务上达到很高的准确率。LLaVA 1.5使用CLIP作为视觉编码器,使用开源L…