内容持续更新中
近日,北京大学等科研团队宣布发布了一款名为 LLaVA-o1的多模态开源模型,据称这是首个能够进行自发、系统推理的视觉语言模型,堪比 GPT-o1。 该模型在六个具有挑战性的多模态基准测试中表现优异,…