马毅团队发现：微调多模态大模型会导致灾难性遗忘

随着 GPT-4 的发布，多模态大模型（MLLM）成为热点。马毅团队提出了 EMT 框架，评估微调后的 MLLM 的灾难性遗忘。实验发现，微调 MLLM 在提升微调数据集性能的同时，也导致其他数据集性能下降。微调过程中，MLLM 会产生与微调数据集相关的幻觉文本，忽略原始问题。研究为后续工作提供了框架和基准，模型设计和训练技巧仍需进一步优化。马毅团队首次系统评估了 MLLM 中的灾难性遗忘问题，平衡不同能力之间的权衡。

七个圈AIGC破圈俱乐部欢迎您！

9.2万用户在看

3款AI工具让历史名人‘复活’：梵高、莫扎特、奥斯汀等重现当下

7.6万用户在看

用AI写出最火的玄幻小说，全过程完整指南！附提示词和思路讲解

6.2万用户在看

快速上手！Midjourney 网页版操作指南，生成MJ图片无需Discord！

5.6万用户在看

马毅团队发现：微调多模态大模型会导致灾难性遗忘

最近更新

文章目录

马毅团队发现：微调多模态大模型会导致灾难性遗忘

发评论，每天都得现金奖励！超多礼品等你来拿

关联网址

关联标签

相关文章

搜索

近期热门

七个圈AIGC破圈俱乐部欢迎您！

9.2万 用户在看

3款AI工具让历史名人‘复活’：梵高、莫扎特、奥斯汀等重现当下

7.6万 用户在看

用AI写出最火的玄幻小说，全过程完整指南！附提示词和思路讲解

6.2万 用户在看

快速上手！Midjourney 网页版操作指南，生成MJ图片无需Discord！

5.6万 用户在看

马毅团队发现：微调多模态大模型会导致灾难性遗忘

最近更新

文章目录

马毅团队发现：微调多模态大模型会导致灾难性遗忘

发评论，每天都得现金奖励！超多礼品等你来拿

关联网址

关联标签

相关文章

9.2万用户在看

7.6万用户在看

6.2万用户在看

5.6万用户在看